本有機會成為世界首富的人,想幫你把資料從科技公司手中奪回來

作者 | 發布日期 2018 年 10 月 26 日 8:15 | 分類 名人談 , 科技史 , 科技教育 line share follow us in feedly line share
本有機會成為世界首富的人,想幫你把資料從科技公司手中奪回來


沒有他的發明,我們連嘲笑微軟 IE 瀏覽器的機會都沒有;沒有他的發明,GoogleAmazon、百度、阿里巴巴都不會存在;沒有他的發明,你蘋果手機的 Siri 可能比現在還蠢。

他是提姆‧伯納斯─李(Tim Berners-Lee),英國電腦科學家,他的發明叫全球資訊網(World Wide Web,WWW)

伯納斯─李不是像「賈伯斯」這種如雷灌耳的名字,但關於他最有噱頭的段子又極具 10 萬標題的潛力:

「網路之父」本可輾壓比爾蓋茲成為世界首富,但他竟沒有為發明申請專利!

假如申請發明專利,世界首富不是蓋茲而是他!

如果他願意,20 年前就能成為世界首富!

▲ 本文主角伯納斯─李年輕時。

事實上,沒有人是真正的「網路之父」,因為網路並不是單獨一個人的發明,說伯納斯─李是「全球資訊網之父」較準確。伯納斯─李沒有申請專利,不是因為他沒有意識到這個發明的價值,而是出於推廣全球資訊網的考量。

很多人分不清網路(Internet)和全球資訊網(WWW)的區別,簡單理解網路就是全球性,而全球資訊網是我們上網時最常用的入口。舉一個不太恰當但容易理解的比喻:

如果把網路當成城堡裡的寶石,想擁有它必須從城門進入。你有很多門可選:HTTP 之門、FTP 之門、SMTP 之門……你不用弄懂這些神符一樣的英文代表什麼意思,只要知道代表全球資訊網的「HTTP 之門」是門檻最低的門,且這道門的鑰匙就是瀏覽器。

全球資訊網還沒發明前,網路也存在了很多年,但上網並不是件輕鬆愉快的事。那時人們透過撥打伺服器號碼上網,入口不是瀏覽器,沒有網頁、沒有圖片、更沒有影片,只有下面這種一行文字資訊。

毫無疑問,全球資訊網是伯納斯─李最重要的發明,但他這輩子做過的事還有很多,比如成立全球資訊網聯盟、提出語義網、呼籲數據公開、成立社交網路數據平台,但都緊緊圍繞同一個主題:打破「資訊、數據之牆」,促進開放互通。

誕生全球資訊網的福地,是個看似和電腦沒關係的地方

伯納斯李從小就是電腦迷,父母都曾參與世上第一台商業電腦「曼徹斯特‧馬克一號」(Manchester Makr I)的設計研發,讓他從小就對電腦知識耳濡目染。

1973~1976 年,他在牛津大學女王學院學習物理專業。大學期間,由於違反規定被禁止使用學校電腦,他自己動手用一台電視、一個摩托羅拉舊型微處理器(Motorola 6800)、一根焊接棒,拼成一台電腦。

1976 年大學畢業後,伯納斯─李在不同公司擔任程式設計師,但每份工作都持續不了多久。1980 6~12 月,伯納斯─李以諮詢顧問的身分,在歐洲核子研究中心從事軟體工程工作。歐洲核子研究中心是物理界著名的研究所,也是發現「上帝粒子」(希格斯玻色子)的地方。

1980 年的歐洲核子研究中心,是一個資訊需要高頻率交換,但又充滿各種「資訊圍牆」的地方:1 萬人在這裡來來往往,其中只有 3 千名左右是研究所員工,其餘都是世界各地研究院的人員。他們使用不同電腦、不同網路、不同資料格式、不同檔案系統。

身為軟體工程師,伯納斯─李需要幫助這些研究人員連上不同電腦,執行不同軟體程式,在不同格式的檔案中找到有關聯的數據,這個過程「讓人充滿了挫敗感」。

為了改變局面,伯納斯─李打造了基於超文件的索引系統 Enquire,幫研究人員在不同電腦裡迅速找到資訊,儘管只是單機程式,還有很大的局限性。

Enquire 的底層技術「超文件」,最早於 1963 年提出,1976 年發明後投入使用。超文件如今在網路隨處可見,我們可為文字加上連結,點擊後跳轉到網頁、檔案或檔案的某處。某種意義上,基於超文件的 Enquire 就是全球資訊網的原型。

伯納斯─李很快又離開了歐洲核子研究中心,加入一家電腦公司,參與遠端網路呼叫設計,因而獲得網路設計經驗。1984 年,他以研究員身分重返歐洲核子研究中心工作。

為什麼伯納斯─李沒有申請「全球資訊網」的專利?

回到歐洲核子研究中心的伯納斯─李,已具備了開發全球資訊網的條件:超文件和網路設計經驗、超強的執行能力、開放的思維方式,再加上歐洲核子原子中心這個天然實驗場。

外部環境也已成熟:TCP/IP 協定、域名系統等底層技術逐漸完善,降低普通人上網門檻的需求也越來越強烈。

1989 3 月,伯納斯─李萌生了將超文件系統和網路結合,創造一個全球性超文件連接網路的想法:

全球資訊網需要的技術,例如超文件系統、網際網路和多種字型的文字檔案,都已設計出來了。我只需要結合它們……把現在的檔案系統都想像成大型虛擬檔案系統的一部分。

伯納斯─李撰寫了提案,交給主管邁克‧森道爾(Mike Sendall),後者並沒有非常感興趣,只在提案封面寫了簡評:不太明確,但令人激動……(Vague, but exciting…)18 個月後,邁克才允許伯納斯─李兼職做提案,但只是抱著試試看的心態。

▲ 伯納斯─李提案的封面,右上角有當時主管的評價。

伯納斯─李很快開始動手寫程式,到 1990 年聖誕,他基本上定義了 Web 的基本概念:HTTP(超文字傳輸安全協定)、HTML(超文件標示語言)、URL(統一資源定位符)。你不用了解這 3 個名詞的技術如何達成,只需要知道:

  • HTTP 超文字傳輸安全協定:負責傳送資訊。
  • HTML 超文件標示語言:負責在網頁顯示資訊。
  • URL 統一資源定位符:負責給每個網頁一個位址,方便你找到它。

這 3 樣東西結合起來,塑造了我們今天習以為常的上網方式:在位址欄輸入網頁位址,便能轉到相應網頁;如果該檔案有超連接,還能點擊它跳轉。相互有關的資訊透過「點擊─跳轉」連起來了。

1991 8 月,伯納斯─李開放他發明的第一個網頁瀏覽器,並上線世界第一個網頁:http://info.cern.ch/

這個網頁非常簡單,抬頭 3 個大字:World Wide Web。手稿介紹全球資訊網是什麼、所用的技術、參與計畫的人、計畫的歷史等。

▲ 世上第一個網頁。

值得一提的是,全球資訊網計畫參與者中,名為羅伯特·卡里奧(Robert Cailliau)的資訊工程師長期使用 Hypercard,這是蘋果 1987 年發表、2004 年關停的超文件系統,透過卡里奧間接影響了全球資訊網的設計。

▲ 蘋果電腦以前的超文件系統 Hypercard。

全球資訊網發明後,伯納斯─李並沒有申請專利,因為他很清楚,「開放」是全球資訊網普及的前提,「你無法計畫做一個宇宙一樣大的空間,同時保持控制」。

全球資訊網開放大眾的 1991 年,同時誕生的還有明尼蘇達大學的 GopherGopher 在後來和全球資訊網的競爭中落敗,部分原因就是收費策略。

事實上,伯納斯─李確實曾考慮為自己的發明申請專利,但不是全球資訊網而是瀏覽器。最後,他還是因為自己「開放互聯」的價值觀放棄了這做法。

「幾百萬人突然發現全球資訊網可能比性愛還棒」

誕生頭兩年,全球資訊網並沒有多少人用。不管伯納斯─李怎麼努力推廣,每天只有 10~100 次點擊率,就連技術社群也不接納全球資訊網。

他將全球資訊網相關論文提交給超文件社群 Hypertext’91,但被拒絕了。全球資訊網在他們看來太簡單了,且違背社群規則。

當時,超文件社群的信仰是,連結不應指向不存在或已移除的檔案,因此當時其他一些超文件系統都約束在一個單獨、孤立的資料程式庫裡。

而全球資訊網是全球性的開放系統,如果某個伺服器壞了或某個檔案(網頁)被移除,連結就成了壞鏈。全球資訊網的開放性在超文件社群看來,反而成了褻瀆信仰。

改變出現在 1993 年,這一年 Mosaic 瀏覽器問世。Mosaic 瀏覽器是第一個可在文字中插入圖片,而不是在單獨網頁顯示圖片的瀏覽器。它支援全球資訊網、Gopher 等多個網路標準,且擁有友善的用戶介面、簡易的安裝步驟、可靠的效能。

▲ Mosaic 瀏覽器。

Mosaic 瀏覽器發表時,市面有好幾個競爭者如 ErwiseViolaWWWMidasWWW tkWWW,但種種特徴使它脫穎而出、大受歡迎,並帶動全球資訊網流行,「幾百萬人突然發現全球資訊網可能比性愛還棒」。

全球資訊網真正使網路由少數精英使用的資訊傳送管道,變成全世界共用的資訊共用平台。1993 年後,越來越多公司開始在全球資訊網的基礎上提供服務、做生意,全球資訊網重塑世界經濟的故事不必再述。

全球資訊網影響力逐步增加同時,伯納斯─李也獲得了肯定:2004 年獲得大英帝國爵士級司令勳章、2017 年獲得電腦科學領域最負盛名的獎項──圖靈獎。

對任何人來說,取得如此成就已可躺在功勞簿上睡大覺,但伯納斯─李真是閒不下來,他對網路的貢獻遠不止全球資訊網這個發明。

蘋果手機的 Siri,也得益於伯納斯─李的工作

伯納斯─李 1989 年的提案中,全球資訊網「不僅是文件檔的網路,也是知識的網路」。

全球資訊網首先透過超文件連結做到檔案(網頁)互連,到了 1998 年,伯納斯─李正式將「知識網路」的構想命名為語義網(Semantic Web),並將工作重心放在推廣語義網。

語義網是全球資訊網的變革和延伸,目的是讓電腦也能像人類一樣了解網頁內容。

比如,人們看到網路天氣預報,會知道哪個數字是溫度,哪個是濕度。語義網的目的就要透過隱藏的編碼,告訴電腦哪個數字代表溫度,哪個數字代表濕度,並說明 「溫度」 和「濕度」的含義。

2006 年,語義網發展到了瓶頸,需要大量結構化的公開資料,伯納斯─李提出互聯資料(Linked Data)的概念,還在 2009 年 TED 大會呼籲政府和機構公開原始數據Raw Data)。同年,白宮成立一個網站 Data.gov,要求所有部門都要有公開資料。

大量資料公開後,有機構將資料結構化,這些結構化的互聯資料庫默默影響著人工智慧的發展。

2011 年,IBM 的人工智慧 Watson 在美國電視智力競賽節目《危險邊緣》(Jeopardy!)擊敗人類選手,獲得百萬美元大獎,就是採用 DBpedia(維基百科的結構化資料程式庫)、YAGO(整合 WikipediaWordNet GeoNames 三個來源的資料程式庫)等成果。

2012 年,Google 收購一家做結構化資料的公司 Metaweb,於後者資料程式庫 Freebase 的基礎上發起知識圖譜(Knowledge Graph)計畫。蘋果的 Siri,也是脫胎於基於語義網的計畫 CALO(Cognitive Assistant that Learns and Organizes)

▲ 右側紅框圈起來的就是語義網應用。(Source:網路截圖)

一個帳號登入所有應用,不怕應用倒閉的新平台

儘管伯納斯─李一直推動網路往開放方向發展,但「數據圍牆」現象還是以另一種形式重現:科技公司借免費服務將用戶控制在自己的應用產品內,用戶的資料分散在各平台,更無力保護隱私。

矛盾最近幾年集中爆發,標誌性事件莫過於今年 Facebook 爆2016 年時保護隱私不力,讓劍橋分析公司未經授權存取 5 千萬用戶資料。社會開始出現批評科技公司、將數據還給用戶的聲音。

在這時間點,伯納斯─李的新計畫恰逢其時。2018 9 29 日,他發表一篇名為《網路的一小步……文章,宣布成立基於 Solid 平台的新創公司 Inrupt

2015 年,伯納斯─李就在麻省理工啟動 Solid 計畫Solid 全稱為社交互聯資料(Social Linked Data),是一個去中心化的社交平台,基於 2006 年提出的互聯資料技術和規格。

現在我們使用社交平台的現狀是,Google 有帳號、Facebook 有帳號、Twitter 有帳號、Instagram 有帳號,此外可能還有微信、QQ、微博等。每個帳號的資料都獨立存在營運方的伺服器,互不相通。

這有兩個顯而易見的弊端:1. 用戶資料掌握在營運方手裡,有被濫用的可能;2. 如果營運方經營不善或關停服務,那用戶在這個社交平台的資料也付諸流水。Path 和 Google+ 關停,就是最好的例子。

Solid 的解決方案把用戶資料和應用分開,讓用戶集中自己的資料,稱之為「個人線上資料」(Personal Online Data,簡稱 POD)。然後,將 POD 存在自己建的伺服器,或受信任的個人線上資料商(Personal Online Data Stores,簡稱 PODS)

用戶會有一個 Web ID,可登陸所有基於 Solid 平台的應用,用戶能自己控制給哪個應用多少資訊。

目前,Solid 平台還處於原型階段,主要針對開發者。伯納斯─李用 Solid 平台的技術打造一款自己使用的應用,一家外媒看過後評價

這款應用程式使用 Solid 的去中心化技術,允許伯納斯─李無縫存取他的所有資料──行事曆、音樂、影片、聊天紀錄、研究。它就像 Google Drive、Microsoft Outlook、Slack、Spotify WhatsApp 的混合體。

至於 Inrupt,是幫助 Solid 平台成長的新創公司。Inrupt 之於 Solid,好比 Mosaic 瀏覽器之於全球資訊網,是領路人角色。伯納斯─李希望 Inrupt 能為 Solid 帶來「生態系統」,其中的市場機會包括 Solid App Solid 資料儲存等。

伯納斯─李已向麻省理工學院請長假,專心在開發者群體推廣 Solid Inrupt。這是他又一次轉變工作重心。過去,伯納斯─李一直致力透過全球資訊網、語義網網路公開資訊,現在他嘗試透過 Solid 來連結個人資訊、解決科技大公司壟斷用戶數據的問題。

這不是短期內可看到成效的專案:社交巨頭和網路公司不會將用戶帳號數據拱手相讓,使用戶個體自發遷移也需要極大的教育成本。但正如全球資訊網剛誕生時沒人關注,誰也不知道 Solid 會不會成為下一棵參天大樹。

(本文由 PingWest 授權轉載;首圖來源:Flickr/Open Data Institute CC BY 2.0)