其他知識領域應用 Google PageRank 演算法一樣拿手

作者 | 發布日期 2014 年 08 月 21 日 15:29 | 分類 Google
c011f82b1088d85a52ab80f2bf42151e

1998 年,兩個名不見經傳的研究生,Larry Page 和 Sergey Brin,第一次在學術論文上介紹了 Google 這個搜尋引擎,而關鍵創新點就在於他們發明的名叫 PageRank 的演算法(PageRank 是 Larry Page 的 Page,而不是網頁的意思)。Google 正是依據 PageRank 演算法將搜索到的網站進行排序,正如他們二人所說的:PageRank「帶來了網頁新秩序」。




PageRank 將網站的連結和超連結作為指標,衡量其重要性和權威性。然後 Google 根據此資訊來排列搜索結果。Page 和 Brin 發表的分析結果,並不只是當時現有數學的一個新的應用,學者們認為,他們找到的是一個全新的方法,雖然可能有借鑒一些前人的成果。

雖然 Google 對 PageRank 提供搜索結果的依賴程度到底有多少,只有公司內部的人才知道,但是,可以肯定的是,該演算法對 Google 現在數千億的市值起到了不可磨滅的作用。

而 PageRank 在網頁之外,也具有驚人的大範圍的實用性,幾乎涵蓋所有領域,從體育團隊的排名到大腦內部交互連結的分析。

普渡大學的電腦學家 David Gleich 這麼評價道:「它有點像是 Google 發明的鏡頭。如果你有各種不同的鏡頭隨機組合,你就可以觀察到各種不同的系統——就像是你同時有了顯微鏡、望遠鏡、數位相機等等。但你還是需要有自己獨特的視角。」

自動論文發表以後,十六年來,Gleich 一直在研究 PageRank 演算法在其他領域的應用。他已經發現了數十種可以使用該演算法的具體案例。他的做法並不是深入研究每一個實例的具體實現,而是為了證明 PageRank 確實擁有廣大的適用範圍。

他說,只要有圖譜,就有 PageRank 的用武之地。它是一種數學的思維方式,代表了一組事物的關係或流程,研究物件可以是 Web 頁面、辦公室工作人員、Facebook 的使用都、基因、蛋白質或者交通情況。「PageRank 就像各種圖譜一樣,無處不在。」

以下是一些有趣的使用案例。目前,這些對 Google 的商業或社會影響並沒有產生什麼作用,但也不排除會有這麼一天。

 

文學作品

最重要的文學作品是什麼?PageRank 演算法可以説明回答這個看似很主觀的問題。Nebraska 大學的一位文學教授開發了一款軟體,使用了 PageRank 和其他的演算法。他的研究物件是十九世紀的文學作家。經過分析了近 3,600 部長篇小說,軟體得出了結論:珍.奧斯丁和沃爾特.史考特(Sir Walter Scott)是那個年代最有影響力的作家。

 

體育運動

在特定的運動項目中,誰是歷史上最好的球隊或球員?這個問題如果交給球迷,那必將吵得不可開交,因為評判標準同樣是主觀的。有一則論文利用 PageRank 分析了 1968 年之後的所有職業網球比賽,它將相同的兩個對手之間的比賽結果進行匹配,以「聲望得分」為基礎構建了一個網路。得出的結論是,在網球界,Jimmy Connors 是史上最好的球員。就像 Gleich 說的,這些排名背後的基本思想是:假設一個粉絲會追隨著一隻球隊或球員,直到他被打敗,而後他會繼續追隨勝利的一方,直到結果出現。這類似於飆網者在網站連結中做出選擇。

 

神經科學

Gleich 在他的論文中寫道:「人類的大腦是一個重要的網路,可我們對它的瞭解少的可憐。」PageRank 當然也適用於此。最近,它被用來評估不同大腦區域之間的聯結和重要性,以及隨著年齡的變化結果會如何改變。

 

癌症研究

在一篇名為「Google Goes Cancer」的論文裡,研究人員開發了一種基於 Google 演算法的「新型計算方法」,該演算法説明他們確定了七個與遺傳有關的腫瘤基因,這將幫助醫生更好的指導癌症治療的過程。

 

交通網路

PageRank 的另一應用是用來預測城市裡的交通流量和人流動向。有一項研究依賴於該演算法的一個關鍵因素:一個叫做 teleporting(傳送)的概念,它模擬了人類的決定:開始或中止行程,或者在既定的街道停車。這有助於交通運輸研究人員更好的創建測量模型,類比道路的車流量和人流量。

(本文由 36Kr 授權轉載)

關鍵字: , ,

發表迴響