疫情是否好轉,看 Instagram 創始人打造的武漢肺炎傳播預測模型怎麼說

作者 | 發布日期 2020 年 04 月 24 日 7:30 | 分類 網路 , 醫療科技 Telegram share ! follow us in feedly


2019 新型冠狀病毒(俗稱武漢肺炎)疫情目前在全球並沒有好轉跡象,截至 4 月 22 日上午 10 點 30 分,確診人數達 256 萬,死亡人數超過 17.7 萬,且仍在持續增長。

疫情到底什麼時候結束,這成為懸在所有人心頭的問題。遺憾的是,許多流行病學專家都對病情徹底結束持悲觀態度,認為武漢肺炎最終可能演化為常態性地區流行病。

流行病學有個指標,可指出病情在一定區域的傳播情況。

此數值簡稱為 R,全稱為「即時有效傳染數」(effective reproduction number),簡單來說,是感染某流行病的一名患者,任意時間能傳染的人數。

4 月 21 日,Instagram 聯合創始人Kevin Systrom 發表新型冠狀病毒的 Rt 預測模型(Rt=R 值+時間變化)。他還和另一位聯合創始人Mike Krieger 一起做了網站 Rt.live,可即時追蹤美國 50 個州各自 Rt 數值。透過觀察此數值,可一眼看出武漢肺炎在各州的擴散增幅如何,抑或逐漸得到控制。

但是在看這個網站之前,我們首先需要理解 Rt 的具體含義。

有效傳染數 Rt 是什麼?

你可能聽過 R0(讀作 R-naught),中文叫基本傳染數,指的是在特定環境,不考慮時間等其他因素,一個病人平均感染的人數,數值越高,疾病的傳染力越強。

之前美國 CDC 計算的新型冠狀病毒 R0 在 2.2~2.7,如果不控制,每 2~3 天感染者數量會翻一倍。但考慮到疾控措施,以及不斷變化的情況,R 值每天都有可能浮動,Rt 就是 R 值加上時間變化。

觀察此數值很有意義。如果 R 值大於 1,說明疾病將會繼續擴散;如果小於 1,說明一個確診病人的感染能力被限制了,疾病傳染會自行消退,直至最終消失。

「R0 是大家都知道的數值,就是 t=0,但 R0 只是單一指標,對人們行為和疾控措施的適應性不夠強。」Kevin Systrom 在 GitHub 頁面寫道。隨著疫情發展,增加和減少疾控措施都會造成 Rt 變化,因此了解目前的 Rt 數值很重要。

觀察 Rt 值有很強的指導意義,可幫助人們理解目前的疾控措施是否有效,還可以幫忙做決定,是否需要增加或減少疾控的限制措施。

不過 Systrom 指出,目前世界採用此思路的國家並不多,只有港大公共衛生學院在追蹤香港的 Rt 值。

且他認為追蹤一個國家的 Rt 意義不大,粒度必須要細化到當地,如州、縣和城市等級。所以他從美國各州和地方的衛生部門的報告提取武漢肺炎檢測和確診數據,製作這個網站。從這些數據,可看出美國武漢肺炎疫情控制的情況。

美國武漢肺炎疫情控制如何?

前面我們提到,R 值越低,疾病的傳染能力越低。而 Rt.live 網站就是以 Rt=1 為分水嶺,列出各州數據:

從網站首頁互動圖表可看出,左側綠色的州在 4 月 18 日的 Rt<1:

  • 佛羅里達州=0.99
  • 奧勒岡州=0.89
  • 密西根州=0.88
  • 康乃狄克州=0.42

靠右側紅色的州 Rt 數值高於 1:

  • 紐約州=1.0
  • 北卡羅萊納州=1.1
  • 麻薩諸塞州=1.2
  • 德克薩斯州=1.2
  • 加州=1.3
  • 華盛頓州=1.4
  • 俄亥俄州=1.6
  • 北達科他州=1.7

同時,網站也提供各州 Rt 值過去一個月的變化曲線。

可看出加州 4 月 6~11 日期間短暫跌落到 1 以下,近日又回升。

紐約州在 3 月中旬經歷高峰。好在,可能由於強而有力的疾控措施,包括居家隔離等,3 月下旬疫情逐漸得到控制。

所有州的曲線圖,最近似乎都有小幅回升。看起來康乃狄克州控制最好,雖然有波動,但總體呈下降趨勢,顯示出境內疾控措施的有效性。

如何預測 Rt?

要指出的是,這是預測模型,基於過去幾天報告的核酸檢測和確診患者等數據,並不是絕對真實的 Rt 值。

Systrom 方法的基礎是 2008 年 Luís Bettencourt 和 Ruy Ribeiro 等人發表的論文,基於貝葉斯方法,加入高斯雜訊預測隨時間變化的 R 值。

基礎公式如下:在 Rt 時間發現 k 數量的新增病例可能性,乘以 Rt 時間可能性,除以發現 k 數量新增病例可能性,就能得到 Rt 分布區間。

隨著時間變化,再用前一天數值預測當天數值。

同時,預測模型還需要某天新增某數量患者 λ 的可能性函數:

根據已有的新增病例數值,可預測未來幾天的 Rt 可能分布區間:

還未引入真實世界數據的前提下,Systrom 最佳化一些演算法,可在他的 GitHub 頁面看到演算法設計思路。

接下來就是加入美國各州匯報的病例數據驗證和進一步最佳化,可在 The Covid Tracking Project 的網站 covidtracking.com 找到這些數據。

這些數據的可靠性沒問題,因為直接來自公共衛生部門,但真實性需打些折扣,因為核酸檢測能力不足,理論上當日新增的病患一部分可能是前一天累積,所以 Systrom 針對此情況高斯模糊了時序數據。

最後執行演算法,根據之前的公式就可算出 Rt,剩下的就是把所有州的預測數值跑出來、製圖。本文只簡單介紹 Systrom 的研究方法,如果對演算法有興趣或有問題,可自行參閱 GitHub 頁面

Systrom 也指出,目前模型有幾個已知的問題。如果真實世界的核酸檢測能力激增或銳減,都會對數值準確度產生影響;檢測陽性和症狀出現有延遲,無法透過這個模型體現;以及一個純數學預測模型,無法完美預言真實世界的情況。

其他預測

之前 Kevin Systrom 就對美國疫情有過一些基於數學模型的預測。

比如,根據 3 月底當時紐約市的數據,據他計算,如果任意挑出 250 人,所有人都未感染的機率只有 56%。250 人差不多是紐約市一個普通人平均認識的人數量,這意味著整個紐約市有 44% 市民至少認識一位感染者。

再如果在紐約市開一間星巴克,按照每天 1,000 名客人計算,每天不會有感染者進門的機率有多少?答案如下圖,可看出從 3 月 15 日開始,機率越來越低。有趣的是,星巴克也在那一天宣布關閉紐約市所有門市。

他還做過一個有趣的計算:如果不聽勸,非要出門活動,且有 90% 信心不會碰到感染者──要滿足你的舒適度底線,城市最大人口數是多少?

他算出在 3 月初,美國人還沒意識到疫情會多嚴重時,城市人口最多可不到 100 萬人;如果 95% 不會碰到感染者是你的舒適度底線,城市人口約 40 多萬人;97% 對應 25 萬人左右;99%=約 10 萬。

但隨著疫情逐漸升級,能滿足舒適度的人口極限數量快速下降。在這個推導模型,到了 3 月底,無論你認為自己的運氣有多好,出門都幾乎一定會碰見感染者。

由此他希望說明,在這樣的危機時刻,居家隔離是保護自己的最佳方式,而出入公共場合十分危險。

Kevin Systrom 是誰

Kevin Systrom 和 Mike Krieger 在 2018 年突然宣布離開 Facebook 及創立的 Instagram。

Instagram 是美國在行動網路時代的第一個現象級產品。Systrom 從小熱愛程式設計,曾經是 AOL 旗下 AIM 軟體商駭客,開發可發送大量垃圾訊息導致對方帳號斷線的外掛。

本科畢業後,Systrom 先後加入 Twitter、Google,雖然並非電腦科學專業,但一直自學程式設計,就讀史丹佛大學期間和 Krieger 都參加過史丹佛享譽盛名的 Mayfield Fellow Program 創業培訓課程。

兩人第一次創業做的是名叫 Burbn 的簽到軟體,但後來發現用戶很喜歡用裡面的照片濾鏡功能,經過一番爭論,最終他們做出了 Instagram,Systrom 擔任 CEO,受過正規電腦訓練的 Krieger 擔任工程負責人。新產品上線當天,用戶量就突破 2.5 萬,一週突破 10 萬,第二個月 100 萬,到了第二年月活躍用戶突破 5,000 萬。

Facebook 收購後,Instagram 想過維持小而獨立的規模,但最終未能倖免 Facebook 的野心。兩位聯合創始人對祖克柏事無鉅細的管理和產品設計風格的侵犯,感到十分厭煩,甚至遭祖克柏撤回對 Instagram 產品增長支持的威脅。最終,兩人都離開了公司。

Rt.live 是兩人在從 Instagram 離職之後首次攜手開發的新產品。Systrom 主要負責數據分析和演算法設計,Krieger 負責產品和網站設計。

(本文由 PingWest 授權轉載;首圖來源:pixabay

延伸閱讀: