NIH 發布包含 10,600 張 CT 圖像資料庫,為 AI 演算法測試鋪路

作者 | 發布日期 2018 年 08 月 07 日 9:00 | 分類 AI 人工智慧 , 醫療科技 follow us in feedly

據消息,美國國立衛生研究院(NIH)最近發表一個龐大的胸部 X 光資料庫,現在已公開近 10,600 張電腦斷層掃描(Computed Tomography,簡稱 CT)圖像,以支援醫療人工智慧演算法的開發和測試。



這個大型成像資料庫稱為 DeepLesion,是由美國國立衛生研究院的 Ronald Summers 及同事創建。他們標記了機構放射科醫生臨床相關的 CT 掃描結果。

Summers 是 NIH 影像生物標記和電腦輔助診斷實驗室的高級研究員和放射學家。

根據美國國立衛生研究院的說法,這些標記通常很複雜,包括描述病變大小和位置的箭頭、線條、分割和文本,以便讓臨床醫生監測疾病變化。標記醫學圖像需要廣泛的臨床經驗,且耗費大量時間。

實際上,缺乏可用於訓練 AI 演算法的大型醫學圖像資料庫,一直被認為是 AI 技術尋求突破的主要障礙。Summers 及同事的努力就是為了改變這種狀況,至少在 X 光方面。去年他們發表了 ChestX-ray8 資料庫,包含 10 萬張 X 光圖像。

DeepLesion 透過夠強大的 CT 掃描資料庫和附帶標記來訓練深度神經網路,進而幫助繞過這些障礙。美國國立衛生研究院建議,有朝一日可以「使科學界創建具統一框架的大規模通用病變檢測器」。

據了解,資料庫包括來自馬里蘭州貝塞斯達 NIH 臨床中心 4,400 多名患者的大約 10,600 項研究。雖然目前大多數資料庫包含 10 至數百個單一類型的病變,但該組設計的 DeepLesion 可容納超過 32,000 個病灶,涵蓋各種放射學發現,如肺結節、淋巴結腫大和肝腫瘤。

有了多範疇的病變資料庫,DeepLesion 為研究人員提供了開發人工智慧演算法的機會,能自動檢測和診斷多種病變類型。美國國立衛生研究院指出,未來還可能發展成一個通用病變檢測器,可用作初始篩選工具,並將結果發送到其他更專業的演算法。此外,研究人員可能可在同一次 CT 掃描中研究不同類型病變之間的關係,進而全面評估癌症負擔。

為了開始展示這種潛力,Summers 及同事用 DeepLesion 資料庫訓練一個典型的通用病變檢測器,以發現各種病變。他們的探測器靈敏度達到 81.1%,每個圖像有 5 個假陽性。

據了解,研究人員計劃繼續向 DeepLesion 添加圖像,以提高檢測器的準確性,他們希望將 MRI 掃描包含到資料庫,並結合未來多家醫院的數據。研究小組認為,除病變檢測外,資料庫還能幫助訓練演算法分類病變,並根據現有模式預測病變的發展。

(本文由 雷鋒網 授權轉載;首圖來源:NIH