NIH 發布包含 10,600 張 CT 圖像資料庫，為 AI 演算法測試鋪路

據消息，美國國立衛生研究院（NIH）最近發表一個龐大的胸部 X 光資料庫，現在已公開近 10,600 張電腦斷層掃描（Computed Tomography，簡稱 CT）圖像，以支援醫療人工智慧演算法的開發和測試。

這個大型成像資料庫稱為 DeepLesion，是由美國國立衛生研究院的 Ronald Summers 及同事創建。他們標記了機構放射科醫生臨床相關的 CT 掃描結果。

Summers 是 NIH 影像生物標記和電腦輔助診斷實驗室的高級研究員和放射學家。

根據美國國立衛生研究院的說法，這些標記通常很複雜，包括描述病變大小和位置的箭頭、線條、分割和文本，以便讓臨床醫生監測疾病變化。標記醫學圖像需要廣泛的臨床經驗，且耗費大量時間。

實際上，缺乏可用於訓練 AI 演算法的大型醫學圖像資料庫，一直被認為是 AI 技術尋求突破的主要障礙。Summers 及同事的努力就是為了改變這種狀況，至少在 X 光方面。去年他們發表了 ChestX-ray8 資料庫，包含 10 萬張 X 光圖像。

DeepLesion 透過夠強大的 CT 掃描資料庫和附帶標記來訓練深度神經網路，進而幫助繞過這些障礙。美國國立衛生研究院建議，有朝一日可以「使科學界創建具統一框架的大規模通用病變檢測器」。

據了解，資料庫包括來自馬里蘭州貝塞斯達 NIH 臨床中心 4,400 多名患者的大約 10,600 項研究。雖然目前大多數資料庫包含 10 至數百個單一類型的病變，但該組設計的 DeepLesion 可容納超過 32,000 個病灶，涵蓋各種放射學發現，如肺結節、淋巴結腫大和肝腫瘤。

有了多範疇的病變資料庫，DeepLesion 為研究人員提供了開發人工智慧演算法的機會，能自動檢測和診斷多種病變類型。美國國立衛生研究院指出，未來還可能發展成一個通用病變檢測器，可用作初始篩選工具，並將結果發送到其他更專業的演算法。此外，研究人員可能可在同一次 CT 掃描中研究不同類型病變之間的關係，進而全面評估癌症負擔。

為了開始展示這種潛力，Summers 及同事用 DeepLesion 資料庫訓練一個典型的通用病變檢測器，以發現各種病變。他們的探測器靈敏度達到 81.1%，每個圖像有 5 個假陽性。

據了解，研究人員計劃繼續向 DeepLesion 添加圖像，以提高檢測器的準確性，他們希望將 MRI 掃描包含到資料庫，並結合未來多家醫院的數據。研究小組認為，除病變檢測外，資料庫還能幫助訓練演算法分類病變，並根據現有模式預測病變的發展。

（本文由雷鋒網授權轉載；首圖來源：NIH）