德州大學奧斯汀等參與的 Hobby-Eberly Telescope Dark Energy Experiment(HETDEX)4 日宣布,已完整開放大型宇宙資料庫,讓科學家、初學者與人工智慧共同探索這份前所未有的天文資料。此資料庫以超過 0.5PB 的原始與處理後資料為基礎建立,涵蓋宇宙早期星系形成與演化、星系氣體與恆星分布,以及宇宙結構等研究主題。
HETDEX 以光譜觀測方式掃描深空,2017~2024 年霍比─埃伯利望遠鏡(Hobby-Eberly Telescope,HET)在麥克唐納天文台完成相當於 2,000 個滿月面積的夜空調查,建立一張追溯至宇宙誕生約 18 億年後(約 12 億年前之前更早時期亦有涵蓋)的地圖。此次公開資料包括約 6 億條光譜,聚焦「宇宙正午」(Cosmic Noon)時期,也就是距今約 100 億至 120 億年前,恆星形成最活躍的年代。團隊表示,這些光譜能讓天文學家從化學成分、運動狀態到與地球距離等多面向解讀天體資訊。
此次釋出的資料含 431,000 個 3D 資料立方體(約 43.1 萬個),以及 HETDEX 至今巡天目錄:超過 100 萬個遙遠星系、50 萬個近距離恆星形成星系、1.8 萬個超大質量黑洞與逾 15 萬顆恆星。研究員指出,這是首度完整 HETDEX 資料集與巡天目錄一併公開,使用者可依天區位置下載客製化資料子集,降低使用門檻。
為了讓更多使用者處理如此龐大的資料,團隊與德州先進計算中心(TACC)合作,提供雲端高效能運算資源與 JupyterHub 平台,並將原本超過半拍位元組的資料處理壓縮到約 10TB,搭配教學與工具,方便人類與 AI 分析。HETDEX 研究員也表示,TACC 的 Lonestar6、Stampede2、Stampede3、Wrangler 與 Maverick 等系統,長期支援資料儲存、處理與分析工作。
團隊說明,AI 扮演重要角色,如自動移除衛星與流星干擾的軟體,以及協助辨識早期星系的自動化方案;超過 24,000 名公民科學家也透過「Dark Energy Explorers」計畫協助確認候選星系。雖然核心巡天任務已完成,團隊表示觀測繼續、校準也會持續改善,未來還會釋出更多補充資料。欲取得資料與更多資訊,可參見 HETDEX 與 TACC 網站。
- Covering the Fastest Computers in the World and the People Who Run Them
- HETDEX opens massive Cosmic Noon dataset to scientists, novices and AI
(首圖來源:HETDEX)






