史上最大「神經語言資料集」誕生?新創 Conduit 將解碼 1 萬小時腦波對話

作者 | 發布日期 2025 年 12 月 12 日 10:20 | 分類 AI 人工智慧 , 生物科技 , 醫療科技 line share Linkedin share follow us in feedly line share
Loading...
史上最大「神經語言資料集」誕生?新創 Conduit 將解碼 1 萬小時腦波對話

在舊金山,一家名為 Conduit 的新創公司最近完成了一項引人注目的資料收集計畫,該計畫在六個月內從數千名參與者那裡收集了約 1 萬小時的非侵入性腦部掃描資料。該資料集被認為是迄今為止最大的神經語言資料集,旨在訓練思維轉文本的人工智慧模型,直接解碼人類在說話或打字前幾秒鐘的腦信號。

參與者在小型隔間中進行兩小時的會話,以語音或簡化鍵盤與大型語言模型(LLM)自由交流。最初的測試依賴於結構化任務,但Conduit發現自然對話能顯著提高資料品質,因此轉向了更具個性化的交流方式。在過程中,Conduit面臨著來自腦電圖(EEG)記錄的電氣干擾挑戰,最初透過包裹設備和使用電池供電來消除噪音,但隨著專案擴大,模型的改進減少了對激進噪音減少的需求。

(Source:網頁截圖)

Conduit的營運策略包括即時監控資料完整性,並透過動態預訂和超額預訂來改善營運效率,這使得實驗室能夠在20小時的日程中同時運行多個隔間。這些調整使得每小時可用資料的邊際成本在五個月內降低了約40%,實現了收集這個前所未有的腦語言資料的可擴展和成本效益的方法。

此資料集的意義在於,它有潛力改善人工智慧模型解讀自然人類思想轉化為文本的能力,推進腦機介面和神經技術的應用。

(首圖來源:shutterstock)

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》