Category Archives: 開放資料

90% 科學資料未充分利用,AI 能否讓塵封研究成果重獲新生?

作者 |發布日期 2025 年 10 月 27 日 8:20 | 分類 AI 人工智慧 , Big Data , 數位內容

科學界有個嚴重被忽略的問題:大量研究資料,由於未納入正式發表的研究報告,可能永遠無法使用、驗證或延伸。為彌補缺憾,科學出版社 Frontiers 開發名為 FAIR² Data Management 的 AI 系統,讓「隱形的資料」(約占 90%)重返研究舞台。資訊刊登於 Frontiers 官網,揭示科學數據流失的解決方案。 繼續閱讀..

只靠移除一行程式碼,Google 升起 AI 護城河還清理 SEO 的「長期幻覺」

作者 |發布日期 2025 年 10 月 21 日 7:50 | 分類 AI 人工智慧 , Big Data , Google

故事始於今年 9 月中旬,全球的網站流量因為網站搜尋曝光暴跌、平均排名卻上升的矛盾而陷入混亂、也引發全球 SEO 相關從業人員的討論,而這場風暴的中心,就是 Google 無預警地停用了「num=100」URL 參數,這個能一次性獲取 100 筆搜尋結果的非官方功能,是整個 SEO 數據產業賴以維生的基石。Google 此舉未經任何公告,卻直接衝擊了產業的運作核心。

繼續閱讀..

數位亂流中堅守公正,維基百科如何展現網路知識韌性

作者 |發布日期 2025 年 09 月 08 日 8:10 | 分類 AI 人工智慧 , 數位內容 , 網路

當今數位時代,維基百科如何在其他網路資源崩潰的情況下生存,成為一個引人注目的話題。維基百科自 2001 年成立以來,已經成為全球最大的知識庫,擁有超過 700 萬篇英文文章,並在面對各種政治和社會挑戰時,展現出其獨特韌性。 繼續閱讀..

三分鐘協助醫護臨床判斷!工研院打造 AI 語音「MedBobi 2.0 整合平台」

作者 |發布日期 2025 年 07 月 21 日 11:28 | 分類 AI 人工智慧 , 數位內容 , 機器人

工研院今日攜手亞東醫院、中山醫學大學附設醫院、高雄榮民總醫院與奇美醫院,共同啟動「MedBobi 2.0 整合平台」,協助醫護人員從行政支援邁向臨床判斷,縮短作業時間從 30 分鐘至 3 分鐘,並開放給所有願意導入的長照、醫療機構使用。

繼續閱讀..

AI 橫行,30 年前寫給「君子」的 robots.txt 擋得住今日爬蟲巨獸嗎?

作者 |發布日期 2025 年 07 月 12 日 0:00 | 分類 AI 人工智慧 , Big Data , 數位內容

近日台灣法律科技新創「七法公司」(Lawsnote),因使用網路爬蟲(Web Crawler)程式抓取法學資料庫內容,遭法學資料庫業者「法源資訊公司」提告,指控 Lawsnote 非法擷取資料用於商業營利,涉嫌侵害著作權與妨害電腦使用。 繼續閱讀..

Hugging Face 推 AI 桌上機器人,開源設計降低門檻普及 AI 開發

作者 |發布日期 2025 年 07 月 11 日 7:40 | 分類 AI 人工智慧 , 尖端科技 , 機器人

AI 機器人備受科技界期待,已經是下個兵家必爭的產品。而 AI 平台 Hugging Face 最近宣布推出售價 299 美元的桌上機器人 Reachy Mini,不以高效能為賣點,反而推廣開源設計,期望將 AI 驅動的機器人技術帶給全球數百萬開發者。 繼續閱讀..

全台買氣縮手!六都房貸件數大縮 1.6 萬件、新青安累計破 11 萬戶

作者 |發布日期 2025 年 06 月 17 日 16:33 | 分類 Big Data , 房地產 , 財經

房市迎來寒冬,住商機構根據聯徵中心資料統計,六都 2025 年第一季房貸件數較去年同期大減約 1.6 萬件,年減幅高達 36.3%,顯示買氣明顯萎縮,但新青安累計破 11 萬戶,不受銀行法天條限制,受理總金額突破 9,300 億元,其中台灣銀行響應政策最積極,受理件數逾 3 萬件。

繼續閱讀..

AI 摘要引爭議,維基百科喊停測試計畫

作者 |發布日期 2025 年 06 月 12 日 11:45 | 分類 AI 人工智慧 , 開放資料

在網路上,生成式人工智慧的應用越來越普遍,甚至連維基百科這個由志願者編輯維護的知識寶庫也開始嘗試導入 AI 技術。維基百科最近啟動了一項 AI 摘要的測試,為部分文章提供精簡的內容摘要,然而,這項計畫在編輯們的強烈反彈中被迫暫停。 繼續閱讀..

AI 訓練不靠「侵權」也能創新,最新研究推翻產業迷思

作者 |發布日期 2025 年 06 月 06 日 12:00 | 分類 AI 人工智慧 , OpenAI , 資訊安全

在人工智慧(AI)領域,許多公司聲稱其工具無法在不使用受版權保護的內容的情況下存在。然而,最近的一項研究顯示,這種說法並不完全正確。研究人員成功訓練了一個新的大型語言模型(LLM),該模型的資料集僅使用公共領域和開放授權的內容,雖然這個模型的效能不如當前的先進模型,但其道德性卻得到提升。 繼續閱讀..

防堵 AI「資訊污染」源頭,專家:人類原創內容是關鍵防線

作者 |發布日期 2025 年 06 月 05 日 13:45 | 分類 AI 人工智慧 , ChatGPT , 開放資料

隨著 ChatGPT 於 2022 年底的推出,網路上大量湧現 AI 產生的內容,導致人類原創內容變得越來越稀少。因此,許多研究者開始著手保存 2021 年及之前的人類生成內容,因為這些內容被視為數位世界的根基,能夠幫助 AI 模型更好地理解人類思維。根據 Cloudflare 的副總裁 Will Allen 的說法,這些早期的資料對於確保 AI 模型的準確性至關重要,尤其是在醫療、法律等專業領域。
繼續閱讀..