Category Archives: 開放資料

AI 橫行,30 年前寫給「君子」的 robots.txt 擋得住今日爬蟲巨獸嗎?

作者 |發布日期 2025 年 07 月 12 日 0:00 | 分類 AI 人工智慧 , Big Data , 數位內容

近日台灣法律科技新創「七法公司」(Lawsnote),因使用網路爬蟲(Web Crawler)程式抓取法學資料庫內容,遭法學資料庫業者「法源資訊公司」提告,指控 Lawsnote 非法擷取資料用於商業營利,涉嫌侵害著作權與妨害電腦使用。 繼續閱讀..

Hugging Face 推 AI 桌上機器人,開源設計降低門檻普及 AI 開發

作者 |發布日期 2025 年 07 月 11 日 7:40 | 分類 AI 人工智慧 , 尖端科技 , 機器人

AI 機器人備受科技界期待,已經是下個兵家必爭的產品。而 AI 平台 Hugging Face 最近宣布推出售價 299 美元的桌上機器人 Reachy Mini,不以高效能為賣點,反而推廣開源設計,期望將 AI 驅動的機器人技術帶給全球數百萬開發者。 繼續閱讀..

全台買氣縮手!六都房貸件數大縮 1.6 萬件、新青安累計破 11 萬戶

作者 |發布日期 2025 年 06 月 17 日 16:33 | 分類 Big Data , 房地產 , 財經

房市迎來寒冬,住商機構根據聯徵中心資料統計,六都 2025 年第一季房貸件數較去年同期大減約 1.6 萬件,年減幅高達 36.3%,顯示買氣明顯萎縮,但新青安累計破 11 萬戶,不受銀行法天條限制,受理總金額突破 9,300 億元,其中台灣銀行響應政策最積極,受理件數逾 3 萬件。

繼續閱讀..

AI 摘要引爭議,維基百科喊停測試計畫

作者 |發布日期 2025 年 06 月 12 日 11:45 | 分類 AI 人工智慧 , 開放資料

在網路上,生成式人工智慧的應用越來越普遍,甚至連維基百科這個由志願者編輯維護的知識寶庫也開始嘗試導入 AI 技術。維基百科最近啟動了一項 AI 摘要的測試,為部分文章提供精簡的內容摘要,然而,這項計畫在編輯們的強烈反彈中被迫暫停。 繼續閱讀..

AI 訓練不靠「侵權」也能創新,最新研究推翻產業迷思

作者 |發布日期 2025 年 06 月 06 日 12:00 | 分類 AI 人工智慧 , OpenAI , 資訊安全

在人工智慧(AI)領域,許多公司聲稱其工具無法在不使用受版權保護的內容的情況下存在。然而,最近的一項研究顯示,這種說法並不完全正確。研究人員成功訓練了一個新的大型語言模型(LLM),該模型的資料集僅使用公共領域和開放授權的內容,雖然這個模型的效能不如當前的先進模型,但其道德性卻得到提升。 繼續閱讀..

防堵 AI「資訊污染」源頭,專家:人類原創內容是關鍵防線

作者 |發布日期 2025 年 06 月 05 日 13:45 | 分類 AI 人工智慧 , ChatGPT , 開放資料

隨著 ChatGPT 於 2022 年底的推出,網路上大量湧現 AI 產生的內容,導致人類原創內容變得越來越稀少。因此,許多研究者開始著手保存 2021 年及之前的人類生成內容,因為這些內容被視為數位世界的根基,能夠幫助 AI 模型更好地理解人類思維。根據 Cloudflare 的副總裁 Will Allen 的說法,這些早期的資料對於確保 AI 模型的準確性至關重要,尤其是在醫療、法律等專業領域。
繼續閱讀..

全台數據水庫最上游!純 AI 軟體股意藍資訊上櫃首日飆 68%

作者 |發布日期 2025 年 05 月 28 日 10:00 | 分類 AI 人工智慧 , Big Data , 證券

意藍資訊今日以每股承銷價 45.8 元掛牌上櫃,盤中最高一度來到 77 元,漲幅 68%,首日上演蜜月行情,意藍資訊擁有台灣規模最大的數據設施,每日處理高達 60~70 億字語料,被譽為台灣「數據水庫的最上游」,更是全台最純的 AI 軟體股。

繼續閱讀..

川普解僱版權局局長掀爭議:為保馬斯克?AI 訓練合法性引發關注

作者 |發布日期 2025 年 05 月 12 日 12:30 | 分類 AI 人工智慧 , 開放資料

美國總統唐納·川普(Donald Trump)最近解僱了美國版權局局長希拉·佩爾穆特(Shira Perlmutter),此舉引發了廣泛的關注和爭議。佩爾穆特的解僱與版權局最近發布的一份報告有關,該報告探討了人工智慧(AI)訓練中使用版權材料的合法性。根據報導,佩爾穆特在拒絕支持伊隆·馬斯克(Elon Musk)獲取大量版權作品以訓練AI模型的請求後被解僱,這一行動被民主黨代表喬·莫雷爾(Joe Morelle)形容為「前所未有的權力擴張,毫無法律依據」。 繼續閱讀..

GitHub 烏龍事件:中國 IP 意外遭封鎖 19 小時,官方緊急修復

作者 |發布日期 2025 年 04 月 16 日 7:40 | 分類 中國觀察 , 社群 , 網通設備

原始碼託管平台 GitHub 13 日因設定錯誤,意外禁止所有中國 IP 地址瀏覽 GitHub。未登入用戶無法瀏覽網站,僅已登入用戶可正常使用。事件自 2025 年 4 月 13 日凌晨 4 時 1 分至晚上 10 時 55 分,持續約 19 小時。GitHub 最終修復錯誤,中國 IP 用戶可正常瀏覽 GitHub,事件告一段落。

繼續閱讀..

專家:開源 AI 模型或成軍事應用的更佳選擇

作者 |發布日期 2025 年 03 月 21 日 12:00 | 分類 AI 人工智慧 , 軍事科技 , 開放資料

最近舉行的新加坡國防高峰會,專家指開源人工智慧(AI)模型可能對軍事應用更安全。專家強調,當開源程式碼共享,整個 AI 社群能一起努力,使模型更安全堅固,引發對開源於軍事領域應用的廣泛討論,專家認為這種方式不僅增加透明度,還能促進創新和合作。 繼續閱讀..

數發部擬推新法,打造台灣主權 AI 訓練語料資料庫

作者 |發布日期 2025 年 02 月 11 日 14:47 | 分類 AI 人工智慧 , Big Data , 科技政策

台版 ChatGPT、國科會可信任 AI 對話引擎 TAIDE 礙於資料量太少,早就停止更新。為促進開放資料運用,數發部官員表示,正研擬促進資料創新利用發展條例草案,並規劃打造台灣主權 AI 訓練語料資料庫,希望滿足 TAIDE 訓練需求。 繼續閱讀..