IBM 送給 AI 開發者的禮物:入門級 Watson 機器人

作者 | 發布日期 2016 年 12 月 23 日 8:30 | 分類 人工智慧 , 機器人 , 軟體、系統 follow us in feedly

兩個月前的 Watson 開發者大會上,IBM 發表了 TJBot──能組裝出紙板機器人的 DIY 工具組合。可不要因為傻萌、簡陋的外表小看它,它本質上是基於 Watson 的可編程 AI 。早在發表紙箱版本之前,遍布全球的開發者就已創造出雷射切割和 3D 列印的 TJBot:包括南非、肯亞、義大利、德國、瑞士、巴基斯坦、加拿大和香港。雷鋒網獲知,多個開發者團隊表示,有興趣與 IBM 合作,為 TJBot 設計新的使用場景:從用於機器人 / 認知課程的教學,到關懷老年人、開發談話代理的企業級解決方案。



雷鋒網配圖
雷鋒網配圖

IBM 發表的如何製作 TJBot、如何對它編程的指令集(被稱為「選單」),在 Instructables 線上開發者社群廣受好評。該計畫在社群主要頁面都有體現,並已收到 21,000 份用戶評論。TJBot 被各種層次的開發者所接受,從初學者到專家。大家用它來創建能學習、推理、與人自然互動的認知對象。

簡化設計──為開發者而開發

TJBot 計畫的初衷,是成為用戶體驗和試驗「具象化認知」的入門素材。「具象化認知」是指把 AI 技術植入到它已經在與之互動的裝置、物體、空間裡。如果這個過程夠簡單,用戶們會創造出什麼來呢?會產生什麼樣的設計思路?TJBot 幫助尋找這些問題的答案。做為大家都買得起的 DIY 工具,它把「具象化認知」的創新過程民主化。

雷鋒網配圖

為了這一目標, TJBot 計畫的一個指導原則是「簡單」。這在硬體零件和程式語言平台的選擇上得到體現。從最基本的原型機工具入手,IBM 測試了各種 LED、麥克風、揚聲器和伺服馬達;最後選擇出小巧、功能多樣但又容易上手的模型。同樣地,控制這些感測器的軟體使用 Nodejs 編寫,它是一個用 JavaScript 開發軟體應用的開源、跨平台的執行環境。

藉助傳感器和 Watson 達到多種功能:

做為原型機,TJBot 的技能正在不斷擴展:據雷鋒網所知,它現在已經能說話、進行語音辨識、揮手和跳舞。這些能力由它內建的感測器、以及一系列認知服務來完成。比如,TJBot 的說話功能由 Watson 文字到語音服務在軟體層面完成,然後透過揚聲器播放出來。同樣的, Watson 語音到文字服務,以及 TJBot 的麥克風,組合起來使它能進行語音辨識。這些技能可以被進一步組合,創造出新的應用場景,比如說創建虛擬代理或者數位助手。

新增加選單

雷鋒網配圖

目前,TJBot 在 Github 的工具庫包含 3 個基本「選單」:讓 TJBot 對簡單語音命令做出回應的代碼,分析推文的情緒並回覆,還有讓 TJBot 做為談話代理。社群的開發者們為它加入了兩個選單:TJWave 和 Swifty TJ。TJwave 很有趣,它展示給開發者如何控制 TJBot 的手臂。它還包含額外功能:讓 TJBot 隨音樂「起舞」:TJBot 會播放一段音樂文件,提取其中的節拍和峰值,然後隨之揮手。控制 TJBot 的小短手還能用來使語音互動更生動,以及模仿人類說話時的手部動作。Swifty TJ 展示如何用 Swift 語言控制 TJBot 上的 LED。隨著 TJBot 的選單目錄不斷擴大,Swifty TJ 為 Swift 開發者給 TJBot 寫代碼提供了出發點。

下一步

2017 年,IBM 將專注於在 3 個領域提升 TJBot 開發、維護和學習。

  • 開發:IBM 會不斷對現有選單進行改進,同時探索紙板機器人的新技能。一個例子是:IBM 剛剛利用 TJBot 的鏡頭感測器(配合相關軟體應用)完成了它的視覺辨識能力。
  • 維護:發展並維護 TJBot 開發者社群,把 TJBot 介紹給新用戶,分享新選單、用戶難題和反饋。
  • 學習:或許,這是下一步最重要的事。這包含對開發者使用體驗、裝置用戶使用體驗的調查研究,以提供更好的設計思路和對認知應用的設計指導。

 

(本文由 雷鋒網 授權轉載;首圖來源:IBM) 

發表迴響