Google Clips 攝影機＋AI＝自動判斷有趣的錄影時機

最近幾年人工智慧技術大幅成長，許多應用也如雨後春筍冒出，能自動判斷錄影時機的 Google Clips 攝影機，就是在人工智慧與機械學習的協助下，讓演算法辨識鏡頭下的人、微笑、寵物、日落、地標等景色，但演算法如何進一步判斷攝影時機，仍是個艱困的挑戰。

透過真人評分

Google Clips 是款不需額外操作，就能自動判斷錄影時機的攝影機，設計理念有三大要點，首先開發團隊希望所有運算能在 Clips 完成，並保有長效電池續航力與降低攝影延遲，優點是不需上傳任何資料到伺服器，不但更能保障使用者隱私，也能在沒有網路連線的環境使用。

再者開發團隊規劃以拍攝短片為主，而非靜態照片，不但有助於記錄歡樂時光的氛圍，也能透過較長的影片彌補單張照片不易抓到完美時機的缺陷。最後，Clips 只專注透過內容的趣味性判斷錄影的起迄時間，並不考慮構圖、光線、色調等攝影技巧。

接下來的問題，就是如何訓練 Clips 演算法，讓它知道怎樣的場景有趣。如同一般機械學習，開發團隊著手建立數千部不同主題影片構成的資料庫，並讓攝影與影片剪輯專家評定影片優劣，讓演算法能以此衡量影片趣味的素材為何。然而這樣又會產生新的問題，那就是我們該如何將影片有系統、平順地 0~100 分中評分。

為了解決這個問題，開發團隊準備了第二套資料庫，他們將影片切割為許多片段，隨機挑選 2 片段，詢問受測者（人類）比較喜歡哪段。讓受測者以「2 選 1」評定，比直接為影片定分數容易許多，且受測者給予的答案也相當接近，當分析 1,000 支影片切出的 5,000 萬片段「2 選 1」數據後，就能透過計算方式得到整部影片（而非片段）的分數（對，數字沒錯。靠人類分析 5,000 萬筆片段是相當累人的工作）。