2014 台灣資料科學愛好者年會-獨家專訪 Gogolook 執行長郭建甫

作者 | 發布日期 2014 年 09 月 02 日 13:39 | 分類 Big Data , 科技教育 , 網路
14090201-02

甫落幕的 2014 台灣資料科學愛好者年會,吸引全台對資料處理、Big Data 有興趣的人,在 8/30~8/31 兩天齊聚中研院人文社會科學館國際會議廳,一起聆聽資料科學家第一手的資料分析經驗,主辦單位也特別安排資料分析上手課程,以 R 語言帶領新手進入資料科學領域。



第二天的講者為 Gogolook(公司中文名為「走著瞧」)的執行長郭建甫與資料科學家高義銘,Gogolook 被視為台灣近幾年最成功的創業計畫,旗下來電辨識 App「Whoscall」,以能夠有效防制騷擾、惡意詐騙電話、騷擾簡訊功能而聞名,在 2013 年底的下載率就已突破 600 萬次,並獲 LINE 的母公司「NAVER」青睞,以 5.29 億收購。

在 8/31 的演講中,郭建甫與高義銘暢談 Whoscall 如何從一開始的創業發想,到成為現在大家所看到的模樣,他們以深入淺出、又略帶鄉民口吻的方式,將 Whoscall 的整個發展過程,與數據處理時所使用的概念與統計方法,大方公開給在場的聽眾,有興趣的讀者可以參考已釋出的投影片。

 

▲ 資料科學在 Whoscall 產品體系中的角色 from 台灣資料科學愛好者年會

 

演講完後,《科技新報》有幸邀請執行長郭建甫與行銷總監楊立德接受專訪,從 WhosCall 談起,最後以台灣資料科學家在 Big Data 熱潮中應該有的技能與想法,呼應台灣資料科學愛好者年會所期待的:讓資料分析在台灣不再是口號,而是大家手邊隨時可用來解決問題及創造價值的工具

 

草創初期如何蒐集資料?

在使用者研究中有個方法叫綠野仙蹤法(Wizard of Oz,編按:採用幕後人工來模擬電腦系統人機介面的作法),如同電影《MIB 星際戰警》中的劇情般,有一台可以將信件分很快的機器,結果打開後裡面坐著一隻外星人。WhosCall 草創初期因使用者少,同樣利用工人智慧概念,先抓取全球所有的垃圾電話網站(Spam),接著標記(tag)這些電話號碼,等逐步累積夠多的活躍使用者,再將資料科學家的角色放入。

許多新事業在草創初期都必須有所突破,WhosCall 就是藉由網路的資訊,突破一開頭的瓶頸。除了抓取垃圾電話網站的資料,在台灣,一般人若被詐騙也會在網路上留下蛛絲馬跡,提醒其他人這支電話不要接,因此一開始我們將所有的網路使用者當作 WhosCall 的使用者,來標記電話,如此一來進入門檻就比較低,並可進一步達到足夠的資訊量,最後自然而然就會有資料科學分析。

14090201-04

萬事起頭難, WhosCall 成立時遇到最困難的事是什麼?

沒有人相信我們做 WhosCall 的價值在哪裡。一開始找錢很困難,當時很多人都不明白,一間專做防詐騙的軟體可以賺錢,但整個團隊目標很清楚──我們在做對使用者有用的事情,只是不知道怎麼賺錢,因此在募資方面進行的很辛苦,直到 Google 執行長 Eric Schmidt 訪台提到我們,才讓大眾開始關注 WhosCall。

但即使 Schmidt 點名我們,吸引很多創投來找我們談,卻仍然沒有資金進來,因為投資者還是看不懂為什麼要做防詐騙 App,也看不出有任何商業模式在,加上我們也表明不會跟任何電話中心、行銷公司合作,因此,最後資金來源仍然仰賴如資策會創投、國發基金等公家單位,沒有任何的私人資金挹注,直到 2013 年,LINE 的母公司 Naver 與 WhosCall 談妥 5.29 億收購金,才算是有穩定的資金來源。

如何吸引使用者持續回報資料?另外,一開始使用者回報錯字問題,之後怎麼改善?是以人工方式一個個確認嗎?

俗語說壞事傳千里,WhosCall 其實就是跟隨人性走。為什麼 WhosCall 可以在草創時靠著網路搜尋到的詐騙電話建立資料庫,因為大部分的人在接到類似電話時,不管是出自於抱怨或是提醒,會習慣上網分享。一開始 WhosCall 是把相關回報資訊放上去,但久而久之就發現用戶都很願意回報,因此只要提供入口,不需要加以引誘,使用者就會自動回報。把壞人揪出來的傾向是人的天性,而掌握人性永遠是成功的不二法則。

14090201-05

(圖片來源:WhosCall)

至於改進錯字的方法很多種,目前 WhosCall 使用投票方法,讓使用者從候選標記中選出最適當的,另外,WhosCall 也可以讓使用者看到其他人的票,所以雖然有些標記可能有錯字或不精確,但藉由投票,可讓回報狀態朝向更正確的意思。

有許多以在地為主的過濾服務是以人工確認,也做得很好,但 WhosCall 是以全球市場為格局,不可能每個市場都用人工來確認,例如 WhosCall 在阿拉伯語區很受歡迎、使用者很多,但 WhosCall 並沒有特別請一位會阿拉伯語的人進行標記確認,而是用群眾的力量進行修正。

有保險業、電話行銷公司或電信業者有跟你們接觸嗎?你們如何應付或建議?

最近有電信業者主動來與我們接觸,因為他們百思不得其解,為什麼接聽率越來越低,也拉不起來。電話中心的運作,主要是由機器每分鐘撥出一定數量的電話,再讓服務人員負責接聽。為了應付接聽率越來越低的情形,原本 1 分鐘打 100 通增加到 500 通,最後 1,000 通,但都不見起色。本來電信業者以為 WhosCall 影響力沒有那麼大,但後來發現台灣的 App 使用者有好幾百萬人,所以只要電話被一些使用者過濾與回報,之後標記速度會越來越快,再加上 WhosCall 使用的規則並非一般常見的,而是能貼近使用者的習慣,因此未來的電話行銷生態勢必得改變。

14090201-07

(圖片來源:TigerTel)

未來電話行銷不應該用這麼簡單的方法,應該針對目標客戶來著手。舉例來說想像某個情境,當電話行銷人員打給某個 60 歲以上的老人,WhosCall 接到這通電話時,上面就顯示為 XX 人壽、XX 保險,並將資訊列出來,如提供有關牙齒的保險,或是針對骨頭的保險,將事實講清楚,並在第一時間就將資訊呈現給用戶。

行銷公司也不應該用接聽率來評估整體情況,而是應該以使用者滿意度來評斷,必須將焦點放在「不適當的銷售上」,例如不應該在大中午打電話、不應該在 5~6 點下班時間打電話,還有什麼溝通方式較好。目前電話中心的解決方法是一直換電話,但全台灣的電話也沒有多少可以換,所以最恰當的方式,是整個電話中心或電話行銷公司的生態要改變,而 WhosCall 也正準備從這當中探討出新的模式。

演講中有提到「過去不知道怎麼用 Big Data 幫公司賺錢」,那現在的想法呢?

應該是說我不知道 Big Data 怎麼幫公司賺錢,但我知道 Big Data 怎麼滿足用戶的需求,只要能滿足用戶數的需求,使用者就會大增,只要消費者相信我們,最終我們將能找到對的決策方向。

Big Data 並不是告訴我們賺錢的方法,其實 WhosCall 從成立到現在,任何一個時間點都可以把資料賣給別人,但這無法真正幫到用戶,甚至會侵犯到使用者隱私。老實說 WhosCall 其實有競爭對手,像是印度、中國都有類似的 App,而且做的不錯,可是為什麼他們無法打進台灣、日本或韓國,原因是他們做的事情很像在賣資料,甚至毫不在意隱私權。相比之下,WhosCall 一開始就只取能幫助到使用者的資料,也只把資料應用到這些事情上。

14090201-08

(圖片來源:Nic McPhee CC BY 2.0)

WhosCall 也與新北市政府警局合作,由警察局提供即時警政訊息,再透過 WhosCall 內建的推播功能以及臉書粉絲團發布的方式,讓民眾接收到預警資訊。WhosCall 之所以會在兩三年間快速成長,完全是因為使用者信任我們。WhosCall 堅守對使用者的價值,這讓我們之後在建立商業模式時,是能夠創造獲利空間。

WhosCall 與 Line 結親後,下一步的規劃是甚麼?

即時通訊的市場很大,Line 的實力又很強,WhosCall 可藉由 Line 對全球快速的拓展,進軍到全世界,但 WhosCall 同時也要靠自己的力量,推到沒有 Line 的地方。

Big Data 怎麼改變你看事情的方法?

Big Data 幫助我把假設釐清,而且為這些假設找到更深層的價值。對於 Big Data 這個議題,我認為 「Big」是被炒作出來,其實還是在處理「Data」,而 Data 就是在探討直覺背後的邏輯。

當一通電話每次打出去都響一聲就掛斷,而且打給很多人,光想就覺得很有問題, Big Data 有辦法找到背後的脈絡,甚至能提供更高價值,告訴我們更多的事情,例如這樣的狀況只要發生在 3~5 個人身上,就可以做判斷。 Big Data 幫助我們將現實當中主觀又直覺的想法,以更精簡且具邏輯性的方式產出,有時候 Big Data 會讓我們看清事實是很簡潔的,就像 WhosCall 開始在做資料分析時,萃取了五六十個特徵,但最後發現只要十幾二十個就可以判斷。

14090201-06

(圖片來源:WhosCall)

有些專家學者預言,Big Data 最終的勝利者還是擁有資料的人,請問你怎麼看待這件事?

我的想法與他們類似,這也是 WhosCall 為什麼一定要蒐集自己的資料。若從 Google、Facebook、Amazon 等資料持有者那邊拿到資料,再做處理與分析,那我們還是跳脫不出「代工」的思維,仍得靠這些大客戶的臉色吃飯。此外最原始的資料其實非常醜,有很多雜訊與缺漏,而 Google、Facebook 內部真正在做資料分析的科學家,其實大部分都是資料「黑手」,也就是想辦法把資料變的乾淨簡潔,才能給下游的包商使用。

台灣由於市場規模的關係,缺少真正且龐大的原始資料,因此大部分的台灣資料科學家沒有處理過原始資料的經驗,而是將別人已整理好的資料套入模式,進行分析,這很可惜,因此建議有心想走資料科學領域的人,應該注重這方面的訓練。

14090201-06

對有相關資料分析經驗,又想創業的年輕人有什麼建議嗎?

雖然 Big 有點炒作過頭,但 Data 一定是未來的顯學,對於會資料分析的人,已經擁有這時代最有價值的能力,下一步就是想辦法學會 Coding,或找到一個 Coding 能力很強的同伴,另外要想辦法把靈光一現的想法、對資料價值的觀察建立成一個 App,不用侷限於只符合台灣人的需求,而是要把它放在全世界,更簡單的是將自己的想法快速建造出來,讓使用者告訴你甚麼地方需要他。

過去為什麼 Data 的價值無法展現出來,主要是因為成本太高,但現在每支手機都是個感測器,都可以從用戶中直接蒐集資料,例如有一個 App 叫「你那邊天氣如何?」就讓用戶回報當地的天氣資訊,只要你對資料有熟悉度,並且想到一個好的點子,就趕快做出 App 放到網路上,讓使用者回報資訊給你,並將這些數據再利用,回饋給使用者。總之最後還是老話一句:「Doing is the best plan!」
 

發表迴響