Airbnb 如何利用大數據幫使用者確定房租價格?

作者 | 發布日期 2016 年 05 月 15 日 0:00 | 分類 Big Data , 網路 , 電子商務 follow us in feedly

Airbnb 的數據科學團隊領導人 Riley Newman 在 nerds.airbnb.com 的部落格上寫道:「數據是一種行為或事件的紀錄,通常情況下它可以代表出人們所做出的決定。如果你可以重現一個人做出決定的過程,你就可以從中學到很多東西;這是從人們那裡知道他們喜歡或不喜歡什麼的不直接的辦法──這個特性比那個更吸引我,我發現這個功能很好用但是那些……沒有那麼好用。這樣的反饋可以成為做出有關社群成長、產品開發或資源最佳化的決定時,非常有價值的資訊來源。我們可以把來自客戶的資訊翻譯成一種更適合指引我們做出決定的語言。」



正是這種從使用者回饋中獲得資訊的洞察力,讓 Airbnb 得以將他們的精力集中在發展高峰期時熱門旅遊景點的房東數量上,並且為價格制定出明確的結構標準,使得他們能最大化程度利用他們全球化屬性而收集來的巨量數據。比如說,數據可以幫助 Airbnb 透過位置、出租時所在的時間段、床位的類型、交通的發達程度等數種變量,來決定一個房間或一間公寓的合適價格,Airbnb 現在可以利用演算法來幫助他們的客戶做到這些。

如果你考慮到這些房間都是真正的「家」,而不是旅館那種標準化的、可輕易用星級來評判好壞的房間,你就會發現要給出一個清晰的調價方式真的是件很有挑戰性的事。畢竟那些在城市公寓中比較會讓人滿意的條件(比如 Wi-Fi、便捷的交通),對於一間古典、精緻的小農舍可能就沒有那麼重要了(那裡的房客可能會更渴望平靜、浪漫的生活,而不是 Wi-Fi 覆蓋或地鐵直達)。

為了幫助房東們定價,Airbnb 開發了一套叫 「Aerosolve」的機器學習平台。這個平台會自動將城市劃分成無數個由微型街區組成的小區域,並分析房東們拍攝的房間照片(展示一個溫馨舒適的臥室會比展示一間時髦的客廳更加容易獲得青睞!)Aerosolve 還模仿酒店和航空公司的定價模式搭建了一套動態定價策略。

Airbnb 還開源了一個叫「Airpal」的平台:這是一個使用者友好型的數據分析平台,能允許公司的任何員工──而不是只有那些受過專業訓練的員工獲得和分析公司的數據訊息,並且使用 Airpal 提供的工具對其進行質詢。

 

應用的結果怎麼樣?

就像 Newman 說的那樣:「頗為諷刺的是,衡量一個數據科學團隊給公司帶來的影響反而是很難的,但是有一個明顯的訊號是:現在不管是技術人員還是非技術人 員,都一致的希望能參考更多數據來做出決定。」這種現象在 Airpal 裡得到了表現和證明。2014 年上線運行的 Airpal 系統至今已經被超過三分之一 的員工用來進行查詢和質疑。這個讓人印象深刻的數字表明了數據已經成為了 Airbnb 內部決定流程中非常重要的一環。

而 Airbnb 的不斷成長也是另一個他們對數據的明智使用產生了回報的側面體現。

 

有哪些數據被用上了?

被分析的數據主要是由格式化的和無固定格式的消息混合起來的內部資訊:屋主拍攝的房間照片、地理位置、居住條件(房間、床位的數量、Wi-Fi、熱水浴缸等),使用者反饋和評分、事物處理數據之類。也有一些外部數據會被考慮進去。比如英國的愛丁堡有一個非常有名的節日「愛丁堡國際藝術節(The Edinburgh Festival)」,在節日期間,同一條件的房間的定價會比一年中的其餘時段都要高一些。

 

可以說一些技術細節嗎?

Airbnb 目前手握將近 1500TB 的數據,像蜂巢一樣由 HDFS(Hadoop Distributed File System,一種用來管理大數據的文件系統)集群組織起來,託管在亞馬遜的 EC2(Elastic Compute Cloud)雲端服務中。Airbnb 曾經用亞馬遜的 RedShift 服務做為數據查詢工具,但後來換成了 Facebook 的 Presto。因為 Presto 是開源的,所以他們能及早的修復發現的漏洞並且附上相應的修補程式。

在未來,Airbnb 希望將數據處理的方式由現在的批量處理升級為即時處理,這能讓他們更快發現和處理支付過程中出現的異常現象,並且提升房源匹配和個性化資訊的準確度。

 

有什麼需要克服的困難嗎?

其實 Airbnb 的數據科學團隊面臨的一項巨大的挑戰,反而是跟上公司夢幻般的發展速度。在 2011 年早些時候,這個團隊僅由 3 名數據學家組成,因為那時候公司還很小,所以儘管只有 3 人,他們也能有足夠的精力來處理每個員工遇到的數據問題。但在那一年年底,Airbnb 就已經有了 10 個國際分公司,公司的人數有了巨大的增長,這也意味著數據團隊不可能再一對一的為公司的員工解決問題了。

就像 Newman 對此所說的那樣:「我們需要找到一個讓我們的工作變得更大眾、通俗的做法,不僅是侷限於一對一的指導和幫助,我們需要允許工作組、全公司甚至我們的整個社群都了解使用這些數據的辦法。」隨著更快速和可靠的技術的購入,這個想法成為了可能。他們還把搜尋查詢基礎數據的工作也從科學家們手中交給了整個公司的團隊們,在項目控制面板和 Airpal 提供工具的幫助下,這些數據讓 Airbnb 的團隊如虎添翼。並且由於數據科學家們從這些繁瑣的一對一工作中解脫了出來,他們可以將精力集中在一些更酷、更有用的項目上。教會公司的團隊如何使用這些工具是幫助他們獲得對數據的洞察力的關鍵。

 

我們能從中學到什麼?

Airbnb 是一家對大數據的需求和應用隨著公司的擴張而成長的完美例子。我想,他們隨著公司成長而調整、轉換自己以適應新節奏的能力是他們賴以成功的關鍵和精髓。這點更突出了大數據的「非靜態」屬性,你的數據處理策略可能需要隨時變化來應對需求的改變。

而一個數據科學團隊能與公司內的所有團隊都配合的如此之好(即使他們不會再與每個員工面對面交流了),也是一件非常了不起的事。這不僅意味著數據團隊能保證一直對公司的商業目標保持最貼切的理解,也強調了公司保持基於數據決定方式的重要性。畢竟如果沒有人會依據它們來行動的話,你有再多的數據也沒有用。

(本文由 雷鋒網 授權轉載;首圖來源:cloudTech) 

關鍵字: , , , ,

發表迴響