在今天看見明天
熱門: 台積電 兆豐金 股市 00929 航運股
投資理財
保險稅制
產業時事
職場生活
今周大耳朵 Podcast
富足今周起
幸福熟齡
ESG永續台灣
專題報導
今選頻道
存股助理
今周學堂
訂購優惠
活動報名

獨家專訪 掌握50億筆資料的短租龍頭首席經濟學家 出租率增四倍 Airbnb大數據策略揭祕

獨家專訪  掌握50億筆資料的短租龍頭首席經濟學家 出租率增四倍  Airbnb大數據策略揭祕

黃煒軒

產業動態

攝影/蕭芃凱

1095期

2017-12-14 10:00

儘管在全球業務擴張風波不斷,但Airbnb的「價格媒合」功能,實為大數據的活用案例。在Airbnb團隊中,每十五位員工就有一位是資料科學家,他們如何把大數據變成企業基因?

「太有趣了!Airbnb就像個糖果店一樣,有源源不絕的驚喜等待發現!」 曾為哈佛大學商學院助理教授、現任Airbnb首席經濟學家暨資料科學團隊主管的彼得.柯爾斯(Peter Coles),在接受本刊專訪時笑著指出。

 

被《富比世》雜誌譽為「住房界的eBay」,二○○八年八月成立的Airbnb,與Uber並列為近年全球「共享經濟」的兩大典型代表。成立九年來,房源總數已超過四百萬,遍及全球一百九十一個國家、逾六萬五千個城市,數量之驚人,甚至超越全球前三大連鎖飯店業者房間總數。

 

累計至今,Airbnb已為全球帶來超過二.五億的旅遊人次。而在台灣,僅過去一年,其帶進的國際旅客即逾百萬,占整體入境旅客比率近十%,Airbnb為其股東、知名創投紅杉資本賺得的報酬,更是創下投資以來的新高紀錄,一舉超越Google和聊天服務WhatsApp。

 

然而,Airbnb驚人的成長動力,除了來自創辦人對房屋共用市場需求的獨到眼光外,另一個較鮮為人知的關鍵,則是來自其大數據團隊所扮演的角色。

 

分析數百萬房源 擷取三大「關鍵特徵」

 

Airbnb網站上逾四百萬的房源,每間各具特色,除了房間大小、地址、內部裝潢皆有相當的差異外,房客在接待、飲食或旅遊導覽方面亦有各自的需求,若再考慮季節性因素或各地特有的大型活動,其間排列組合將產生幾近「無窮」的數據。

 

要從這些巨量的數據洪流中提取有用資訊,在許多傳統企業眼中,光用想的就令人頭皮發麻。然而,Airbnb卻透過一套精緻的「數據工程」,將這一切化為可能。這也是吸引柯爾斯加入Airbnb的一大因素。

 

「在學術機構,想獲得能夠驗證假說的大量資料,往往需要十足的運氣;但在Airbnb,我卻可以輕易地獲取這些,而伴隨這些巨量資料的,是許多超酷、值得挖掘的有趣問題!」柯爾斯指出。

 

究竟如何做到?Airbnb數據團隊的第一步,是提取所謂的「關鍵特徵」,在公司演算法發展初期,團隊會先針對房間來源(以下稱房源)的相似性、資料的新舊程度和房源的位置進行分類。相似性的部分比如住房的類型(公寓或城堡)、房間可容納人數、形態(集體宿舍或私人房間)以及既有房客的評論等特徵。

 

此外,因為房源需求受到季節性因素影響很大,數據團隊因此先將相關性低的資料(例如今年前幾季的數據)排除,僅保留相關性最高的部分;考慮了季節性因素後,最終還有一個令Airbnb頭痛的問題:位置。

 

50億筆資料試算 為屋主找出最佳推薦價

 

有別於傳統旅館多成聚落型分布於各城市,Airbnb的房源遍布各處。許多城市的房價分布,除了與市中心的距離有所關聯外,亦與街區特性高度連動;也因此,Airbnb在數據分析初期,動用了許多製圖人員,將各城街區搭配房價,通過地理資訊的分析,如周圍的河流、公路和運輸線,畫出相應的「價格邊界」,再對房源進行分類。

 

經過逾五十億筆歷史資料分析試算後,一五年六月,Airbnb正式推出「價格提示」(price tips)功能。該功能即以前述分類機制作為基礎,進一步納入更多(數百個)房源參數及市場需求因子,並透過分類機器學習模型的方式,對系統進行訓練。

 

系統會記錄每一次房主的價格選擇,並將之與系統原先的建議價格比較,一旦有所偏離,即會透過動態演算在下一次調整。此外,團隊在一開始設定估價模型時,會先假設一些參數較為重要,也因此會給予其較高的權重,比如說地理條件比有沒有浴缸重要。然而,透過分析哪些價格提示獲得了成功,系統會回頭修正不同房源參數的權重,同時在必要的情況下添加新參數。

 

「若談到在近年大數據的發展下,Airbnb對全球做了什麼貢獻,『價格媒合』(matching)這一塊算是一個典範。」柯爾斯表示。而一旦採用公司的建議價格,根據Airbnb的分析,房主租出去的機率提升近四倍。

 

然而,在實務上,由技術人員藉由大量的數據累積及分析建模後所搭建的資料平台,卻常常會出現業務人員不知道如何使用的情況,亦即他們缺乏將巨量資料轉化為「價值」的能力,「這也是現在許多傳統企業在面對大數據浪潮下的困境。」東吳大學巨量資料管理學院助理教授鄭江宇指出。

 

Airbnb

▲點擊圖片放大

 

推公司資料透明共享 員工可調閱全球住宿數據

 

有別於傳統公司,Airbnb三位創辦人中有兩位是設計出身,公司又是依靠產品起家,對業務開發格外重視,此外,他們亦深刻體認到,Airbnb業務要能快速發展,「資料」必須扮演主力推手的角色。「大數據就是Airbnb的生命之血(lifeblood)。」Airbnb資料科學前總監紐曼(Riley Newman)曾如此比喻。

 

也因此,在創辦初期,除了在總部的資料科學部門有負責統整資料分析基礎架構的人員外,業務、公共政策等不同的垂直部門,也都會配置專屬的資料科學家,他們因此可針對不同部門需求,預先建立資料模型,或提供專屬的資料服務。目前Airbnb在全球約三千名員工中,資料科學家團隊就超過兩百人,相當於每十五位員工,就有一位資料科學家,充分顯示出Airbnb對數據驅動業務的高度重視。

 

另一方面,對「資料民主化」精神的堅持,更是Airbnb內部大數據發展成功的一大關鍵。Airbnb的非IT(資訊科技)部門員工,除了可透過各部門的「營運儀表板(Dashboard)」自行調閱公司在各城市的住宿預訂等相關數據,公司亦開發了一款名叫Superset的開放資料平台,使用者可用來執行複雜的運算及跨部門間快速地傳輸資料,並以顯而易懂的視覺化方式來呈現。「其他的我不敢說,但我們在這一塊的技術應用,已經可與臉書及Google並肩了。」柯爾斯自豪地說。

 

同時,在內部員工的培訓上,Airbnb亦不遺餘力,除了持續在「營運儀表板」等相關工具投入資源改善可用性外,公司內部亦成立了「數據大學」,從最初階的統計學、SQL(用來從資料庫讀取與儲存資料的電腦語言)到高等計量經濟模型、實驗設計及機器學習,提供一系列完整的「數據人才」養成課程。開辦僅一年多,已有接近半數的公司員工至少在該「大學」修習了一門課程。「不過,目前最多員工修習的仍是入門的初級統計學啦!」柯爾斯大笑。

 

最終,彷彿回應鄭江宇對台灣企業的憂慮般,「這麼多年來,我們已累積了許多資料,現在其實早已不缺數據,缺的是如何讓更多人能更容易地親近及使用數據,並從中產生出有益的洞察。」柯爾斯語帶提醒地表示。


彼得.柯爾斯(Peter Coles)
出生:1976年
現職:Airbnb首席經濟學家暨資料科學團隊主管
經歷:哈佛大學商學院助理教授、eBay全球策略及資料實驗室總監、經濟分析部門主管
學歷:史丹佛大學經濟學博士

延伸閱讀
把敵人變動能 Booking.com進逼Airbnb旅宿共享一哥地位
把敵人變動能 Booking.com進逼Airbnb旅宿共享一哥地位

2019-03-04

把家中空房間出租 Airbnb幫台灣房東年加薪12.7萬
把家中空房間出租 Airbnb幫台灣房東年加薪12.7萬

2017-12-12

也來談談Airbnb
也來談談Airbnb

2017-09-21

專訪未來學大師、《第三次工業革命》作者里夫金 Uber、Airbnb後  下一波共享經濟:能源
專訪未來學大師、《第三次工業革命》作者里夫金 Uber、Airbnb後 下一波共享經濟:能源

2017-06-01

全球民宿出租龍頭拚合法  做Uber做不到的事  Airbnb打江山 不能沒有的救援王
全球民宿出租龍頭拚合法 做Uber做不到的事 Airbnb打江山 不能沒有的救援王

2017-01-05