來源:數據觀 時間:2017-03-09 10:25:41 作者:大數據文摘
?Google于今早在舊金山舉行的Google Cloud Next會議上確認將收購數據科學競賽平臺Kaggle,但沒有公開收購條款細節(jié)。
?圖:2017年3月9日Kaggle社區(qū)最新排名
?這項收購并不出人意料。Kaggle在平臺上擁有50萬數據科學家,它將使Google能夠立即在AI社區(qū)中拓展其覆蓋范圍。隨著谷歌與亞馬遜在云計算領域的競爭難分伯仲,它將需要盡可能多的制勝點。
?這也將幫助谷歌在數據科學社區(qū)中更加扎實地確立其品牌——盡管得益于其像TensorFlow這樣的項目,它已經是主角之一。谷歌面臨著日益激烈的競爭,因為人工智能領域已經向自動駕駛和深度學習等垂直領域發(fā)展,公司不論大小都可以分到一杯羹。這從理論上可以將谷歌排除在最佳人工智能操作公司名單之外,雖然谷歌旗下的阿爾法狗剛剛戰(zhàn)勝圍棋世界冠軍。
?購買Kaggle及其在人工智能社區(qū)內的知名度也可能有助于招聘。Google需要確保它不斷吸收專門從事深度學習的最佳人才,與其他公司(例如Pinterest(專注于視覺搜索))競爭。即使并不是一個比較專業(yè)化的技術收購,收購也意味著谷歌正在擴大關注范圍,以探索更深入不同類別的方法,以確保其在人工智能的主導地位。
?據估計,Google會保證Kaggle繼續(xù)運營其服務—并保留其當前名稱。
?Kaggle由Goldbloom和Ben Hamner于2010年創(chuàng)立。企業(yè)和研究人員在Kaggle上發(fā)布數據,讓全世界的統(tǒng)計師和數據科學家對數據集進行建模和分析,以競賽的形式評選出最佳模型。Kaggle的眾包競賽模式的價值在于,讓人們有可能從無窮無盡的建模方法中,尋找到最優(yōu)解。作為一個舉辦數據科學和機器學習競賽的平臺,盡管早期有一些競爭對手,如DrivenData,TopCoder和HackerRank,Kaggle已經通過特別的市場定位,將它們遠遠甩在后面。它已經是數據科學和機器學習競賽領域當之無愧的大哥大。
?Kaggle也有一些與谷歌的“歷史淵源”,就在本月初,Google和Kaggle合作舉辦了一場價值100,000美元的機器學習競賽,圍繞YouTube視頻進行分類。這場比賽也與Google Cloud Platform進行了深入的整合。
?雖然谷歌的收購主要基于Kaggle所構建的社區(qū)、而不是其技術價值,Kaggle自身也針對數據科學競賽開發(fā)了不少有用的工具。數據科學家可以使用一個基于云的平臺Kaggle Kernels(曾經被稱為Scripts)運行數據分析和建模的代碼、將源代碼分享給他人以得到社區(qū)中的反饋意見,以及將源代碼展示在自己的Kaggle資料中。這樣,企業(yè)將非常容易看到Kaggle競賽中排名靠前的選手所做過的工作,這也是數據工作者競相爭取更高Kaggle排名的原因(當然,另一個原因是企業(yè)為最佳數據分析結果給出的巨額獎金!)。
?Kaggle的另一項服務是其網站上的招聘信息發(fā)布。目前還不知道谷歌將如何處理這項業(yè)務。
?圖:Kaggle招聘服務
?根據Crunchbase,Kaggle從2010年推出以來,籌集了1250萬美元(PitchBook說是1275萬美元)。Kaggle的投資者包括Index Ventures,SV Angel,Max Levchin,Naval Ravikant,Google首席經濟學家Hal Varian,Khosla Ventures和Yuri Milner。
?以下為Kaggle的 CEO,Anthony Goldbloom的演講內容:
?我很自豪和興奮地宣布,Kaggle準備加入谷歌云!
?七年前,我們發(fā)起了第一場競賽,以預測歐洲歌唱大賽的投票模式。Jure Zbontar贏了,他擊敗其它的21支隊伍,贏得1000美元的獎金。
?從那以來,Kaggle社區(qū)已經使用機器學習來為高中作文打分,診斷心力衰竭和提高希格斯玻色子發(fā)現的顯著性。 Geoff Hinton和George Dahl在默克競爭中展示了深層神經網絡的力量,Tianqi Chen使用Kaggle Kernels向XGBoost介紹了社區(qū)。 Kaggle的個人資料庫已經成為一項公認的認證證明,社區(qū)成員在這里完成從DeepMind到沃爾瑪公司的工作。去年8月,我們推出了一個開放的數據平臺,社區(qū)已經共享了數百個高質量的數據集。在Kaggle社區(qū),我們已經一起取得了很多重要進展!
?Kaggle的團隊將作為一個整體加入Google Cloud,并將保留Kaggle的獨特品牌。我們將繼續(xù)發(fā)展我們的競賽和開放數據平臺,繼續(xù)對所有數據科學家、公司、方法和技術開放。 Kaggle Kernels將繼續(xù)支持源自Google多樣化生態(tài)系統(tǒng)的機器學習庫和包,也會繼續(xù)支持那些并非源自Google的工具包。
?Kaggle加入Google將允許我們實現更多目標。它將世界上最大的數據科學社區(qū)與世界上最強大的機器學習云相結合。更令人振奮的是,這還能聯合ImageNet創(chuàng)作者李飛飛和李佳的力量。
?將Google云技術接入我們的社區(qū)后,我們將能夠接入強大的基礎架構、可擴展的培訓和部署服務,以及存儲和查詢大型數據集的能力。
?感謝所有人為建立我們超級棒的社區(qū)所付出的努力。我無比期待接下來能和你們一起實現更多。
?——Anthony Goldbloom, CEO
?編譯 | 姜范波,任杰,Sophie
責任編輯:陳近梅