來源:大數(shù)據(jù)文摘 時(shí)間:2017-09-11 11:44:20 作者:Catherine Lu
在AI型公司的混戰(zhàn)中,我們已看到了數(shù)不勝數(shù)的公司相繼倒下。在剩下的AI巨頭和后起之秀中,哪類公司又能成為最終的贏家呢?
從Element AI,Databricks到DigitalGenius,AI型公司鋪天蓋地席卷而來。各類公司分化出了不同的特性,也選擇了不同的戰(zhàn)略發(fā)展方向。
在他們中,我們能夠看到為客戶提供定制解決方案的“數(shù)據(jù)科學(xué)咨詢公司”,為AI解決方案提供底層基礎(chǔ)構(gòu)架的“AI平臺(tái)公司”,以及通過產(chǎn)品化解決方案解決某個(gè)特定商業(yè)問題的“垂直整合AI公司”。
在我看來,能夠突破這一三足鼎立的局面笑到最后的,應(yīng)當(dāng)是垂直整合AI公司。
為什么這么說呢?
首先讓我們從這三類公司的定位講起。
數(shù)據(jù)科學(xué)咨詢公司:產(chǎn)品化程度低
AI平臺(tái)公司:產(chǎn)品化程度高,解決方法針對(duì)用例數(shù)多
垂直整合AI公司:產(chǎn)品化程度高,解決方法針對(duì)用例數(shù)少
圖片縱軸:(下)定制;(上)產(chǎn)品化
圖片橫軸:(左) 單個(gè)用例;(右)多個(gè)用例
圖片內(nèi)容:(左上)垂直整合AI公司; (右上)AI平臺(tái)公司;(下)數(shù)據(jù)科學(xué)咨詢公司
任何一類公司都有自己的優(yōu)勢(shì)和劣勢(shì)。任何一個(gè)類別中也都有最優(yōu)秀的公司。但是我認(rèn)為最成功的公司會(huì)集中在垂直整合AI公司中。讓我們一個(gè)個(gè)來分析看。
數(shù)據(jù)科學(xué)咨詢公司
數(shù)據(jù)科學(xué)咨詢公司的產(chǎn)品化程度較低。由于AI模型極其依賴于客戶提供的數(shù)據(jù),這類公司的主要優(yōu)勢(shì)在于他們更容易交付給客戶更好的結(jié)果。這類公司的劣勢(shì)在于不能很快的規(guī)?;?。如果公司期望迅速增長(zhǎng),他們應(yīng)該設(shè)法向其他類別的方向發(fā)展。
現(xiàn)在這類公司的數(shù)量越來越多。很多公司甚至并沒有意識(shí)到他們已陷入了這個(gè)類別——直到他們發(fā)現(xiàn)公司規(guī)?;霈F(xiàn)困難或者很難找到可以重復(fù)的用例。這些公司也許有獨(dú)一無二的技術(shù),可以獲得很多客戶,甚至有別的公司愿意高價(jià)收購(gòu)。但是,要想發(fā)展超出一定的規(guī)模,他們一定要“成長(zhǎng)”,并且把解決方案產(chǎn)品化。AI解決方案產(chǎn)品化是極其困難的,有兩個(gè)主要原因。首先,如上文所述,很多AI產(chǎn)品極其依賴數(shù)據(jù),而每個(gè)客戶提供的數(shù)據(jù)各不相同。更進(jìn)一步說,客戶的確切需求也有很大差別。
Element AI是一家典型的數(shù)據(jù)科學(xué)咨詢公司,這家公司今年夏初拿到了高達(dá)1億200萬美元的A輪投資 。但目前為止,這家公司還沒有一個(gè)具體的產(chǎn)品或者解決方法。他們的“解決方法組合”網(wǎng)頁(yè)列出了15條不用的用例; “解決方法” 網(wǎng)頁(yè)介紹說他們“構(gòu)建易于整合入現(xiàn)有流程的定制應(yīng)用程序”。基于他們獲得的大量投資,Element AI未來應(yīng)該會(huì)有所“成長(zhǎng)”,并將他們的AI解決方案產(chǎn)品化。
產(chǎn)品化究竟是什么意思?如果一個(gè)解決方法可以多次安裝,過程中幾乎不需要定制,就可以說這個(gè)解決方法已經(jīng)產(chǎn)品化了。產(chǎn)品化可以讓公司收入增長(zhǎng)速度遠(yuǎn)超成本增長(zhǎng)速度。相反的,一個(gè)咨詢公司雇傭的員工數(shù)量與公司同期的業(yè)務(wù)數(shù)量是大致成正比的。
幸運(yùn)的是,對(duì)于Element Al和與其類似的公司而言,他們不需要做到完全產(chǎn)品化(即解決方案安裝時(shí)完全不用定制)。舉個(gè)例子,某AI公司決定要在產(chǎn)品化上投入工程師人力資源,目標(biāo)是解決方案每次安裝時(shí)定制成本降低80%。與達(dá)到完全產(chǎn)品化相比,完成80%的目標(biāo)可能只需要20%的人力資源。剩下20%的解決費(fèi)用可以作為合理的一次性安裝費(fèi)用轉(zhuǎn)嫁給客戶。因此,實(shí)現(xiàn)80%產(chǎn)品化的目標(biāo)或許足以達(dá)到產(chǎn)品規(guī)模化的目的。
圖表橫軸:工程師人力;總軸:產(chǎn)品化
產(chǎn)品化還有其他好處。產(chǎn)品化可以給其他新入行的公司設(shè)置障礙。在其他新公司努力解決規(guī)?;瘑栴}的時(shí)候,本公司可以更快的整合,技術(shù)團(tuán)隊(duì)也可以把工作重心投入到開發(fā)公司的核心知識(shí)產(chǎn)權(quán)上。
AI平臺(tái)公司
AI平臺(tái)公司提供底層基礎(chǔ)構(gòu)架,而具體的AI解決方案可以在上面運(yùn)行。AI平臺(tái)允許終端客戶導(dǎo)入數(shù)據(jù),清理和變換數(shù)據(jù),訓(xùn)練模型和驗(yàn)證模型。AI平臺(tái)公司的例子包括H2O.ai公司, Skytree公司, 和 (最近轉(zhuǎn)型的) Databricks公司。
這類公司有不少獨(dú)特的優(yōu)勢(shì)。首先,他們面向的市場(chǎng)巨大。任何企圖擴(kuò)充自己AI工具的公司都是他們的潛在客戶。除此之外,AI平臺(tái)公司產(chǎn)品化程度高,因?yàn)槠脚_(tái)僅僅基于底層運(yùn)算構(gòu)架,操作系統(tǒng),和支撐硬件。最后,他們有一個(gè)產(chǎn)品粘性優(yōu)勢(shì),意思是一旦某個(gè)公司依賴這個(gè)平臺(tái),該公司就很難離開這個(gè)平臺(tái)了。
但是,大多數(shù)AI平臺(tái)公司的生存空間也受到威脅:
開源AI項(xiàng)目數(shù)量和質(zhì)量增長(zhǎng)
會(huì)使用這些開源項(xiàng)目的程序員數(shù)量增長(zhǎng)
近年來,開源項(xiàng)目在質(zhì)量和可選性上取得了令人震驚的進(jìn)步。谷歌TensorFlow庫(kù)最初僅專注于深度學(xué)習(xí),現(xiàn)在其覆蓋范圍已經(jīng)拓展到訓(xùn)練、測(cè)試和機(jī)器學(xué)習(xí)模型維護(hù)等領(lǐng)域,并獲得了廣泛認(rèn)可。TensorFlow一方面能夠輕松訓(xùn)練出好用的模型,另一方面還能夠憑借各種特性將模型應(yīng)用到生產(chǎn)環(huán)境中(比如TensorFlow Serving)。此外,眾多其他公司和個(gè)人的貢獻(xiàn)也是開源環(huán)境發(fā)展的一大助力。雅虎旗下的一個(gè)開源項(xiàng)目就在Apache Spark上運(yùn)行TensorFlow。臉書此前已經(jīng)開放了其內(nèi)部AI平臺(tái)FBLearner Flow的代碼,對(duì)開源機(jī)器學(xué)習(xí)庫(kù)Torch也貢獻(xiàn)良多。開發(fā)者David Cournapeau 于2007年創(chuàng)立的Scikit-learn也是大熱的AI庫(kù)之一,目前平臺(tái)貢獻(xiàn)者數(shù)量已超過900名。
越來越多的程序猿能夠得心應(yīng)手地使用這些開源工具。供給在需求的刺激下不斷攀升,而未來五年,數(shù)據(jù)科學(xué)相關(guān)崗位需求量預(yù)計(jì)將增長(zhǎng)15%。此外,新一代數(shù)據(jù)科學(xué)家相比“前輩”分析人員也刷新了不少技能點(diǎn):前者能夠熟練運(yùn)用數(shù)據(jù)科學(xué)課程中涉及的標(biāo)準(zhǔn)化開源AI工具,而后者主要是通過SAS、Excel、Alteryx和MATLAB等封閉式平臺(tái)來學(xué)習(xí)數(shù)據(jù)操作和建模。
在上述兩大趨勢(shì)的推動(dòng)下,大多數(shù)企業(yè)都會(huì)投向開源工具的懷抱,有些還會(huì)聘請(qǐng)咨詢顧問來協(xié)助工具的具體落實(shí);而真正的AI平臺(tái)公司可以施展拳腳的余地也就所剩無幾了。
AI平臺(tái)公司的日子并不好過,市場(chǎng)上已經(jīng)出現(xiàn)了這方面的跡象。H2O.ai在2016年9月裁員10%,力圖從“廣撒網(wǎng)”式銷售模式轉(zhuǎn)型為針對(duì)少數(shù)精選客戶的“深耕細(xì)作”。公司有可能沿著產(chǎn)品化軸線深入發(fā)展,推出的解決方案在定制化色彩更加濃厚的同時(shí)也能為公司帶來更大的訂單(銷售團(tuán)隊(duì)規(guī)模也更?。?。另一個(gè)比較常見的發(fā)展方向是專注某一個(gè)用例集,最終演變?yōu)榇怪盇I公司。
Databricks憑借其全球領(lǐng)先的Apache Spark專業(yè)知識(shí)和人才,有可能打造出無與倫比的AI平臺(tái)。舉例來說,他們可能會(huì)專為推動(dòng)AI而對(duì)Spark進(jìn)行重大改進(jìn),而這正是其他公司很難復(fù)制的。在與開源解決方案難分伯仲的情況下,Databricks的競(jìng)爭(zhēng)對(duì)手就會(huì)變成采用開源解決方案的內(nèi)部團(tuán)隊(duì)和其他公司(比如IBM的Data Science Experience就推出了在Spark上運(yùn)行的Jupyter筆記本電腦)。換個(gè)思路,Databricks也可能專攻垂直AI解決方案,并將之作為主要收入來源。
垂直AI 公司
垂直AI 公司通過產(chǎn)品化的解決方案解決某一個(gè)或一系列的商業(yè)問題,幫助他們的企業(yè)客戶借助AI實(shí)現(xiàn)進(jìn)一步提升,而無需企業(yè)在內(nèi)部構(gòu)建或維護(hù)模型。這類案例不勝枚舉,比如提供客戶支持服務(wù)的DigitalGenius,提供招聘服務(wù)的Entelo,提供網(wǎng)絡(luò)安全服務(wù)的Cylance,以及提供欺詐識(shí)別服務(wù)的DataVisor(我所在的公司)。
今年早些時(shí)候,Andrew Ng在《為什么AI是新電能》一文中也提到這一情況。在文中他這樣寫道:
正如電能為上個(gè)世紀(jì)帶來了翻天覆地的變化,幾乎沒有事物沒有被這一浪潮裹挾;如今我絞盡腦汁,也想不出幾年后還有什么行業(yè)是AI改變不了的。
AI的強(qiáng)化范圍不僅包括現(xiàn)有企業(yè)的核心技術(shù),支持運(yùn)營(yíng)也被納入到了羽翼之下,具體包括銷售、營(yíng)銷、客戶支持、內(nèi)部通信、金融等不一而足。然而上述領(lǐng)域并非核心IP,因此企業(yè)也不會(huì)煞有介事地將之列為AI解決方案的優(yōu)先改善對(duì)象,而是會(huì)采取購(gòu)買解決方案的方式。垂直AI公司的機(jī)遇正在此處。
因此,垂直AI企業(yè)能夠充分發(fā)揮產(chǎn)品化解決方案的作用來擴(kuò)大公司體量,卻無需頭疼困擾AI平臺(tái)企業(yè)的生存問題。然而相比AI平臺(tái)企業(yè),垂直AI企業(yè)的短板在于這塊市場(chǎng)蛋糕更小,同行競(jìng)爭(zhēng)也更加激烈。但如果包括Andrew Ng在內(nèi)的等人是正確的,這塊還在不斷變大的蛋糕還是能夠容納所有市場(chǎng)的垂直AI公司佼佼者的。也正基于這一點(diǎn),我認(rèn)為AI領(lǐng)域的大多數(shù)贏家都將是垂直AI公司。
當(dāng)然,并不是所有垂直AI公司都能笑到最后。贏家必須滿足三個(gè)主要條件。
首先,公司的解決方案必須能夠解決實(shí)際問題,并有強(qiáng)有力的成功案例作為背書。確實(shí)有一些垂直AI公司靠一些酷炫名詞來唬人,然而他們的解決方案事實(shí)上根本無法發(fā)揮AI的作用。對(duì)于那些掛羊頭賣狗肉的AI公司來說,他們的問題在于憑借三寸不爛之舌,把那些差強(qiáng)人意的解決方案賣給不太懂技術(shù)的消費(fèi)者。
其次,公司的解決方案不論是現(xiàn)在還是未來,都切忌與公司內(nèi)部團(tuán)隊(duì)競(jìng)爭(zhēng)。如果公司的內(nèi)部團(tuán)隊(duì)已經(jīng)在著手解決這個(gè)問題了,那么想要把你的AI解決方案再賣給他們簡(jiǎn)直比登天還難。進(jìn)一步來看,把AI解決方案賣給想要內(nèi)部消化這個(gè)問題的公司具有長(zhǎng)期性風(fēng)險(xiǎn),可能會(huì)導(dǎo)致教會(huì)徒弟、餓死師傅的局面發(fā)生,最終還是由公司內(nèi)部團(tuán)隊(duì)取代你的解決方案。
第三,整合工作應(yīng)控制在合理范圍內(nèi)?!?/strong>合理”的定義取決于解決方案的投資回報(bào)率以及終端客戶的身份。有些客戶認(rèn)為“合理的”整合時(shí)間是一天,而其他人會(huì)認(rèn)為如果投資回報(bào)率很高的話,一年也是合理的。如果不存在重大的制約因素,那么解決方案的整合工作就不是什么大事;如果解決方案依賴于客戶數(shù)據(jù)或基礎(chǔ)框架,那么就必須嚴(yán)肅認(rèn)真地加以考慮。
展望未來
即使是現(xiàn)如今,AI在各個(gè)領(lǐng)域的參與程度也已經(jīng)遠(yuǎn)超我們的認(rèn)知。Netflix的電影推薦、亞馬遜的Alexa以及信用卡詐騙警示等只是數(shù)百萬消費(fèi)者接觸AI的冰山一角。展望未來10年,隨著人們破譯了創(chuàng)立或發(fā)展為AI公司的密碼,AI解決方案所帶來的種種利好將加速鋪展在人們面前。
有朝一日,當(dāng)所有公司都完成了AI化,“AI公司”這一說法也將不復(fù)存在。
作者 |Catherine Lu
編譯 | 元元,白丁,笪潔瓊,錢天培
責(zé)任編輯:陳近梅