來源:數(shù)乾坤編譯 時間:2024-04-10 14:48:31 作者:
近日,美國知名風(fēng)險投資機構(gòu)FirstMark發(fā)布了2024MAD(Machine learning, AI & Data) 生態(tài)系統(tǒng)全景圖(《機器學(xué)習(xí)、人工智能與數(shù)據(jù)全景》)。全景顯示,2024年機器學(xué)習(xí)、人工智能與數(shù)據(jù)行業(yè)生態(tài)中,共有2011家企業(yè)上榜,這一數(shù)字比去年的1416家有所上升,其中,有578家企業(yè)是新加入者。FirstMark指出,當(dāng)前數(shù)據(jù)已被大量數(shù)字化,可以使用現(xiàn)代化工具快速且廉價地存儲、處理和分析,最重要的是,它可以被輸入到性能更高的 ML/AI 模型中,這些模型可以理解、識別、分析,并基于它進行預(yù)測推算,甚至生成文本、代碼、圖像、聲音和視頻。
一、機器學(xué)習(xí)、人工智能與數(shù)據(jù)全景
FirstMark的分析文章指出,之所以有這么多企業(yè)涌入機器學(xué)習(xí)、人工智能與數(shù)據(jù)等賽道,是由于連續(xù)兩波大規(guī)模的公司創(chuàng)立和融資所致。
第一波是持續(xù)約10年的數(shù)據(jù)Infra周期,從大數(shù)據(jù)開始——以現(xiàn)代數(shù)據(jù)棧結(jié)束。人們期待已久的領(lǐng)域整合尚未真正發(fā)生,大多數(shù)的公司仍然存在。
第二波是ML/AI周期,這一周期是以GenAI的出現(xiàn)為標(biāo)志開始的。我們正處于這一周期的早期階段,大多數(shù)公司都非常年輕,因此在全景中包含了許多年輕的初創(chuàng)公司(相當(dāng)多的公司仍處于種子階段)。
兩次大浪潮+有限的整合=大量公司出現(xiàn)。
二、2024年值得深思的24個問題
FirstMark表示,人工智能領(lǐng)域的發(fā)展速度瞬息萬變,覆蓋面前所未有,帶來了24個值得關(guān)注和深思的問題。
1.結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)
這部分既是一個主題,也是 FirstMark 在對話中經(jīng)常提及的,以幫助解釋當(dāng)前的趨勢。簡而言之,不是所有數(shù)據(jù)都是相同的。大致而言,有兩大類數(shù)據(jù),圍繞每個家族,都出現(xiàn)了一套工具和用例。
結(jié)構(gòu)化數(shù)據(jù)管道:即可以適應(yīng)行和列的數(shù)據(jù)。
為了分析目的,數(shù)據(jù)從交易數(shù)據(jù)庫和 SaaS 工具中提取,存儲在云數(shù)據(jù)倉庫(如 Snowflake)中,進行轉(zhuǎn)換,并使用商業(yè)智能(BI)工具進行分析和可視化,主要用于理解現(xiàn)在和過去(所謂的“描述性分析”)。這一流程通常由下面討論的現(xiàn)代數(shù)據(jù)棧啟用,分析是核心用例。
此外,結(jié)構(gòu)化數(shù)據(jù)也可以“傳統(tǒng)”ML/AI 模型用于預(yù)測未來(預(yù)測性分析)——例如,哪些客戶最有可能流失。
非結(jié)構(gòu)化數(shù)據(jù)管道:即通常不適合行和列的數(shù)據(jù)世界,如文本、圖像、音頻和視頻。非結(jié)構(gòu)化數(shù)據(jù)主要是在 GenAI 模型(LLMs 等)中得到訓(xùn)練和使用(推理)。
這兩類數(shù)據(jù)(及相關(guān)工具和公司)目前的運氣和關(guān)注度大不相同。非結(jié)構(gòu)化數(shù)據(jù)(ML/AI)很熱門;結(jié)構(gòu)化數(shù)據(jù)(現(xiàn)代數(shù)據(jù)棧等)則不然。
2.現(xiàn)代數(shù)據(jù)堆棧已死?
大約在2019-2021年,軟件世界中沒有什么比現(xiàn)代數(shù)據(jù)棧(MDS)更吸引人的東西了。與“大數(shù)據(jù)”一樣,它是少數(shù)幾個從數(shù)據(jù)工程師跨越到更廣泛受眾(高管、記者、銀行家)的Infra概念之一?,F(xiàn)代數(shù)據(jù)棧基本上涵蓋了上面提到的那種結(jié)構(gòu)化數(shù)據(jù)管道。它圍繞著快速增長的云數(shù)據(jù)倉庫,與之相關(guān)的供應(yīng)商位于其上游(如Fivetran和Airbyte)、其頂部(DBT)和下游(Looker、Mode)。隨著 Snowflake 成為有史以來最大的軟件 IPO,對 MDS 的興趣爆炸性增長,伴隨著瘋狂的、ZIRP(零利率政策)驅(qū)動的公司創(chuàng)立和 VC 融資。
在一兩年內(nèi),整個類別變得過于擁擠——數(shù)據(jù)目錄、數(shù)據(jù)可觀察性、ETL、反向 ETL,僅舉幾例。現(xiàn)代數(shù)據(jù)棧不僅是解決實際問題的真正解決方案,也是一個營銷概念和一系列創(chuàng)業(yè)公司在數(shù)據(jù)價值鏈中形成的事實聯(lián)盟。
快進到今天,情況大為不同。2023 年,F(xiàn)irstMark 預(yù)覽了 MDS“壓力山大”,這種壓力在 2024 年只會繼續(xù)加劇。
MDS 面臨兩個關(guān)鍵問題:
組建現(xiàn)代數(shù)據(jù)棧需要將多個獨立供應(yīng)商的各種最佳解決方案拼湊在一起。結(jié)果是,從金錢、時間和資源的角度來看,這是一項昂貴的工作。在后 ZIRP 預(yù)算削減時代,財務(wù)官辦公室不會看好這一點。
MDS 不再是街區(qū)上的酷孩子。GenAI搶走了高管、VC和媒體的所有注意力——它需要上面提到的那種非結(jié)構(gòu)化數(shù)據(jù)管道。
3.數(shù)據(jù)基礎(chǔ)設(shè)施整合,規(guī)模不斷擴大
鑒于上述情況,2024年數(shù)據(jù)基礎(chǔ)設(shè)施和分析領(lǐng)域接下來會發(fā)生什么?它可能看起來像這樣:
現(xiàn)代數(shù)據(jù)堆棧及其周圍的許多初創(chuàng)公司將積極地重新定位為“人工智能基礎(chǔ)設(shè)施初創(chuàng)公司”,并試圖在現(xiàn)代人工智能堆棧中找到一席之地。這在某些情況下可行,但在大多數(shù)情況下,從結(jié)構(gòu)化數(shù)據(jù)到非結(jié)構(gòu)化數(shù)據(jù)可能需要根本性的產(chǎn)品演變。
數(shù)據(jù)基礎(chǔ)設(shè)施行業(yè)最終將出現(xiàn)一些整合。迄今為止,并購活動相當(dāng)有限,但2023年確實發(fā)生了一些收購,無論是插手還是中型收購,包括Stemma(被Teradata收購)、Manta(被IBM收購)、Mode(被Thoughtspot收購)等,將會有更多的創(chuàng)業(yè)失敗——隨著風(fēng)險投資資金的枯竭,事情會變得艱難。許多初創(chuàng)公司大幅削減了成本,但遲早他們的現(xiàn)金流將結(jié)束。不要指望看到華而不實的頭條新聞,不幸的是這將會發(fā)生。
該領(lǐng)域的較大公司,無論是規(guī)模擴大的公司還是上市公司,將加倍下注于其平臺戰(zhàn)略,并努力覆蓋更多功能。其中一部分將通過收購(因此整合)實現(xiàn),但很多也將通過自主開發(fā)實現(xiàn)。
4.檢查Databricks與Snowflake
說到該領(lǐng)域的大公司,讓我們來看看Snowflake 和 Databricks 這兩個關(guān)鍵數(shù)據(jù)基礎(chǔ)設(shè)施參與者之間的 “巨獸之爭”。
Snowflake(歷史上來自結(jié)構(gòu)化數(shù)據(jù)管道領(lǐng)域)仍然是一家令人難以置信的公司,也是估值最高的上市科技股之一(截至發(fā)稿時,EV/NTM 收入為 14.8 倍)。 然而,與許多軟件行業(yè)一樣,該公司的增長速度已大幅放緩--截至撰寫本文時,該公司 2024 財年的產(chǎn)品收入同比增長 38%,總計 26.7 億美元,預(yù)計 NTM rev 增長 22%)。 也許最重要的是,Snowflake 給人的印象是一家在產(chǎn)品方面面臨壓力的公司--它在擁抱人工智能方面一直比較緩慢,收購能力也相對較弱。最近有些突然的首席執(zhí)行官更迭是另一個有趣的數(shù)據(jù)點。
Databricks(歷史上來自非結(jié)構(gòu)化數(shù)據(jù)管道和機器學(xué)習(xí)領(lǐng)域)正經(jīng)歷著全面強勁的發(fā)展勢頭,據(jù)報道(因為它仍然是一家私營公司),24 財年的營收達到 16 億美元,增長率超過 50%。 重要的是,Databricks正在通過收購(最引人注目的是以 13 億美元收購了MosaicML)和自主產(chǎn)品開發(fā),成為生成式人工智能領(lǐng)域的重要參與者--首先是作為非結(jié)構(gòu)化數(shù)據(jù)的重要存儲庫,為LLMs提供數(shù)據(jù),同時也是模型的創(chuàng)建者,從Dolly到DBRX,這是公司在撰寫本文時剛剛宣布的一種新的生成式人工智能模型。
在Snowflake與 Databricks的競爭中,新的重大演變是 Microsoft Fabric的推出。它于2023年5月發(fā)布,是一個端到端、基于云的數(shù)據(jù)和分析SaaS平臺。它集成了大量微軟產(chǎn)品,包括OneLake(開放式湖泊庫)、PowerBI和Synapse Data Science,基本上涵蓋了從數(shù)據(jù)集成、工程到數(shù)據(jù)科學(xué)的所有數(shù)據(jù)和分析工作流。按照慣例,大公司發(fā)布產(chǎn)品時,宣布與實際產(chǎn)品之間會有一定的差距,但結(jié)合再加上微軟在生成式人工智能領(lǐng)域的大力推動,這可能會成為一個可怕的威脅(作為故事的另一個轉(zhuǎn)折點,Databricks很大程度上位于 Azure之上)。
5.2024年商業(yè)智能以及生成式人工智能是否能改變數(shù)據(jù)分析?
在現(xiàn)代數(shù)據(jù)棧和結(jié)構(gòu)化數(shù)據(jù)管道世界的所有部分中,商業(yè)智能是重塑時機最成熟的類別。我們在2019年的MAD中強調(diào)了商業(yè)智能行業(yè)是如何幾乎完全整合的,并在2021年的MAD中談到了度量存儲的出現(xiàn)。
商業(yè)智能/分析的轉(zhuǎn)型速度比我們預(yù)期的要慢。 該行業(yè)在很大程度上仍由微軟的PowerBI、Salesforce的Tableau和谷歌的Looker等老產(chǎn)品主導(dǎo),這些產(chǎn)品有時會在更廣泛的銷售合同中免費捆綁銷售。一些公司進行了整合(Thoughtspot 收購了Mode,Sisu被Snowflake悄然收購)。 一些年輕的公司正在采用創(chuàng)新的方法,無論是規(guī)模企業(yè)還是初創(chuàng)企業(yè),但它們一般都處于發(fā)展初期。
除了可能在數(shù)據(jù)提取和轉(zhuǎn)換方面發(fā)揮強大作用外,生成式人工智能還可能在數(shù)據(jù)分析的超級化和民主化方面產(chǎn)生深遠(yuǎn)影響。
這方面的活動確實很多。OpenAI 推出了 "代碼解釋器"(Code Interpreter),后來更名為 "高級數(shù)據(jù)分析"(Advanced Data Analysis)。微軟為 Excel 中的財務(wù)人員推出了 Copilot AI 聊天機器人。在云計算供應(yīng)商、Databricks、Snowflake、開源軟件和大量初創(chuàng)公司中,很多人正在開發(fā)或已經(jīng)發(fā)布了 "文本到 SQL "產(chǎn)品,以幫助使用自然語言在數(shù)據(jù)庫中運行查詢。
這種前景既令人興奮,又具有潛在的顛覆性。 數(shù)據(jù)分析的圣杯一直是它的民主化。 如果自然語言能夠成為筆記本、數(shù)據(jù)庫和商業(yè)智能工具的界面,那么將有更多的人能夠進行分析。
然而,商業(yè)智能行業(yè)的許多人對此持懷疑態(tài)度。 SQL 的精確性和理解查詢背后業(yè)務(wù)背景的細(xì)微差別被認(rèn)為是自動化的巨大障礙。
6.現(xiàn)代人工智能堆棧的崛起
到目前為止,我們討論的很多內(nèi)容都與結(jié)構(gòu)化數(shù)據(jù)管道世界有關(guān)。
如前所述,非結(jié)構(gòu)化數(shù)據(jù)基礎(chǔ)架構(gòu)的世界正在經(jīng)歷一個截然不同的時刻。 非結(jié)構(gòu)化數(shù)據(jù)為LLM提供了源源不斷的動力,而且對它的需求也非常旺盛。 每家正在試驗或部署生成式人工智能的公司都在重新發(fā)現(xiàn)一個老生常談的話題:"數(shù)據(jù)是新的石油"。 每個人都希望獲得LLM的能力,但要在自己的(企業(yè))數(shù)據(jù)上進行訓(xùn)練。
大大小小的公司紛紛抓住機會,為生成式人工智能提供基礎(chǔ)設(shè)施。
從Databricks到Scale AI(該公司將最初為自動駕駛汽車市場開發(fā)的標(biāo)簽基礎(chǔ)架構(gòu)發(fā)展為與OpenAI和其他公司合作的企業(yè)數(shù)據(jù)管道),再到Dataiku(該公司推出了LLM Mesh,使全球2000強企業(yè)能夠在多個LLM供應(yīng)商和模型之間無縫協(xié)作),幾家人工智能擴展公司都在積極發(fā)展自己的產(chǎn)品,以利用市場的發(fā)展勢頭。
與此同時,新一代人工智能基礎(chǔ)架構(gòu)初創(chuàng)企業(yè)也在多個領(lǐng)域嶄露頭角,其中包括:
矢量數(shù)據(jù)庫,以生成式人工智能模型可以使用的格式(矢量嵌入)存儲數(shù)據(jù)。 專業(yè)廠商(Pinecone、Weaviate、Chroma、Qudrant 等)在今年取得了豐碩成果,但一些現(xiàn)有數(shù)據(jù)庫廠商(MongoDB)也迅速做出反應(yīng),增加了矢量搜索功能。關(guān)于更長的上下文窗口是否會完全消除對矢量數(shù)據(jù)庫的需求,爭論也一直在進行,雙方都有自己的觀點。
框架(LlamaIndex、Langchain 等),用于連接和協(xié)調(diào)所有移動部件
護欄(Guardrails),位于 LLM 和用戶之間,確保模型提供的輸出符合組織規(guī)則。
評估器,幫助測試、分析和監(jiān)控生成式人工智能模型的性能,這是一個難題,對公共基準(zhǔn)的普遍不信任就證明了這一點。
路由器,幫助在不同模型之間實時引導(dǎo)用戶查詢,以優(yōu)化性能、成本和用戶體驗。
成本保護器,幫助監(jiān)控使用 LLM 的成本。
端點,有效的應(yīng)用程序接口,可抽象出底層基礎(chǔ)設(shè)施(如模型)的復(fù)雜性。
鑒于現(xiàn)代數(shù)據(jù)堆棧的歷史,我們一直在抵制使用“現(xiàn)代人工智能堆棧”這一術(shù)語。
但這一表述捕捉到了許多相似之處:許多初創(chuàng)公司都是當(dāng)時的“熱門公司”,就像之前的 MDS 公司一樣,它們往往成群結(jié)隊,結(jié)成營銷聯(lián)盟和產(chǎn)品合作關(guān)系。
而新一代的人工智能基礎(chǔ)架構(gòu)初創(chuàng)企業(yè)也將面臨一些與之前的MDS公司相同的挑戰(zhàn):這些類別中的任何一個都足以建立一家價值數(shù)十億美元的公司嗎?大公司(主要是云提供商,也包括 Databricks 和 Snowflake)最終會自己構(gòu)建哪一部分?
7.我們身處AI炒作周期的什么階段?
數(shù)十年間,人工智能就經(jīng)歷了寒冬和熱季。過去的10到12年間,是我們經(jīng)歷的第三個人工智能炒作周期:2013—2015年,深度學(xué)習(xí)在ImageNet 2012之后進入人們的視線;2017—2018年,聊天機器人熱潮和TensorFlow興起時,又經(jīng)歷了一個炒作周期;自 2022年11月以來,又經(jīng)歷了生成式人工智能(Generative AI)。
這一輪炒作尤為激烈,甚至讓人感覺像是人工智能泡沫,原因有很多:這項技術(shù)令人印象深刻;它非常有內(nèi)涵,能吸引科技圈以外的廣大受眾;對于手握大量干粉的風(fēng)險投資人來說,它是城里唯一的游戲,因為幾乎所有其他科技領(lǐng)域都不景氣。
炒作帶來了所有常見的好處——“沒有非理性的繁榮,就沒有偉大的成就”、“百花齊放”、“雄心勃勃的項目可以獲得大量資金”,當(dāng)然了也會出現(xiàn)其他不和諧的聲音——一夜之間人人都成了人工智能專家,每家初創(chuàng)公司都是人工智能初創(chuàng)公司,太多的人工智能會議/播客/新聞通訊......
所以,任何炒作周期的主要問題都會不可避免地反彈。
在這一市場階段,存在著相當(dāng)多的“怪異性”和風(fēng)險性:這一領(lǐng)域的標(biāo)桿公司有著非常不尋常的法律和治理結(jié)構(gòu);有很多“計算換股權(quán)”交易沒有得到充分理解或披露;很多頂級初創(chuàng)公司都是由人工智能研究人員團隊運營的;很多風(fēng)險投資交易讓人聯(lián)想到 ZIRP 時代: 對于非常年輕的公司而言,"土地掠奪"、大額融資和令人瞠目的估值都是如此。
當(dāng)然,人工智能的炒作已經(jīng)出現(xiàn)了裂痕,但我們?nèi)匀惶幵诿恐芏加行迈r事物讓人大開眼界的階段。據(jù)報道,沙特阿拉伯的400億美元人工智能基金等消息似乎表明,流入該領(lǐng)域的資金不會很快停止。
8.實驗與現(xiàn)實:2023年是虛假的一年嗎?
與上述相關(guān)——鑒于炒作,到目前為止有多少是真實的,而不僅僅是實驗性的?2023 年是充滿行動的一年:每個技術(shù)供應(yīng)商都急于將GenAI納入他們的產(chǎn)品供應(yīng);每個全球2000強公司的董事會都要求他們的團隊“攻堅AI”,并且一些企業(yè)的AI部署以創(chuàng)紀(jì)錄的速度發(fā)生,包括在Morgan Stanley和Citibank等受監(jiān)管行業(yè)的公司;當(dāng)然,消費者對 GenAI應(yīng)用也表現(xiàn)出極大的興趣。
因此,2023年是一個重大的勝利的一年:OpenAI 達到了20億美元的年收入率;Anthropic 以允許其預(yù)測2024年收入為8.5億美元的速度增長;團隊規(guī)模僅為40人的Midjourney在沒有投資的情況下收入增長到2億美元;Perplexity AI從0增長到每月1000萬活躍用戶……等等。我們應(yīng)該持懷疑態(tài)度嗎?
我們不禁擔(dān)憂:
在企業(yè)中,很多支出都用在了概念驗證或容易獲勝的項目上,通常都是從創(chuàng)新預(yù)算中支出的。
與解決實際業(yè)務(wù)問題相比,有多少是出于高管們不想顯得束手無策的考慮?
在消費領(lǐng)域,人工智能應(yīng)用的流失率很高。有多少是出于好奇?
無論是在個人生活還是職業(yè)生活中,許多人都表示不能完全確定如何使用新一代人工智能應(yīng)用程序和產(chǎn)品。
并非所有的人工智能產(chǎn)品,即使是那些由最優(yōu)秀的人工智能人才打造的產(chǎn)品,都會有神奇的效果:我們是否應(yīng)該把 Inflection AI在融資13億美元后迅速倒閉的決定視為一種承認(rèn),即世界不需要另一個人工智能聊天機器人,甚至不需要 LLM提供商?
9.LLM公司:也許并非如此商品化?
數(shù)十億的風(fēng)險投資和公司資金正在投資于基礎(chǔ)模型公司。因此,過去18個月中大家最關(guān)心的問題:我們是否正在目睹資本投入到最終商品化產(chǎn)品中的驚人燒錢?或者這些 LLM 提供商是新的 AWS、Azure和GCP?
一個令人不安的事實是,似乎沒有LLM正在構(gòu)建持久的性能優(yōu)勢。截至發(fā)稿,Claude 3 Sonnet 和 Gemini Pro 1.5 的性能優(yōu)于GPT-4,GPT-4的性能又優(yōu)于 Gemini 1.0 Ultra,如此等等——但這似乎每幾周就會改變。性能也可能波動——在某個時點,ChatGPT“失去理智”并“變得懶惰”,暫時地。
此外,開源模型(Llama 3、Mistra等以及DBRX等)在性能方面正在迅速追趕。另一方面,市場上的LLM提供商比最初看起來的要多。幾年前,普遍的說法是只能有一兩家 LLM公司,存在著贏者通吃的動態(tài),部分原因是全球只有少數(shù)人具備擴大Transformers的必要專業(yè)知識。
事實證明,能力超出最初預(yù)期的團隊更多。除了OpenAI 和Anthropic,還有一些初創(chuàng)公司在進行基礎(chǔ) AI 工作——Mistral、Cohere、Adept、AI21、Imbue、01.AI 等。然后當(dāng)然還有 Google、Meta 等團隊。話雖如此,到目前為止LLM 提供商似乎做得很好。
OpenAI和Anthropic 的收入以驚人的速度增長,也許 LLM模型確實會變得商品化,LLM公司仍然面臨著巨大的商業(yè)機會。他們已經(jīng)成為“全?!惫荆瑸槎鄠€受眾(消費者、企業(yè)、開發(fā)者)提供應(yīng)用程序和工具,除了底層模型外?;蛟S與云供應(yīng)商的類比確實相當(dāng)恰當(dāng)。AWS、Azure 和 GCP 通過應(yīng)用程序/工具層吸引并留住客戶,并通過大體上無差別的計算/存儲層進行貨幣化。
10.LLMs、SLMs 和混合未來
對于所有關(guān)于大型語言模型的興奮,過去幾個月的一個明確趨勢是小型語言模型(SLMs)的加速,例如 Meta 的 Llama-2-13b、Mistral的Mistral-7b 和 Mixtral 8x7b、Microsoft 的 Phi-2和Orca-2。
雖然LLMs正在變得越來越大(據(jù)報道 GPT-3 有 1750 億個參數(shù),GPT-4 有 1.7 萬億個參數(shù),世界正在等待更加龐大的 GPT-5),SLMs 成為許多用例的強大替代品,因為它們運營成本更低,更易于微調(diào),且通常提供強大的性能。
專門化模型的興起,針對特定任務(wù)(如編碼的 Code-Llama、Poolside AI)或行業(yè)(例如 Bloomberg 的財經(jīng)模型,或為材料科學(xué)建模的初創(chuàng)公司 Orbital Materials 等)的專用模型,也是加速的另一個趨勢。
正如我們在許多企業(yè)部署中已經(jīng)看到的,世界正在快速演變?yōu)榻Y(jié)合多個模型的混合架構(gòu)。
盡管價格已經(jīng)下降,但大型專有 LLMs 仍然非常昂貴,經(jīng)歷延遲問題,因此用戶/客戶將越來越多地部署模型的組合,大型和小型,商業(yè)和開源,通用和專用,以滿足他們的特定需求和成本約束。
11.傳統(tǒng) AI 是否已消失?
隨著 ChatGPT 的推出,有趣的事情發(fā)生了:到目前為止部署的大部分AI一夜之間被標(biāo)記為“傳統(tǒng) AI”,與“生成式AI”形成對比。這對許多到目前為止被認(rèn)為是從事前沿工作的AI從業(yè)者和公司來說有點震驚,因為“傳統(tǒng)”一詞明顯暗示了所有形式的AI都將被新事物徹底替代。實際情況要復(fù)雜得多。
傳統(tǒng)AI和GenAI最終非常互補,因為它們處理不同類型的數(shù)據(jù)和用例?,F(xiàn)在被標(biāo)記為“傳統(tǒng) AI”的東西,或偶爾被稱為“預(yù)測性AI”或“表格 AI”,也是現(xiàn)代AI(基于深度學(xué)習(xí))的一部分。然而,它通常專注于結(jié)構(gòu)化數(shù)據(jù),和諸如推薦、流失預(yù)測、價格優(yōu)化、庫存管理等問題。
"傳統(tǒng) AI" 在過去十年中經(jīng)歷了巨大的采用,并且已經(jīng)在全球成千上萬的公司中大規(guī)模生產(chǎn)部署。相比之下,GenAI主要操作非結(jié)構(gòu)化數(shù)據(jù)(文本、圖像、視頻等)。它在不同類別的問題(代碼生成、圖像生成、搜索等)上表現(xiàn)出色。
這里也是,未來是混合的:公司將使用LLMs處理某些任務(wù),預(yù)測模型處理其他任務(wù)。最重要的是,他們經(jīng)常將它們結(jié)合起來 LLMs可能不擅長提供精確的預(yù)測,比如流失預(yù)測,但你可以使用一個LLM調(diào)用另一個模型的輸出,后者專注于提供那個預(yù)測,反之亦然。
12.套殼和成為全棧的競爭
2023年,大家都喜歡使用“Thin Wrappers”這個貶義詞。如果你的核心能力是由別人的技術(shù)提供的,那么很難構(gòu)建持久的價值和差異化,這是爭論的要點。而且?guī)讉€月前有報告說,像Jasper這樣的初創(chuàng)公司在經(jīng)歷了流星般的收入上升后遇到了困難,似乎證實了這種思考方式。
有趣的問題是,隨著時間的推移,年輕初創(chuàng)公司構(gòu)建更多功能會發(fā)生什么?“ Thin Wrappers”是否會變成“Thick Wrappers”?2024年,似乎厚包裝有通過以下方式實現(xiàn)差異化的路徑:
專注于特定問題,通常是垂直的——因為任何太橫向的東西都有成為大科技“殺戮區(qū)”的風(fēng)險。
構(gòu)建針對該問題的工作流程、協(xié)作和深度集成。
在AI模型層面做大量工作——無論是用特定數(shù)據(jù)集微調(diào)模型還是創(chuàng)建針對其特定業(yè)務(wù)的混合系統(tǒng)(LLMs、SLMs 等)。換句話說,它們需要既狹窄又“全?!保☉?yīng)用程序和Infra)。
13.2024 年值得關(guān)注的有趣領(lǐng)域:AI 代理、邊緣 AI
過去一年圍繞 AI 代理概念的興奮頗多——基本上是智能系統(tǒng)的最后一英里,可以執(zhí)行任務(wù),通常以協(xié)作方式。這可以是從幫助預(yù)訂旅行(消費者用例)到自動運行完整的 SDR 活動(生產(chǎn)力用例)到 RPA 風(fēng)格的自動化(企業(yè)用例)等任何事情。AI 代理是自動化的圣杯 - 一個“文本到行動”的范例,其中 AI 為我們完成任務(wù)。每隔幾個月,AI 世界就會為類似代理的產(chǎn)品瘋狂,從去年的 BabyAGI 到最近的 Devin AI(一個“AI 軟件工程師”)。然而,總的來說,到目前為止,這種興奮大多是為時過早的。在涉及幾個模型的復(fù)雜系統(tǒng)可以一起工作并代表我們采取實際行動之前,還有很多工作要做,以使 GenAI 變得不那么脆弱且更可預(yù)測。還有一些缺失的組件——比如需要將更多記憶構(gòu)建進 AI 系統(tǒng)中。然而,預(yù)計在接下來的一兩年內(nèi),AI 代理將是一個特別令人興奮的領(lǐng)域。
另一個有趣的領(lǐng)域是邊緣 AI。盡管存在對大規(guī)模運行并作為端點提供的 LLMs 的巨大市場需求,但 AI 的一個圣杯是能夠在本地設(shè)備上運行的模型,不需要 GPUs,特別是手機,以及智能的 IoT 類設(shè)備。這個領(lǐng)域非?;钴S:Mixtral、Ollama、Llama.cpp、Llamafile、GPT4ALL(Nomic)。谷歌和蘋果也可能越來越活躍。
14.GenAI 是否正朝著 AGI 發(fā)展,還是走向平臺?
鑒于所有對 AI 的狂熱討論,以及似乎每周都有令人難以置信的新產(chǎn)品出現(xiàn)——但是否存在一個世界,在這個世界中,GenAI的進步放緩而不是一直加速到AGI?這意味著什么?
論點有兩方面:一是基礎(chǔ)模型是一項蠻力練習(xí),我們將耗盡資源(計算、數(shù)據(jù))來“喂養(yǎng)”它們。二是即使我們不耗盡,最終通往AGI的路徑是推理,而LLMs不具備這種能力。有趣的是,這與6年前行業(yè)的討論大致相同。
自 2018 年以來似乎發(fā)生的最大變化是投入到(日益能干的)模型中的大量數(shù)據(jù)和計算。在 AI 推理方面取得了多少進展,總體上來說還不太清楚——盡管 DeepMind 的 AlphaGeometry 程序似乎是一個重要的里程碑,因為它結(jié)合了語言模型和符號引擎,利用邏輯規(guī)則進行推理。距離任何形式的“耗盡計算或數(shù)據(jù)”有多近,是很難評估的。“耗盡計算”的前沿似乎每天都在被進一步推遲。
NVIDIA 最近宣布的 Blackwell GPU 系統(tǒng),公司表示它可以部署一個 27 萬億參數(shù)模型(相對于 GPT-4 的 1.7 萬億)。數(shù)據(jù)部分更為復(fù)雜——有一個更為戰(zhàn)術(shù)的問題,關(guān)于耗盡合法授權(quán)數(shù)據(jù),以及一個更廣泛的問題,關(guān)于總體上耗盡文本數(shù)據(jù)。
當(dāng)然,正在進行很多關(guān)于合成數(shù)據(jù)的工作。Yann LeCun 討論了如何將模型帶入下一個層次,可能需要它們能夠吸收更豐富的視頻輸入,這目前還不可能。對 GPT-5 的期待非常高。它比 GPT-4 好多少將被廣泛視為 AI 整體進步速度的風(fēng)向標(biāo)。從創(chuàng)業(yè)生態(tài)系統(tǒng)參與者(創(chuàng)始人、投資者)的狹窄視角來看,問題可能不那么重要,至少在中期內(nèi)——如果 GenAI 的進展明天達到漸近線,仍然有多年的商業(yè)機會,將當(dāng)前擁有的技術(shù)部署到各個垂直行業(yè)和用例中。
15.GPU戰(zhàn)爭
我們是否處于一個大周期的早期,計算成為世界上最寶貴的商品,還是在大規(guī)模生產(chǎn)GPU的過程中過度建設(shè),肯定會導(dǎo)致大崩潰?作為 GenAI 準(zhǔn)備的GPU的唯一游戲,NVIDIA 當(dāng)然正在享受它的時刻,股價五倍增長至 2.2 萬億美元估值,自 2022 年底以來總銷售額增長了三倍,圍繞其收益的巨大興奮以及 Jensen Huang 在GTC的活動可與 Taylor Swift 爭奪 2024 年最大事件。?
也許這部分也是因為它是風(fēng)險投資在 AI 中投資的數(shù)十億美元的最終受益者?不管怎樣,對于它作為公司的無可否認(rèn)的能力,NVIDIA的命運將與當(dāng)前淘金熱的可持續(xù)性有多大聯(lián)系。
硬件是困難的,準(zhǔn)確預(yù)測臺積電在臺灣需要生產(chǎn)多少 GPU 是一門艱難的藝術(shù)。此外,競爭對手正在盡力反應(yīng),從 AMD 到 Intel 到 Samsung;初創(chuàng)公司(如 Groq 或 Cerebras)正在加速,新的初創(chuàng)公司可能會形成,如 Sam Altman 傳聞中的 7 萬億美元芯片公司。一個包括谷歌、英特爾和高通在內(nèi)的科技公司聯(lián)盟正試圖攻擊 NVIDIA 的秘密武器:其 CUDA 軟件,該軟件使開發(fā)者綁定到 Nvidia 芯片。?
FirstMark 的看法:隨著 GPU 短缺的緩解,NVIDIA 可能會在短到中期內(nèi)面臨下行壓力,但長期來看,AI 芯片制造商的前景依然非常光明。
16.開源 AI:太多好東西了嗎?
大力支持開源 AI,顯然這在過去一年或者更長時間里一直是一個大趨勢。Meta 大力推動其 Llama 模型,法國的 Mistral 從爭議的焦點變成了 GenAI 的新星,谷歌發(fā)布了 Gemma,HuggingFace 繼續(xù)作為開源 AI 的活躍家園,托管了大量模型。GenAI 中一些最具創(chuàng)新性的工作已在開源社區(qū)完成。
然而,也存在一種普遍感覺,即開源社區(qū)正經(jīng)歷膨脹。現(xiàn)在有數(shù)以千計的開源 AI 模型可用。許多是玩具或周末項目。模型在排名中上升或下降,一些在短短幾天內(nèi)按 Github 星標(biāo)標(biāo)準(zhǔn)(雖然是一個有缺陷的指標(biāo),但仍然有用)經(jīng)歷了流星般的上升,但從未轉(zhuǎn)化為特別可用的東西。
市場將自我糾正,一小部分成功的開源項目將獲得云提供商和其他大科技公司的不成比例支持。但與此同時,當(dāng)前的爆炸性增長讓許多人感到眩暈。
17.AI 的實際成本是多少?
GenAI的經(jīng)濟學(xué)是一個快速發(fā)展的話題。不出所料,很多空間的未來都圍繞著它——例如,如果提供 AI 驅(qū)動的答案的成本顯著高于提供十個藍(lán)色鏈接的成本,能否真正挑戰(zhàn)谷歌在搜索方面?如果軟件公司真的由 AI 驅(qū)動,推理成本是否會侵蝕他們的毛利率??
好消息是,如果您是 AI 模型的客戶/用戶:似乎正處于價格方面的競爭到底階段的早期,這比人們可能預(yù)測的要快。一個關(guān)鍵驅(qū)動因素是開源 AI(如 Mistral 等)的并行興起和商業(yè)推理供應(yīng)商(如 Together AI、Anyscale、Replit)采用這些開放模型并將它們作為端點提供。
客戶幾乎沒有切換成本(除了處理不同模型產(chǎn)生不同結(jié)果的復(fù)雜性),這給 OpenAI 和 Anthropic 帶來了壓力。嵌入式模型成本顯著下降的一個例子是,多個供應(yīng)商(如 OpenAI、Together AI 等)同時降低了價格。從供應(yīng)商的角度來看,構(gòu)建和服務(wù) AI 的成本仍然非常高。
據(jù)報道,Anthropic 花費了其產(chǎn)生的收入的一半以上支付給像 AWS 和 GCP 這樣的云提供商來運行其 LLMs。還有與出版商簽訂許可協(xié)議的成本。另一方面,也許所有人作為生成性技術(shù)的用戶應(yīng)該享受由風(fēng)險投資資助的免費服務(wù)的爆炸。
18.大公司和 AI 的政治經(jīng)濟學(xué)變化:微軟是否已經(jīng)贏了?
這是每個人在 2022 年底首先問的問題之一,到了 2024 年這個問題更加突出:大科技公司會捕獲 GenAI 中的大部分價值嗎?AI 獎勵規(guī)?!嗟臄?shù)據(jù)、更多的計算、更多的 AI 研究人員往往會產(chǎn)生更大的力量。大科技公司對此非常清楚。與以往平臺轉(zhuǎn)換中的老牌公司不同,它們也對潛在的顛覆非常反應(yīng)敏捷。在大科技公司中,微軟似乎一直在玩 4D 國際象棋。
顯然有與 OpenAI 的關(guān)系,微軟最早在 2019 年對其進行了投資,并已經(jīng)向其投資了 130 億美元。但微軟也與開源競爭對手 Mistral 合作。它對 ChatGPT 的競爭對手 Inflection AI(Pi)進行了投資,只是最近以引人注目的方式將其收購。最終,所有這些合作似乎只會增加對微軟的云計算需求——Azure 的收入同比增長 24% 至 330 億美元,在 2024 年第二季度,Azure 云增長了 6 個百分點,歸功于 AI 服務(wù)。與此同時,谷歌和亞馬遜已經(jīng)與 OpenAI 的競爭對手 Anthropic 合作并投資(在撰寫本文時,亞馬遜剛剛承諾為該公司再投資 27.5 億美元,作為其計劃中的 40 億美元投資的第二部分)。
亞馬遜還與開源平臺 Hugging Face 合作。據(jù)報道,谷歌和蘋果正在討論在蘋果產(chǎn)品中整合 Gemini AI。Meta 可能通過全面推進開源 AI,正在以低成本打擊所有人。然后是中國發(fā)生的一切。顯而易見的問題是,初創(chuàng)公司有多少空間可以成長并成功。一批初創(chuàng)公司(主要是 OpenAI 和 Anthropic,可能很快就會加入 Mistral)似乎已經(jīng)通過正確的合作關(guān)系達到了脫離速度。對于許多其他初創(chuàng)公司,包括一些資金充足的公司,評判仍然在進行中。
是否應(yīng)該將 Inflection AI 讓自己被收購,以及 Stability AI 首席執(zhí)行官的問題,視為一群“二線” GenAI 初創(chuàng)公司在商業(yè)上取得成功更加困難的承認(rèn)?
19.對 OpenAI 的狂熱
OpenAI 繼續(xù)引起極大的興趣——860 億美元的估值,收入增長,宮廷陰謀,以及 Sam Altman 成為這一代的 Steve Jobs:一些有趣的問題:OpenAI 是否嘗試做太多了?在所有 11 月的戲劇之前,就有 OpenAI 開發(fā)日,在那里 OpenAI 明確表示它將在 AI 中做所有事情,無論是垂直(全棧)還是水平(跨用例):模型 + ?Infra ?+ 消費者搜索 + 企業(yè) + 分析 + 開發(fā)工具 + 市場等。
當(dāng)一家初創(chuàng)公司是大范式轉(zhuǎn)變中的早期領(lǐng)導(dǎo)者,并且事實上擁有無限的資本訪問權(quán)時,這并非前所未有的策略(Coinbase 在加密貨幣中有點這樣做)。但觀察這一點將會很有趣:雖然這肯定會簡化 MAD 風(fēng)景,但這將是一個巨大的執(zhí)行挑戰(zhàn),尤其是在競爭加劇的背景下。從 ChatGPT 的懶惰問題到其市場努力的表現(xiàn)不佳,表明 OpenAI 不受商業(yè)重力法則的免疫。?
OpenAI 和微軟會分手嗎?與微軟的關(guān)系令人著迷——顯然,微軟的支持對 OpenAI 在資源(包括計算)和分銷(企業(yè)中的 Azure)方面是巨大的助力,此舉在 GenAI 浪潮的早期被廣泛視為微軟的大師級舉動。同時,如上所述,微軟已經(jīng)明確表示它不依賴 OpenAI(擁有所有代碼、權(quán)重、數(shù)據(jù)),它已經(jīng)與競爭對手(例如 Mistral)合作,并且通過 Inflection AI 的收購增強了其 AI 研究團隊。?
與此同時,OpenAI 是否會繼續(xù)希望與微軟保持單一線程的合作關(guān)系,而不是部署在其他云上?鑒于 OpenAI 的巨大野心,和微軟對全球統(tǒng)治的目標(biāo),雙方何時會得出結(jié)論,他們更多是競爭對手而不是合作伙伴?
20.2024 年將是企業(yè)中 AI 的一年嗎?
如上所述,2023 年對企業(yè)來說感覺像是那些關(guān)鍵年份,每個人都急于擁抱新趨勢,但除了一些概念驗證之外,實際上并沒有太多事情發(fā)生。也許 GenAI 在 2023 年的最大贏家是像 Accenture 這樣的公司,據(jù)報道,它們通過 AI 咨詢產(chǎn)生了 20 億美元的費用。?
無論如何,人們希望 2024 年將成為企業(yè)中 AI 的大年——或者至少對 GenAI 來說,因為傳統(tǒng) AI 已經(jīng)在那里占有顯著的份額。但仍處于回答全球 2000 強公司面臨的一些關(guān)鍵問題的早期階段:
用例是什么?到目前為止,容易實現(xiàn)的用例主要是:一是為開發(fā)團隊的代碼生成副駕駛;二是企業(yè)知識管理(搜索、文本摘要、翻譯等);三是AI 客戶服務(wù)聊天機器人(一個先于 GenAI 的用例)。當(dāng)然還有其他(營銷、自動化 SDR 等),但還有很多需要弄清楚(副駕駛模式與全自動化等)。
應(yīng)該選擇哪些工具?如上所述,未來似乎是混合的,結(jié)合了商業(yè)供應(yīng)商和開源,大型和小型模型,橫向和垂直的 GenAI 工具。但從哪里開始?
誰將部署和維護這些工具?全球 2000 強公司中存在明顯的技能短缺。如果你認(rèn)為招聘軟件開發(fā)人員很難,那就試著招聘機器學(xué)習(xí)工程師吧。
如何確保它們不會產(chǎn)生幻覺?是的,正在進行大量的工作,圍繞 RAG 和防護欄以及評估等,但 GenAI 工具可能完全錯誤的可能性,以及實際上不了解 GenAI 模型如何工作的更廣泛問題,是企業(yè)中的大問題。
ROI 是什么?大型科技公司已經(jīng)在利用 GenAI 滿足自己的需求,并且它們展示了有趣的早期數(shù)據(jù)。在其財報電話會議中,Palo Alto Networks 提到大約減半了其 T&E 服務(wù)的成本,ServiceNow 提到增加了開發(fā)創(chuàng)新速度的 52%,但我們還處于理解企業(yè)中 GenAI 的成本/回報方程的早期階段。對于 GenAI 供應(yīng)商來說,好消息是企業(yè)客戶有足夠的興趣分配預(yù)算(重要的是,不再是“創(chuàng)新”預(yù)算,而是實際的 OpEx 預(yù)算,可能從其他地方重新分配)和資源來弄清楚。但可能談?wù)摰氖且粋€ 3-5 年的部署周期,而不是一年。
21.AI 是否會終結(jié) SaaS?
這是過去 12 個月的流行觀點之一。問題的一個版本是:AI 使編碼速度提高了 10 倍,因此,即使只有幾個普通開發(fā)人員,你也能夠創(chuàng)建一個定制的 SaaS 產(chǎn)品版本,滿足你的需求。當(dāng)你可以自己構(gòu)建時,為什么要支付大量資金給 SaaS 提供商呢?
另一個版本的問題是:未來是由一個 AI 智能(可能由幾個模型組成)運行你的整個公司,通過一系列代理。你不再購買 HR 軟件、財務(wù)軟件或銷售軟件,因為 AI 智能以完全自動化和無縫的方式完成了一切。
我們似乎還相距甚遠(yuǎn),這兩種趨勢實際上以任何成熟的方式發(fā)生,但正如我們都知道的,AI 的變化非???。
與此同時,未來的一個可能版本是 SaaS 產(chǎn)品將變得更加強大,因為 AI 將被構(gòu)建進每一個產(chǎn)品中。
22.AI 是否會終結(jié) VC?
AI 是否可以自動化風(fēng)險資本,無論是在公司選擇還是投資后增值方面,圍繞 AI 平臺轉(zhuǎn)變是否正確定位資產(chǎn)類別,存在一系列有趣的問題:
風(fēng)險資本是否太小?世界上的 OpenAIs 需要籌集數(shù)十億美元,并且可能需要籌集更多億美元。這些資金中的大部分是由大公司提供的,如微軟——很可能在很大程度上以計算換股權(quán)的形式。當(dāng)然,許多風(fēng)投已經(jīng)投資于大型基礎(chǔ)模型公司,但至少這些投資與傳統(tǒng)的 VC 軟件投資模式明顯不同。也許 AI 投資將需要超大型 VC 基金——在撰寫本文時,沙特阿拉伯似乎即將與美國 VC 公司合作啟動一個 400 億美元的 AI 基金。
風(fēng)險資本是否太大?如果你相信 AI 將提高我們的生產(chǎn)力 10 倍,包括超級編碼者和自動化的 SDR 代理以及自動化的營銷創(chuàng)造,那么我們即將見證一個由骨干團隊(或許只是一個獨行俠)運行的全自動化公司的誕生,理論上這些公司可以達到數(shù)億美元的收入并上市。
一個年收入達到 1 億美元的由獨行俠運營的公司在其旅程的任何時點是否需要風(fēng)險資本?
23.AI 是否會重振消費者市場?
自社交媒體和移動日子以來,消費者市場一直在尋找下一個動力。生成性 AI 很可能就是它。
一些有趣的領(lǐng)域(其中還有許多其他):
搜索:幾十年來第一次,谷歌的搜索壟斷出現(xiàn)了一些早期但可信的競爭者。少數(shù)初創(chuàng)公司如 Perplexity AI 和 You.com 正在引領(lǐng)從搜索引擎到答案引擎的演變。
AI 伴侶:超越反烏托邦的方面,如果每個人都擁有一個無限耐心且有幫助的伴侶,專注于滿足某人的特定需求,無論是知識、娛樂還是治療。
AI 硬件:Humane、Rabbit、VisionPro 是消費者硬件中令人興奮的新產(chǎn)品。
超個性化娛樂:隨著生成性 AI 工具變得更好(且更便宜),我們將發(fā)明什么新形式的娛樂和藝術(shù)?
24.AI 和區(qū)塊鏈:胡說八道還是令人興奮?
AI 和加密的交集看起來像是 X/Twitter 笑話的完美素材。然而,不可否認(rèn)的是,AI 正在變得集中在少數(shù)公司手中,這些公司擁有最多的計算能力、數(shù)據(jù)和 AI 人才——從大科技公司到著名的非開放 OpenAI。與此同時,區(qū)塊鏈的核心提議是啟用創(chuàng)建去中心化網(wǎng)絡(luò),允許參與者共享資源和資產(chǎn)。這里有豐富的探索空間,這是我們多年前開始探索的一個話題(演示)。
一些與 AI 相關(guān)的加密項目經(jīng)歷了顯著加速,包括 Bittensor*(去中心化機器智能平臺)、Render(去中心化 GPU 渲染平臺)、Arweave(去中心化數(shù)據(jù)平臺)。
雖然我們沒有在今年的 MAD 景觀中包括加密部分,但這是一個值得關(guān)注的有趣領(lǐng)域。
現(xiàn)在,像往常一樣,問題是加密行業(yè)是否能夠自助,而不是退化為數(shù)以百計的與 AI 相關(guān)的模因幣、抽水泵和傾銷計劃及騙局。
額外:我們在這里沒有討論的其他話題:
AI 會殺死我們所有人嗎?AI 末日論者與 AI 加速論者
監(jiān)管、隱私、倫理、深度偽造
AI 只能在舊金山“制造”嗎?
三:融資、并購和 IPO
融資
當(dāng)前的融資環(huán)境是“兩個市場的故事”情況,其中 AI 和其他所有東西是分開的。
整體融資持續(xù)下滑,2023 年下降了 42% 至 2484 億美元。2024 年的前幾個月顯示了一些可能的新生跡象,但到目前為止趨勢基本上保持不變。
由于上述原因,數(shù)據(jù) Infra 幾乎沒有看到太多的融資活動,Sigma Computing 和 Databricks 是罕見的例外。
顯然,AI 的情況完全不同。
AI 融資市場不可避免的特征包括:
大量資本集中在少數(shù)幾家初創(chuàng)公司,特別是 OpenAI、Anthropic、Inflection AI、Mistral 等。
企業(yè)投資者的活動水平異常高。2023 年最活躍的三個 AI 投資者是微軟、谷歌和英偉達。
上述企業(yè)交易中有些金額實際是現(xiàn)金,與“計算換股權(quán)”相比有些模糊不清。
自 2023 年 MAD 以來的一些值得注意的交易(按大致時間順序,非詳盡列表?。?/p>
OpenAI,一家(或者是?)基礎(chǔ)模型開發(fā)商,跨兩輪融資 103 億美元,現(xiàn)估值為 860 億美元;
Adept,另一家基礎(chǔ)模型開發(fā)商,融資 3.5 億美元,估值為 10 億美元;
AlphaSense,金融服務(wù)市場研究平臺,跨兩輪融資 4.75 億美元,現(xiàn)估值為 25 億美元;
Anthropic,又一家基礎(chǔ)模型開發(fā)商,跨三輪融資 64.5 億美元,估值為 184 億美元;
Pinecone,向量數(shù)據(jù)庫平臺,融資 1 億美元,估值為 7.5 億美元;
Celestial AI,光互連技術(shù)平臺,用于內(nèi)存和計算,跨兩輪融資 2.75 億美元;
CoreWeave,GPU 云提供商,融資 4.21 億美元,估值為 25 億美元;
Lightmatter,開發(fā)光驅(qū)動芯片的公司,跨兩輪融資 3.08 億美元,現(xiàn)估值為 12 億美元;
Sigma Computing,云托管數(shù)據(jù)分析平臺,融資 3.4 億美元,估值為 11 億美元;
Inflection,另一家基礎(chǔ)模型開發(fā)商,融資 13 億美元,估值為 40 億美元;
Mistral,一家基礎(chǔ)模型開發(fā)商,跨兩輪融資 5.28 億美元,現(xiàn)估值為 20 億美元;
Cohere,(驚喜)一家基礎(chǔ)模型開發(fā)商,融資 2.7 億美元,估值為 20 億美元;
Runway,生成視頻模型開發(fā)商,融資 1.91 億美元,估值為 15 億美元;
Synthesia*,企業(yè)視頻生成平臺,融資 9000 萬美元,估值為 10 億美元;
Hugging Face,機器學(xué)習(xí)和數(shù)據(jù)科學(xué)平臺,用于開源模型的工作,融資 2.35 億美元,估值為 45 億美元;
Poolside,專注于代碼生成和軟件開發(fā)的基礎(chǔ)模型開發(fā)商,融資 1.26 億美元;
Modular,AI 開發(fā)平臺,融資 1 億美元,估值為 6 億美元;
Imbue,AI 代理開發(fā)商,融資 2.12 億美元;
Databricks,數(shù)據(jù)、分析和 AI 解決方案提供商,融資 6.84 億美元,估值為 432 億美元;
Aleph Alpha,另一家基礎(chǔ)模型開發(fā)商,融資 4.86 億美元;
AI21 Labs,基礎(chǔ)模型開發(fā)商,融資 2.08 億美元,估值為 14 億美元;
Together, GenAI 開發(fā)的云平臺,跨兩輪融資 2.085 億美元,現(xiàn)估值為 12.5 億美元;
VAST Data,深度學(xué)習(xí)數(shù)據(jù)平臺,融資 1.18 億美元,估值為 91 億美元;
Shield AI,為航空航天和國防工業(yè)開發(fā) AI 駕駛員的公司,融資 5 億美元,估值為 28 億美元;
01.ai,基礎(chǔ)模型開發(fā)商,融資 2 億美元,估值為 10 億美元;
Hadrian,為航空航天和國防制造精密組件工廠的公司,融資 1.17 億美元;
Sierra AI,客戶服務(wù)/體驗的 AI 聊天機器人開發(fā)商,跨兩輪融資 1.1 億美元;
Glean,AI 驅(qū)動的企業(yè)搜索平臺,融資 2 億美元,估值為 22 億美元;
Lambda Labs,GPU 云提供商,融資 3.2 億美元,估值為 15 億美元;
Magic,代碼生成和軟件開發(fā)的基礎(chǔ)模型開發(fā)商,融資 1.17 億美元,估值為 5 億美元。
并購 & 私有化
自 2023 年 MAD 以來,并購市場一直相當(dāng)安靜。許多傳統(tǒng)軟件收購者專注于自己的股價和整體業(yè)務(wù),而不是積極尋找收購機會。
特別嚴(yán)格的反壟斷環(huán)境使?jié)撛谑召徴叩那闆r變得更加棘手。私募股權(quán)公司在更加艱難的市場中相當(dāng)活躍,尋求低價機會。
一些涉及多年來出現(xiàn)在 MAD 全景中的公司的值得注意的交易(按規(guī)模順序):
半導(dǎo)體制造商博通收購了云計算公司 VMWare,交易金額為 690 億美元;
網(wǎng)絡(luò)和安全 Infra 公司 Cisco 收購了監(jiān)控和可觀測平臺 Splunk,交易金額為 280 億美元;
客戶體驗管理公司 Qualtrics 被 Silver Lake 和 CPP 投資私有化,交易金額為 125 億美元;
支出管理平臺 Coupa 被 Thoma Bravo 私有化,交易金額為 80 億美元;
監(jiān)控和可觀測平臺 New Relic 被 Francisco Partners 和 TPG 收購,交易金額為 65 億美元;
數(shù)據(jù)分析平臺 Alteryx 被 Clearlake Capital 和 Insight Partners 私有化,交易金額為 44 億美元;
收入編排平臺 Salesloft 被 Vista Equity 收購,交易金額為 23 億美元,隨后也收購了客戶體驗 AI 聊天機器人開發(fā)商 Drift;
數(shù)據(jù)湖屋提供商 Databricks 收購了 AI 開發(fā)平臺 MosaicML,交易金額為 13 億美元(以及其他公司,金額較低,如 Arcion 和 Okera);
數(shù)據(jù)分析平臺 Thoughtspot 收購了商業(yè)智能初創(chuàng)公司 Mode Analytics,交易金額為 2 億美元;
數(shù)據(jù)倉庫提供商 Snowflake 收購了消費者 AI 搜索引擎 Neeva,交易金額為 1.5 億美元;
云托管提供商 DigitalOcean 收購了云計算和 AI 開發(fā)初創(chuàng)公司 Paperspace,交易金額為 1.11 億美元;
為云計算提供芯片的制造商 NVIDIA 收購了邊緣的 AI/ML 優(yōu)化平臺 OmniML。
當(dāng)然,還有微軟對 Inflection AI 的“非收購收購”。
2024 年會是 AI 并購的一年嗎?很多取決于市場動力的持續(xù)。
在市場的低端,過去 12-18 個月里,許多擁有強大團隊的年輕 AI 初創(chuàng)公司獲得了資金。在過去十年的最后幾個 AI 炒作周期中,許多收購發(fā)生在初始融資周期之后——通常價格似乎與這些公司實際吸引力不成比例,但 AI 人才一直很稀缺,今天也不例外。
在市場的高端,領(lǐng)先的數(shù)據(jù)平臺和領(lǐng)先的 AI 平臺之間進一步融合有強烈的商業(yè)理由。然而,這些交易可能會更加昂貴。
IPO
在公開市場上,AI 一直是一個熱門趨勢?!捌叽缶揞^”股票(Nvidia、Meta、Amazon、Microsoft、Alphabet、Apple 和 Tesla)在 2023 年至少增長了 49%,推動了整個股市的上漲。
總體而言,公開市場上純粹的 AI 股票仍然非常稀缺。可用的少數(shù)幾個受到了豐厚的回報——Palantir 股價在 2023 年跳升了 167%。
這對一大批與 AI 相關(guān)的準(zhǔn) IPO 初創(chuàng)公司應(yīng)該是一個好兆頭。在 MAD 空間有很多公司達到了相當(dāng)?shù)囊?guī)?!紫仁?Databricks,但還有其他一些公司,包括 Celonis、Scale AI、Dataiku* 或 Fivetran。
然后是 OpenAI 和 Anthropic 如何看待公開市場的有趣問題。
與此同時,2023 年在 IPO 方面是非常糟糕的一年。只有少數(shù)與 MAD 相關(guān)的公司上市:營銷自動化平臺 Klaviyo 于 2023 年 9 月以 92 億美元的估值上市;論壇式社交網(wǎng)絡(luò)平臺 Reddit(為 AI 玩家許可其內(nèi)容)于 2024 年 3 月以 64 億美元的估值上市;為 AI 和云 Infra 提供智能連接的半導(dǎo)體公司 Astera Labs 于 2024 年 3 月以 55 億美元的估值上市。
以下為2024MAD拆分圖: