來源:數(shù)據(jù)觀綜合 時間:2023-06-20 14:11:29 作者:
6月19日,騰訊云召開發(fā)布會,首次正式公布行業(yè)大模型研發(fā)進展,并發(fā)布面向B端客戶的騰訊云MaaS(Model-as-a-service,模型即服務(wù))服務(wù)解決方案,幫助客戶生成專屬大模型和提供相關(guān)應用。
這是騰訊首次公布大模型相關(guān)進展,其選擇將重點放在AI和行業(yè)相結(jié)合上,希望解決各個行業(yè)存在的具體問題。此前,百度、阿里巴巴等均推出了通用大模型產(chǎn)品,而字節(jié)跳動亦被指將在今年年中推出大模型。而騰訊本次推出的是行業(yè)大模型。
騰訊公布MaaS全景圖 今年以來,通用大模型受到市場矚目,眾多企業(yè)也躍躍欲試。但在具體企業(yè)場景中,通用大模型尚無法完全滿足企業(yè)的很多需求。
騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示:“就模型而言,比起通用大模型,企業(yè)更需要針對具體行業(yè)的大模型,并結(jié)合企業(yè)自身的數(shù)據(jù)進行訓練和精調(diào),以打造出更實用的智能服務(wù)?!?/p>
湯道生舉例稱,通用大模型不一定懂行業(yè)的專業(yè)術(shù)語,也不了解企業(yè)內(nèi)部獨特的情況,回答會比較籠統(tǒng),信息也不夠及時?!按蠹壹绕诖絹碓綇姶蟮耐ㄓ么竽P?,同時也在思考如何在使用大模型時,保護企業(yè)數(shù)據(jù)的產(chǎn)權(quán)與隱私,如何降低大模型的使用成本,這都是企業(yè)要考慮的現(xiàn)實問題?!?/p>
基于客戶實際痛點和需求,騰訊云全新公布MaaS全景圖,依托騰訊云TI平臺打造行業(yè)大模型精選商店,為企業(yè)客戶提供涵蓋模型預訓練、模型精調(diào)、智能應用開發(fā)等一站式行業(yè)大模型解決方案。
此前,在騰訊一季度財報電話會上,騰訊公司總裁劉熾平就表示,騰訊對AI一直有所布局,AI 及大模型對于騰訊整個業(yè)務(wù)來說是一個增長的擴大器。如今,騰訊云MaaS將成為騰訊ToB業(yè)務(wù)的新增長極。
基于騰訊云MaaS的能力,騰訊的騰訊企點、騰訊會議、騰訊云AI代碼助手等三大SaaS應用全面智能升級。
提供一站式大模型服務(wù)
與發(fā)布通用大模型產(chǎn)品相比,騰訊云則直接跨越至大模型的行業(yè)應用環(huán)節(jié)。主要是通用大模型的訓練數(shù)據(jù)主要來自公開數(shù)據(jù)集或網(wǎng)絡(luò)數(shù)據(jù),對于特定行業(yè)的專業(yè)領(lǐng)域知識了解有限。此外,通用大語言模型的訓練需要大量計算資源和漫長的訓練周期,同時,安全和合規(guī)也是必要的考量因素。
從騰訊云MaaS全景圖可以看到,騰訊云加大了大模型基礎(chǔ)設(shè)施建設(shè)。
在技術(shù)底座方面,今年4月14日,騰訊云發(fā)布新一代HCC高性能計算集群,采用最新一代星星海自研服務(wù)器,搭載NVIDIA H800 TensorCoreGPU,基于自研網(wǎng)絡(luò)、存儲架構(gòu),帶來3.2T超高互聯(lián)帶寬、TB級吞吐能力和千萬級IOPS。實測結(jié)果顯示,新一代集群算力性能較前代提升3倍。
此外,騰訊云即將推出向量數(shù)據(jù)庫(Tencent Cloud VectorDB),源自騰訊集團每日處理千億次檢索的向量引擎(OLAMA),單索引支持10億級向量規(guī)模,更適用于AI運算、檢索,數(shù)據(jù)接入AI的效率也比傳統(tǒng)方案提升10倍。
在平臺層面,騰訊云TI平臺內(nèi)置多個高質(zhì)量行業(yè)大模型,涵蓋金融、傳媒、文旅、政務(wù)、工業(yè)等多個行業(yè)場景,企業(yè)可以結(jié)合自身場景數(shù)據(jù)可按需定制精調(diào),也可以根據(jù)自身需求開展多模型訓練任務(wù),大幅降低大模型應用門檻。用戶也可以通過TI平臺以及模型的私有化部署、權(quán)限管控和數(shù)據(jù)加密等方式,讓企業(yè)用戶在打造模型與使用模型時都更放心。
同時,騰訊云TI平臺提供完善的大模型工具鏈,包括數(shù)據(jù)標注、訓練、評估、測試和部署等全套工具。同時,由TI-ACC升級的“太極Angel”提供更優(yōu)的訓練和推理加速能力。在傳統(tǒng)CV、NLP算法模型的基礎(chǔ)上,新增了對大模型的訓練和推理加速能力,通過異步調(diào)度優(yōu)化、顯存優(yōu)化、計算優(yōu)化等方式,相比行業(yè)常用方案性能提升30%+。
再次,TI平臺沉淀了從“業(yè)務(wù)分析、數(shù)據(jù)處理、大模型選擇”到“模型評測”的一體化完整方法論,同時支持MLOps的體系及工具,保障客戶需求的順利交付。
值得注意的是,騰訊云打造了一站式行業(yè)大模型精選商店,內(nèi)置多個高質(zhì)量行業(yè)大模型,涵蓋金融、傳媒、文旅、政務(wù)、教育等多個行業(yè)場景。兼容支持多模型訓練任務(wù),企業(yè)可以按需取用。
大模型賽道群雄逐鹿
自ChatGPT去年末在全球掀起巨大轟動以來,大模型已成為全球最熱鬧的賽道之一。在這個賽道上,中美是兩大頭部玩家。
據(jù)最新發(fā)布的《中國人工智能大模型地圖研究報告》(以下簡稱《報告》)統(tǒng)計,過去5年,中國10億以上參數(shù)規(guī)模的大模型已經(jīng)發(fā)布了79個,涉及14個省市,北京和廣東最多。美國已經(jīng)發(fā)布了100個大模型。在大模型領(lǐng)域,中國和美國遙遙領(lǐng)先,兩國相加占全球總量的80%以上。
《報告》顯示,中國自2020年進入大模型加速發(fā)展期,目前與美國保持同步增長態(tài)勢。在自然語言處理、機器視覺和多模態(tài)等各技術(shù)分支上均在同步跟進、快速發(fā)展,涌現(xiàn)出盤古、悟道、文心一言、通義千問、星火認知等一批具有行業(yè)影響力的預訓練大模型,形成了緊跟世界前沿的大模型技術(shù)群。
當前,中國人工智能大模型正呈現(xiàn)蓬勃發(fā)展態(tài)勢。
互聯(lián)網(wǎng)大廠一馬當先。百度率先推出“文心一言”,騰訊推出AI智能創(chuàng)作助手“騰訊智影”及“混元”AI大模型,阿里達摩院推出中文多模態(tài)預訓練模型M6項目,科大訊飛啟動生成式預訓練大模型“1+N”任務(wù)攻關(guān),華為推出“盤古”大模型,字節(jié)跳動也被爆正在布局大模型AI Lab……
科技大佬和創(chuàng)業(yè)團隊也紛紛入局。今年2月,原美團聯(lián)合創(chuàng)始人、高級副總裁王慧文宣布打造中國OpenAI。之后,前搜狗CEO王小川,前京東AI掌門人周伯文,阿里技術(shù)副總裁賈揚清,出門問問創(chuàng)始人李志飛,AI大牛、創(chuàng)新工場人工智能工程院院長李開復等一眾大佬,爭先加入ChatGPT創(chuàng)業(yè)隊伍。今年3月,語言大模型玩家瀾舟科技宣布完成了Pre-A+輪融資,并推出語言生成模型——孟子MChat可控大模型;清華唐杰教授的智譜AI;清華系黃民烈教授的聆心智能;清華系NLP實驗室孫茂松、劉知遠團隊;深言科技豈凡超;循環(huán)智能聯(lián)合創(chuàng)始人楊植麟;復旦邱錫鵬教授團隊等等,也都被曝已或早或晚耕耘于大模型沃野。
各大城市制定相關(guān)政策。上海、北京兩地相繼出臺人工智能相關(guān)政策。日前,《深圳市加快推動人工智能高質(zhì)量發(fā)展高水平應用行動方案(2023-2024年)》重磅發(fā)布,深圳將發(fā)揮政府投資引導基金作用,統(tǒng)籌整合基金資源,形成規(guī)模1000億元的人工智能基金群。整體來看,《行動方案》分別從強化智能算力集群供給、增強關(guān)鍵核心技術(shù)與產(chǎn)品創(chuàng)新能力、提升產(chǎn)業(yè)集聚水平等六大方向制定多項措施,旨在打造國家新一代人工智能創(chuàng)新發(fā)展試驗區(qū)和國家人工智能創(chuàng)新應用先導區(qū)。
對于大模型帶來的相關(guān)影響,中金公司認為,大模型有望將C端的社交、內(nèi)容、游戲、消費、旅游、信息/知識等重新定義,包括騰訊、百度、阿里巴巴等企業(yè)也許能完成轉(zhuǎn)型,當然也不排除有新的創(chuàng)業(yè)公司脫穎而出;在B端,其認為原有的OA辦公、市場銷售、生產(chǎn)供應鏈等環(huán)節(jié)都有望融入通用人工智能,提升工作效率。