中國(guó)大模型落地應(yīng)用案例集（2023）

來源：中國(guó)信通院華東分院時(shí)間：2024-01-10 16:43:26 作者：

　　近日，中國(guó)信通院聯(lián)合上海人工智能實(shí)驗(yàn)室成立的大模型測(cè)試驗(yàn)證與協(xié)同創(chuàng)新中心牽頭，首次面向全國(guó)范圍征集全行業(yè)優(yōu)秀應(yīng)用實(shí)踐，并形成《2023大模型落地應(yīng)用案例集》（以下簡(jiǎn)稱“《案例集》”）。

　　作為首部聚焦落地應(yīng)用的權(quán)威研究成果，《案例集》全面展示了大模型前沿技術(shù)和發(fā)展成果，推動(dòng)了大模型為代表的人工智能技術(shù)賦能社會(huì)經(jīng)濟(jì)高質(zhì)量發(fā)展。經(jīng)專家組的多輪評(píng)審，共52個(gè)各自領(lǐng)域的典型大模型技術(shù)落地應(yīng)用成功入選。

　　2022年底ChatGPT的橫空出世，引爆了國(guó)內(nèi)外大模型的熱情，各行各業(yè)的創(chuàng)業(yè)者已經(jīng)集結(jié)在十字路口蓄勢(shì)待發(fā)。

　　從國(guó)內(nèi)市場(chǎng)來看，目前人工智能（AI）大模型已經(jīng)在各行各業(yè)“落子不斷”。據(jù)公開資料不完全統(tǒng)計(jì)顯示，國(guó)內(nèi)大模型的發(fā)展路徑是“通用+垂直”兩條腿走路，其中垂類大模型落地速度最快。《案例集》顯示，有近65%+的AI大模型是垂直大模型。

　　趨勢(shì)已然，大模型技術(shù)突破代表了AI發(fā)展的一個(gè)重要里程碑，下面筆者將梳理中國(guó)從業(yè)者構(gòu)建的“底層原創(chuàng)技術(shù)-中層基礎(chǔ)模型-上層行業(yè)應(yīng)用”的大模型圖鑒。

　　PART 1

　　大模型領(lǐng)域中國(guó)學(xué)者的技術(shù)貢獻(xiàn)

圖注：ResNet的四位作者分別是：何愷明、張祥雨、任少卿、孫劍

　　2016年，來自微軟亞洲研究院的四位學(xué)者提出深度殘差學(xué)習(xí)（ResNet），解決了深度網(wǎng)絡(luò)的梯度傳遞問題。要知道，2015年之前深度學(xué)習(xí)最多只能訓(xùn)練20層，ResNet之后，就可以有效地訓(xùn)練超過百層的深度神經(jīng)網(wǎng)絡(luò)。

　　2017年Google發(fā)布Transformer，它的出現(xiàn)打穩(wěn)了AI大模型的“地基”，不僅“顛覆”了自然語(yǔ)言處理（NLP）中的機(jī)器翻譯任務(wù)，而且還提供了一種新的思路來處理圖像數(shù)據(jù)。

　　中國(guó)學(xué)者也圍繞Transformer做了許多改進(jìn)和完善，例如微軟亞洲研究院聯(lián)合西安交通大學(xué)推出LONGNET，將Transformer的序列長(zhǎng)度擴(kuò)展10億+；京東探索研究院聯(lián)合武漢大學(xué)提出全球首個(gè)面向遙感任務(wù)設(shè)計(jì)的億級(jí)視覺Transformer大模型；阿里達(dá)摩院提出新的Transformer結(jié)構(gòu)FMViT，大幅度提升AI模型精度與速度……

　　在大模型領(lǐng)域細(xì)數(shù)中國(guó)學(xué)者貢獻(xiàn)，許多原創(chuàng)性貢獻(xiàn)來自本土。已故的商湯科技創(chuàng)始人湯曉鷗（緬懷）在2023世界人工智能大會(huì)上，發(fā)表演講時(shí)表示：在深度學(xué)習(xí)的大門上，我們按了18次門鈴，取得了許多跨時(shí)代的突破。其中湯曉鷗提到了上海人工智能實(shí)驗(yàn)室領(lǐng)軍科學(xué)家林達(dá)華，他當(dāng)時(shí)設(shè)計(jì)的計(jì)算機(jī)視覺開源算法體系OpenMMLab，目前已經(jīng)成為國(guó)際上最具影響力的視覺算法開源體系。值得一提的是，林達(dá)華也是書生大模型體系的重要貢獻(xiàn)者。

　　京東探索研究院早在2021年年初就展開了大模型體系（超級(jí)深度學(xué)習(xí)）的建設(shè)和基礎(chǔ)研究，領(lǐng)導(dǎo)京東建設(shè)了中國(guó)第一個(gè)NVIDIA DGX Superpod天琴alpah-α超算集群。在此基礎(chǔ)上，京東探索研究院的織女模型vega v2 在2022年登頂SuperGLUE榜首，一舉超越同場(chǎng)競(jìng)技的谷歌、微軟、Meta等業(yè)界頂尖企業(yè)；2021年研究院開發(fā)的大規(guī)模視覺模型ViTAE，在ImageNet Real的目標(biāo)識(shí)別和MS COCO的人體姿態(tài)估計(jì)等權(quán)威榜單上均獲得世界第一。

　　圖注：（上）2022年京東探索研究院發(fā)表論文《Self-Evolution Learning for Discriminative Language Model Pretraining》，提出自我進(jìn)化學(xué)習(xí)方法，為vega v2大模型的設(shè)計(jì)提供核心思想；

　?。ㄏ拢?021年京東探索研究院發(fā)表論文《ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias》，嘗試將 CNN和transformer相結(jié)合。

　　因此，國(guó)內(nèi)公司的 AI 大模型研發(fā)雖然比國(guó)外公司晚，但是發(fā)展卻異常地迅速，其內(nèi)在邏輯便是：本土企業(yè)和學(xué)者對(duì)深度學(xué)習(xí)技術(shù)的深入理解與創(chuàng)新。在大模型的底層技術(shù)已經(jīng)固定的時(shí)代，他們靠著持續(xù)的探索和努力才能構(gòu)建出秀麗的“上層建筑”。

　　在OpenAI發(fā)布ChatGPT之前，國(guó)內(nèi)的一些企業(yè)就已經(jīng)押注AI大模型技術(shù)：例如2021 年 4 月，華為云聯(lián)合循環(huán)智能發(fā)布盤古超大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型，參數(shù)規(guī)模達(dá) 1 000 億；2021 年 6 月，北京智源人工智能研究院發(fā)布了超大規(guī)模智能模型“悟道 2.0”，參數(shù)規(guī)模達(dá)到 1.75 萬億；2021 年 12 月，百度推出 ERNIE 3.0 Titan 模型，參數(shù)規(guī)模達(dá) 2 600 億，同期，阿里巴巴達(dá)摩院的 M6 模型參數(shù)達(dá)到 10 萬億，將大模型參數(shù)直接提升了一個(gè)量級(jí)。

　　到2023年，大模型繼續(xù)火熱，國(guó)內(nèi)的AI大模型團(tuán)隊(duì)已逐漸拓展到視覺、決策領(lǐng)域，甚至用于解決蛋白質(zhì)預(yù)測(cè)、航天等領(lǐng)域的重大科學(xué)問題，阿里、京東、oppo等大廠都有相應(yīng)的成果。

　　PART 2

　　大模型應(yīng)用拐點(diǎn)已至

　　圖靈獎(jiǎng)獲得者Yann LeCun說過：AI大模型的技術(shù)都是公開的，算不上底層技術(shù)上的創(chuàng)新，如果你愿意一探究竟的話，可以發(fā)現(xiàn)它背后沒有任何秘密可言。

　　但借著這些“過時(shí)”的技術(shù)，在中國(guó)擁有龐大的人才基數(shù)和數(shù)據(jù)集的情況下，可以發(fā)展出更適合本土環(huán)境和語(yǔ)境的大模型。

　　那么如何形象理解大模型?前科技部長(zhǎng)王志剛從高維度表示,大模型,就是大數(shù)據(jù)、大算力、強(qiáng)算法。形象一些：大模型事實(shí)上就是算法、數(shù)據(jù)、算力上的有效結(jié)合。傳統(tǒng)巨頭在大模型領(lǐng)域的技術(shù)投入普遍都是在積極防御，而中國(guó)企業(yè)在非常積極地推動(dòng)向應(yīng)用中的落地。

　　目前，業(yè)界除了把AI大模型商業(yè)落地模式統(tǒng)分為 toB 和 toC之外，在市場(chǎng)劃分上則遵循通用與垂直兩大路徑，兩者在參數(shù)級(jí)別、應(yīng)用場(chǎng)景等方面差異正在顯性化。

　　通用大模型往往是指具備處理多種不同類型任務(wù)的AI模型，這些模型通常是通過大規(guī)模的數(shù)據(jù)訓(xùn)練而成，能夠在多個(gè)領(lǐng)域和應(yīng)用中表現(xiàn)出良好的效能。大家耳熟能詳?shù)膸讉€(gè)通用大模型均來財(cái)力雄厚的企業(yè)：

　　1.書生浦語(yǔ)開源大模型：由上海人工智能實(shí)驗(yàn)室研發(fā)，涵蓋 70 億參數(shù)的輕量級(jí)版本 InternLM-7B，以及 200 億參數(shù)的中量級(jí)版本和 InternLM-20B，以及完整的開源工具鏈體系。InternLM-7B 在包含 40 個(gè)評(píng)測(cè)集的全維度評(píng)測(cè)中展現(xiàn)出卓越且平衡的性能，它在兩個(gè)被廣泛采用的基準(zhǔn) MMLU 和 CEval 上分別取得了 50.8 和 52.8 的高分，開源一度刷新了 7B 量級(jí)模型的紀(jì)錄。

　　2.昆侖萬維天工大模型：“天工”是一個(gè) AI 搜索引擎，一個(gè)對(duì)話式 AI 助手?！疤旃ぁ睋碛袕?qiáng)大的自然語(yǔ)言處理和智能交互能力，能夠?qū)崿F(xiàn)個(gè)性化 AI 搜索、智能問答、聊天互動(dòng)、文本生成、編寫代碼、語(yǔ)言翻譯等多種應(yīng)用場(chǎng)景并且具有豐富的知識(shí)儲(chǔ)備，涵蓋科學(xué)、技術(shù)、文化、藝術(shù)、歷史等領(lǐng)域。

　　3.通義千問 2.0：由阿里云研發(fā)的超大規(guī)模的語(yǔ)言模型，具備多輪對(duì)話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語(yǔ)言支持等功能。通義千問 2.0 在復(fù)雜指令理解、文學(xué)創(chuàng)作、通用數(shù)學(xué)、知識(shí)記憶、幻覺抵御等能力上均比上代有顯著提升。

　　4.MiniMax-abab：由科技創(chuàng)業(yè)公司MiniMax研發(fā)。據(jù)悉，“Max-abab”是文本、語(yǔ)音、視覺三模態(tài)的千億參數(shù)大語(yǔ)言模型，在中、英文服務(wù)領(lǐng)域均已超過GPT-3.5 的水平。今年8月份，“MiniMax-abab”大模型通過了國(guó)家首批大模型服務(wù)備案，面向社會(huì)公眾提供服務(wù)。

　　5.言犀基礎(chǔ)大模型：由京東科技研發(fā)，該模型融合了70%的通用數(shù)據(jù)和30%的數(shù)智供應(yīng)鏈原生數(shù)據(jù)，具有更高的產(chǎn)業(yè)屬性。

　　6.百靈語(yǔ)言大模型：由螞蟻集團(tuán)基于Transfromer架構(gòu)研發(fā)。該模型基于萬億級(jí)Token語(yǔ)料訓(xùn)練而成，支持窗口長(zhǎng)度達(dá)32K，在主流推理類榜單中排名前列。據(jù)悉，螞蟻百靈大模型已完成備案，基于百靈大模型的多款產(chǎn)品已陸續(xù)完成內(nèi)測(cè)，正陸續(xù)向公眾開放。

　　這些通用大模型包含千億甚至萬億參數(shù)，覆蓋自然語(yǔ)言處理、圖像識(shí)別、語(yǔ)音識(shí)別等方面的任務(wù)，已在知識(shí)問答、醫(yī)療咨詢、娛樂領(lǐng)域、視頻生成等數(shù)十個(gè)行業(yè)場(chǎng)景領(lǐng)域，展現(xiàn)出廣闊的落地應(yīng)用潛力。

　　與通用大模型相比，垂類大模型參數(shù)量相對(duì)較小。但是因?yàn)橛幸恍┬袠I(yè)的核心數(shù)據(jù)和業(yè)務(wù)系統(tǒng)的生產(chǎn)數(shù)據(jù)參與，所以在相應(yīng)行業(yè)解決問題更為高效、直接。

　　從《案例集》來看，在金融、教育、醫(yī)療等領(lǐng)域，已經(jīng)有不少公司發(fā)布了相應(yīng)產(chǎn)品。

　　根據(jù)《案例集》入選案例的應(yīng)用場(chǎng)景，垂類大模型更針對(duì)于企業(yè)級(jí)應(yīng)用場(chǎng)景的垂直性和專業(yè)性要求，而在模型部署層面，更少的模型參數(shù)、訓(xùn)練數(shù)據(jù)意味著更少的成本，因此垂直應(yīng)用領(lǐng)域有望實(shí)現(xiàn)“萬模齊發(fā)”。

　　《案例集》公布的名單，也恰恰驗(yàn)證了目前垂類大模型發(fā)展的一些趨勢(shì)：

　　1. 加注端側(cè)、邊緣側(cè)應(yīng)用。輕量化參數(shù)能讓手機(jī)助手接入AI大模型能力。目前已有案例包括OPPO的小布助手、華為的智能助手小藝等等。

　　2. 更傾向于“解決方案”式的交付方式。由于垂類大模型接受了大量特定領(lǐng)域的數(shù)據(jù)和知識(shí)，因此可以基于領(lǐng)域知識(shí)生成更具深度的解決方案。例如ChatDD 新一代對(duì)話式藥物研發(fā)助手，面向游戲行業(yè)的圖像內(nèi)容生成式大模型等等。

　　3. 大模型開始向多模態(tài)領(lǐng)域發(fā)展。多模態(tài)意味著豐富的數(shù)據(jù)形式，包含視覺、聽覺和時(shí)序信息。對(duì)于大模型模型來說，這意味著可以從多模態(tài)中提取和學(xué)習(xí)更多維度的信息。類似于《案例集》中的單晶爐自動(dòng)化工藝識(shí)別多模態(tài)模型，相信未來將會(huì)出現(xiàn)更多。

　　4. “通用+垂直”模型互相融通的態(tài)勢(shì)。隨著AI技術(shù)的發(fā)展，不同類型的模型之間的界限變得越來越模糊。例如，一些通用模型開始整合垂直領(lǐng)域的知識(shí)，而一些垂直模型也開始利用通用模型的技術(shù)來增強(qiáng)其功能。例如百川大模型在娛樂領(lǐng)域的應(yīng)用。

　　PART 3

　　搶灘大模型未來：構(gòu)建生態(tài)

　　對(duì)于AI大模型這種劃時(shí)代的超級(jí)機(jī)遇而言，勝負(fù)不在于做出一個(gè)爆款應(yīng)用，賺到幾億盈利，而在于，是否抓到了大時(shí)代的方向。

　　換句話說，當(dāng)下的大模型競(jìng)爭(zhēng)早已超過了技術(shù)的范疇，更多是一種生態(tài)層面的比拼，具體表現(xiàn)在有多少應(yīng)用、有多少插件、有多少開發(fā)者以及用戶等。誰(shuí)能夠率先圍繞大模型構(gòu)建生態(tài)，或者說誰(shuí)率先融入生態(tài)，誰(shuí)就能成為領(lǐng)先者。

　　大模型要想像電力一樣輸送給千行百業(yè)和千家萬戶，必然需要一個(gè)體系化的產(chǎn)業(yè)生態(tài)，構(gòu)建這個(gè)生態(tài)需要一系列相互關(guān)聯(lián)的因素，包括技術(shù)發(fā)展、應(yīng)用場(chǎng)景、數(shù)據(jù)管理、倫理與法律問題、以及社會(huì)影響等。

　　在生態(tài)建構(gòu)的路徑上，目前企業(yè)可分為兩派。一派將大模型接入原有的產(chǎn)品線，做升級(jí)和優(yōu)化；另一派試圖以大模型產(chǎn)品為中心，建構(gòu)新一代的“超級(jí)應(yīng)用”。而有些企業(yè)試圖跳過這兩種路徑，多方面融入AI大模型生態(tài)。從《案例集》公布的大模型服務(wù)類案例，我們可以看到有些中國(guó)企業(yè)做了以下嘗試：

　　例如螞蟻集團(tuán)實(shí)現(xiàn)了一個(gè)大模型數(shù)據(jù)高效高質(zhì)量供給平臺(tái)，不僅可降低數(shù)據(jù)獲取和使用成本，且保證來源合規(guī)，并能夠有效提升數(shù)據(jù)質(zhì)量、過濾風(fēng)險(xiǎn)數(shù)據(jù)保障訓(xùn)練安全；優(yōu)刻得開發(fā)的AGI云上模型服務(wù)平臺(tái)，能提供數(shù)據(jù)標(biāo)準(zhǔn)化整合、安全合規(guī)、提供算力等服務(wù)；上海道客研發(fā)的云原生大模型知識(shí)庫(kù)平臺(tái)能夠幫助解決信息孤島，以及定制個(gè)性化的私人語(yǔ)料庫(kù)；泡泡瑪特的AI 整合平臺(tái)集成多個(gè)知名AI大模型，為用戶提供一站式 AI服務(wù)……

　　這些大模型服務(wù)工具，在一定程度上能有效地解決“幻覺”、“道德”、“性能”、“數(shù)據(jù)合規(guī)”等當(dāng)前AI大模型遇到的問題。更重要的是借助這些服務(wù)，可以建設(shè)規(guī)范可控的自主工具鏈，幫助AI企業(yè)探索“大而強(qiáng)”的通用模型，助力公司研發(fā)“小而美”的垂直行業(yè)模型，從而構(gòu)建基礎(chǔ)大模型和專業(yè)小模型交互共生、迭代進(jìn)化的良好生態(tài)。

　　具體內(nèi)容如下