來(lái)源:數(shù)據(jù)觀綜合 時(shí)間:2023-08-31 15:26:20 作者:
8月31日,據(jù)財(cái)聯(lián)社報(bào)道,從多位獨(dú)立信源處獲悉,國(guó)內(nèi)將有11家大模型陸續(xù)通過《生成式人工智能服務(wù)管理暫行辦法》備案,首批將在8月31日起將陸續(xù)向全社會(huì)公眾開放服務(wù)。
產(chǎn)品獲批后,上述企業(yè)機(jī)構(gòu)的大模型產(chǎn)品,即可在網(wǎng)站/應(yīng)用商店下載后直接使用。
首批大模型面向社會(huì)公眾開放
首批大模型產(chǎn)品獲批名單共有8款A(yù)I大模型,涵蓋國(guó)內(nèi)知名科技企業(yè)、初創(chuàng)企業(yè)以及科研機(jī)構(gòu)。其中,有3家知名科技企業(yè),包括百度(文心一言)、抖音(云雀大模型)及商湯(日日新大模型);3家初創(chuàng)企業(yè)為智譜AI(GLM大模型)、百川智能(百川大模型)、MiniMax(ABAB大模型);兩家科研機(jī)構(gòu)是中科院(紫東太初大模型)、上海人工智能實(shí)驗(yàn)室(書生通用大模型)。按地域劃分,北京為5家,上海3家。
另?yè)?jù)報(bào)道稱,華為、騰訊,科大訊飛、360等AI大模型也將陸續(xù)獲批,向社會(huì)公眾開放。
8月31日凌晨,百度宣布文心一言將從8月31日起率先向全社會(huì)全面開放。用戶可以在應(yīng)用商店下載“文心一言APP”或登錄“文心一言官網(wǎng)”體驗(yàn)。據(jù)悉,百度還將開放一批經(jīng)過全新重構(gòu)的AI原生應(yīng)用,讓廣大用戶充分體驗(yàn)生成式AI的理解、生成、邏輯、記憶四大核心能力。
除了百度文心一言以外。王小川創(chuàng)辦的百川智能也于8月31日對(duì)外宣布,已率先通過《生成式人工智能服務(wù)管理暫行辦法》備案,今日起面向全社會(huì)開放服務(wù),成為首批通過備案的8家公司之一。
8月31日,智譜AI正式上線首款生成式AI助手“智譜清言”,已在各大應(yīng)用商店上線。
8月31日,商湯日日新大模型旗下自然語(yǔ)言應(yīng)用“商量SenseChat”正式面向廣大用戶開放服務(wù)。用戶可訪問https://chat.sensetime.com注冊(cè)使用,或通過商湯官網(wǎng)訪問體驗(yàn)。
此外,盡管還沒有官宣全面開放,但目前抖音“豆包”、科大訊飛星火認(rèn)知等也可以注冊(cè)使用。
以下為首批獲批上線的大模型企業(yè)介紹:
百度-文心一言大模型
作為全球大廠中首個(gè)發(fā)布的生成式 AI 產(chǎn)品,百度“文心一言”于2023年3月16日開啟邀測(cè),基礎(chǔ)模型文心大模型早在 2019 年就在國(guó)內(nèi)率先發(fā)布,近期升級(jí)的文心大模型 3.5 也持續(xù)在十余個(gè)國(guó)內(nèi)外權(quán)威測(cè)評(píng)中位居第一。
百度創(chuàng)始人、董事長(zhǎng)兼首席執(zhí)行官李彥宏表示,當(dāng)文心一言向數(shù)以億計(jì)互聯(lián)網(wǎng)用戶大規(guī)模開放服務(wù)后,能夠獲得大量真實(shí)世界中的人工反饋,這將進(jìn)一步改進(jìn)基礎(chǔ)模型,并以更快速度迭代文心一言,創(chuàng)造更好的用戶體驗(yàn)。
近十年,百度累計(jì)研發(fā)投入超 1400 億元,壓強(qiáng)式研發(fā)投入讓百度實(shí)現(xiàn)厚積薄發(fā),成為全球?yàn)閿?shù)不多的、有著應(yīng)用、模型、框架、芯片四層全棧布局的 AI 公司,實(shí)現(xiàn)端到端優(yōu)化,并在各個(gè)層面都有領(lǐng)先業(yè)界的關(guān)鍵自研技術(shù)。
抖音集團(tuán)-云雀大模型
8月17日,抖音集團(tuán)(前字節(jié)跳動(dòng))宣布開始對(duì)外測(cè)試AI對(duì)話產(chǎn)品“豆包”。據(jù)稱,“豆包”是字節(jié)跳動(dòng)公司基于云雀模型開發(fā)的 AI 工具,提供聊天機(jī)器人、寫作助手以及英語(yǔ)學(xué)習(xí)助手等功能,它可以回答各種問題并進(jìn)行對(duì)話,幫助人們獲取信息,支持網(wǎng)頁(yè) Web 平臺(tái),iOS 以及安卓平臺(tái),但 iOS 需要使用 TestFlight 安裝。
智譜AI-GLM大模型
成立于2019年的智譜AI,是國(guó)內(nèi)最早一批研發(fā)大模型的企業(yè),由清華大學(xué)知識(shí)工程實(shí)驗(yàn)室(KEG)技術(shù)成果轉(zhuǎn)化。
當(dāng)前,智譜已經(jīng)發(fā)布包括雙語(yǔ)千億級(jí)超大規(guī)模預(yù)訓(xùn)練模型GLM-130B,中英雙語(yǔ)對(duì)話模型ChatGLM、認(rèn)知大模型平臺(tái)Bigmodel.ai,包括CodeGeeX和CogView等產(chǎn)品。
基于ChatGLM,智譜已于今年推出To C聊天對(duì)話應(yīng)用“智譜清言”。而在To B層面,智譜也已經(jīng)與多家國(guó)內(nèi)互聯(lián)網(wǎng)巨頭,政企達(dá)成合作。
百川智能-百川大模型
百川成立于2023年,由搜狗創(chuàng)始人王小川創(chuàng)立。今年6月15日,百川智能推出70億參數(shù)量的中英文語(yǔ)言模型Baichuan-7B,一個(gè)月后又接連發(fā)布了參數(shù)量130億的通用大語(yǔ)言模型Baichuan-13B-Base、對(duì)話模型Baichuan-13B-Chat及INT4/INT8兩個(gè)量化版本。前不久,百川智能剛剛宣布推出新一代大模型Baichuan-53B。
中科院自動(dòng)化研究所-紫東太初大模型
中科院自動(dòng)化研究所成立于1956年10月,是中國(guó)最早成立的國(guó)立自動(dòng)化研究機(jī)構(gòu)?!白蠔|太初”定位為跨模態(tài)通用人工智能平臺(tái),于2021年正式發(fā)布。
目前,“紫東太初”參數(shù)已達(dá)千億級(jí)別,擁有視覺、文本、語(yǔ)音多種模態(tài),基于全棧國(guó)產(chǎn)化基礎(chǔ)軟硬件平臺(tái)建立。今年6月,紫東太初發(fā)布2.0版本,再加入了視頻、傳感信號(hào)、3D點(diǎn)云等新的模態(tài)數(shù)據(jù)。目前,紫東太初已在文本創(chuàng)作、醫(yī)療、物流、政務(wù)等多個(gè)行業(yè)實(shí)現(xiàn)應(yīng)用落地。
商湯-日日新大模型
今年4月,商湯推出日日新SenseNova”大模型。據(jù)悉,日日新大模型擁有提供自然語(yǔ)言、內(nèi)容生成、自動(dòng)化數(shù)據(jù)標(biāo)注、自定義模型訓(xùn)練等多種能力,其中還包括商量SenseChat、秒畫SenseMirage、如影SenseAvatar、瓊宇SenseSpace、格物SenseThings、明眸等功能強(qiáng)大且易用的內(nèi)容生成平臺(tái)產(chǎn)品。目前,商湯最新版大模型“商量SenseChat 2.0版本”已發(fā)布,其參數(shù)達(dá)千億級(jí)規(guī)模。
Minimax-ABAB大模型
Minimax成立于2021年,由前商湯科技副總裁、通用智能技術(shù)負(fù)責(zé)人閆俊杰成立。Minimax已經(jīng)發(fā)布了包括文本到視覺/語(yǔ)音/文本三個(gè)基礎(chǔ)模型架構(gòu),推出自研通用大模型“ABAB”,以及虛擬聊天軟件Glow、生成式對(duì)話AI產(chǎn)品Inspo等。
Minimax也是如今國(guó)內(nèi)估值最高的大模型初創(chuàng)公司之一。據(jù)路透6月報(bào)道,Minimax完成了新一輪2.5億美元融資后,整體估值超過12億美元。
上海人工智能實(shí)驗(yàn)室-書生大模型
上海人工智能實(shí)驗(yàn)室(又稱浦江實(shí)驗(yàn)室)成立于2020年,由上海人工智能創(chuàng)新中心發(fā)起設(shè)立。
2021年,浦江實(shí)驗(yàn)室聯(lián)合商湯、香港中文大學(xué)、上海交通大學(xué)發(fā)布通用視覺技術(shù)體系“書生”(INTERN)。到如今,書生大模型體系參數(shù)已達(dá)千億級(jí)別,包括“書生·多模態(tài)”、“書生·浦語(yǔ)”和“書生·天際”等三大基礎(chǔ)模型,以及面向大模型研發(fā)與應(yīng)用的開源體系。
內(nèi)卷的AI大模型
當(dāng)前,中國(guó)大模型呈現(xiàn)蓬勃發(fā)展態(tài)勢(shì)??萍疾啃乱淮斯ぶ悄馨l(fā)展研究中心發(fā)布的《中國(guó)人工智能大模型地圖研究報(bào)告》顯示,從全球已經(jīng)發(fā)布的大模型分布來(lái)看,中美兩國(guó)數(shù)量合計(jì)占全球總數(shù)的超 80%,美國(guó)在大模型數(shù)量方面居全球之首,中國(guó)目前則已進(jìn)入大模型快速發(fā)展期,與美國(guó)保持同步增長(zhǎng)態(tài)勢(shì)。
據(jù)不完全統(tǒng)計(jì),截止今年5月,中國(guó) 10 億參數(shù)規(guī)模以上的大模型已發(fā)布 79 個(gè)。IDC預(yù)測(cè),2026年中國(guó)人工智能軟件及應(yīng)用市場(chǎng)規(guī)模將達(dá)到211億美元,人工智能將進(jìn)入大規(guī)模落地應(yīng)用關(guān)鍵期。
我國(guó)2020年進(jìn)入大模型加速發(fā)展期,目前與美國(guó)保持同步增長(zhǎng)態(tài)勢(shì)。在自然語(yǔ)言處理、機(jī)器視覺和多模態(tài)等各技術(shù)分支上均在同步跟進(jìn)、快速發(fā)展,涌現(xiàn)出盤古、悟道、文心一言、通義千問、星火認(rèn)知等一批具有行業(yè)影響力的預(yù)訓(xùn)練大模型,形成了緊跟世界前沿的大模型技術(shù)群。
報(bào)告顯示,目前中國(guó)在14個(gè)省市/地區(qū)均有團(tuán)隊(duì)在開展大模型研發(fā),北京、廣東兩地最多,地域集中度相對(duì)較高。從領(lǐng)域分布來(lái)看,自然語(yǔ)言處理仍是目前大模型研發(fā)最為活躍的重點(diǎn)領(lǐng)域,其次是多模態(tài)領(lǐng)域,在計(jì)算機(jī)視覺和智能語(yǔ)音等領(lǐng)域的大模型還較少。國(guó)內(nèi)大學(xué)、科研機(jī)構(gòu)、企業(yè)等不同創(chuàng)新主體都在積極參與大模型研發(fā),學(xué)術(shù)界與產(chǎn)業(yè)界之間的聯(lián)合開發(fā)還不充分。
通過調(diào)研全國(guó)范圍內(nèi)的算力基礎(chǔ)設(shè)施分布情況發(fā)現(xiàn),北京、廣東、浙江、上海等地的大模型數(shù)量最多,同時(shí)這4個(gè)地方也是近3年人工智能服務(wù)器采購(gòu)數(shù)量最多的地區(qū),表現(xiàn)出非常明顯的強(qiáng)相關(guān)性,為大模型研發(fā)應(yīng)用提供了重要支撐。同時(shí),各地也在通過提供公共智能算力方式補(bǔ)充快速增長(zhǎng)的人工智能算力需求,為大模型研發(fā)提供更多算力支撐。
《報(bào)告》分析發(fā)現(xiàn),目前中國(guó)大模型產(chǎn)業(yè)化應(yīng)用大致出現(xiàn)兩種并行的發(fā)展路徑,文心一言、通義千問、紫東太初等中國(guó)一批通用化大模型正在快速發(fā)展,打造跨行業(yè)通用化人工智能能力平臺(tái),其應(yīng)用行業(yè)正在從辦公、生活、娛樂向醫(yī)療、工業(yè)、教育等加速滲透。
與此同時(shí),一批針對(duì)生物制藥、遙感、氣象等垂直領(lǐng)域的專業(yè)類大模型,正在發(fā)揮其領(lǐng)域縱深優(yōu)勢(shì)不斷深化落地,提供針對(duì)特定業(yè)務(wù)場(chǎng)景的高質(zhì)量專業(yè)化解決方案。
根據(jù)騰訊研究院、同濟(jì)大學(xué)、騰訊云、騰訊新聞共同發(fā)布的《人機(jī)共生——大模型時(shí)代的AI十大趨勢(shì)觀察》報(bào)告,“大模型”已可以在多個(gè)領(lǐng)域催生出全新的商業(yè)價(jià)值,第一批跨功能的應(yīng)用程序已在眼前:金融、零售、政府、制造、物流、地產(chǎn)、教育等多個(gè)行業(yè),以及財(cái)務(wù)、HR、客服等應(yīng)用場(chǎng)景,“大模型”展現(xiàn)了出色能力。報(bào)告預(yù)測(cè),各行業(yè)都將迅速整合大模型的能力。與其他顛覆型技術(shù)一樣,這種變革一開始會(huì)緩慢發(fā)展,然后迅速加速。
國(guó)內(nèi)百大模型列表及排名
為了更好地評(píng)估和比較這些模型在中文領(lǐng)域的表現(xiàn),已經(jīng)有針對(duì)中文的通用大模型的測(cè)評(píng)基準(zhǔn)。
中文通用大模型基準(zhǔn)(SuperCLUE)就是其中的一個(gè)測(cè)評(píng)基準(zhǔn),嘗試對(duì)主流的AI通用模型進(jìn)行一個(gè)可量化的對(duì)比評(píng)分。它主要回答的問題是:在當(dāng)前通用大模型大力發(fā)展的情況下,中文大模型的效果情況。包括但不限于:這些模型不同任務(wù)的效果情況、相較于國(guó)際上的代表性模型做到了什么程度、 這些模型與人類的效果對(duì)比。SuperCLUE從三個(gè)不同的維度評(píng)價(jià)模型的能力:基礎(chǔ)能力、專業(yè)能力和中文特性能力。其中專業(yè)能力包括中學(xué)、大學(xué)與專業(yè)考試,涵蓋了從數(shù)學(xué)、物理、地理到社會(huì)科學(xué)等50多項(xiàng)能力。
國(guó)內(nèi)百大模型列表
近日,SuperCLUE發(fā)布了中文大模型8月榜單。8月榜單由5部分組成:總排行榜、OPEN多輪開放問題排行榜、OPT三大能力客觀題排行榜、十大基礎(chǔ)能力排行榜、開源排行榜。
2023年8月SuperCLUE中文大模型總排行榜
2023年8月SuperCLUE-OPEN排行榜
2023年8月 SuperCLUE-OPT排行榜
2023年8月 SuperCLUE 基礎(chǔ)能力排行榜
2023年8月 SuperCLUE 開源排行榜
從榜單上的測(cè)評(píng)結(jié)果來(lái)看,國(guó)內(nèi)大模型在中文任務(wù)上的表現(xiàn)與GPT3.5仍有一定距離,但差距在持續(xù)縮??;開源模型競(jìng)爭(zhēng)力進(jìn)一步提升;模型在開放問題和客觀選擇題的表現(xiàn)有不一致的情況。
監(jiān)管政策逐步落實(shí),大模型加速走向應(yīng)用
今年以來(lái)熱度極高的大模型,一直是各互聯(lián)網(wǎng)大廠競(jìng)逐的賽道,各大科技公司均推出了自家的大模型,呈現(xiàn)出“百模大戰(zhàn)”的盛況。
但是,生成式AI落地面臨著監(jiān)管方面的限制,這也是大模型產(chǎn)品遲遲未能向公眾開放的重要原因。在獲得備案審批之前,各家只是在小范圍進(jìn)行內(nèi)測(cè),用戶則需要“排隊(duì)”申請(qǐng)內(nèi)測(cè)資格。
4月11日,國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布的關(guān)于《生成式人工智能服務(wù)管理辦法(征求意見稿)》提出,利用生成式人工智能產(chǎn)品向公眾提供服務(wù)前,應(yīng)當(dāng)按照《具有輿論屬性或社會(huì)動(dòng)員能力的互聯(lián)網(wǎng)信息服務(wù)安全評(píng)估規(guī)定》向國(guó)家網(wǎng)信部門申報(bào)安全評(píng)估,并按照《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》履行算法備案和變更、注銷備案手續(xù)。
6月20日,國(guó)家網(wǎng)信辦發(fā)布了關(guān)于深度合成服務(wù)算法備案信息的公告,公開發(fā)布境內(nèi)深度合成服務(wù)算法備案信息。41個(gè)深度合成服務(wù)算法被納入清單,涉及26家公司,百度、阿里巴巴、騰訊、字節(jié)跳動(dòng)、美團(tuán)等互聯(lián)網(wǎng)大廠均榜上有名。
8月15日,由國(guó)家互聯(lián)網(wǎng)信息辦公室等七部門聯(lián)合發(fā)布的《生成式人工智能服務(wù)管理暫行辦法》正式實(shí)施,這也是我國(guó)首個(gè)針對(duì)生成式人工智能產(chǎn)業(yè)的規(guī)范性政策。
相關(guān)監(jiān)管政策的逐步落實(shí),國(guó)內(nèi)大模型企業(yè)有了明確的政策準(zhǔn)入,生成式AI的發(fā)展也有了更多的確定性。隨著首批通過備案的大模型率先向用戶開放,大模型賽道上的“搶跑者”率先過線,進(jìn)入公眾眼球,并有望在未來(lái)的市場(chǎng)競(jìng)爭(zhēng)中獲得更多的先發(fā)優(yōu)勢(shì)。業(yè)界預(yù)計(jì),大模型在下一個(gè)階段有望迎來(lái)應(yīng)用層之戰(zhàn)。
責(zé)任編輯:張薇