來(lái)源:人民郵電報(bào) 時(shí)間:2023-12-29 09:40:57 作者:
今年3月ChatGPT-4上線以來(lái),國(guó)內(nèi)科技龍頭企業(yè)密集推出人工智能大模型,百度“文心一言”、阿里云“通義千問(wèn)”、華為“盤古”、360“智腦”、昆侖萬(wàn)維“天工”、京東“靈犀”、科大訊飛“星火”、騰訊“混元”、商湯“日日新”等大模型先后登場(chǎng),呈現(xiàn)百花齊放、迅猛發(fā)展的態(tài)勢(shì)。截至2023年10月初,國(guó)內(nèi)公開(kāi)的AI大模型已經(jīng)超過(guò)200個(gè)。
當(dāng)前,大模型正在成為推動(dòng)新一輪科技創(chuàng)新、產(chǎn)業(yè)升級(jí)、生產(chǎn)力躍遷的重要力量。隨著前沿技術(shù)推動(dòng)產(chǎn)業(yè)全鏈條升級(jí),未來(lái)從田間到產(chǎn)線,從實(shí)驗(yàn)室到便利店,大模型可能無(wú)處不在。
“與早期的人工智能模型相比,今年我國(guó)大模型在參數(shù)量上實(shí)現(xiàn)了質(zhì)的飛躍,復(fù)雜任務(wù)建模能力整體提升,學(xué)習(xí)能力、泛化性更強(qiáng),具備了更高層次的認(rèn)知互動(dòng)能力。”北郵國(guó)家大學(xué)科技園元宇宙產(chǎn)業(yè)協(xié)同創(chuàng)新中心執(zhí)行主任陳曉華表示。
然而,在大模型迅猛發(fā)展的背后,也存在一系列問(wèn)題亟待解決。
首先是對(duì)大模型套殼的質(zhì)疑。近期,從谷歌新發(fā)布的AI模型Gemini演示視頻的造假,到字節(jié)跳動(dòng)被曝出部分工程師使用OpenAI技術(shù)開(kāi)發(fā)自己的大語(yǔ)言模型,違反了OpenAI服務(wù)條款,因此被暫停了賬戶……“百模大戰(zhàn)”的激烈競(jìng)爭(zhēng)以及引發(fā)的亂象,也讓業(yè)界對(duì)大模型評(píng)測(cè)標(biāo)準(zhǔn)以及統(tǒng)一規(guī)范提出了新的課題。
由于大模型的復(fù)雜性和應(yīng)用場(chǎng)景的多樣性,如何評(píng)價(jià)其性能和效果成為下一階段的一個(gè)極具挑戰(zhàn)性的問(wèn)題。因此,建立一套科學(xué)、合理、完善的評(píng)價(jià)體系對(duì)于大模型的應(yīng)用至關(guān)重要,它能夠推動(dòng)技術(shù)進(jìn)步、促進(jìn)產(chǎn)業(yè)發(fā)展,同時(shí)確保技術(shù)應(yīng)用的合規(guī)性和社會(huì)效益。
其次,隨著互聯(lián)網(wǎng)和科技企業(yè)不斷調(diào)整大模型參數(shù),傳統(tǒng)企業(yè)對(duì)于數(shù)智化轉(zhuǎn)型需求的增加,算力需求增長(zhǎng)。但是,由于高端芯片獲取難度大,大模型的研發(fā)成本進(jìn)一步增加。北京大學(xué)智能學(xué)院副院長(zhǎng)林宙辰教授提出通過(guò)合作共享資源和數(shù)據(jù),以及創(chuàng)新訓(xùn)練方法和獎(jiǎng)勵(lì)機(jī)制,來(lái)更高效地開(kāi)發(fā)和利用大模型的必要性。他提出通過(guò)股份和特別的獎(jiǎng)勵(lì)機(jī)制來(lái)鼓勵(lì)公司共享數(shù)據(jù)和算力,其中股份可以基于資金貢獻(xiàn)或者模型準(zhǔn)確率的貢獻(xiàn)來(lái)分配,個(gè)人也可以提供數(shù)據(jù),或者參與到訓(xùn)練過(guò)程中,通過(guò)數(shù)據(jù)質(zhì)量和微調(diào)效果擁有股份。這或許能幫助中小企業(yè)移開(kāi)面前的“成本”“技術(shù)”兩座大山。
在算法方面,國(guó)產(chǎn)大模型與國(guó)際先進(jìn)水平相比沒(méi)有根本性差異,基本都是圍繞深度神經(jīng)網(wǎng)絡(luò)、注意力機(jī)制、人工調(diào)優(yōu)等基礎(chǔ)算法進(jìn)行模型結(jié)構(gòu)或局部算法優(yōu)化,而在算力、數(shù)據(jù)等方面則與國(guó)際先進(jìn)水平存在一定差距。艾瑞咨詢產(chǎn)業(yè)數(shù)字化研究院負(fù)責(zé)人徐樊磊介紹,為提升整體算力效率和滿足差異化需求,應(yīng)建立支撐大模型萬(wàn)億量級(jí)參數(shù)計(jì)算的“智算中心”?!爸撬阒行摹笨衫矛F(xiàn)有高質(zhì)量數(shù)據(jù)中心,通過(guò)提升組網(wǎng)能力、協(xié)同能力、軟硬件適配能力等實(shí)現(xiàn)部署。當(dāng)前,“萬(wàn)卡”級(jí)別的智算中心正在主要節(jié)點(diǎn)城市發(fā)展起來(lái)。
面向未來(lái),企業(yè)不能盲目跟風(fēng),需要滿足自身已有的基礎(chǔ)產(chǎn)品和用戶群體在AI領(lǐng)域的訴求。從政產(chǎn)學(xué)研用通盤視角來(lái)看,政策端需要做好統(tǒng)籌調(diào)度,支持孵化大模型產(chǎn)業(yè)生態(tài),提供相應(yīng)的創(chuàng)新要素供給,促進(jìn)科技成果轉(zhuǎn)化和產(chǎn)業(yè)大模型落地成熟、成規(guī)模化;技術(shù)端需要進(jìn)一步推動(dòng)軟硬件技術(shù)一體化,為大模型的產(chǎn)業(yè)端應(yīng)用提供更牢固的技術(shù)基礎(chǔ);產(chǎn)業(yè)端則需要促進(jìn)產(chǎn)業(yè)對(duì)大模型和數(shù)智化應(yīng)用升級(jí)的知識(shí)認(rèn)知、能力建設(shè)和人才培養(yǎng),并結(jié)合當(dāng)前產(chǎn)業(yè)大模型訓(xùn)練需求,協(xié)助和支持科研界將大模型成果落實(shí)落地。
責(zé)任編輯:張薇