來(lái)源:中央廣電總臺(tái)中國(guó)之聲 時(shí)間:2024-02-21 16:28:53 作者:
這兩天,Sora的橫空出世,讓很多人陷入科技狂歡,至今熱度依然不減。
“炸裂”“顛覆”“斷層式領(lǐng)先”“降維打擊”……眾網(wǎng)友初見文生視頻大模型Sora時(shí),紛紛發(fā)出驚嘆和贊揚(yáng)。不少科技圈大佬也嘖嘖稱贊,馬斯克直接在社交平臺(tái)感慨“gg humans”(人類輸了),360公司董事長(zhǎng)周鴻祎甚至預(yù)測(cè),一旦AI能夠接上攝像頭,把所有電影和互聯(lián)網(wǎng)上的視頻都看一遍,就離AGI(通用人工智能)真的不遠(yuǎn)了,這一天可能在一兩年內(nèi)就會(huì)到來(lái),而不是十年或二十年。就連春節(jié)后股市首個(gè)交易日也給出積極反饋——Sora大模型概念股多只漲停。
Sora是誰(shuí)?為何能掀起巨浪?
如果你還不知道Sora,那它的母公司OpenAI發(fā)布的上一個(gè)AI產(chǎn)品,你一定聽說(shuō)過(guò):人工智能ChatGPT。而Sora是OpenAI發(fā)布的一個(gè)AI文生視頻大模型,它可將文字描述轉(zhuǎn)化為長(zhǎng)達(dá)60秒的高清視頻。
在此之前,其實(shí)已有一些文生視頻大模型,比如Pika、Runway等,為何Sora還能在各行各業(yè)引起如此之大的震撼呢?
工信部信息通信經(jīng)濟(jì)專家委員會(huì)委員劉興亮認(rèn)為Sora“震撼有三”:
一是大大降低了視頻制作門檻。“過(guò)去的文生視頻模型,需要一定專業(yè)能力才能完成,而Sora把這個(gè)門檻降到了最低:一段話、一張圖就能生成一段高質(zhì)量視頻?!眲⑴d亮表示,Sora把專業(yè)剝離開來(lái),讓普通人可以輕松做到文生視頻,門檻之低令人震撼。
二是生成視頻是個(gè)全新世界。劉興亮說(shuō),過(guò)去的文生視頻還是對(duì)已有素材的加工整合,而Sora生成視頻中的人物、事物可以是現(xiàn)實(shí)生活中完全沒有的,過(guò)去并不存在的?!斑@太不可思議了”。
三是生成視頻質(zhì)量堪比大片,為觀眾帶來(lái)更豐富和多樣化的視覺體驗(yàn)。“視頻中有角色,有表演,盡管目前還有一些bug,但人物表情非常細(xì)膩,視頻運(yùn)鏡和場(chǎng)景轉(zhuǎn)化十分絲滑,還可以自行分鏡、切換景別?!?/p>
劉興亮表示,此前的文生視頻模型,只能生成單鏡頭,時(shí)間也非常短,只有3~4秒時(shí)間,且一旦輸入新詞語(yǔ),就會(huì)生成新鏡頭,主角就會(huì)變換,而Sora不但將時(shí)間延長(zhǎng)到了60秒,還能自主進(jìn)行視角轉(zhuǎn)換、鏡頭景別切換,而且保持主體一致性。“無(wú)論是視頻長(zhǎng)度、清晰度,還是鏡頭景別的切換,都需要在技術(shù)上達(dá)到量級(jí)的飛躍”。
之所以能達(dá)到上面的效果,得益于Sora一個(gè)具顛覆性的特質(zhì)——世界模型特質(zhì)。何為世界模型特質(zhì)?即對(duì)真實(shí)的物理世界進(jìn)行建模,讓機(jī)器能夠像人一樣,對(duì)世界中的各種事物、關(guān)系和事件有理解和認(rèn)知。這一特性也使得其視頻生成得更流暢、更合邏輯。
據(jù)OpenAI官網(wǎng)介紹,“Sora能夠生成具有多個(gè)角色、特定類型的運(yùn)動(dòng)以及主體和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場(chǎng)景。該模型不僅能理解用戶在提示詞中提出的要求,還能理解這些東西在現(xiàn)實(shí)世界中的存在方式?!币簿褪钦f(shuō),Sora能通過(guò)視頻、圖片等多模態(tài)數(shù)據(jù)(即多種不同類型或模式的數(shù)據(jù),包括文本、圖像、音頻、視頻等多種形式的信息)來(lái)理解世界。
可以說(shuō),Sora是機(jī)器模擬現(xiàn)實(shí)世界的一個(gè)里程碑,AGI(通用人工智能:就像是一臺(tái)萬(wàn)能機(jī)器人或電腦大腦,能夠做人能做的幾乎所有事情。跟現(xiàn)在我們接觸到的大多數(shù)人工智能不一樣,現(xiàn)在的人工智能做得好的事情很單一,比如自動(dòng)駕駛的就很會(huì)開車,但是你讓它去下棋或者做飯,就可能一竅不通。但通用人工智能就不同了,你可以把它想象成一個(gè)“超級(jí)聰明”的電腦大腦,不僅能開車,還能做飯、教書、下棋,乃至創(chuàng)作音樂和藝術(shù)作品,而且還能在遇到新問題時(shí)自我學(xué)習(xí),找到解決問題的方法。打個(gè)比方,就好比一個(gè)全才的“小明”,不僅學(xué)習(xí)成績(jī)優(yōu)異,各門學(xué)科樣樣精通,而且還擅長(zhǎng)體育、音樂、美術(shù),幾乎什么都會(huì)。并且,小明還能夠迅速地學(xué)習(xí)和適應(yīng)全新的技能或是學(xué)科。)時(shí)代或?qū)⒓铀俚絹?lái)。
Sora將給“我”帶來(lái)什么?
Sora將給我們普通人的生活帶來(lái)什么影響?
劉興亮認(rèn)為,老百姓最直觀的感受主要有四方面。
一是進(jìn)入真正全民短視頻時(shí)代,短視頻行業(yè)或?qū)⒂瓉?lái)另一個(gè)高峰。目前短視頻創(chuàng)作者數(shù)量和直播并沒有想象中那么大,因?yàn)橐欢沃谱骶嫉亩桃曨l,需要一定拍攝、剪輯等技能。未來(lái),只要輸入一段文字、一張照片,每個(gè)人都可以在西瓜地里吃瓜、在盧浮宮里游覽、在鏡頭面前口吐蓮花?!爸灰銚碛泻玫膶徝馈?chuàng)造力和想象力,就可以收獲頗豐?!?/p>
二是獲取更多高質(zhì)量視頻信息的效率或?qū)⒋蟠筇岣摺D壳?,一段高質(zhì)量視頻的制作周期較長(zhǎng),從策劃、拍攝到剪輯耗時(shí)耗力,未來(lái),一旦Sora技術(shù)成熟,短視頻數(shù)量很可能再次迎來(lái)爆發(fā)。畢竟,不管要做一只螞蟻從地球潛入馬里亞納海溝,還是做出機(jī)器人在人體中探索等多么不可思議的畫面,都僅僅需要一句指令而已。
另外,或?qū)⒃诟蟪潭壬洗龠M(jìn)教育資源分配不公等問題的解決?!跋癖本┻@樣的大城市,為什么好的學(xué)區(qū)房那么貴,為什么三甲醫(yī)院的號(hào)那么難掛,其實(shí)很重要的一個(gè)原因是,資源有限,人數(shù)眾多,優(yōu)質(zhì)資源不可能惠及每一個(gè)人。”劉興亮表示,隨著像Sora這種人工智能技術(shù)的發(fā)展,AGI時(shí)代的到來(lái),一系列問題或?qū)⒌玫骄徑?。AI打破了時(shí)間和空間的界限,在山區(qū)的孩子,通過(guò)視頻課程、在線作業(yè)和虛擬實(shí)驗(yàn),增加了教育機(jī)會(huì)均等化。孩子們還可以便捷地享受名師課堂的魅力,AI輔導(dǎo)系統(tǒng)和智能助教,甚至是名師數(shù)字人,能夠提供教師難以解決的關(guān)鍵資源和輔導(dǎo),緩和優(yōu)質(zhì)師資短缺問題。孩子們還可以不離家鄉(xiāng),通過(guò)AI技術(shù),就可以身臨其境般地在世界各地游學(xué)。“相信通過(guò)這種方式,能很大程度上縮小教育差距,解決教育資源的不公平,這是一個(gè)非常積極的影響。然而,實(shí)現(xiàn)這些目標(biāo)也面臨挑戰(zhàn),如基礎(chǔ)設(shè)施投入、數(shù)據(jù)隱私保護(hù)等問題。”
此外,劉興亮還表達(dá)了擔(dān)心——真假將越發(fā)難辨,假作真時(shí)真亦假,人們辨別信息真實(shí)性的成本將大大提高。以前,都說(shuō)有圖有真相,如今,有圖也無(wú)真相,“耳聽+眼見”都不一定為真?!?0分鐘騙走400萬(wàn)”“9秒被騙245萬(wàn)”……如今AI詐騙已屢見不鮮。當(dāng)AI生成視頻進(jìn)入尋常百姓家,AI工具造成的負(fù)面影響將再度擴(kuò)大。
劉興亮說(shuō),由于我們普通人在日常生活中通常不會(huì)逐幀分辨視頻真?zhèn)?,越發(fā)以假亂真的AI視頻生成,足以化為欺詐者和詆毀者手里的利刃,刺向毫無(wú)防備的人。“AI內(nèi)容制作,讓現(xiàn)實(shí)和虛擬界線變得模糊,內(nèi)容真實(shí)性、版權(quán)、隱私、數(shù)據(jù)安全等問題紛至沓來(lái),除了自己要時(shí)刻多一分小心,社會(huì)也需要一系列政策、法律和倫理規(guī)范來(lái)應(yīng)對(duì),才能確保技術(shù)發(fā)展不脫軌,保護(hù)好每個(gè)人的利益?!?/p>
Sora等AI會(huì)奪走“我”的飯碗嗎?
Sora如此之厲害,以至于讓很多行業(yè)從業(yè)者感到瑟瑟發(fā)抖,對(duì)未來(lái)“飯碗”能否保住感到擔(dān)憂。
這種擔(dān)心并非空穴來(lái)風(fēng)。
近些年,人工智能已在影視行業(yè)中開始應(yīng)用。比如電影《流浪地球2》中已經(jīng)應(yīng)用了人工智能去做包括面部的增齡、減齡等方面的呈現(xiàn),以及聲音的處理。郭帆曾在去年透露,《流浪地球3》預(yù)計(jì)現(xiàn)場(chǎng)拍攝團(tuán)隊(duì)可能會(huì)從《流浪地球2》時(shí)的2000多人,減少到只剩幾百人。
△《流浪地球2》劇照 | 資料圖
可見,人工智能更新迭代之快?!艾F(xiàn)在的人工智能更新迭代速度,已經(jīng)以天為單位計(jì)了。”劉興亮說(shuō)。有估計(jì)認(rèn)為,未來(lái)三年影視行業(yè)將有20萬(wàn)個(gè)職位受到AI沖擊,音效工程師、配音演員、特效以及后期制作也將受到影響。如果技術(shù)繼續(xù)進(jìn)步,這類職位將越來(lái)越多地被AI工具所取代。
“擔(dān)心自己會(huì)失業(yè)的焦慮心情可以理解,但無(wú)論在什么行業(yè),面對(duì)AI帶來(lái)的重大變革,能否繼續(xù)在此行業(yè)站穩(wěn),很大程度上取決于轉(zhuǎn)型速度?!眲⑴d亮表示,讓你失業(yè)的其實(shí)不是AI,是那些掌握了AI工具的人,“別人掌握了,你沒有,你可能就被淘汰了。所以,我們得去適應(yīng)時(shí)代?!?/p>
如何適應(yīng)?教育和終身學(xué)習(xí)是應(yīng)對(duì)AI變革的關(guān)鍵,“擁抱AI、與之共舞,讓自己成為周圍環(huán)境中最懂AI的人。你掌握得越快,你可能就越能在這種大環(huán)境中勝出,不被淘汰;你掌握得越慢,你面臨被淘汰的風(fēng)險(xiǎn)可能就越大;如果你完全不掌握,那一定會(huì)被淘汰?!?/p>
無(wú)論如何,未來(lái)已來(lái)。面對(duì)不斷地被更新、被轉(zhuǎn)型,你準(zhǔn)備好了嗎?
責(zé)任編輯:張薇