經(jīng)濟(jì)導(dǎo)報(bào)記者 劉勇
這個(gè)春節(jié)假期什么最火?那肯定是Sora!OpenAI發(fā)布的人工智能文字生成視頻大模型。
美國(guó)當(dāng)?shù)貢r(shí)間2024年2月15日,OpenAI正式發(fā)布文生視頻模型Sora,并發(fā)布了48個(gè)文生視頻案例和技術(shù)報(bào)告,正式入局視頻生成領(lǐng)域。
Sora能夠根據(jù)提示詞可以快速制作最長(zhǎng)一分鐘、準(zhǔn)確反映用戶(hù)提示、可一鏡到底的視頻,視頻中可包含多個(gè)角色、特定的動(dòng)作、主題和背景,在單個(gè)視頻中Sora還可創(chuàng)建多個(gè)鏡頭,多角度保留角色和視覺(jué)的風(fēng)格!澳胲垺绷诵袠I(yè)目前大概只有平均“4s”的視頻生成長(zhǎng)度。
此外,還可以使用Sora連接兩個(gè)輸入視頻,在具有完全不同主題和場(chǎng)景組成的視頻之間實(shí)現(xiàn)無(wú)縫過(guò)渡。
百度百科的解釋是,Sora繼承了DALL-E 3的畫(huà)質(zhì)和遵循指令能力,可以根據(jù)用戶(hù)的文本提示創(chuàng)建逼真的視頻。該模型可以深度模擬真實(shí)物理世界,能生成具有多個(gè)角色、包含特定運(yùn)動(dòng)的復(fù)雜場(chǎng)景,能理解用戶(hù)在提示中提出的要求,還了解這些物體在物理世界中的存在方式。
Sora對(duì)于需要制作視頻的藝術(shù)家、電影制片人或?qū)W生帶來(lái)無(wú)限可能,其是OpenAI“教AI理解和模擬運(yùn)動(dòng)中的物理世界”計(jì)劃的其中一步,也標(biāo)志著人工智能在理解真實(shí)世界場(chǎng)景并與之互動(dòng)的能力方面實(shí)現(xiàn)飛躍。
針對(duì)此次Sora所帶來(lái)的討論,360創(chuàng)始人周鴻祎在社交網(wǎng)絡(luò)上也分享了自己的看法。他認(rèn)為,Sora的誕生意味著AGI(通用人工智能)實(shí)現(xiàn)可能從10年縮短至一兩年。
談到Sora最大的優(yōu)勢(shì),周鴻祎表示,以往文字視頻軟件都是在2D平面上對(duì)圖形元素進(jìn)行操作,可以把視頻看成多個(gè)真實(shí)圖片的組合,并沒(méi)有真正掌握這個(gè)世界的知識(shí)。但Sora產(chǎn)生的視頻里,它能像人一樣理解坦克是有巨大沖擊力的,坦克能撞毀汽車(chē),而不會(huì)出現(xiàn)汽車(chē)撞毀坦克這樣的情況,“一旦人工智能接上攝像頭,把所有的電影都看一遍,把各視頻平臺(tái)的視頻都看一遍,對(duì)世界的理解將遠(yuǎn)遠(yuǎn)超過(guò)文字學(xué)習(xí)。一幅圖勝過(guò)千言萬(wàn)語(yǔ),而視頻傳遞的信息量又遠(yuǎn)遠(yuǎn)超過(guò)一張圖,這就離AGI真的不遠(yuǎn)了,不是10年20年的問(wèn)題,可能一兩年很快就可以實(shí)現(xiàn)!
而在業(yè)內(nèi)專(zhuān)家看來(lái),認(rèn)為AGI能在一兩年內(nèi)實(shí)現(xiàn)的觀點(diǎn)過(guò)于樂(lè)觀。中國(guó)人工智能產(chǎn)業(yè)聯(lián)盟安全治理委員會(huì)專(zhuān)委會(huì)副主委、浙江大學(xué)教授潘恩榮認(rèn)為,AGI在一兩年內(nèi)實(shí)現(xiàn)不能作為一種真實(shí)的預(yù)測(cè)!耙?yàn)槲覀冎v的通用人工智能往往指的是‘人’作為主體所作用的能力,然而現(xiàn)在人工智能能實(shí)現(xiàn)的事情,更像是‘物’的能力。”
不過(guò)也有人擔(dān)心,Sora大面積使用,AGI的實(shí)現(xiàn)也是必然,只是時(shí)間長(zhǎng)短的問(wèn)題。那么一旦AGI到來(lái),是否會(huì)真的出現(xiàn)電腦的自我意識(shí)覺(jué)醒?畢竟人類(lèi)是通過(guò)視覺(jué)感知認(rèn)知世界,才能把一個(gè)具體的世界(畫(huà)面)和大腦里的文字等抽象概念進(jìn)行連接的。也就是說(shuō)畫(huà)面視頻和文字是互相對(duì)應(yīng)的。而sora已經(jīng)解決了抽象到具體表象,也能表象到抽象!這是什么意思?它已經(jīng)能理解人類(lèi)世界了。這就是他自我意識(shí)的覺(jué)醒。
那么問(wèn)題來(lái)了,一旦AGI實(shí)現(xiàn),真的會(huì)出現(xiàn)電影中的情景——人工智能的自我意識(shí)覺(jué)醒嗎?