
“未來的50年甚至100年,一定是人工智能不斷階躍式發(fā)展,逐漸走向通用人工智能的道路。”商湯科技智慧決策與游戲事業(yè)部的總經(jīng)理劉宇在WAIC2023期間接受《科創(chuàng)板日報》記者采訪時表示,“但就當(dāng)下而言,我們距離通用人工智能、距離所有的場景都能夠通過所謂的大模型來解決問題,其實(shí)還有很長的路要走。”
在WAIC2023上,“商湯日日新”大模型體系進(jìn)行了升級。其中,秒畫SenseMirage 3.0的模型參數(shù)從今年4月首次發(fā)布以來的10億提升至70億量級。
劉宇本身也是秒畫產(chǎn)品的負(fù)責(zé)人,他向《科創(chuàng)板日報》記者介紹,“秒畫平臺集齊了文字生成圖像、圖像生成圖像等一系列能力的AI作圖產(chǎn)品,也在WAIC期間對外開放。我們還正式上線了為進(jìn)階用戶提供的模型自訓(xùn)練、模型微調(diào)等功能。”
今年以來,中國大模型行業(yè)爆炸式發(fā)展,短短半年多時間,已有超過80個大模型產(chǎn)品相繼發(fā)布,進(jìn)入了所謂的“百模時代”。除了通用大模型外,針對垂直行業(yè)的模型也備受關(guān)注。
劉宇認(rèn)為,目前整個市場對于大模型的需求,可以分成三檔,即大B(企業(yè))端、小B端跟C端。
“其中,根據(jù)大B端的市場需求跟服務(wù)形式,我們會跟這些垂類行業(yè)深度綁定,企業(yè)提供領(lǐng)域知識,由我們來提供相應(yīng)的模型定制化服務(wù)。而對于小B端來說,像秒畫平臺的模型微調(diào)功能就是為其提供的。他們可以把自己的數(shù)據(jù)集進(jìn)行上傳,利用平臺背后強(qiáng)大的算力,可能只需要10分鐘就可以訓(xùn)練微調(diào)的小模型,比如像某一款車型的展示圖模型。”
業(yè)界普遍認(rèn)為,游戲行業(yè)是AIGC的天然適用場景,也是最重要的商業(yè)化方向之一。未來,隨著AI技術(shù)的“爆發(fā)式”發(fā)展,AIGC在游戲領(lǐng)域的應(yīng)用有望全面帶動游戲行業(yè)生產(chǎn)革命。對此,劉宇表示,游戲行業(yè)已經(jīng)在非常熱烈地?fù)肀I技術(shù)。
“游戲行業(yè)正在利用技術(shù)來賦能生產(chǎn)端、運(yùn)營端。比如像NPC對話的生成,宣傳廣告的內(nèi)容生成等。”
談及AI浪潮下的失業(yè)危機(jī),劉宇認(rèn)為,并不需要過度擔(dān)憂。
“AI之所以能對話、畫畫,都是通過學(xué)習(xí)人類的數(shù)據(jù)才擁有的能力。這意味著,首先得有原畫師創(chuàng)作出非常多高質(zhì)量的畫,AI才能達(dá)到他們的能力。所以不能說原畫師在未來的競爭力會變差,一些可復(fù)制的工作會被替代。而原畫師可以利用AI工具來更快速地創(chuàng)作,讓用戶更滿意。”
“我唯一的建議是,擁抱新技術(shù),盡快地學(xué)習(xí)到這些工具。”劉宇強(qiáng)調(diào),“那么個人競爭力反而會變得更強(qiáng),不會變得更弱。”
不少業(yè)內(nèi)分析指出,未來的通用智能一定是多模態(tài)智能,當(dāng)前多模態(tài)算法正處在“寒武紀(jì)大爆發(fā)”的早期。劉宇也認(rèn)同這一趨勢,未來,大模型一定是多模態(tài)輸入、多模態(tài)輸出的模式。
“目前不少大模型已初步實(shí)現(xiàn)了一些多模態(tài)能力,能夠接受語言和圖像的輸入,但只能輸出語言。但未來一定是多模態(tài)輸入、多模態(tài)輸出的形式。其實(shí)底層原理是共通的,只是需要聰明的研究員設(shè)計新的算法,需要更多的天然數(shù)據(jù)能讓大模型去學(xué)習(xí)。”
“這也是大模型下一步要解決的核心問題。”劉宇進(jìn)一步補(bǔ)充道,“目前商湯也在研發(fā)多模態(tài)大模型,解決認(rèn)知和感知的問題,同時也在做決策大模型,解決基于推理的理解問題。最終,我們會把它結(jié)合起來,希望為未來的通用人工智能提供技術(shù)方案。”