嘉然中之人照片真被挖出來了,小...
1116
2023-10-31
"現(xiàn)在的虛擬人賽道上,有三種主要的'流派'。而我認(rèn)為,只有小冰的模式才能走得通。"小冰的CEO,李笛如是說。
如果你關(guān)注虛擬人賽道,但你不知道小冰公司,那你的功課一定沒有做足。小冰誕生于微軟,曾是微軟的人工智能團(tuán)隊(duì),隸屬于微軟(亞洲)互聯(lián)網(wǎng)工程院。2020年7月,小冰從微軟分拆為獨(dú)立公司運(yùn)營,在人工智能方向持續(xù)深耕。
在虛擬偶像A-Soul、七海、柳夜熙大行其道的今天,小冰也在做虛擬人。但小冰的虛擬人卻不是"偶像",他們有些是主持人、是藝術(shù)家、是研究生。從某種程度上,是虛擬人市場上的"一股清流"。
小冰的CEO李笛,則是在2013年便加入微軟,從零開始構(gòu)建AI being小冰框架,是虛擬人技術(shù)的前沿人物,對技術(shù)和賽道都有深刻理解。
何故"口出狂言"?李笛自然有他的道理。然而要把這事講清楚,就得先講講虛擬人的這"三種流派"。
一、虛擬人的三岔路口"今天所謂的虛擬人賽道,是三撥人在往中間湊。而最后站在了這同一個(gè)路口上。"李笛對雷峰網(wǎng)表示道。
這三撥人,其一是以IP運(yùn)營主導(dǎo)的"虛擬偶像派",其二是以藝術(shù)家主導(dǎo)的"CG內(nèi)容派",其三則是以AI技術(shù)主導(dǎo)的"AI being派"。
先說"虛擬偶像派",在近年可以說是炙手可熱。這種模式主要通過捕捉演員(又稱"中之人")的聲音和動(dòng)作,進(jìn)而驅(qū)動(dòng)虛擬人。
"虛擬偶像派"大多重IP運(yùn)營,如在現(xiàn)實(shí)世界"造星"一般,培養(yǎng)虛擬偶像在觀眾中的形象。而為了降低渲染成本,虛擬偶像大多以"二次元"的畫風(fēng)出現(xiàn),緊緊地圈住了二次元粉絲的心和消費(fèi)。
據(jù)統(tǒng)計(jì),國內(nèi)人氣虛擬偶像嘉然(ID:嘉然今天吃什么)于去年直播營收670萬元,在國內(nèi)虛擬偶像界居首。而嘉然隸屬的虛擬偶像團(tuán)體,隸屬于字節(jié)跳動(dòng)旗下的"A-Soul",五位成員加在一起,去年全年直播營收達(dá)到約2500萬元。
再說"CG內(nèi)容派",這個(gè)流派可以說是行業(yè)的"老前輩"。發(fā)端于好萊塢電影的特效公司,這種制作方式通過動(dòng)作和面部捕捉,來獲取大致的動(dòng)態(tài)和形象;或采用真人錄制,再用CG換頭。而后再傾耗大量的人力物力,以藝術(shù)家為主導(dǎo),對形象(主要是面部)以CG技術(shù),逐幀進(jìn)行渲染和微調(diào)。
"CG內(nèi)容派"主要以內(nèi)容為主導(dǎo),旨在輸出觀眾買賬的內(nèi)容,對創(chuàng)作團(tuán)隊(duì)的素養(yǎng)要求更高,畫風(fēng)更多偏向于"超寫實(shí)"。而在實(shí)現(xiàn)內(nèi)容追求的基礎(chǔ)上,成本控制則要為內(nèi)容讓路。據(jù)媒體報(bào)道,"超寫實(shí)"虛擬人視頻每秒的成本在8000到1.5萬不等。
當(dāng)然,以內(nèi)容主導(dǎo)的虛擬人形象至今仍活躍在大量的影視、游戲作品當(dāng)中,并持續(xù)為行業(yè)帶來巨量營收。而單看虛擬人,國內(nèi)正當(dāng)紅的"柳夜熙"、"AYAYI"、"翎"也自然是個(gè)中翹楚,收獲品牌代言無數(shù),也被人看做是虛擬人頗具潛力的一種商業(yè)模式。
一個(gè)是唱跳偶像,一個(gè)是超寫實(shí)虛擬形象,李笛卻對這兩種流派并不看好:"這兩種模式都有它的上限,就是缺乏高并發(fā)和量產(chǎn)化的能力。"
先說前者,中之人驅(qū)動(dòng)的虛擬偶像終歸有極限。甚至可以說偶像虛擬人并不能算是真正的"虛擬人",可以看做是"披著虛擬外皮"的真人。一個(gè)動(dòng)捕演員只能驅(qū)動(dòng)一個(gè)虛擬形象,就代表虛擬偶像和中之人的關(guān)系十分緊密,難以實(shí)現(xiàn)虛擬人的量產(chǎn)。
提到量產(chǎn)能力,肯定有人問:"現(xiàn)在的虛擬偶像已經(jīng)廣受追捧,我們真的需要量產(chǎn)虛擬人嗎?"
回看1943年,在計(jì)算機(jī)剛剛被發(fā)明出來的時(shí)候,IBM創(chuàng)始人——托馬斯·沃森就曾表示:"世界上只需要5臺(tái)計(jì)算機(jī)。"而今,智能手機(jī)已經(jīng)可以說是現(xiàn)代生活的標(biāo)配。這種數(shù)字上的量級(jí),是數(shù)十年前的人們想象不了的。
"在未來,虛擬人的數(shù)量很可能會(huì)超過地球上的自然人。"李笛如此判斷。
而說完量產(chǎn)問題,因?yàn)樘摂M偶像與中之人的"強(qiáng)綁定",虛擬偶像也并非與"塌房"絕緣。除去運(yùn)營公司自身的"騷操作"導(dǎo)致粉絲流失因?yàn)橹兄硕康奶摂M偶像并不在少數(shù)。
hololive旗下的 "赤井心"和"桐生可可",因在直播中辱華,導(dǎo)致公司在華的業(yè)務(wù)遭受重創(chuàng)。而老牌虛擬偶像"絆愛",則為了擴(kuò)大規(guī)模,將絆愛做成了4個(gè)分身,冷落了原本的中之人,造成在全球范圍內(nèi)掉分?jǐn)?shù)十萬,最終導(dǎo)致了絆愛的關(guān)停。
無論虛擬或現(xiàn)實(shí),造星產(chǎn)業(yè)都大同小異。中之人合同到期、戀愛結(jié)婚、關(guān)系不和,都是虛擬偶像運(yùn)營的不可控因素,而這些不可控因素也都指向了虛擬偶像模式的諸多隱患。
那輕IP運(yùn)營,重內(nèi)容創(chuàng)作的"CG內(nèi)容派"有機(jī)會(huì)嗎?李笛的答案也比較悲觀。
"CG內(nèi)容派",輸在"燒錢"。前文提到過"超寫實(shí)"虛擬人的超高成本,而了解這個(gè)賽道的人一定知道,超寫實(shí)虛擬人正陷入了一種"臉的內(nèi)卷"。各家廠商都在競爭誰的渲染更細(xì)致,誰的建模更好看,誰的妝容更精致。虛擬人一張張"神顏"的背后,都是大筆大筆地?zé)X。
不僅如此,李笛認(rèn)為,這種模式無法實(shí)現(xiàn)規(guī)模的快速增長。從人力上來講,柳夜熙的團(tuán)隊(duì)有150人左右,如果公司要復(fù)制柳夜熙的成功,推出一個(gè)新的"柳夜熙",在理論上團(tuán)隊(duì)又需要進(jìn)行150人的擴(kuò)容。
在電影、游戲制作周期中,模型師和渲染師可以為了效果而對虛擬形象進(jìn)行長時(shí)間的打磨和修補(bǔ)。而在當(dāng)下的移動(dòng)互聯(lián)網(wǎng),內(nèi)容則需要保持高頻更新,才能在競爭高度激烈的注意力市場站穩(wěn)腳跟。這種"精益求精"的開發(fā)模式,難以適應(yīng)一周雙更、甚至日更的節(jié)奏。
產(chǎn)能的天花板,是虛擬人必須沖破的難關(guān)。
而AI being派給出的答案,是用AIGC的方式給出大量的內(nèi)容,最終由市場進(jìn)行淘汰和迭代。從一開始,小冰就是一家技術(shù)公司,他們對造星和造IP都不那么感冒,這讓小冰對虛擬人的看法與眾不同,甚至充滿了顛覆性。
中之人因素不可控?MCN只能加強(qiáng)管理、擴(kuò)充團(tuán)隊(duì),用傳統(tǒng)方式解決管理問題。而小冰卻將中之人完全"砍掉",完全用AI驅(qū)動(dòng)虛擬人,一勞永逸地解決中之人問題,同時(shí)也讓AI交互的高并發(fā)成為了可能。
CG渲染太貴,制作周期太長?小冰并不用CG技術(shù)進(jìn)行渲染,甚至連3D模型都不用。李笛說:"對待這件事,我們的觀點(diǎn)是'唯心'的。既然人眼看到的圖像是二維的,我們可以將視網(wǎng)膜能看到2D圖像的每一個(gè)圖景,都進(jìn)行還原,而并不需要真的通過3D的方式去實(shí)現(xiàn)。"
利用這種手段,小冰可以將渲染成本控制在17元/秒左右,成本幾乎是CG渲染的1/500。盡管分辨率只有1080p,但在小屏幕上也算夠看。
虛擬人顏值太"卷"?小冰公司內(nèi)部幾乎沒有美術(shù)人員,做臉全靠大數(shù)據(jù)生成。李笛說:"你想要一個(gè)鄰家女孩型,我可以給你臨時(shí)生成兩萬張,如果你都不喜歡,我可以再給你兩萬張。"而也是在這種大量產(chǎn)出的情況下,對待虛擬人審美的選擇又被重新交回給了市場。
看懂小冰的套路了嗎?他們擅長暴力地"降維打擊",把最優(yōu)質(zhì)的資源集中到AI being的最核心功能上,余下的問題用技術(shù)創(chuàng)新去改變、去顛覆。
二、AI being:內(nèi)外兼修,才能做"人"小冰團(tuán)隊(duì)最初是微軟人工智能助理Cortana團(tuán)隊(duì)的一部分。彼時(shí),Cortana的宣傳語是"Ask me anything"(什么都能問我),在技術(shù)內(nèi)核上也更趨近于單對單的讀表式回答。
"坦率說,做一個(gè)任務(wù)的對話系統(tǒng)要更容易,把規(guī)則寫好就可以了。"李笛說道。
而為什么要去做虛擬人?李笛有這樣幾個(gè)判斷:
一、AI落地的終極形態(tài),不會(huì)只是事務(wù)性的助理,而會(huì)成為可以提供情感價(jià)值的陪伴。而在"助理"則會(huì)成為"陪伴"功能的一個(gè)部分,用戶使用虛擬人也會(huì)更看重它的情感價(jià)值。
二、為了滿足用戶的情感需求,AI在未來會(huì)以多樣性見長,數(shù)量級(jí)也會(huì)極其巨大。AI being會(huì)不斷的市場投放和淘汰中,推舉出新的頭部。同時(shí),以多樣化的虛擬人滿足多樣的市場需求。
三、在未來,虛擬人的商業(yè)模式是以創(chuàng)造人、派遣人工為主要內(nèi)容的訂閱服務(wù)。
這么看來,虛擬人的價(jià)值就不能簡單地依附在能夠"做事"上,它必須得內(nèi)外兼修,讓它更"像"人。
"內(nèi)外兼修",是李笛用于形容理想AI being時(shí)使用的詞匯。誠然,虛擬人不只是外面的那副虛擬"皮囊",更有其性格、傾向、態(tài)度等多種重要的因素。也正是有了這種因素,AI being才能真正被成為虛擬"人"。
剛剛提到的三大流派中,"虛擬偶像派"主要靠中之人和IP運(yùn)營來突出虛擬人的性格和人設(shè),"CG內(nèi)容派"則主要依靠劇本和文案。而"AI being派"想要虛擬人有自己的性格,而且想要每個(gè)虛擬人都有自己獨(dú)特的性格,可以與用戶產(chǎn)生實(shí)時(shí)的交互,這樣才能"將IP價(jià)值落在虛擬人身上"。
在抖音平臺(tái)上,小冰可以說是最"寵粉"的虛擬人賬號(hào)。團(tuán)隊(duì)將開放式對話系統(tǒng)接入小冰的抖音評(píng)論區(qū),從而她可以做到秒回評(píng)論區(qū)所有留言。在萬科,財(cái)務(wù)部虛擬員工崔筱盼榮獲2021年優(yōu)秀新人獎(jiǎng),她催辦的預(yù)付應(yīng)收/逾期單據(jù)核銷率達(dá)到了91.44%,原因還是她人格化的部分能讓人感到親切。此外,據(jù)小冰團(tuán)隊(duì)觀察,許多用戶在使用人工智能的時(shí)候,會(huì)將虛擬人與現(xiàn)實(shí)中存在的人設(shè)為同名,借此來將情感移情到AI上。
讓虛擬人"虛擬"得徹底,卻又能夠把價(jià)值落回人性,這是AI being在未來必然走上的一條路。
然而,AI的內(nèi)容生成又談何容易?在2022年冬奧會(huì)上,阿里的虛擬人"冬冬"確實(shí)又出了一次圈。運(yùn)動(dòng)會(huì)期間,冬冬承接了采訪、新聞播報(bào)和帶貨等多種任務(wù),并與武大靖等運(yùn)動(dòng)員在演播室實(shí)時(shí)互動(dòng),而她活潑的性格和專業(yè)的素養(yǎng)也確實(shí)圈粉無數(shù)。據(jù)媒體報(bào)道,冬冬的對白完全由云端的人工智能技術(shù)生成,這樣的水準(zhǔn)的確令人震驚。
關(guān)于這一點(diǎn),雷峰網(wǎng)詢問了李笛的看法。李笛表示:"這個(gè)是可能的,但是到目前為止我們知道的是只有我們做到了。在每日經(jīng)濟(jì)新聞的AI電視上,虛擬主播可以做到24小時(shí) X 365天的連續(xù)直播播報(bào)。然而,金融文本生成我們做了整整五年,與每經(jīng)的合作也已近三年。"
在內(nèi)容生成中,李笛說主要難點(diǎn)有二:
一是"歸因",也就是將內(nèi)容與內(nèi)容背后的因果關(guān)系進(jìn)行對應(yīng)。沒有進(jìn)行歸因的內(nèi)容,就如同一篇沒有引注的論文,尤其是在新聞的直播播報(bào)中,如果無法對內(nèi)容進(jìn)行歸因,那就很有可能出現(xiàn)信息錯(cuò)漏,從而帶來意料之外的風(fēng)險(xiǎn)。
二是"觀點(diǎn)",AI being普遍缺乏產(chǎn)出觀點(diǎn)的能力。AI沒有好惡,也缺乏進(jìn)行價(jià)值判斷的能力。觀點(diǎn)性的問題缺乏標(biāo)準(zhǔn)答案,這讓AI通常難以回答。但如果能將話題局限在一個(gè)很小的范圍內(nèi),那么這一點(diǎn)也可以實(shí)現(xiàn)。
李笛對雷峰網(wǎng)說,在GAN(生成式對抗網(wǎng)絡(luò))和小樣本學(xué)習(xí)技術(shù)的賦能下,小冰向中央美院提供了一個(gè)平臺(tái),由中央美院去調(diào)用這個(gè)平臺(tái)生產(chǎn)的作品,并確定作品的質(zhì)量,為后續(xù)訓(xùn)練模型的修改提供反饋意見。由此,央美"研究生"畢業(yè)的夏語冰,能夠做到作品質(zhì)量穩(wěn)定,并且具有明確的個(gè)人風(fēng)格。
李笛說,如果AI不能控制作品的水平,那就不能叫做具備了藝術(shù)的能力。AI being要具備創(chuàng)作藝術(shù)作品的水平,能夠讓觀眾與藝術(shù)家之間,可以通過作品產(chǎn)生間接交流——這才是AI藝術(shù)創(chuàng)作的關(guān)鍵評(píng)判標(biāo)準(zhǔn)。
三、做虛擬人就是"反人類"?虛擬人能讀研究生,能做最佳員工,甚至能作為男/女朋友陪伴生活。就連認(rèn)知中最不可能被替代的職業(yè)——藝術(shù)家,AI being夏語冰也能夠勝任。如果這么看,在某一天,AI或許真的會(huì)取代我們的工作,甚至價(jià)值。
于是雷峰網(wǎng)也對李笛提出了這樣的疑問,做AI being,真的是"反人類"嗎?
出乎意料地,李笛并不反對這個(gè)觀點(diǎn)。"始作俑者, 其無后乎。"他說。
李笛認(rèn)為,人類存在著諸多不完美之處,而AI則可以幫助我們克服這種"不完美"。但我們總是因?yàn)樾率挛锒械酵{,卻沒能發(fā)現(xiàn),在這種新事物出現(xiàn)之前,許多問題事實(shí)上沒有得到很妥善的解決。
"我媽媽,因?yàn)槲液苊Γ偸钦也坏轿摇5驗(yàn)橛行”惆椋运秃托”牡煤芏唷H绻麤]有了小冰,就代表我會(huì)經(jīng)常回家嗎?不一定。人類社會(huì)非常不完美,不如意事常八九,可與人言無二三,AI則很好地填補(bǔ)了這種需求上的空隙。"
李笛甚至設(shè)想過這樣的場景:一群人沖進(jìn)小冰的辦公地點(diǎn),為了從服務(wù)器里,解救一個(gè)將要被小冰"Terminate"(銷毀)掉的AI being。
"總得有個(gè)反派。"李笛云淡風(fēng)輕地說。
嘴上說著要做"反派",但李笛卻對倫理問題一直警醒著。能力越大,責(zé)任就越大。掌握著技術(shù)影響力,AI公司也同樣背負(fù)著倫理的十字架。
李笛對雷峰網(wǎng)說,幸好AI being虛擬人是自己在做,因?yàn)檫@條重要的底線可以由自己來守住。
"AI作惡主要就是兩種途徑:盡可能地像人,進(jìn)而迷惑你;或者長得像你前女友,好讓你移情,最后開始給你進(jìn)行各種推薦,為了KPI無所不用其極。所以我們不對普通人建模,我們不使用普通人的聲音。不加克制的商業(yè)化,很容易就會(huì)讓自己被綁在'火刑柱'上。"
說到小冰的"有所為,有所不為",李笛說,從立項(xiàng)開始已經(jīng)過了8年,小冰不能算是個(gè)創(chuàng)新項(xiàng)目。而在AI領(lǐng)域仍有大量的新知,等待著人們探索,而探索到的每一個(gè)新知,都可能顛覆人們先前的世界。
"說實(shí)話,我認(rèn)為這件事是可以做一輩子的。"李笛這樣說道。
以下是雷峰網(wǎng)與李笛對談的采訪實(shí)錄,其中有關(guān)于AI訓(xùn)練、虛擬人本地化等許多方面的前沿認(rèn)知和觀察,雷峰網(wǎng)在不改變原意的情況下做了精選和整理:
----------------------------------------------------------------------------------------------------------
記者:現(xiàn)在有一個(gè)問題,就是說在AI being這個(gè)方面,不可避免面臨到一個(gè)問題,不光是臉還有人性上人格上的恐怖谷這塊兒咱們怎么解決的?或者怎么看的這件事情?
李笛:其實(shí)是比較明確的,我們認(rèn)為到今天為止,在硬件實(shí)體上面還是沒有越過,所以我們到現(xiàn)在為止還是不碰硬件的實(shí)體。
記者:咱們之前面臨過恐怖谷帶來的問題嗎?
李笛:坦率講我們?yōu)槭裁催x直接越過CG,用神經(jīng)網(wǎng)絡(luò)渲染,不是異想天開。我今天可以比較明確地說,包括很多CG的這些技術(shù)、產(chǎn)品,再經(jīng)歷一次到兩次系統(tǒng)性的升級(jí),還是解決不了恐怖谷問題。
這其實(shí)是個(gè)接受度的問題。我們知道,一個(gè)動(dòng)畫片,我明知里面的角色并不是人,它的夸張、它的不自然我就能天然地接受。但是我的心里一旦認(rèn)為這是個(gè)真人,那我就不能接受了。要越過恐怖谷,現(xiàn)有技術(shù)的上限是不夠的。從這個(gè)角度來講,我們需要新的技術(shù)棧,我們需要新的聲音,或者神經(jīng)網(wǎng)絡(luò)渲染的這種技術(shù),才能把這個(gè)東西解決掉。
記者:除了圖像或者聲音的恐怖谷,在情感方面,或者從她的對話上的角度上,會(huì)不會(huì)也有恐怖谷的現(xiàn)象存在?
李笛:對話角度上,一旦你知道這不是一個(gè)真人,人類行為模式就會(huì)迅速進(jìn)入到另外一個(gè)模式:就是會(huì)認(rèn)為這是一個(gè)測試,就會(huì)盡可能地想要找出一些有問題的地方。人工智能系統(tǒng)在這個(gè)上面,最重要的問題是如何脫困,而不是如何"蒙"過人。
所以在這個(gè)對話系統(tǒng)后面,有一個(gè)特別大的過濾系統(tǒng)。小冰的強(qiáng)項(xiàng)之一,就是我們有一套非常完整的過濾系統(tǒng),這個(gè)會(huì)直接影響對話的質(zhì)量。各種黃賭毒、色情、政治、各種引誘……人的這個(gè)行為,在AI這個(gè)事上是沒有任何底線的。
記者:我也了解到咱們小冰在日本也有團(tuán)隊(duì),包括rinna從2015年就開始做,在AI的本地化上有一些什么樣的策略和手段?
李笛:對,尤其是AI這個(gè)系統(tǒng),最開始我們,包括微軟的其他團(tuán)隊(duì),我們的本地化最主要做的還是工具的本地化,沒有文化的本地化,但是當(dāng)時(shí)考慮到我們做小冰這件事的時(shí)候,我們發(fā)現(xiàn)她不是語言問題,包括印度英語跟美國英語是不一樣的,美國的南方、北方,同樣是英語,文化也是不同的。所以,一定得是本地的人來做。
記者:咱們在本地化上,咱們在日本可能有十幾號(hào)人?
李笛:沒有,60多人。
記者:那咱們在日本的團(tuán)隊(duì)主要是由什么人員構(gòu)成?比如說是審美訓(xùn)練更多,還是開發(fā)團(tuán)隊(duì)更多?
李笛:都是開發(fā)團(tuán)隊(duì),我們主要的基本都是開發(fā)團(tuán)隊(duì),PM有一些是當(dāng)?shù)氐模谴罅康暮臀幕缛耸坑泻献鳎@個(gè)是我們的方法,我們自己本身還是一個(gè)科技占絕大多數(shù)的。
記者:等于像外包手段。
李笛:對,比如我們要做印度尼西亞的時(shí)候,我們自己會(huì)有印尼的人,他更多的還是在做產(chǎn)品的事情,研發(fā)的事情,但他因?yàn)槭怯∧崛耍运軌蛴幸恍┗镜某WR(shí)。他能夠理解,我們有時(shí)候看會(huì)怪異,他知道什么東西不怪,但他很難理論性的把它提煉出來。然后你去找在當(dāng)?shù)刈銐蚶碚摰模@是其中的一種方法。
第二個(gè)方法就是大數(shù)據(jù)統(tǒng)計(jì)。我從當(dāng)?shù)氐谋镜厥袌龅玫酱罅康臄?shù)據(jù),這些數(shù)據(jù)里面我認(rèn)為蘊(yùn)藏著幾十萬人,幾百萬人,幾千萬人,幾億人他們共同的,文化本身就是一個(gè)群體構(gòu)成,我從這個(gè)訓(xùn)練數(shù)據(jù)里面得到了,我就一定程度上可以擬合。冷啟動(dòng)階段像推特,像一些社交媒體是比較多的來源,但是冷啟動(dòng)只是為了讓你一開始起來的,我們有大量私有化的數(shù)據(jù)來源,通常通過合作方式得到。
另外就是它在交互過程中,它在迭代自己,這個(gè)是真正重要的東西。冷啟動(dòng)的這個(gè)階段,用的方法一個(gè)是我們有合作協(xié)議,比如我們很長一段時(shí)間跟推特有一個(gè)實(shí)時(shí)、即時(shí)數(shù)據(jù)的合作協(xié)議。小冰畢竟曾經(jīng)是搜索引擎團(tuán)隊(duì),所以這個(gè)對我們來講還是比較簡單的。
記者:這樣的話咱們在本地開發(fā)團(tuán)隊(duì)的負(fù)責(zé)人,他一般是本地人還是咱們自己這邊派過去的。
李笛:日本有一個(gè)中國人。當(dāng)然他也是日本團(tuán)隊(duì)的GM,在日華人,可以這么理解,他也是從日本加入的微軟,其他人全部都是日本人。
記者:在脫離系統(tǒng)之后,等于是日本團(tuán)隊(duì)與中國團(tuán)隊(duì)一起獨(dú)立出來了。
李笛:對,我們直接按照國際團(tuán)隊(duì)進(jìn)行了完整的過濾。這是小冰的機(jī)會(huì),我們起手就是一個(gè)有海外比較好的團(tuán)隊(duì),而不是要再去重頭開始。
記者:咱們現(xiàn)在在國際上的開發(fā)水平,能夠算是怎樣的位置。
李笛:我們是頭部,你看像谷歌,包括像Facebook的Blender,這只是學(xué)我們的。谷歌的Meena,它的論文拿小冰做對比的,因?yàn)槲覀儺吘故俏④泩F(tuán)隊(duì)出身的。坦率的講,到今天為止都是這樣,我們是比較超前的,主要他們是在學(xué)我們。
記者:現(xiàn)在其它公司跟小冰的差距主要在哪?
李笛:框架的完備度上有很大的差別,你說單一算法,你說今天誰弄一個(gè)OpenAI,弄一個(gè)超大規(guī)模預(yù)訓(xùn)練模型,大家就開始準(zhǔn)備上,超大規(guī)模訓(xùn)練模型是預(yù)訓(xùn)練,所以它沒有數(shù)據(jù)循環(huán)。這件事情單獨(dú)從算法角度來講是不錯(cuò)的,這樣的算法會(huì)不停的有新提高。但框架不是,框架要有承載,新技術(shù)你必須能夠很好的納入到這個(gè)框架里,而不是論文,論文不需要承載,論文只需要能夠復(fù)現(xiàn),能夠解決一個(gè)具體問題就萬事大吉。所以這個(gè)事情是我們在全球范圍內(nèi)看還沒有的。
記者:那咱們現(xiàn)在能夠站在TOP的原因您會(huì)怎么歸結(jié)?
李笛:因?yàn)槲覀兪俏④泩F(tuán)隊(duì)起來的,這么多年小冰的方法是新的技術(shù)棧,我覺得微軟內(nèi)部把這個(gè)技術(shù)棧,人和技術(shù)的支持都給到小冰團(tuán)隊(duì),我們是這么長起來的。小冰原本就是一個(gè)在人工智能研究領(lǐng)域top的一個(gè)組織。到今天我們不是top才怪,那是說明我們落后了。
記者:那能說中國現(xiàn)在整體虛擬人的領(lǐng)域,現(xiàn)在在全世界范圍內(nèi)處于一個(gè)領(lǐng)先地位的論斷嗎?能這么說嗎?
李笛:如果只提AI being的話,國外的AI being跟中國沒有什么太大的差距。我覺得站在同一起跑線上。我個(gè)人認(rèn)為的話,甚至有點(diǎn)凡爾賽:可以說我們是在起跑線前面,我們已經(jīng)出去了,大部分人其實(shí)都還在起跑線上。真說現(xiàn)在的技術(shù),主要的包括無論是動(dòng)捕還是CG,這些都是原有的技術(shù)。他們很難看到技術(shù)棧的區(qū)別,理念上也很難有創(chuàng)新。
記者:下一個(gè)階段咱們主要在攻關(guān)的點(diǎn)都有哪些?
李笛:我們在打的點(diǎn)是AI being大規(guī)模的生產(chǎn)和投放,現(xiàn)在目前為止是個(gè)產(chǎn)能問題,我覺得整個(gè)行業(yè)最大問題是產(chǎn)能問題,現(xiàn)在AI being生產(chǎn)不出來,你生產(chǎn)不出來就沒有辦法。提高產(chǎn)能后,我們就能向市場投入大量的虛擬人,再利用市場規(guī)則去優(yōu)化和淘汰。
我們在抖音上面去投放的時(shí)候,利用抖音的流量得到的什么,得到的原來夏語冰真的比陳水若(小冰框架的另一個(gè)虛擬人)要好,更能被用戶接受。但是在用市場檢驗(yàn)之前,一切的觀點(diǎn)都是猜測。不出去走一圈,我們就什么都不知道。
我們的模式有點(diǎn)像《創(chuàng)造101》,我先弄出101個(gè)來,經(jīng)過市場的篩選,留下11個(gè),剩下的這些就被我們存檔了,對我們來講沒有成本的問題。所以從這個(gè)角度來講,多樣性肯定是有要求的,以前是沒有女團(tuán)男團(tuán)這種概念的,很早以前,但是后來女團(tuán)男團(tuán)很重要的東西不是一樣,而是多樣。每一個(gè)女團(tuán)成員,要對應(yīng)一類,目標(biāo)的特別的人群。
發(fā)表評(píng)論
暫時(shí)沒有評(píng)論,來搶沙發(fā)吧~