元宇宙概念爆火后,作為現(xiàn)實(shí)與元宇宙場(chǎng)景連接的重要“媒介”之一虛擬人以主角身份再次破圈。虛擬主播、虛擬教師、虛擬客服、虛擬導(dǎo)游等各類虛擬人物形象也愈發(fā)立體和全面地展示在我們的生活中,虛擬人普適化看似又進(jìn)了一步。然而,這些倍受追捧的虛擬人多以CG技術(shù)加持,低智能的驅(qū)動(dòng)能力、局限的推廣應(yīng)用、高額的造價(jià)卻讓更多受眾望而卻步。
今年8月,拓元智慧利用其全棧AI技術(shù),推出了真人復(fù)刻、數(shù)字克隆人服務(wù),并通過在垂直領(lǐng)域創(chuàng)建具備推理和認(rèn)知能力的數(shù)智人大腦,打造出低門檻、可規(guī)?;涞氐臄?shù)智人解決方案,為大眾用戶提供在虛實(shí)融合世界的分身和交互中介,使其成為新的連接及生活方式。
全棧AI技術(shù) 1:1還原真人形象和聲音
《2022虛擬人產(chǎn)業(yè)發(fā)展白皮書》指出,決定2D真人數(shù)智人高真實(shí)度還原的核心技術(shù)是各類驅(qū)動(dòng)算法設(shè)計(jì)和模型訓(xùn)練,數(shù)據(jù)訓(xùn)練的質(zhì)量將決定數(shù)智人內(nèi)容產(chǎn)出的效果。拓元智慧作為一家具備原創(chuàng)領(lǐng)先技術(shù)的AI數(shù)智人平臺(tái)服務(wù)商,在虛擬數(shù)智人核心技術(shù)領(lǐng)域積極布局、持續(xù)創(chuàng)新突破,其核心團(tuán)隊(duì)在自監(jiān)督學(xué)習(xí)、知識(shí)及因果推理、多模態(tài)內(nèi)容生成等關(guān)鍵技術(shù)板塊積淀了多年深厚的技術(shù)基礎(chǔ)。
通過原創(chuàng)的人體及人臉三維重建、語義/情感關(guān)聯(lián)的表情和動(dòng)作生成、情感化/風(fēng)格化語音合成等全棧AI技術(shù)能力,拓元智慧能根據(jù)真人出鏡錄制的短暫音視頻內(nèi)容,完成人物形象、聲音復(fù)刻及還原,實(shí)現(xiàn)媲美真人的宇宙元分身。
在形象復(fù)刻方面,一是采用人臉三維結(jié)構(gòu)重建模型,訓(xùn)練人物表情、口型和人臉形象,渲染出生動(dòng)、靈活的臉部肌肉和表情;二是采用肢體三維結(jié)構(gòu)重塑,通過肢體可驅(qū)動(dòng)引擎完成穿著渲染模塊和虛實(shí)環(huán)境交互對(duì)齊。在聲音合成方面,則是采用高保真多層級(jí)語音模型,完成音色、語調(diào)和語速的高度還原。
支持 IP定制 滿足全領(lǐng)域多場(chǎng)景應(yīng)用
傳統(tǒng)認(rèn)知下,形象好、氣質(zhì)佳、普通化標(biāo)準(zhǔn)、音質(zhì)好的人物才可以復(fù)刻出效果好的虛擬數(shù)智人,但基于認(rèn)知AI及數(shù)智大腦原理制作數(shù)智人的拓元,早已打破這一前提。無論是政府機(jī)構(gòu)、教育培訓(xùn)、MCN機(jī)構(gòu)還是媒體單位,想要復(fù)刻的人物是男性、女性、老人還是兒童,拓元復(fù)刻技術(shù)均能根據(jù)不同外形、語音的人物設(shè)定復(fù)刻出專屬他的IP元宇宙分身,并通過復(fù)刻而成的分身更換不同風(fēng)格、不同場(chǎng)景,真正實(shí)現(xiàn)“1次復(fù)刻、N次分身”,為用戶帶來差異化營(yíng)銷體驗(yàn)。
此外,拓元還可提供專業(yè)的拍攝流程指導(dǎo)、復(fù)刻模型數(shù)據(jù)解析、個(gè)性化推薦等專屬客戶服務(wù),并為客戶隱私安全保駕護(hù)航。
低成本運(yùn)營(yíng) 助力企業(yè)/個(gè)人降本增效
復(fù)刻好了數(shù)智人,怎么用呢?早在2019年人民日?qǐng)?bào)社“果果”、新華社“新小微”就告訴了我們答案,虛擬人視頻制作可通過SAAS服務(wù)、AI云計(jì)算及API開放完成。只是高額的制作成本、局限的應(yīng)用場(chǎng)景,并不被普通受眾所接受,大家仍持觀望態(tài)度。但如今虛擬人已開始席卷國(guó)內(nèi)各大短視頻平臺(tái),很多刷到的口播短視頻賬號(hào)內(nèi)容,都是由AI虛擬數(shù)智人生成,騰訊、字節(jié)跳動(dòng)、微軟等大廠已開放虛擬人制作平臺(tái),高成本虛擬人及虛擬人視頻制作已是過去式。
拓元智慧也于近期開放了元分身產(chǎn)品平臺(tái),推出了顛覆式的AI黑科技。平臺(tái)以打造高真實(shí)度AI數(shù)智分身為核心,通過文本編輯、個(gè)性化背景及字幕調(diào)整、多情感音色的選擇,一鍵輸出多場(chǎng)景多樣化口播視頻,突破了時(shí)空限制,實(shí)現(xiàn)了制片循環(huán)精簡(jiǎn)化、人效利用精益化、制作成本低廉化、制作產(chǎn)能規(guī)模化四大突破,為視頻內(nèi)容產(chǎn)業(yè)提供了元宇宙時(shí)代的嶄新手段??蓭椭悦襟w創(chuàng)作者實(shí)現(xiàn)高質(zhì)量文本輸出、批量化視頻內(nèi)容生產(chǎn),快速“養(yǎng)成”優(yōu)質(zhì)流量達(dá)人,同時(shí)還能助力醫(yī)療、娛樂、游戲、教育、通信、銀行等企事業(yè)單位降本增效。
未來,拓元智慧將繼續(xù)深耕AI虛擬數(shù)智人技術(shù),逐步推動(dòng)虛擬分身和元宇宙的普及化。
關(guān)于拓元智慧
拓元(廣州)智慧科技有限公司(X-Era AI),簡(jiǎn)稱“拓元智慧”,是一家具備原創(chuàng)領(lǐng)先技術(shù)的多模態(tài)認(rèn)知AI技術(shù)及應(yīng)用服務(wù)商,面向不同行業(yè)用戶提供統(tǒng)一的能夠模擬真人形象、行為、常識(shí)、創(chuàng)造力和價(jià)值觀的AI數(shù)智人平臺(tái)。團(tuán)隊(duì)核心成員來自阿里、商湯等知名企業(yè)及Oxford、CMU、中山大學(xué)等頂尖科研機(jī)構(gòu),擁有多年的前沿AI技術(shù)研究及工程化與業(yè)務(wù)落地經(jīng)驗(yàn)。
拓元智慧擁有300多項(xiàng)技術(shù)成果,在國(guó)際頂級(jí)期刊/會(huì)議上累計(jì)發(fā)表學(xué)術(shù)論文300余篇,在數(shù)十項(xiàng)主流AI競(jìng)賽或者評(píng)測(cè)基準(zhǔn)中獲得冠軍,十余次獲得學(xué)術(shù)期刊及會(huì)議的最佳/優(yōu)秀論文獎(jiǎng),獲得中國(guó)圖像圖形學(xué)會(huì)科學(xué)技術(shù)一等獎(jiǎng)、吳文俊人工智能自然科學(xué)獎(jiǎng)、省部級(jí)自然科學(xué)獎(jiǎng)等。
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。