虛擬數(shù)字人全景解讀:一文讀懂?dāng)?shù)字人進(jìn)化史
來(lái)源:世優(yōu)科技虛擬人 編輯:lgh 2025-01-17 09:00:42 加入收藏
在當(dāng)今數(shù)字化浪潮洶涌澎湃的時(shí)代,數(shù)字人正以一種前所未有的速度和方式,深度融入到我們生活的方方面面。
從繁華都市街頭的巨型電子屏幕上展示的虛擬偶像,到互聯(lián)網(wǎng)世界中與我們互動(dòng)交流的數(shù)字客服,再到線下大廳展館為用戶實(shí)時(shí)指引解決問(wèn)題的智能導(dǎo)覽,數(shù)字人的身影無(wú)處不在。它們不再僅僅是科幻作品中的想象元素,而是成為了現(xiàn)實(shí)生活中推動(dòng)各行業(yè)變革與發(fā)展的重要力量。
那么,究竟什么是數(shù)字人?它們經(jīng)歷了怎樣的發(fā)展歷程?又憑借哪些關(guān)鍵技術(shù)得以實(shí)現(xiàn)?在當(dāng)下的發(fā)展現(xiàn)狀如何?未來(lái)又將有著怎樣廣闊的前景和多元的應(yīng)用呢?本文將深入且全面地對(duì)數(shù)字人的各個(gè)方面展開(kāi)探討。
一、發(fā)展歷史
數(shù)字人的發(fā)展歷程猶如一部波瀾壯闊的科技史詩(shī),從早期簡(jiǎn)單粗糙的雛形,到如今高度逼真、智能交互的成熟形態(tài),每一個(gè)階段都凝聚著無(wú)數(shù)科研人員和技術(shù)學(xué)者的智慧與心血?;仡檾?shù)字人的發(fā)展歷史,不僅能夠讓我們清晰地看到科技進(jìn)步的脈絡(luò),更能幫助我們預(yù)測(cè)其未來(lái)的發(fā)展趨勢(shì)。
01 早期探索階段
數(shù)字人的起源可以追溯到上世紀(jì)中葉,計(jì)算機(jī)技術(shù)剛剛起步,圖形處理能力極為有限。
在這一時(shí)期,數(shù)字人形象僅僅是簡(jiǎn)單的幾何圖形拼湊而成,缺乏細(xì)節(jié)和真實(shí)感,動(dòng)作也顯得十分僵硬和機(jī)械。例如,1966 年,美國(guó)麻省理工學(xué)院的研究人員開(kāi)發(fā)出了一款名為 “Simon” 的早期數(shù)字人模型,它只能通過(guò)簡(jiǎn)單的線條勾勒出大致的人體輪廓,無(wú)法進(jìn)行任何復(fù)雜的動(dòng)作或交互。
盡管早期數(shù)字人的表現(xiàn)形式極為初級(jí),但這些探索為后續(xù)的發(fā)展奠定了基礎(chǔ),科學(xué)家們開(kāi)始意識(shí)到,通過(guò)計(jì)算機(jī)技術(shù)可以創(chuàng)造出虛擬的人物形象,并且隨著技術(shù)的不斷進(jìn)步,這些形象有望變得更加逼真和智能。
02 技術(shù)積累階段
隨著計(jì)算機(jī)硬件性能的逐步提升,以及圖形學(xué)算法的不斷發(fā)展,數(shù)字人在形象和動(dòng)作表現(xiàn)方面有了一定的改善,在這一時(shí)期,數(shù)字人主要應(yīng)用于影視特效和游戲開(kāi)發(fā)領(lǐng)域。1982 年上映的電影《電子世界爭(zhēng)霸戰(zhàn)》中,技術(shù)人員開(kāi)始嘗試在數(shù)字空間中復(fù)刻人的形象,雖然其造型仍然比較簡(jiǎn)單,但已經(jīng)開(kāi)始運(yùn)用計(jì)算機(jī)圖形技術(shù)來(lái)呈現(xiàn)虛擬世界中的人物。
在游戲領(lǐng)域,早期的電子游戲中也出現(xiàn)了一些簡(jiǎn)單的數(shù)字人角色,如《超級(jí)馬里奧》系列中的馬里奧形象,它們的出現(xiàn)標(biāo)志著數(shù)字人開(kāi)始在互動(dòng)娛樂(lè)領(lǐng)域嶄露頭角。同時(shí),這一時(shí)期的動(dòng)作捕捉技術(shù)也開(kāi)始得到初步應(yīng)用,為數(shù)字人動(dòng)作的自然流暢表現(xiàn)提供了一定的支持。
03 快速發(fā)展階段
進(jìn)入 21 世紀(jì),隨著計(jì)算機(jī)圖形學(xué)、動(dòng)作捕捉、實(shí)時(shí)渲染等技術(shù)的飛速發(fā)展,數(shù)字人迎來(lái)了快速發(fā)展的黃金時(shí)期。在影視特效方面,數(shù)字人的應(yīng)用越來(lái)越廣泛,并且形象和動(dòng)作的逼真度達(dá)到了前所未有的高度。
2009 年上映的電影《阿凡達(dá)》堪稱數(shù)字人技術(shù)發(fā)展的里程碑之作,通過(guò)先進(jìn)的動(dòng)作捕捉技術(shù)和計(jì)算機(jī)圖形渲染技術(shù),電影中的納美人形象栩栩如生,其細(xì)膩的皮膚紋理、生動(dòng)的面部表情以及流暢自然的動(dòng)作,給觀眾帶來(lái)了震撼的視覺(jué)體驗(yàn),《阿凡達(dá)》的成功不僅展示了數(shù)字人技術(shù)在影視制作中的巨大潛力,也為后續(xù)數(shù)字人技術(shù)的發(fā)展提供了強(qiáng)大的動(dòng)力。
2015 年,我國(guó)較早一批專注數(shù)字人領(lǐng)域的企業(yè)出現(xiàn)在人們的視野中。世優(yōu)科技也成立于這個(gè)時(shí)期,匯聚高精技術(shù)人才構(gòu)建的研發(fā)團(tuán)隊(duì),涵蓋動(dòng)作捕捉、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別與合成等核心領(lǐng)域,逐步構(gòu)建起一套標(biāo)準(zhǔn)化且高效的數(shù)字人及虛擬場(chǎng)景制作流程,不僅確保了數(shù)字人的制作效果高度逼真、栩栩如生,更極大地提升了制作效率,降低了成本,為大規(guī)模商業(yè)化應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。
04 成熟應(yīng)用階段
近年來(lái),隨著 5G、云計(jì)算、人工智能、大數(shù)據(jù)等新一代信息技術(shù)的廣泛應(yīng)用,數(shù)字人的發(fā)展進(jìn)入了成熟應(yīng)用階段。數(shù)字人不僅在形象、動(dòng)作和智能交互方面達(dá)到了極高的水平,在人工智能技術(shù)的推動(dòng)下,數(shù)字人開(kāi)始具備了一定的智能交互能力,而且在應(yīng)用場(chǎng)景和領(lǐng)域上也實(shí)現(xiàn)了多元化拓展。
一些聊天虛擬人開(kāi)始出現(xiàn),它們能夠通過(guò)自然語(yǔ)言處理技術(shù)與用戶進(jìn)行簡(jiǎn)單的對(duì)話。在娛樂(lè)領(lǐng)域,虛擬偶像和虛擬主播成為了熱門(mén)話題,除了初音未來(lái)、洛天依、絆愛(ài)等知名虛擬偶像外,越來(lái)越多的虛擬主播活躍在各大直播平臺(tái)上,涵蓋了游戲直播、生活分享、知識(shí)科普等多個(gè)領(lǐng)域。另一邊,服務(wù)型數(shù)字人廣泛應(yīng)用于金融、電商、教育等行業(yè),在線上線下為用戶提供便捷、高效的服務(wù)。
二、數(shù)字人分類(lèi)
數(shù)字人作為一個(gè)涵蓋多種類(lèi)型和應(yīng)用場(chǎng)景的概念,根據(jù)其功能、應(yīng)用領(lǐng)域以及技術(shù)形式的不同,可以大致分為以下幾類(lèi):
01 按功能用途可分為內(nèi)容創(chuàng)作型、身份型、服務(wù)型數(shù)字人。
內(nèi)容創(chuàng)作型數(shù)字人: 主要用于內(nèi)容生產(chǎn)與傳播,像虛擬偶像洛天依,通過(guò)發(fā)行音樂(lè)專輯、舉辦演唱會(huì)來(lái)輸出內(nèi)容,活躍于二次元文化領(lǐng)域;虛擬主播絆愛(ài),在視頻平臺(tái)產(chǎn)出各種有趣視頻吸引大量粉絲;
身份型數(shù)字人: 這類(lèi)數(shù)字人代表特定個(gè)體身份,如一些企業(yè)打造與創(chuàng)始人形象相似的數(shù)字人,用于企業(yè)宣傳,例如世優(yōu)科技為中國(guó)電建地產(chǎn)打造的數(shù)字員工長(zhǎng)安和華曦,在“跨時(shí)空嗨購(gòu)夜”直播間中,與真實(shí)的主持人同臺(tái)主持,為觀眾送去福利,以更精準(zhǔn)的角度切入年輕消費(fèi)群體的需求;同時(shí),還有人們?yōu)樽约簞?chuàng)建的數(shù)字分身,在虛擬社交平臺(tái)中展現(xiàn)自我、與他人的數(shù)字分身進(jìn)行互動(dòng);
服務(wù)型數(shù)字人: 聚焦于在線上線下為用戶提供各類(lèi)服務(wù),比如文旅景區(qū)的數(shù)字人導(dǎo)游,為游客提供個(gè)性化旅游推薦和指引,銀行大廳里的數(shù)字人助手,能解答客戶業(yè)務(wù)咨詢,而政務(wù)大廳的數(shù)字人導(dǎo)覽,可以引導(dǎo)民眾辦理政務(wù)事項(xiàng)。
02 從技術(shù)實(shí)現(xiàn)角度劃分,數(shù)字人分為基于“動(dòng)捕驅(qū)動(dòng)”和基于“AI 驅(qū)動(dòng)”的類(lèi)型。
基于動(dòng)捕驅(qū)動(dòng)的數(shù)字人: 依托動(dòng)作捕捉、表情捕捉等技術(shù),將真人的動(dòng)作和表情實(shí)時(shí)映射到數(shù)字人身上。在 2023 年杭州亞運(yùn)會(huì)閉幕式,數(shù)字火炬手弄潮兒在大蓮花體育場(chǎng)上空,與觀眾揮手比心,這就是通過(guò)動(dòng)作捕捉,讓弄潮兒的動(dòng)作栩栩如生。
基于 AI 驅(qū)動(dòng)的數(shù)字人: 依靠多種人工智能算法,實(shí)現(xiàn)自主對(duì)話、行為決策等功能。例如,世優(yōu)科技自主研發(fā)的“世優(yōu)波塔”AI數(shù)字人智能體,融合主流大模型、實(shí)時(shí)信息抓取、智能講解展示等強(qiáng)大能力,通過(guò)AI Agent進(jìn)行靈活調(diào)用,再搭配親切自然且專業(yè)的虛擬數(shù)字人形象,能和用戶展開(kāi)知識(shí)問(wèn)答、話題討論等互動(dòng)。
03 從數(shù)字人風(fēng)格分類(lèi),數(shù)字人又能分為 3D 數(shù)字人和 2D 真人復(fù)刻兩大類(lèi)型。
3D 數(shù)字人: 利用三維建模技術(shù)創(chuàng)建的具有高度真實(shí)感的數(shù)字化人物形象,它不僅僅是簡(jiǎn)單的平面圖像或低維度的虛擬形象,而是在三維空間中構(gòu)建的包含人物的外貌、身體結(jié)構(gòu)、動(dòng)作姿態(tài)等多種細(xì)節(jié)的虛擬人物。這些數(shù)字人可以通過(guò)計(jì)算機(jī)圖形學(xué)、動(dòng)畫(huà)技術(shù)等手段實(shí)現(xiàn)栩栩如生的外觀和自然流暢的動(dòng)作。
卡通風(fēng)格:具有夸張的造型與鮮艷的色彩,人物身體比例常被變形處理,比如頭部可能占比較大,四肢短小且圓潤(rùn),以突出可愛(ài)、活潑的感覺(jué)。
二次元風(fēng)格:融合了動(dòng)漫文化特色,人物形象通常具有大眼睛、小嘴巴、修長(zhǎng)身材等典型特征,該風(fēng)格在二次元?jiǎng)勇⒂螒?、虛擬偶像領(lǐng)域深受歡迎,契合二次元愛(ài)好者對(duì)于獨(dú)特審美和幻想世界的追求。
美型寫(xiě)實(shí)風(fēng)格:在追求人物真實(shí)感的同時(shí),對(duì)人物形象進(jìn)行美化處理,常見(jiàn)于影視、游戲中對(duì)顏值要求較高的角色塑造,吸引追求視覺(jué)美感的受眾。
寫(xiě)實(shí)風(fēng)格:高度還原真實(shí)人物的外貌、形態(tài)和質(zhì)感,通過(guò)高精度的 3D 掃描和建模技術(shù),精確呈現(xiàn)人物面部的皺紋、毛孔、毛發(fā)等細(xì)微特征,以及身體的肌肉紋理、骨骼結(jié)構(gòu),在光影效果處理上,模擬真實(shí)環(huán)境中的光照,使人物看起來(lái)如同真實(shí)存在于場(chǎng)景之中。
超寫(xiě)實(shí)風(fēng)格:是寫(xiě)實(shí)風(fēng)格的進(jìn)一步升華,在各個(gè)方面都追求極致的真實(shí),不僅在人物外貌、質(zhì)感上達(dá)到幾乎與真人無(wú)異的程度,在表情、動(dòng)作的細(xì)節(jié)表現(xiàn)上也極為逼真。
2D 真人復(fù)刻數(shù)字人: 主要在二維平面上高度還原真實(shí)人物,通過(guò)收集大量目標(biāo)人物的視頻素材,運(yùn)用圖像識(shí)別與分析算法,解析人物的面部特征、發(fā)型、服飾紋理及色彩等,借助數(shù)字繪畫(huà)、圖像處理技術(shù)繪制逼真的二維人物形象。這種風(fēng)格能快速打造具有辨識(shí)度的角色,且成本低、制作周期短,但缺乏真實(shí)立體感 。
三、技術(shù)支持
數(shù)字人的誕生與發(fā)展,離不開(kāi)一系列先進(jìn)技術(shù)的支撐。這些技術(shù)相互融合、協(xié)同作用,共同為數(shù)字人的逼真形象塑造、智能交互能力以及生動(dòng)行為表現(xiàn)提供了堅(jiān)實(shí)的保障。
01 計(jì)算機(jī)圖形學(xué)
計(jì)算機(jī)圖形學(xué)是數(shù)字人形象構(gòu)建的核心技術(shù)之一。通過(guò)原畫(huà)、建模、材質(zhì)、燈光等一系列技術(shù)手段,能夠創(chuàng)造出高度逼真的數(shù)字人形象,從皮膚的細(xì)膩紋理到每一根毛發(fā)的細(xì)節(jié),都能夠栩栩如生地呈現(xiàn)在觀眾眼前。
在建模方面,通常采用多邊形建模技術(shù),通過(guò)構(gòu)建大量的三角形或四邊形網(wǎng)格,來(lái)精確地描繪數(shù)字人的身體輪廓、面部特征以及肢體形態(tài)。材質(zhì)和紋理的制作、光線的路徑等,也是計(jì)算機(jī)圖形學(xué)中的重要環(huán)節(jié)。通過(guò)使用各種材質(zhì)和紋理貼圖,能夠?yàn)閿?shù)字人賦予不同的表面屬性,如皮膚的光澤度、彈性,衣物的質(zhì)感、紋理等,而合適的光照設(shè)置能夠營(yíng)造出逼真的光影效果,增強(qiáng)數(shù)字人的立體感和層次感。
02 動(dòng)作捕捉技術(shù)
動(dòng)作捕捉技術(shù)是賦予數(shù)字人生動(dòng)自然肢體動(dòng)作的重要手段。通過(guò)該技術(shù),演員的真實(shí)動(dòng)作能夠被實(shí)時(shí)捕捉并精確地映射到數(shù)字人身上,使數(shù)字人能夠呈現(xiàn)出與演員相同的動(dòng)作姿態(tài)和表情變化。
動(dòng)作捕捉技術(shù)主要分為光學(xué)動(dòng)作捕捉和慣性動(dòng)作捕捉兩種類(lèi)型。光學(xué)動(dòng)作捕捉系統(tǒng)通常由多個(gè)攝像頭組成,通過(guò)拍攝演員身上佩戴的反光標(biāo)記點(diǎn)的位置和運(yùn)動(dòng)軌跡,來(lái)計(jì)算出演員的肢體動(dòng)作,這種方法具有高精度、高分辨率的優(yōu)點(diǎn),能夠捕捉到非常細(xì)微的動(dòng)作變化,但對(duì)拍攝環(huán)境和設(shè)備要求較高,成本也相對(duì)較高;慣性動(dòng)作捕捉系統(tǒng)則是通過(guò)演員身上佩戴的慣性傳感器,測(cè)量加速度、角速度等物理量,來(lái)推算出演員的肢體動(dòng)作,這種方法具有便攜性好、成本較低的優(yōu)點(diǎn),但在精度和穩(wěn)定性方面相對(duì)較弱。
03 真人復(fù)刻技術(shù)
真人復(fù)刻技術(shù)旨在打造與特定真實(shí)人物高度相似的數(shù)字人。這一過(guò)程首先需要對(duì)真人進(jìn)行全方位的掃描與數(shù)據(jù)采集,與 3D 制作技術(shù)側(cè)重于構(gòu)建立體的人體模型不同,2D 真人復(fù)刻主要聚焦于在二維平面上高度還原真實(shí)人物的形象、神態(tài)等。
真人復(fù)刻技術(shù)通過(guò)先進(jìn)的圖像識(shí)別與分析算法,對(duì)這些目標(biāo)圖像中的人物面部特征、發(fā)型、服飾紋理等進(jìn)行細(xì)致解析,表現(xiàn)為平面化的數(shù)字形象。其特點(diǎn)是具備真人特征,但受限于錄制內(nèi)容無(wú)法實(shí)現(xiàn)三維呈現(xiàn),應(yīng)用場(chǎng)景包括數(shù)字人講師、虛擬主播、客服助手等。
04 語(yǔ)音合成技術(shù)
語(yǔ)音合成技術(shù)讓數(shù)字人能夠擁有自然、生動(dòng)且貼合自身設(shè)定的聲音。早期的語(yǔ)音合成較為機(jī)械,聲音缺乏情感和韻律,如今,通過(guò)對(duì)大量人類(lèi)語(yǔ)音數(shù)據(jù)的學(xué)習(xí),模型能夠理解語(yǔ)音中的韻律、語(yǔ)調(diào)變化規(guī)律以及情感表達(dá)特點(diǎn)。
數(shù)字人可以通過(guò)提取目標(biāo)人物的語(yǔ)音樣本,讓語(yǔ)音合成模型學(xué)習(xí)其獨(dú)特的音色、發(fā)音習(xí)慣和語(yǔ)言風(fēng)格,語(yǔ)音合成技術(shù)還能根據(jù)數(shù)字人對(duì)話的語(yǔ)境和情感需求,動(dòng)態(tài)調(diào)整語(yǔ)音的韻律、語(yǔ)速和語(yǔ)調(diào),如在表達(dá)興奮情緒時(shí)提高語(yǔ)速和語(yǔ)調(diào),在表示安慰時(shí)放緩語(yǔ)速、降低語(yǔ)調(diào),極大提升數(shù)字人語(yǔ)音交互的真實(shí)感和感染力。
05 人工智能技術(shù)
人工智能技術(shù)賦予了數(shù)字人智能交互和自主學(xué)習(xí)的能力,使其能夠與人類(lèi)進(jìn)行自然流暢的對(duì)話,并根據(jù)不同的情境和用戶需求做出合理的反應(yīng)。
自然語(yǔ)言處理是人工智能技術(shù)在數(shù)字人領(lǐng)域中的重要應(yīng)用之一,通過(guò)自然語(yǔ)言處理技術(shù),數(shù)字人能夠理解人類(lèi)語(yǔ)言的語(yǔ)義和語(yǔ)法結(jié)構(gòu),并生成相應(yīng)的回答。在自然語(yǔ)言處理的過(guò)程中,首先需要對(duì)輸入的文本進(jìn)行預(yù)處理,包括分詞、詞性標(biāo)注、命名實(shí)體識(shí)別等,語(yǔ)言模型對(duì)文本進(jìn)行語(yǔ)義理解和分析,常見(jiàn)的語(yǔ)言模型包括循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)以及近年來(lái)發(fā)展迅速的 Transformer 模型等,能夠?qū)W習(xí)到大量的語(yǔ)言知識(shí)和語(yǔ)義信息,從而準(zhǔn)確地理解用戶的問(wèn)題。最后,根據(jù)理解的結(jié)果,運(yùn)用生成模型生成合適的回答,并通過(guò)語(yǔ)音合成技術(shù)將文本轉(zhuǎn)換為語(yǔ)音輸出。
機(jī)器學(xué)習(xí)技術(shù)也是數(shù)字人實(shí)現(xiàn)智能交互的關(guān)鍵,通過(guò)對(duì)大量數(shù)據(jù)的學(xué)習(xí)和分析,數(shù)字人能夠不斷優(yōu)化自身的行為和決策,提高與用戶交互的質(zhì)量和效率。例如,在數(shù)字人客服的應(yīng)用中,機(jī)器學(xué)習(xí)算法可以根據(jù)用戶的歷史咨詢記錄和反饋信息,學(xué)習(xí)到用戶常見(jiàn)的問(wèn)題類(lèi)型和偏好的回答方式,從而在后續(xù)的交互中能夠更加準(zhǔn)確、快速地為用戶提供服務(wù)。同時(shí),機(jī)器學(xué)習(xí)還可以用于數(shù)字人的情感識(shí)別和意圖理解,使數(shù)字人能夠更好地感知用戶的情緒變化和需求,提供更加個(gè)性化、人性化的服務(wù)。
06 AIGC制作
此外,AIGC技術(shù)為數(shù)字人的發(fā)展注入了新的活力 。在內(nèi)容創(chuàng)作方面,AIGC 能夠根據(jù)給定的主題、風(fēng)格等要求,快速生成高質(zhì)量的文本、圖像、音頻甚至視頻內(nèi)容。在數(shù)字人的交互環(huán)節(jié),AIGC 助力數(shù)字人實(shí)現(xiàn)更具創(chuàng)意和個(gè)性化的回應(yīng),當(dāng)用戶與數(shù)字人進(jìn)行對(duì)話時(shí),AIGC 技術(shù)可以讓數(shù)字人不局限于預(yù)設(shè)的回答模板,而是基于對(duì)對(duì)話情境的理解,生成新穎、有趣且貼合語(yǔ)境的回復(fù),提升用戶的交互體驗(yàn)。
四、發(fā)展現(xiàn)狀
目前,數(shù)字人正處于蓬勃發(fā)展的黃金時(shí)期,無(wú)論是在技術(shù)創(chuàng)新、市場(chǎng)應(yīng)用還是產(chǎn)業(yè)發(fā)展方面,都呈現(xiàn)出了極為活躍的態(tài)勢(shì)。
01 技術(shù)創(chuàng)新持續(xù)推進(jìn)
在技術(shù)層面,數(shù)字人相關(guān)技術(shù)的創(chuàng)新不斷取得突破,為數(shù)字人的發(fā)展提供了強(qiáng)大的動(dòng)力支持,主要集中在智能化、精細(xì)化、低成本化和跨平臺(tái)化幾個(gè)方向。
智能化: 借助大規(guī)模語(yǔ)言模型(如文心一言、豆包、星火等)、計(jì)算機(jī)視覺(jué)和情感識(shí)別技術(shù),實(shí)現(xiàn)更高層次的交互智能,這些數(shù)字人將能夠與用戶進(jìn)行自然流暢的語(yǔ)言對(duì)話、情感交流、個(gè)性化互動(dòng)和具備接近真人的行為表現(xiàn),并通過(guò)人工智能技術(shù)理解環(huán)境背景,實(shí)現(xiàn)沉浸式的互動(dòng)體驗(yàn);
真實(shí)感: 得益于圖形處理單元(GPU)和云計(jì)算技術(shù)的進(jìn)步,數(shù)字人能夠在實(shí)時(shí)交互過(guò)程中生成高度逼真的視覺(jué)效果,并支持多用戶同時(shí)使用,利用全息、虛擬現(xiàn)實(shí)(VR)、增強(qiáng)現(xiàn)實(shí)(AR)等技術(shù),數(shù)字人將從傳統(tǒng)的二維屏幕中“走出來(lái)”,實(shí)現(xiàn)三維空間的存在感,從而突破平面顯示的局限;
兼容性: 數(shù)字人正逐步具備跨平臺(tái)運(yùn)行的能力,可在移動(dòng)設(shè)備、計(jì)算機(jī)、數(shù)字大屏等多種平臺(tái)上無(wú)縫切換,此外,還將實(shí)現(xiàn)跨平臺(tái)同步和數(shù)據(jù)共享,支持在不同平臺(tái)之間的身份認(rèn)證與資產(chǎn)管理,真正實(shí)現(xiàn)“一個(gè)數(shù)字人穿梭多個(gè)虛擬世界”的愿景。
02 產(chǎn)業(yè)發(fā)展初具規(guī)模
隨著數(shù)字人技術(shù)的不斷成熟和市場(chǎng)應(yīng)用的日益廣泛,數(shù)字人產(chǎn)業(yè)也逐漸形成了較為完整的產(chǎn)業(yè)鏈條,涵蓋了技術(shù)研發(fā)、內(nèi)容創(chuàng)作、平臺(tái)運(yùn)營(yíng)、商業(yè)應(yīng)用等多個(gè)環(huán)節(jié)。
技術(shù)研發(fā): 大量科研機(jī)構(gòu)和科技企業(yè)投入到數(shù)字人相關(guān)技術(shù)的研究與創(chuàng)新中,不斷推動(dòng)著計(jì)算機(jī)圖形學(xué)、人工智能、動(dòng)作捕捉等核心技術(shù)的進(jìn)步。例如,英偉達(dá)、微軟等科技巨頭在圖形渲染和人工智能算法方面持續(xù)投入巨額資金,取得了一系列領(lǐng)先成果;
內(nèi)容創(chuàng)作: 當(dāng)前市場(chǎng)上的數(shù)字人,不僅注重技術(shù)的革新,更強(qiáng)調(diào)內(nèi)容的表達(dá),通過(guò)細(xì)膩的情感刻畫(huà)和生動(dòng)的故事敘述,賦予數(shù)字人以靈魂和生命力,使其成為連接現(xiàn)實(shí)與虛擬世界的橋梁。柳葉熙、天妤等虛擬數(shù)字人紛紛推出以IP為核心的短劇,吸引眾多粉絲;
平臺(tái)運(yùn)營(yíng): 各大互聯(lián)網(wǎng)平臺(tái)紛紛布局?jǐn)?shù)字人領(lǐng)域,為數(shù)字人的展示和應(yīng)用提供了廣闊的空間。抖音、B站等平臺(tái)積極扶持虛擬主播的發(fā)展,通過(guò)流量?jī)A斜、舉辦相關(guān)活動(dòng)等方式,吸引了大量虛擬主播入駐,同時(shí)也培養(yǎng)了用戶對(duì)于數(shù)字人的關(guān)注度和接受度;
商業(yè)應(yīng)用: 眾多企業(yè)根據(jù)自身業(yè)務(wù)需求,將數(shù)字人應(yīng)用于市場(chǎng)營(yíng)銷(xiāo)、客戶服務(wù)、員工培訓(xùn)等多個(gè)環(huán)節(jié)。例如,美妝品牌歐萊雅推出了虛擬美妝顧問(wèn),能夠?yàn)橄M(fèi)者提供在線化妝指導(dǎo)和產(chǎn)品推薦;金融機(jī)構(gòu)利用數(shù)字人客服解答客戶的常見(jiàn)金融問(wèn)題,提高服務(wù)效率和質(zhì)量。
五、行業(yè)應(yīng)用
娛樂(lè)行業(yè):除了虛擬偶像和虛擬主播,數(shù)字人在影視制作中的應(yīng)用更加廣泛和深入。數(shù)字人可以扮演各種超乎尋常的角色,如具有超能力的英雄、來(lái)自外太空的生物或者奇幻世界中的神秘存在,為影片增添奇幻與冒險(xiǎn)元素。數(shù)字人技術(shù)能夠用于制作逼真的特效場(chǎng)景和角色動(dòng)作,在一些災(zāi)難片、科幻片和動(dòng)作片中,數(shù)字人可以完成高難度的動(dòng)作和驚險(xiǎn)的場(chǎng)景,減少演員的風(fēng)險(xiǎn)和拍攝難度,帶來(lái)震撼的視覺(jué)效果。
利用數(shù)字人技術(shù)讓影視作品中的角色重現(xiàn),或是對(duì)歷史人物進(jìn)行數(shù)字化還原,在江蘇衛(wèi)視的跨年晚會(huì)上,周深與鄧麗君(虛擬技術(shù)呈現(xiàn))“穿越時(shí)空”攜手演唱《小城故事》 與《漫步人生路》,讓經(jīng)典得以重現(xiàn)和延續(xù)。而日本的初音未來(lái)和中國(guó)的洛天依等虛擬偶像,憑借可愛(ài)的形象和動(dòng)人的歌聲,贏得了全球眾多粉絲的喜愛(ài),她們可以舉辦虛擬演唱會(huì),通過(guò)先進(jìn)的動(dòng)作捕捉和實(shí)時(shí)渲染技術(shù),為觀眾帶來(lái)精彩的表演。
游戲領(lǐng)域:玩家可以操控?cái)?shù)字人角色進(jìn)行探索、戰(zhàn)斗、解謎等活動(dòng),這些角色具有豐富的動(dòng)作和表情,能夠與玩家進(jìn)行深度互動(dòng),增強(qiáng)游戲的沉浸感和趣味性,如《黑神話:悟空》中的角色,其高精度建模和動(dòng)作捕捉技術(shù)讓人物形象栩栩如生。游戲中的非玩家角色(NPC)也可以通過(guò)數(shù)字人技術(shù)實(shí)現(xiàn)智能化,根據(jù)玩家的操作行為進(jìn)行實(shí)時(shí)交互,提供個(gè)性化的游戲體驗(yàn),而不再是單一的預(yù)設(shè)反應(yīng)。
直播領(lǐng)域:虛擬主播以數(shù)字人的形象進(jìn)行直播,與觀眾實(shí)時(shí)互動(dòng),可用于游戲直播、娛樂(lè)聊天、知識(shí)科普等多種類(lèi)型的直播內(nèi)容,如 YY 直播的 “靈兒”,作為服務(wù)型數(shù)字人,能提煉直播內(nèi)容、總結(jié)直播間話題等,并為現(xiàn)場(chǎng)觀眾送上福利。另外,數(shù)字人主播可以 24 小時(shí)不間斷地進(jìn)行直播帶貨,介紹商品信息和促銷(xiāo)活動(dòng),通過(guò)智能語(yǔ)音交互和動(dòng)作展示,吸引觀眾的購(gòu)買(mǎi)欲望,如一些美妝品牌和電商平臺(tái)已經(jīng)開(kāi)始嘗試使用數(shù)字人主播進(jìn)行直播帶貨。
社交領(lǐng)域:數(shù)字人可以作為虛擬社交伴侶,與用戶進(jìn)行一對(duì)一的聊天和互動(dòng),提供陪伴和情感支持,用戶可以根據(jù)自己的喜好和需求定制數(shù)字人的外貌、性格和興趣愛(ài)好,在社交平臺(tái)上,數(shù)字人也可以作為互動(dòng)元素,參與用戶的社交活動(dòng),如舉辦虛擬派對(duì)、線上音樂(lè)會(huì)等,為用戶提供更加豐富和有趣的社交體驗(yàn)。
文旅領(lǐng)域:借助 AI、大數(shù)據(jù)等多種新科技,數(shù)字人以全新的視角和身份打通次元壁,通過(guò)數(shù)字導(dǎo)游的方式,為游客提供個(gè)性化的導(dǎo)覽服務(wù)和旅游建議。數(shù)字人可以與虛擬現(xiàn)實(shí)(VR)和增強(qiáng)現(xiàn)實(shí)(AR)技術(shù)結(jié)合,為游客提供虛擬旅游體驗(yàn),讓游客在家中就能領(lǐng)略世界各地的美景,如通過(guò)數(shù)字人導(dǎo)游帶領(lǐng)游客參觀歷史古跡、自然景觀等。同時(shí),數(shù)字人作為文化活動(dòng)的推廣大使,參與各種文化節(jié)、藝術(shù)展覽、民俗活動(dòng)等的宣傳和推廣,吸引更多的游客和觀眾參與,提升文化活動(dòng)的影響力和知名度。
醫(yī)療行業(yè):數(shù)字人在醫(yī)療領(lǐng)域的應(yīng)用前景十分廣闊。在手術(shù)模擬及心理治理方面,數(shù)字人可以根據(jù)患者的具體病情和身體數(shù)據(jù),構(gòu)建出高度逼真的人體器官模型,醫(yī)生可以在虛擬環(huán)境中進(jìn)行手術(shù)預(yù)演,提前規(guī)劃手術(shù)方案,評(píng)估手術(shù)風(fēng)險(xiǎn),提高手術(shù)的成功率。在醫(yī)學(xué)培訓(xùn)方面,數(shù)字人可以為醫(yī)學(xué)生提供更加真實(shí)、豐富的實(shí)踐操作機(jī)會(huì),讓他們?cè)谔摂M環(huán)境中進(jìn)行各種手術(shù)操作和醫(yī)療技能訓(xùn)練,避免在真實(shí)患者身上進(jìn)行試驗(yàn)帶來(lái)的風(fēng)險(xiǎn)。數(shù)字人還能在醫(yī)院的門(mén)診大廳、候診區(qū)等場(chǎng)所,為患者提供智能導(dǎo)診服務(wù),幫助患者快速找到就診科室、醫(yī)生和檢查地點(diǎn),節(jié)省患者的時(shí)間和精力,如世優(yōu)科技的 “數(shù)字人 AI 交互一體機(jī)” 可提供智能導(dǎo)診服務(wù)。
金融行業(yè):除了數(shù)字人客服,數(shù)字人在金融行業(yè)的智能投顧領(lǐng)域也將發(fā)揮重要作用。數(shù)字人可以作為虛擬主播或品牌代言人,制作生動(dòng)有趣的宣傳視頻或直播內(nèi)容,向客戶介紹金融產(chǎn)品和服務(wù),吸引客戶的關(guān)注和購(gòu)買(mǎi)欲望,如百信銀行的數(shù)字人直播服務(wù),能夠?qū)崟r(shí)回答用戶問(wèn)題,提供專業(yè)、個(gè)性化的建議。根據(jù)客戶的行為數(shù)據(jù)、興趣愛(ài)好和風(fēng)險(xiǎn)偏好,數(shù)字人可以為客戶提供個(gè)性化的金融產(chǎn)品和服務(wù)推薦,提高營(yíng)銷(xiāo)的精準(zhǔn)度和效果,增加客戶轉(zhuǎn)化率和留存率。
教育行業(yè):在教育行業(yè),數(shù)字人將推動(dòng)教育模式的創(chuàng)新和變革。除了作為虛擬教師和學(xué)習(xí)伙伴,數(shù)字人還可以創(chuàng)建虛擬學(xué)習(xí)社區(qū),讓學(xué)生們?cè)谔摂M環(huán)境中進(jìn)行互動(dòng)交流、合作學(xué)習(xí)。例如,在歷史、地理等學(xué)科的教學(xué)中,數(shù)字人可以帶領(lǐng)學(xué)生穿越時(shí)空,身臨其境地感受歷史事件的發(fā)生過(guò)程,探索世界各地的自然風(fēng)光和人文景觀。在職業(yè)教育領(lǐng)域,數(shù)字人可以模擬各種職業(yè)場(chǎng)景,為學(xué)生提供真實(shí)的職業(yè)技能培訓(xùn),提高學(xué)生的就業(yè)競(jìng)爭(zhēng)力。
六、數(shù)字人企業(yè)
如果說(shuō)數(shù)字人是未來(lái)數(shù)字世界的居民,那么數(shù)字人企業(yè)就是打造這個(gè)數(shù)字世界的杰出建筑師。世優(yōu)科技成立于 2015 年,在虛擬體驗(yàn)與 AI 數(shù)字人技術(shù)領(lǐng)域已深耕多年,自創(chuàng)立之初,公司便以敏銳的市場(chǎng)洞察力捕捉到元宇宙、數(shù)字人、虛擬場(chǎng)景等前沿領(lǐng)域的巨大潛力,果斷投身于圖形圖像算法、實(shí)時(shí)動(dòng)捕、人工智能等虛擬數(shù)字技術(shù)的專項(xiàng)研究。
01 強(qiáng)大的技術(shù)實(shí)力
世優(yōu)科技匯聚了頂尖技術(shù)人才構(gòu)建的研發(fā)團(tuán)隊(duì),涵蓋人工智能、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別與合成等核心領(lǐng)域,逐步構(gòu)建起一套標(biāo)準(zhǔn)化且高效的數(shù)字人及虛擬場(chǎng)景制作流程,不僅確保了數(shù)字人的制作效果高度逼真、栩栩如生,更極大地提升了制作效率,降低了成本,為大規(guī)模商業(yè)化應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。
例如,世優(yōu)科技為“紀(jì)念鄭成功誕辰 400 周年慶活動(dòng)”打造的3D版“鄭成功”數(shù)字IP,從面部的細(xì)微表情紋路,到身上鎧甲的真實(shí)質(zhì)感,甚至每一根發(fā)絲的飄動(dòng),都通過(guò)三維重建技術(shù)完美呈現(xiàn),讓角色仿佛從屏幕中鮮活走來(lái)。
在驅(qū)動(dòng)技術(shù)方面,世優(yōu)科技依托自主研發(fā)的“實(shí)時(shí)數(shù)字人”動(dòng)作捕捉系統(tǒng),和“波塔”AI驅(qū)動(dòng)系統(tǒng),對(duì)數(shù)字人進(jìn)行智能化驅(qū)動(dòng),讓數(shù)字人的每一個(gè)舉手投足、每一次身體律動(dòng),都像真人般流暢與自然,為用戶營(yíng)造出沉浸式的交互體驗(yàn)。
截至目前,世優(yōu)科技先后獲得國(guó)家高新技術(shù)企業(yè)、中關(guān)村高新技術(shù)企業(yè),國(guó)家級(jí)“專精特新”小巨人企業(yè)稱號(hào),擁有專利60余項(xiàng)、軟著100余項(xiàng),以及多家世界500強(qiáng)給予的獎(jiǎng)項(xiàng)認(rèn)可。
02 豐富的行業(yè)經(jīng)驗(yàn)
多年來(lái),世優(yōu)科技在數(shù)字人領(lǐng)域持續(xù)深耕,積累了大量且多元的行業(yè)經(jīng)驗(yàn),通過(guò)與眾多不同行業(yè)的頭部企業(yè)建立長(zhǎng)期穩(wěn)固的合作,深入洞悉各行業(yè)的獨(dú)特需求與應(yīng)用場(chǎng)景,從而為客戶量身定制數(shù)字人解決方案。迄今為止,世優(yōu)科技打造的數(shù)字人廣泛活躍于各個(gè)領(lǐng)域,涵蓋了虛擬偶像、企業(yè)虛擬代言人、服務(wù)型 AI 數(shù)字人等多種類(lèi)型,滿足了不同客戶群體的多樣化需求。
在品牌營(yíng)銷(xiāo)領(lǐng)域,世優(yōu)科技將安慕希IP“安比麗沃爆”進(jìn)行3D數(shù)字化打造,增強(qiáng)了用戶對(duì)安比作為品牌福利官的形象記憶,并采用數(shù)字人結(jié)合AIGC生成的場(chǎng)景,制作合成動(dòng)畫(huà)展示制作宣傳推廣視頻,大幅度節(jié)省了虛擬視頻內(nèi)容的制作時(shí)間和成本,用IP直播的形式強(qiáng)化用戶對(duì)安比的記憶,在直播中以數(shù)字人實(shí)時(shí)互動(dòng)的方式,拉近品牌與用戶的距離,并通過(guò)福利的發(fā)放強(qiáng)化IP作為品牌福利官的形象。
03 出色的案例交付
世優(yōu)科技以高效的項(xiàng)目執(zhí)行和卓越的交付成果,贏得客戶的高度認(rèn)可,目前已經(jīng)為央視、中國(guó)移動(dòng)、華為、京東、阿里、科大訊飛、國(guó)家電網(wǎng)、海爾、中國(guó)電建等1000多家客戶提供產(chǎn)品或服務(wù),累計(jì)打造超1200個(gè)數(shù)字人。同時(shí),世優(yōu)科技深度參與了多個(gè)大型賽事晚會(huì)活動(dòng)項(xiàng)目的交付,如2023年杭州亞運(yùn)會(huì)、2024年全國(guó)冬季運(yùn)動(dòng)會(huì)以及多屆央視春晚等。
第十九屆亞洲運(yùn)動(dòng)會(huì)落下帷幕,數(shù)字火炬手“弄潮兒”成為亮眼一幕,世優(yōu)科技為閉幕式數(shù)字火炬手提供動(dòng)作捕捉、數(shù)字人驅(qū)動(dòng),到閉幕式應(yīng)用的全棧解決方案,同時(shí)確保了杭州亞運(yùn)會(huì)閉幕式直播的穩(wěn)定性及安全性,配合導(dǎo)演組順利完成虛擬直播任務(wù)。在直播過(guò)程中,觀看人數(shù)和互動(dòng)數(shù)據(jù)也呈現(xiàn)出爆發(fā)式增長(zhǎng),成為閉幕式上的一大熱門(mén)話題,為2023杭州亞運(yùn)會(huì)增添了濃厚的科技色彩和文化底蘊(yùn)
04 持續(xù)的創(chuàng)新能力
創(chuàng)新是世優(yōu)科技發(fā)展的核心驅(qū)動(dòng)力,公司持續(xù)加大研發(fā)投入,積極探索數(shù)字人技術(shù)的全新應(yīng)用與場(chǎng)景。2024年,世優(yōu)科技在AI數(shù)字人智能體方面取得重大突破,自主研發(fā)打造的“世優(yōu)波塔 ”融合主流大模型、實(shí)時(shí)信息抓取、智能講解展示等強(qiáng)大能力,通過(guò)AI Agent進(jìn)行靈活調(diào)用,再搭配親切自然且專業(yè)的虛擬數(shù)字人形象,打造了人工智能時(shí)代更有溫度的多模態(tài)交互系統(tǒng)。
世優(yōu)科技與長(zhǎng)虹智慧顯示共同推出“數(shù)字人+電視機(jī)”的交互新模態(tài),數(shù)字人助手可以根據(jù)用戶的觀看歷史和偏好,為用戶推薦個(gè)性化的內(nèi)容,而豐富多樣的交互場(chǎng)景,讓用戶在觀看電視的過(guò)程中更加便捷、舒適,這一合作成果為智能電視行業(yè)樹(shù)立了新的方向。
七、發(fā)展前景
展望未來(lái),數(shù)字人有望在多個(gè)方面取得更大的突破和發(fā)展。
隨著技術(shù)的持續(xù)進(jìn)步,數(shù)字人將在形象、動(dòng)作和交互上更加逼真自然。量子計(jì)算技術(shù)的發(fā)展可能大幅提升計(jì)算機(jī)的運(yùn)算速度,為數(shù)字人的實(shí)時(shí)渲染和復(fù)雜人工智能算法的運(yùn)行提供強(qiáng)大的算力支持,腦機(jī)接口技術(shù)的成熟或許能讓人類(lèi)與數(shù)字人實(shí)現(xiàn)更加直接、高效的交互,例如人類(lèi)通過(guò)腦電波就能控制數(shù)字人的動(dòng)作和行為,實(shí)現(xiàn)更加沉浸式的體驗(yàn)。
在應(yīng)用場(chǎng)景拓展方面,數(shù)字人將更加深入地融入到社會(huì)生活的各個(gè)角落。在養(yǎng)老領(lǐng)域,數(shù)字人有望作為陪伴者,為老年人提供情感關(guān)懷、健康監(jiān)測(cè)、生活協(xié)助等服務(wù)。而在工業(yè)制造領(lǐng)域,數(shù)字人可以模擬工人進(jìn)行復(fù)雜操作培訓(xùn),提高培訓(xùn)效率和安全性。
元宇宙概念的興起,也為數(shù)字人的發(fā)展帶來(lái)了前所未有的機(jī)遇。數(shù)字人將成為人們?cè)谠钪嬷械闹匾恚脩艨梢酝ㄟ^(guò)數(shù)字人在虛擬世界中進(jìn)行社交、娛樂(lè)、工作、學(xué)習(xí)等活動(dòng)。數(shù)字人在元宇宙中的經(jīng)濟(jì)價(jià)值也將不斷凸顯,如虛擬房產(chǎn)的買(mǎi)賣(mài)、虛擬商品的交易、虛擬服務(wù)的提供等,都可能?chē)@數(shù)字人展開(kāi),形成龐大的數(shù)字經(jīng)濟(jì)生態(tài)系統(tǒng)。
數(shù)字人作為一項(xiàng)具有巨大潛力和變革性的技術(shù),正在深刻地改變著我們的生活和社會(huì),雖然在發(fā)展過(guò)程中面臨著諸多挑戰(zhàn),但隨著技術(shù)的不斷進(jìn)步、倫理道德和法律監(jiān)管的逐步完善,數(shù)字人必將在未來(lái)為我們帶來(lái)更多的驚喜和變革,成為推動(dòng)各行業(yè)發(fā)展的重要力量。
評(píng)論comment