虛擬偶像數(shù)字人設(shè)計(jì)

來(lái)源: 發(fā)布時(shí)間:2024-10-16

根據(jù) iMedia Research 艾媒咨詢發(fā)布的數(shù)據(jù)顯示,近年來(lái),我國(guó)數(shù)字人市場(chǎng)規(guī)模呈現(xiàn)加速增長(zhǎng)趨勢(shì)。2022 年數(shù)字人市場(chǎng)規(guī)模已達(dá)120.8 億元,帶動(dòng)周邊市場(chǎng)規(guī)模為 1866.1 億元。未來(lái),隨著AI技術(shù)的迭代更新,預(yù)計(jì)到 2025年,我國(guó)數(shù)字人的主要市場(chǎng)規(guī)模將達(dá)到 480.6 億元,帶動(dòng)周邊市場(chǎng)規(guī)模近 6402.7 億元。面對(duì)數(shù)字人產(chǎn)業(yè)的強(qiáng)大勢(shì)能和潛力,地方政策積極跟進(jìn),推進(jìn)未來(lái)產(chǎn)業(yè)的發(fā)展。其中,北京市前瞻布局?jǐn)?shù)字人產(chǎn)業(yè),并取得了突出成績(jī)。截至2023年12月,北京從事數(shù)字人相關(guān)業(yè)務(wù)的企業(yè)達(dá)到2805家,以數(shù)字人為主要業(yè)務(wù)的企業(yè)有217家。2023年數(shù)字人主要業(yè)務(wù)企業(yè)營(yíng)收規(guī)模約51億元,預(yù)計(jì)2025年?duì)I收規(guī)模將突破200億元,帶動(dòng)周邊經(jīng)濟(jì)效益750億元。智能數(shù)字人的語(yǔ)音識(shí)別和自然語(yǔ)言處理能力為用戶的交流提供了更加便捷和順暢的體驗(yàn)。虛擬偶像數(shù)字人設(shè)計(jì)

虛擬偶像數(shù)字人設(shè)計(jì),數(shù)字人

虛擬數(shù)字人(Digital Human / Meta Human),是運(yùn)用數(shù)字技術(shù)創(chuàng)造出來(lái)的、與人類形象接近的數(shù)字化人物形象。1964年,波音公司研發(fā)了頭一個(gè)具有人的形象的數(shù)字人。由于數(shù)字人社會(huì)實(shí)踐功能的呈現(xiàn),21世紀(jì),數(shù)字人成為可以和自然人相伴的“人”。2007年,世界上頭一個(gè)使用全息投影技術(shù)舉辦演唱會(huì)的虛擬偶像初音未來(lái)出道。2012年,中國(guó)本土偶像洛天依誕生。 功能特征:形象能力:擁有人的外觀,具有特定的相貌、性別和性格等人物特征。 表達(dá)能力:擁有人的行為,具有用語(yǔ)言、面部表情和肢體動(dòng)作表達(dá)的能力。感知、互動(dòng)能力:擁有人的思想,具有識(shí)別外界環(huán)境、并能與人交流互動(dòng)的能力。天津身份型數(shù)字人解決方案社交平臺(tái)數(shù)字人通過智能算法和用戶數(shù)據(jù)分析,為用戶提供個(gè)性化推薦和社交互動(dòng)。

虛擬偶像數(shù)字人設(shè)計(jì),數(shù)字人

為了生成逼真的動(dòng)作和聲音,AI數(shù)字人需要考慮多個(gè)因素,例如姿態(tài)、速度、節(jié)奏、音調(diào)等。目前,動(dòng)作捕捉和語(yǔ)音合成等技術(shù)雖然可以生成流暢的動(dòng)作和聲音,但仍然存在一些缺陷,例如動(dòng)作單一、聲音單調(diào)、表情缺乏等。為了解決這些問題,研究者提出了許多基于深度學(xué)習(xí)的動(dòng)作和聲音生成方法,可以實(shí)現(xiàn)更自然、更富有表現(xiàn)力、更適應(yīng)不同場(chǎng)景和風(fēng)格的動(dòng)作和聲音生成。例如基于循環(huán)神經(jīng)網(wǎng)絡(luò)或變分自編碼器的動(dòng)作生成,基于WaveNet或Tacotron等序列到序列模型的語(yǔ)音合成。

而對(duì)于早些進(jìn)入人們眼簾的AI數(shù)字人,今年相對(duì)熱度沒那么高。從2021年元宇宙帶火數(shù)字人,將數(shù)字人推向創(chuàng)新的風(fēng)口后,這幾年數(shù)字人的應(yīng)用并沒有得到普遍的普及。一方面是由于數(shù)字人需要基于頂端的適配設(shè)備,二是數(shù)字人的實(shí)際制作成本偏高。目前應(yīng)用較多的當(dāng)屬短視頻數(shù)字人,被應(yīng)用于直播帶貨和短視頻IP分身。就目前整個(gè)數(shù)字人而言,數(shù)字人的形象也是參差不齊。有的形象太假,有的場(chǎng)景單一,整體運(yùn)營(yíng)成本普遍偏高,目前主要應(yīng)用在一些頭部企業(yè)。在健康和健身領(lǐng)域,數(shù)字人可以提供實(shí)時(shí)的指導(dǎo)和監(jiān)督。

虛擬偶像數(shù)字人設(shè)計(jì),數(shù)字人

應(yīng)用前景,虛擬數(shù)字人的應(yīng)用場(chǎng)景包括娛樂、偶像(如虛擬偶像初音未來(lái)、洛天依的舞臺(tái)表演 )、代言人(如希加加代言麥當(dāng)勞)、企業(yè)數(shù)字化轉(zhuǎn)型、體育(如度曉曉解說足球 )、金融(如浦發(fā)銀行數(shù)字員工小浦)等垂直領(lǐng)域。未來(lái),虛擬數(shù)字人將在頭一產(chǎn)業(yè)農(nóng)業(yè)和第二產(chǎn)業(yè)工業(yè)領(lǐng)域中(如生產(chǎn)領(lǐng)域、銷售領(lǐng)域、售后服務(wù)領(lǐng)域等)更多地被使用。數(shù)字人也被稱為虛擬人物(Virtual Character),這是一種由計(jì)算機(jī)程序驅(qū)動(dòng)的擁有自身意識(shí)和身份的人工人。數(shù)字人可以在數(shù)字世界中展現(xiàn)出與真實(shí)人類相同的生理、心理、社會(huì)表現(xiàn)。游戲角色數(shù)字人是游戲中的虛擬角色,可以與玩家進(jìn)行互動(dòng)和戰(zhàn)斗。天津身份型數(shù)字人解決方案

虛擬教師數(shù)字人結(jié)合人工智能和教育內(nèi)容,為學(xué)生提供個(gè)性化的學(xué)習(xí)指導(dǎo)和輔助教育。虛擬偶像數(shù)字人設(shè)計(jì)

虛擬數(shù)字人系統(tǒng)一般情況下由人物形象、語(yǔ)音生成、動(dòng)畫生成、音視頻合成顯示、交互等5個(gè)模塊構(gòu)成。非交互型數(shù)字人,系統(tǒng)依據(jù)目標(biāo)文本生成對(duì)應(yīng)的人物語(yǔ)音及動(dòng)畫,并合成音視頻呈現(xiàn)給用戶。交互型數(shù)字人,智能驅(qū)動(dòng)型數(shù)字人:通過智能系統(tǒng)自動(dòng)讀取并解析識(shí)別外界輸入信息,根據(jù)解析結(jié)果決策數(shù)字人后續(xù)的輸出文本,驅(qū)動(dòng)人物模型生成相應(yīng)的語(yǔ)音與動(dòng)作來(lái)使數(shù)字人跟用戶互動(dòng)。真人驅(qū)動(dòng)型數(shù)字人:真人根據(jù)視頻監(jiān)控系統(tǒng)傳來(lái)的用戶視頻,與用戶實(shí)時(shí)語(yǔ)音,同時(shí)通過動(dòng)作捕捉采集系統(tǒng)將真人的表情、動(dòng)作呈現(xiàn)在虛擬數(shù)字人形象上,從而與用戶進(jìn)行交互。虛擬偶像數(shù)字人設(shè)計(jì)