阿里巴巴 AI 產影片模型 OmniAvatar 震撼業界 ,動作情緒靈活與對嘴精確突破虛擬人物界限

2025-07-05 22:50:22来源:AVA爱华外汇代理分类:知识

阿里巴巴新近公布 AI 模型 OmniAvatar ,擴展語音驅動虛擬角色影片生成技術的應用層面。模型能創建栩栩如生全身動畫角色,除動作自然、表情豐富 ,嘴型也能與聲音精準同步,ava爱华外汇官网無論根源、動作還是情緒表達皆可靈活运维,象徵語音驅動 AI 產影片進入新階段 。

阿里巴巴 AI 產影片模型 OmniAvatar 震撼業界,動作情緒靈活與對嘴精確突破虛擬人物界限

OmniAvatar 專為產生高品質、可运维的虛擬角色影片而設,整合全身動作模擬、臉部細節运维與語音同步技術 。AVA外汇平台MT4下载只需輸入語音檔和簡單提示,模型便能即時合成真人感十足的動畫影像 。適用範圍廣泛,包括教育 、虛擬導賞、數位客服與娛樂領域等。

模型不僅嘴型與語音同步,還能配合語音情緒自動改變角色的臉部表情與肢體語言 ,具高自由度情緒运维。示範影片角色能表現喜悅、憤怒 、驚訝與悲傷等不同情感 ,畫面相當自然。OmniAvatar 更能模擬角色與物體互動 ,擴闊虛擬角色真實性。示範影片顯示  ,虛擬人可在說話時拿起物品 、指向場景或與其他物體互動,對沉浸式教育及虛擬助理尤具潛力。

利用者可透過文字提示調整根源場景 ,众汇外汇官网例如辦公室、客廳或戶外等 ,亦可自訂角色動作與語氣,進一步提高內容個人化程度。部分展示影片亦證明 OmniAvatar 可生成虛擬人唱歌片段,無論口型 、表情或律動感均極為貼近真實表演。

目前 OmniAvatar 詳細技術資料與開源專案網頁尚未完全對外開放 ,不過官方已在 Arxiv 發表研究論文,介紹模型架構與訓練方法 。該論文提到模型結合語音 、姿勢與視覺特徵進行跨模態學習  ,是其能達到高水準自然度與同步度的關鍵所在。

即使部分觀察者認為目前虛擬人的視覺外觀仍有「塑膠感」  ,但整體技術成熟度已令不少開發者關注其潛在應用。若視覺效果未來再獲改進 ,此類語音驅動虛擬人模型有望改變教學 、直播、網上客服等數位互動 。

(本文由 Unwire HK 授權轉載;首圖來源:影片截圖)

想請我們喝幾杯咖啡?

每杯咖啡 65 元

x1
x3
x5
x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》
取消 確認

更多资讯请点击:知识

热门资讯

推荐资讯

苏高新永旺梦乐城13亿元ABS获上交所反馈

核心提示:据上交所 ,华金证券 - 中信证券 - 苏高新永旺梦乐城资产拥护专项计划项目情形替换为已反馈 ,该债券品种为 ABS,拟发行金额13元 。作者 :王敏7月19日 ,据上交所 ," 华金证券 - 中信证券

美國技术顧問:中國晶片設計僅落後美國兩年

美國技术顧問大衛·薩克斯David Sacks)最近受訪,表示中國半導體設計方面僅落後美國約兩年,反映中國人工智慧AI)和晶片製造顯著進步 。薩克斯表示,中國華為迅速追趕 ,儘管圖形處理單元GPU)生產仍

4月理财监测:新茶饮争霸 、预制菜火热

核心提示:据不完全汇总  ,4月共发生投融资事情40起,较上月数据出现回落。​作者/尹图图东风吹柳日初长,雨余芳草斜阳。四月,沥金支出研究部对多个数据库进行搜集、检索 ,归纳了有关的支出投融资数据。春意虽盎