阿里巴巴新近公布 AI 模型 OmniAvatar ,擴展語音驅動虛擬角色影片生成技術的應用層面。模型能創建栩栩如生全身動畫角色,除動作自然、表情豐富 ,嘴型也能與聲音精準同步,ava爱华外汇官网無論根源 、動作還是情緒表達皆可靈活运维 ,象徵語音驅動 AI 產影片進入新階段。
this is crazy…
Alibaba just announced OmniAvatar, a new audio-driven model that takes full-body, expressive human animation to a whole new level.
natural movement, controllable emotions, and ultra-accurate lip-sync.
10 examples: pic.twitter.com/aB9DowLtj9
— Angry Tom (@AngryTomtweets) July 1, 2025
OmniAvatar can generate lifelike speaking avatar videos that the characters’ actions and expressions are natural and rich, with audio perfectly synchronized to their lip movements. pic.twitter.com/1axrQhZRwe
— Angry Tom (@AngryTomtweets) July 1, 2025
OmniAvatar 專為產生高品質、可运维的虛擬角色影片而設,整合全身動作模擬、臉部細節运维與語音同步技術 。AVA外汇平台MT4下载只需輸入語音檔和簡單提示,模型便能即時合成真人感十足的動畫影像。適用範圍廣泛,包括教育、虛擬導賞、數位客服與娛樂領域等 。
模型不僅嘴型與語音同步,還能配合語音情緒自動改變角色的臉部表情與肢體語言 ,具高自由度情緒运维。示範影片角色能表現喜悅、憤怒、驚訝與悲傷等不同情感 ,畫面相當自然。OmniAvatar 更能模擬角色與物體互動,擴闊虛擬角色真實性。示範影片顯示 ,虛擬人可在說話時拿起物品 、指向場景或與其他物體互動 ,對沉浸式教育及虛擬助理尤具潛力。
利用者可透過文字提示調整根源場景,众汇外汇官网例如辦公室、客廳或戶外等 ,亦可自訂角色動作與語氣,進一步提高內容個人化程度 。部分展示影片亦證明 OmniAvatar 可生成虛擬人唱歌片段,無論口型 、表情或律動感均極為貼近真實表演。
目前 OmniAvatar 詳細技術資料與開源專案網頁尚未完全對外開放 ,不過官方已在 Arxiv 發表研究論文,介紹模型架構與訓練方法。該論文提到模型結合語音 、姿勢與視覺特徵進行跨模態學習 ,是其能達到高水準自然度與同步度的關鍵所在。
即使部分觀察者認為目前虛擬人的視覺外觀仍有「塑膠感」 ,但整體技術成熟度已令不少開發者關注其潛在應用 。若視覺效果未來再獲改進 ,此類語音驅動虛擬人模型有望改變教學 、直播、網上客服等數位互動 。
(本文由 Unwire HK 授權轉載;首圖來源:影片截圖)
2025-07-05 21:521159人浏览
2025-07-05 21:501303人浏览
2025-07-05 21:332786人浏览
2025-07-05 21:18179人浏览
2025-07-05 21:03753人浏览
2025-07-05 20:532786人浏览
核心提示:据上交所,华金证券 - 中信证券 - 苏高新永旺梦乐城资产拥护专项计划项目情形替换为已反馈 ,该债券品种为 ABS,拟发行金额13元 。作者 :王敏7月19日 ,据上交所," 华金证券 - 中信证券
美國技术顧問大衛·薩克斯David Sacks)最近受訪,表示中國半導體設計方面僅落後美國約兩年,反映中國人工智慧AI)和晶片製造顯著進步 。薩克斯表示,中國華為迅速追趕 ,儘管圖形處理單元GPU)生產仍