真情服務  厚德載物
聯系我們

市場部:0564-3227239
技術部:0564-3227237
財務部: 0564-3227034
公司郵箱:lachs@126.com
技術郵箱:cc1982@163.com
地址:六安市淠望路103號

當前位置:首 頁 > 新聞中心 > 業界動態 > 查看新聞
字節跳動展示 OmniHuman 多模態框架:圖片 + 音頻 = 逼真動畫,半身全身均可生成
作者:永辰科技  來源:IT之家  發表時間:2025-2-7 8:07:42  點擊:184

字節跳動的研究人員近日展示了一款 AI 模型,可以通過一張圖片和一段音頻生成半身、全身視頻。

字節跳動表示,和一些只能生成面部或上半身動畫的深度偽造技術不同,OmniHuman-1 能夠生成逼真的全身動畫,且能將手勢和面部表情與語音或音樂精準同步

字節跳動在其 OmniHuman-lab 項目頁面發布了多個測試視頻,包括 AI 生成的 TED 演講和一個會說話的阿爾伯特 愛因斯坦。

在周一發布的一篇論文中,字節跳動指出,OmniHuman-1 模型支持不同的體型和畫面比例,從而使視頻效果更自然。

據了解,字節跳動表示,OmniHuman-1 模型基于約 19000 小時的人類運動數據訓練而成,能夠在內存限制內生成任意長度的視頻,并適應不同的輸入信號。

研究人員還表示,OmniHuman-1 在真實性和準確性方面,超越了其他同類動畫工具。目前,該工具暫不提供下載或有關服務。

 
 
 
合作伙伴
華為 | 微軟中國 | 聯想集團 | IBM | 蘋果電腦 | 浪潮集團 | 惠普中國 | 深信服 | 愛數軟件
六安市永辰科技有限公司 版權所有 © Copyright 2010-2021 All Rights 六安市淠望路103號 最佳瀏覽效果 IE8或以上瀏覽器
皖公網安備34150102000370號

訪問量:3214313    皖ICP備11014188號-1