圈子社区App 2月6日消息,字节跳动提出了一种名为OmniHuman的端到端多模态数字人视频生成框架,可基于一张图片和运动信号(如音频、视频或两者)生成视频。该框架混合数据训练策略,科技媒体TechSpot称它可能是目前最逼真的深度仿真算法。不过,该框架目前暂未向公众提供服务。(科创板日报)
暂无讨论,说说你的看法吧
圈子社区App 2月6日消息,字节跳动提出了一种名为OmniHuman的端到端多模态数字人视频生成框架,可基于一张图片和运动信号(如音频、视频或两者)生成视频。该框架混合数据训练策略,科技媒体TechSpot称它可能是目前最逼真的深度仿真算法。不过,该框架目前暂未向公众提供服务。(科创板日报)
之前