新OmniHuman-1 OmniHuman-1是字节跳动推出的一个端到端的多模态条件驱动人类视频生成框架,能够基于单张人类图像和不同类型的运动信号(如音频、视频或音频与视频的组合)生成极为逼真的人类视频。