VIMI大模型
VIMI大模型,商汤科技推出的全球首个可控人物视频生成aiGC产品,VIMI大模型基于商汤的日日新大模型技术,可以通过动作视频、动画、声音、文字等多种驱动元素来驱动人物类图片,画面效果不会随着时间的变化而降低品质或失真,从而生成和目标动作一致的人物类视频。除了可控性外,Vimi在生成人物稳定性、生成视频时长上,也突破了其它大模型AI视频生成的限制,可以稳定的生成分钟级的单镜头人物视频。
VIMI大模型不但可以实现精准的人物表情控制,还可控制照片中人物上半身的自然肢体动作,并自动生成与人物相符的头发、服饰及背景变化。同时光影变化也能做到合理生成,让人物动作和视觉效果流畅自然,画面和谐唯美,是稳定的可控人物视频生成产品。
VIMI大模型功能特征:
可控人物:VIMI能够精确控制视频中人物的面部表情和肢体动作,生成与目标动作高度一致的视频内容。无论是微妙的面部表情变化,还是复杂的全身动作,VIMI都能够准确捕捉并再现。
多种控制方式:VIMI提供了多样化的控制输入方式,包括人物视频、动画参数、语音文字等。使用户能够通过不同的输入方法来驱动视频生成,创造出更丰富和多样化的视频。
分钟级单镜头:支持生成分钟级的单镜头人物视频
合理的视频场景生成:VIMI不仅关注人物本身的表现,还能够生成合理的视频场景,包括人物的头发、服饰、背景等元素的补全,以及光影变化的支持。这使得VIMI生成的视频不仅人物表现自然,整个场景也和谐统一。
稳定生成长视频:VIMI能够生成长达一分钟的单镜头人物视频,且画面效果稳定,不随时间劣化或失真。这是一个显著的突破。
VIMI大模型应用场景:
VIMI主要面向C端用户,适用于聊天、唱歌、舞动等多种娱乐互动场景。
娱乐创作:满足广大用户的娱乐创作需求,如生成数字分身和写真视频和各种趣味的人物表情包。
影视制作:为影视作品提供高质量的人物视频素材,减少制作成本和时间。
动画制作:支持动画创作者使用骨架生成动作,提高动画制作效率。
Vimi大模型在2024年世界人工智能大会(WAIC)上发布,并入选大会展览展示最高荣誉“镇馆之宝”。Vimi大模型能够生成长达1分钟以上的单镜头人物视频,且画面效果不会随时间降低品质或失真,还能根据人物动作调整环境场景,模拟镜头角度变化和头发抖动,提供逼真的视觉效果。
Vimi将完全向广大用户开放使用。用户只需上传不同角度的高清人物照片,即可自动生成数字分身和不同风格的写真短片。针对喜爱自拍的用户,Vimi支援聊天、唱歌、舞动等多种娱乐互动场景。
数据评估
AI工具箱提供的VIMI大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AI工具箱实际控制,在2024年10月6日 上午4:31收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI工具箱不承担任何责任。