Vidu是生数科技与清华大学合作开发的Vidu视频大模型,凭借其创新的U-ViT架构,成为国内首个达到Sora级别的视频大模型。该模型不仅在技术上具有全球首创性,而且通过开源的UniDiffuser模型,展示了其大规模可扩展性的验证。
Vidu 不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。Vidu 模型融合了 Diffusion 与 Transformer 技术,创新性地开发了 U-ViT 架构。能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。
Vidu功能特征:
模型结构:Vidu 模型融合了 Diffusion 与 Transformer 技术,创新性地开发了 U-ViT 架构。
视频生成能力:Vidu 能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。
3D生成:基于简单文字输入,生成高质量、多样性和创造性的图像 图像生成 API调用 在线体验 基于文本或图像输入,生成个性化3D模型 | 基于已有3D模型,对贴图等进行自动化编辑。
实际应用演示:在官方资料中,展示了一个视频示例,内容是“画室中的一艘船驶向镜头”,展现了船和海浪的逼真效果。
高级功能:Vidu 不仅能模拟真实物理世界,还具备丰富的想象力,支持多镜头生成和高时空一致性。
北京生数科技有限公司(简称“生数科技”)成立于2023年3月,核心团队成员来自清华大学人工智能研究院,此外汇集了来自阿里、腾讯、字节等知名科技公司的顶尖人才,是全球范围内领先的深度生成式算法研究团队,拥有扩散概率模型底层创新研发能力。公司致力打造世界领先的多模态大模型,融合文本、图像、视频、3D等多模态信息,探索生成式ai在艺术设计、游戏制作、影视后期、内容社交等场景的商业赋能,通过AI提升人类的创造力和生产力。
数据评估
AI工具箱提供的Vidu都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AI工具箱实际控制,在2024年10月6日 上午4:49收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI工具箱不承担任何责任。