专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。
能够生成长达 1 分钟的高清视频,涵盖广泛的视觉数据类型和分辨率。Sora通过在视频和图像的压缩潜在空间中训练,将其分解为时空位置补丁,实现了可扩展的视频生成。