近日,快手“可灵”视频生成大模型在人工智能领域引起广泛关注。该模型由快手 AI 团队自研,采用了与 Sora 相似的技术路线,并结合多项自研技术创新,效果对标 Sora。
可灵大模型具备众多显著优势。它能够生成大幅度的合理运动,通过 3D 时空联合注意力机制,更好地建模视频中的复杂时空运动,使生成的运动更符合客观规律;可以模拟真实物理世界的特性,无论是光影反射、重力影响下的流体运动,还是与物理世界的交互,都能生成符合物理规律的视频;具备强大的概念组合能力和想象力,能够将用户丰富的想象力转化为具体的画面,例如让熊猫弹吉他唱歌等创意场景轻松实现。