快手可灵大模型——AI视频生产

2024-7-6

https://kling.kuaishou.com/

近日，快手“可灵”视频生成大模型在人工智能领域引起广泛关注。该模型由快手 AI 团队自研，采用了与 Sora 相似的技术路线，并结合多项自研技术创新，效果对标 Sora。

可灵大模型具备众多显著优势。它能够生成大幅度的合理运动，通过 3D 时空联合注意力机制，更好地建模视频中的复杂时空运动，使生成的运动更符合客观规律；可以模拟真实物理世界的特性，无论是光影反射、重力影响下的流体运动，还是与物理世界的交互，都能生成符合物理规律的视频；具备强大的概念组合能力和想象力，能够将用户丰富的想象力转化为具体的画面，例如让熊猫弹吉他唱歌等创意场景轻松实现。

在视频生成方面，可灵大模型表现出色，其生成的视频分辨率高达 1080p，时长可达 2 分钟（帧率 30fps），还支持自由调整宽高比。目前，该模型已在快影 App 开放邀测体验，用户反馈热烈，申请内测人数众多。

6 月 21 日，可灵大模型发布重磅更新，正式开放图生视频功能，支持将静态图像转化为 5 秒钟视频，且用户可通过提示词文本控制图像中物体的运动。同时推出的视频续写功能，支持对生成视频一键续写和连续多次续写，最长可生成约 3 分钟视频。

快手可灵大模型的出现，不仅在国际大模型技术圈层展现了中国技术的领先可能，也加速了 AI 生成视频产品的竞争。它的成功研发，为创作者和行业从业者提供了强大的技术支持，有助于提升创作效率和质量。

在未来的发展中，快手将继续推动可灵大模型的完善和应用场景的拓展。据悉，在 7 月举行的 2024 世界人工智能大会（WAIC）上，快手还将发布最新的大模型技术与应用战略，包括快手大模型技术矩阵全景、基座模型技术创新、应用和落地情况等，有望为用户带来更加丰富多彩的视频内容体验，进一步推动人工智能技术与短视频行业的深度融合与发展。

可灵大模型的诞生，是快手在 AI 技术领域深入探索和创新的重要成果，也体现了中国人工智能在视频生成模型方面的实力和进步，为中国人工智能的发展路径提供了新的方向和启示。