https://kling.kuaishou.com/
近日,快手“可灵”视频生成大模型在人工智能领域引起广泛关注。该模型由快手 AI 团队自研,采用了与 Sora 相似的技术路线,并结合多项自研技术创新,效果对标 Sora。
可灵大模型具备众多显著优势。它能够生成大幅度的合理运动,通过 3D 时空联合注意力机制,更好地建模视频中的复杂时空运动,使生成的运动更符合客观规律;可以模拟真实物理世界的特性,无论是光影反射、重力影响下的流体运动,还是与物理世界的交互,都能生成符合物理规律的视频;具备强大的概念组合能力和想象力,能够将用户丰富的想象力转化为具体的画面,例如让熊猫弹吉他唱歌等创意场景轻松实现。
在视频生成方面,可灵大模型表现出色,其生成的视频分辨率高达 1080p,时长可达 2 分钟(帧率 30fps),还支持自由调整宽高比。目前,该模型已在快影 App 开放邀测体验,用户反馈热烈,申请内测人数众多。
6 月 21 日,可灵大模型发布重磅更新,正式开放图生视频功能,支持将静态图像转化为 5 秒钟视频,且用户可通过提示词文本控制图像中物体的运动。同时推出的视频续写功能,支持对生成视频一键续写和连续多次续写,最长可生成约 3 分钟视频。
快手可灵大模型的出现,不仅在国际大模型技术圈层展现了中国技术的领先可能,也加速了 AI 生成视频产品的竞争。它的成功研发,为创作者和行业从业者提供了强大的技术支持,有助于提升创作效率和质量。
在未来的发展中,快手将继续推动可灵大模型的完善和应用场景的拓展。据悉,在 7 月举行的 2024 世界人工智能大会(WAIC)上,快手还将发布最新的大模型技术与应用战略,包括快手大模型技术矩阵全景、基座模型技术创新、应用和落地情况等,有望为用户带来更加丰富多彩的视频内容体验,进一步推动人工智能技术与短视频行业的深度融合与发展。
可灵大模型的诞生,是快手在 AI 技术领域深入探索和创新的重要成果,也体现了中国人工智能在视频生成模型方面的实力和进步,为中国人工智能的发展路径提供了新的方向和启示。