KLING,让想象变为现实

可灵大模型(KLING)是由快手大模型团队自研打造的视频生成大模型,具备强大的视频生成能力 让用户可以轻松高效地完成艺术视频创作

作品

一条有黄蓝条纹的皇帝天使鱼在岩石的水下栖息地游动

一只手将牛奶从钢制打奶壶倒入桌上一杯咖啡中,背景为模糊的厨房

两朵花在黑色背景下缓慢绽放,展示出细腻的花瓣和花蕊

一只大熊猫在湖边弹吉他

傍晚时分,一辆汽车行驶在公路上,后视镜中映出绚丽的日落和宁静的景色

特写镜头下,一只亮蓝色鹦鹉的羽毛在光线下闪闪发光,展示出其独特的羽毛和鲜艳的色彩

一只戴眼镜的小白兔坐在咖啡馆的椅子上看报纸,桌上有一杯热咖啡

KLING AI 特点

大幅度的合理运动

可灵(KLING)采用3D时空联合注意力机制,能够更好地建模复杂时空运动,生成较大幅度运动的视频内容,同时能够符合运动规律。

视频生成长达2分钟

得益于高效的训练基础设施、极端的推理优化和可扩展的基础设施,KLING 的大模型可以生成长达 2 分钟的视频,帧率为 30fps。

模拟物理世界特征

基于自研模型架构和缩放法则的强大建模能力,可灵可以模拟现实世界的物理特征,生成符合物理规律的视频。

强大的概念组合能力

基于对文本视频语义的深入理解和扩散变压器架构的强大能力,KLING 可以将用户丰富的想象力转化为具体的画面和现实世界中不会出现的虚构场景。

电影级图像生成

基于自研的 3D VAE,KLING 可以生成 1080p 分辨率的电影级视频,既能生动呈现宏大壮丽的场景,又能展现细腻的特写镜头。

支持自由输出视频纵横比

KLING 采用可变分辨率训练策略,在推理过程中可以针对相同内容输出多种视频纵横比,满足在更丰富场景中使用视频素材的需求。

表情和身体驱动

基于自研的 3D 面部和身体重建技术,结合背景稳定性和重定向模块,实现表情和身体全驱动技术。只需一张全身照片,即可体验生动的“唱歌跳舞”玩法。


常见问题

可灵(KLING AI)是什么,它是如何工作的?

KLING AI 是由快手开发的,能够创建长达两分钟的 1080p 高清视频。它擅长表现物体之间的复杂运动和互动。

KLING AI 如何生成逼真的视频?

KLING AI 利用先进的 3D 时空注意机制和扩散变压器技术,准确地建模运动并高效地创建富有想象力的场景。

KLING AI 生成的视频有哪些示例?

示例包括:景观变换的两分钟火车旅行、不同季节的骑自行车、食物准备等,展示了 KLING AI 模拟现实互动的能力。

KLING AI 在视频生成方面与 OpenAI 的 Sora 有何比较?

虽然两者都使用扩散变压器,但 KLING AI 可以生成更长(最多两分钟)和更高分辨率(1080p)的视频,而 Sora 的视频限制在一分钟内。这使得 KLING 在 AI 生成视频技术领域成为有力的竞争者。

KLING AI 是否对公众开放使用?

是的,KLING AI 目前在中国作为公共演示开放,用户可以亲身体验其功能。

KLING AI 对电影和娱乐行业有何潜在影响?

KLING AI 有潜力彻底改变好莱坞及其他地区的内容创作,提供高质量、逼真的视频生成,可能会变革电影和娱乐制作方式。