可靈,讓想像變為現實

可靈大模型(KLING)是由快手大模型團隊自研打造的視頻生成大模型,具備強大的視頻生成能力 讓用戶可以輕鬆高效地完成藝術視頻創作

作品

一條有黃藍條紋的皇帝天使魚在岩石的水下棲息地游動

一隻手將牛奶從鋼制打奶壺倒入桌上一杯咖啡中,背景為模糊的廚房

兩朵花在黑色背景下緩慢綻放,展示出細膩的花瓣和花蕊

一隻大熊貓在湖邊彈吉他

傍晚時分,一輛汽車行駛在公路上,後視鏡中映出絢麗的日落和寧靜的景色

特寫鏡頭下,一隻亮藍色鸚鵡的羽毛在光線下閃閃發光,展示出其獨特的羽毛和鮮豔的色彩

一隻戴眼鏡的小白兔坐在咖啡館的椅子上看報紙,桌上有一杯熱咖啡

KLING AI 特點

大幅度的合理運動

可靈(KLING)採用3D時空聯合注意力機制,能夠更好地建模複雜時空運動,生成較大幅度運動的視頻內容,同時能夠符合運動規律。

視頻生成長達2分鐘

得益於高效的訓練基礎設施、極端的推理優化和可擴展的基礎設施,KLING 的大模型可以生成長達 2 分鐘的視頻,幀率為 30fps。

模擬物理世界特徵

基於自研模型架構和縮放法則的強大建模能力,可靈可以模擬現實世界的物理特徵,生成符合物理規律的視頻。

強大的概念組合能力

基於對文本視頻語義的深入理解和擴散變壓器架構的強大能力,KLING 可以將用戶豐富的想像力轉化為具體的畫面和現實世界中不會出現的虛構場景。

電影級圖像生成

基於自研的 3D VAE,KLING 可以生成 1080p 分辨率的電影級視頻,既能生動呈現宏大壯麗的場景,又能展現細膩的特寫鏡頭。

支持自由輸出視頻縱橫比

KLING 採用可變分辨率訓練策略,在推理過程中可以針對相同內容輸出多種視頻縱橫比,滿足在更豐富場景中使用視頻素材的需求。

表情和身體驅動

基於自研的 3D 面部和身體重建技術,結合背景穩定性和重定向模塊,實現表情和身體全驅動技術。只需一張全身照片,即可體驗生動的“唱歌跳舞”玩法。


常見問題

可靈(KLING AI)是什麼,它是如何工作的?

KLING AI 是由快手開發的,能夠創建長達兩分鐘的 1080p 高清視頻。它擅長表現物體之間的複雜運動和互動。

KLING AI 如何生成逼真的視頻?

KLING AI 利用先進的 3D 時空注意機制和擴散變壓器技術,準確地建模運動並高效地創建富有想像力的場景。

KLING AI 生成的視頻有哪些示例?

示例包括:景觀變換的兩分鐘火車旅行、不同季節的騎自行車、食物準備等,展示了 KLING AI 模擬現實互動的能力。

KLING AI 在視頻生成方面與 OpenAI 的 Sora 有何比較?

雖然兩者都使用擴散變壓器,但 KLING AI 可以生成更長(最多兩分鐘)和更高分辨率(1080p)的視頻,而 Sora 的視頻限制在一分鐘內。這使得 KLING 在 AI 生成視頻技術領域成為有力的競爭者。

KLING AI 是否對公眾開放使用?

是的,KLING AI 目前在中國作為公共演示開放,用戶可以親身體驗其功能。

KLING AI 對電影和娛樂行業有何潛在影響?

KLING AI 有潛力徹底改變好萊塢及其他地區的內容創作,提供高質量、逼真的視頻生成,可能會變革電影和娛樂製作方式。