即時兩岸

「中國版Sora」上線  一相片可生成原地唱跳 (20:17)

號稱「中國版Sora」的文字生成影片模型「可靈」近日上線,由內地短視頻平台「快手」AI團隊研發,採用與Sora一樣的Diffusion Transformer 架構。相較此前內地其他模型以展示為主,可靈已在快手旗下App開放邀測體驗。

官網介紹,可靈具備能夠生成大幅度的合理運動、模擬物理世界特性、強大概念組合能力和想象力、生成的視頻分辨率高達1080p,時長達2分鐘(幀率30fps),且支持自由的寬高比的優勢。其基於快手在視像技術方面的多年積累,採用Sora相似的技術路線,結合多項自研技術創新,效果對標Sora。

官方展示了效果動圖「兩朵花在黑色背景下緩慢綻放,展示出細膩的花瓣和花蕊」、「一只手將牛奶從鋼製打奶壺倒入桌上一杯咖啡中,背景為模糊的廚房」、「一隻戴眼鏡的小白兔坐在咖啡館的椅子上看報紙,桌上有一杯熱咖啡」。此外,基於自研的3D人臉和人體重建技術,結合背景穩定性和重定向模塊,實現表情肢體全驅動技術,僅需一張全身照片,即可體驗生動的「唱跳」玩法。(綜合報道)

上 / 下一篇新聞