可灵AI发布O1视频大模型支持多模态输入与对话式编辑

来源：金石为开网-工人日报

2026-04-28 09:52:46

12月2日消息，据了解，可灵AI于12月1日正式宣布，其自主研发的O1视频大模型正式面向公众全量开放。该模型被定位为一款统一的多模态创作工具，支持用户通过单一输入框融合文字、图像、视频指令进行视频生成与编辑。

据悉，可灵O1模型采用MVL（多模态视觉语言）统一交互架构，结合Chain-of-Thought推理技术，能够处理文生视频、图生视频、局部编辑、镜头延展等多种任务，无需在不同功能模块间切换。该技术通过多视角主体构建方法，旨在解决视频生成中人物或物体在镜头切换时出现的特征漂移问题，以提升画面连贯性。

目前，可灵O1模型已在可灵App及官网开放体验，支持生成3至10秒时长的视频，主要面向短视频创作者、广告团队及个人用户。公司表示后续将开放API接口，供第三方平台集成。（袁雪丽）

本文来自网易科技报道，更多资讯和深度内容，关注我们。

责任编辑：金石为开网

媒体矩阵