金石为开网

可灵AI发布O1视频大模型 支持多模态输入与对话式编辑

来源:金石为开网-工人日报
2026-04-28 09:52:46

12月2日消息,据了解,可灵AI于12月1日正式宣布,其自主研发的O1视频大模型正式面向公众全量开放。该模型被定位为一款统一的多模态创作工具,支持用户通过单一输入框融合文字、图像、视频指令进行视频生成与编辑。

据悉,可灵O1模型采用MVL(多模态视觉语言)统一交互架构,结合Chain-of-Thought推理技术,能够处理文生视频、图生视频、局部编辑、镜头延展等多种任务,无需在不同功能模块间切换。该技术通过多视角主体构建方法,旨在解决视频生成中人物或物体在镜头切换时出现的特征漂移问题,以提升画面连贯性。

目前,可灵O1模型已在可灵App及官网开放体验,支持生成3至10秒时长的视频,主要面向短视频创作者、广告团队及个人用户。公司表示后续将开放API接口,供第三方平台集成。(袁雪丽)

本文来自网易科技报道,更多资讯和深度内容,关注我们。

责任编辑:金石为开网

媒体矩阵


  • 客户端

  • 微信号

  • 微博号

  • 抖音号

客户端

亿万职工的网上家园

马上体验

关于我们|版权声明| 违法和不良信息举报电话:010-84151598 | 网络敲诈和有偿删帖举报电话:010-84151598
Copyright © 2008-2024 by {当前域名}. all rights reserved

扫码关注

金石为开网微信


金石为开网微博


金石为开网抖音


工人日报
客户端
×
分享到微信朋友圈×
打开微信,点击底部的“发现”,
使用“扫一扫”即可将网页分享至朋友圈。