
美国当地时间10月15日,谷歌正式推出了新一代AI视频生成模型Veo 3.1,这是继五月发布Veo 3后的一次重大升级,也被视为对标OpenAI Sora 2的强力回应。自谷歌AI创作应用Flow推出五个月以来,用户已生成超过2.75亿个视频,而Veo 3.1的加入将这场AI视频创作竞赛推向了新高度。 更新博客:https://blog.google/technology/ai/veo-updates-flow/
与OpenAI Sora 2的“生成即所得”理念不同,谷歌Veo 3.1更注重精细控制与专业创作。一位谷歌产品经理指出:“Veo 3.1带来了音画统一的叙事能力,让创作者第一次能在AI视频中‘讲故事’,而不仅是‘做片段’。”
Veo 3.1的画面风格更偏向电影质感,视觉效果精致,虽然稍显“人工化”,但特别适合追求精雕细琢的视觉呈现效果。
相比之下,Sora 2擅长营造手持拍摄的“自然抓拍”风格。这种差异让两者形成了“奈飞”与“抖音”的不同定位——一个注重品质与沉浸感,另一个以快速便捷取胜。
Veo 3.1在前代基础上实现了三大突破,将AI视频生成能力提升到了新水平。
全链路音频生成:Veo 3.1首次为所有核心功能配上了同步音频,包括对话、环境音效和背景音乐。这意味着视频不再需要手动添加音频,实现了真正的音画同步生成。
更强叙事控制力:通过多图像参考、首尾帧插值技术,用户可以精确定义镜头节奏与故事走向。这一功能让Veo 3.1更像是一个“AI创意工作台”,而不仅仅是视频生成工具。
更真实的质感还原:Veo 3.1在光影、材质和动作细节上都有显著提升,整体逼真度更高。它支持720p与1080p分辨率输出,帧速率稳定在24帧/秒,符合专业影视标准。
Veo 3.1的功能设置围绕着“导演级控制”理念展开,五项核心功能覆盖了视频创作的全流程。
• 素材转视频:用户可同时导入多张参考图像,精准控制角色、风格、场景与光影。AI会将多张图像中的元素整合,创作复合视频。
• 帧转视频:提供首尾两张静态图像,AI自动生成中间镜头,实现自然过渡或艺术化转场。这项技术让不同场景间的无缝过渡成为可能。
• 延伸视频:基于已有片段持续生成,将初始视频从4-8秒延伸至30秒甚至1分钟以上。每个新生成的视频片段都基于前一个片段的最后一秒,确保叙事连贯性。
• 插入对象:可向场景中添加任何元素,从现实细节到奇幻生物。AI会自动处理阴影和光线,使新增元素自然融入原有画面。
• 移除元素:用户可从场景中移除任何物体或角色,AI会自动重建背景。这一功能虽已宣布,但部分平台尚未完全开放。
Veo 3.1已全面接入谷歌生态系统,通过多种渠道提供服务。
普通用户可通过Gemini应用或Flow平台直接使用Veo 3.1。访问labs.google/flow/about,新建项目后即可开始创作。Flow平台每月为普通用户提供约100个免费积分,大约可生成五个短视频。
开发者可通过Gemini API集成Veo 3.1的视频生成能力到自己的应用中。
企业用户则可通过Vertex AI平台使用“场景延伸”等企业级功能,满足更专业的视频生产需求。
值得注意的是,新功能在不同平台的可用性存在差异。例如,添加物体和移除物体功能目前在Gemini API上不可用,而场景扩展功能则即将登陆Vertex AI API。
Veo 3.1的应用场景极为广泛,覆盖了多个行业的内容创作需求。
对于内容创作者,Veo 3.1允许用参考图像加音频脚本构建完整短片,大大降低了视频制作门槛。
教育行业可以一键创建定制化、场景化教学视频;广告行业则能快速生成产品短片,模型能够准确保持品牌视觉元素的一致性,对内容标准化生产极具价值。
游戏公司可快速生成叙事动画和CG预告片;媒体机构则能在新闻或纪录片制作中生成过渡镜头与背景音。
企业用户特别欣赏Veo 3.1的品牌一致性能力——上传产品图片或风格参考后,模型能够准确保持这些视觉元素在不同生成内容中的一致性。
目前Veo 3.1处于预览阶段,仅面向Gemini API付费用户开放。
计费标准延续前代:标准版为每秒视频0.40美元,Fast版为每秒视频0.15美元。采用按需计费模式,仅对成功生成的视频收费,无免费额度。
这种透明的定价策略便于企业团队进行预算管理。对于普通用户,Flow平台每月提供约100个免费积分,大约可生成五个短视频,Fast模式每次生成消耗20积分。
Veo 3.1令人惊艳,它让每个普通用户都能体验到导演般的创作乐趣。
精心选择的AI工具来改善您的工作,学习和生活效率。
2025年11月14日,OpenAI正式开启ChatGPT群聊功能试点,标志着AI从个人助手迈向团队协作伙伴的重大转折
Cursor正式迈入2.0时代!其首个自研编程智能体模型Composer将响应速度提升4倍,更颠覆性地支持最多8个AI智能体并行协作。从此,你不再是代码的“打字员”,而是项目的“总指挥”。
Sponsored bySAM TTS