← → 翻页 · ESC 索引
AI Design Workflow2026.05
Vol.01
GPT-IMAGE-2 · SEEDANCE 2.0 · GPT-CODEX-5.5

AIGC 与 Vibe Coding 研究

从想法变方案最终落地产品全流程

生成图像、生成视频、生成软件。重点讨论能力边界、技术原理、成本模型、商用风险,以及它们如何进入设计和产品工作流。

Internal TalkDesign / Product / Growth20 min
AIGC 模型能力与商用边界
GPT-IMAGE-2 · SEEDANCE 2.0 · GPT-CODEX-5.5
GPT-IMAGE-2Capability Boundary
02 / 29
第 2 页 · GPT-IMAGE-2 能力边界

它擅长生成视觉,
不负责最终判断

GPT-IMAGE-2 适合把文字意图、参考图和局部编辑需求转成高质量静态视觉,但商业交付还要靠设计、法务和业务共同验收。

Input
Text+图
支持文本提示、参考图和局部编辑,适合从意图到视觉草案。
Output
4K
可输出多尺寸静态图,适合主视觉、KV、产品图和概念稿。
Strength
Style
强在语义理解、风格迁移、参考图融合和视觉探索速度。
Boundary
Text
精确文字、Logo、复杂版式和跨批次一致性仍需要人工控制。
Not For
Final
不应直接作为最终广告资产上线,必须经过版权、品牌和法律审核。
Ops
Net
网络、额度、区域可用性和接口变化会影响生产稳定性。
能力边界 · 静态视觉生成 / 局部编辑 / 人工验收
GPT-IMAGE-2 · 01
GPT-IMAGE-2Technical Principle
03 / 29
第 3 页 · GPT-IMAGE-2 技术原理

它不是图库检索, 而是视觉语义到像素的编译。

技术上可以理解为:模型把文本意图、参考图片、局部约束、质量和尺寸参数共同编码,再生成一张可继续编辑的静态图像。

技术原理 · 指令遵循 / 参考图融合 / 局部编辑 / 多规格输出
GPT-IMAGE-2 · 02
GPT-IMAGE-2Applications
04 / 29
第 4 页 · GPT-IMAGE-2 核心应用场景

从灵感草图到商业视觉

CREATIVE · EARLY STAGE
Brief → 参考图 → GPT-IMAGE-2 → 方向筛选
快在探索,慢在取舍
概念
把抽象创意转成 3-6 个可讨论的视觉方向。
风格
快速比较材质、色彩、场景、人物和品牌语气。
分镜
生成海报、场景板、广告分镜首帧和概念验证图。
COMMERCIAL · DELIVERY STAGE
母版 → 局部编辑 → 多比例 → 人工修订 → 发布
快在扩展,严在验收
产品图
包装、材质、使用场景、电商主图和社媒变体。
营销
Campaign KV、渠道适配、节日海报和本地化创意。
素材库
沉淀 prompt、参考图、失败样本和可复用视觉配方。
应用场景 · 概念板 / 产品图 / Campaign KV / 本地化素材
GPT-IMAGE-2 · 03
GPT-IMAGE-2Cost & Risk
05 / 29
第 5 页 · GPT-IMAGE-2 成本与商用风险

先小样试错,
再高质确认

成本由输入 token、参考图、输出尺寸、质量档位和迭代次数共同决定。商用时还要预留网络稳定性、版权来源、肖像权、商标、广告法和平台审核风险。

风险 · 网络 / 版权 / 肖像 / 商标 / 法律法规
GPT-IMAGE-2 · 04
Seedance 2.0ByteDance Background
06 / 29
第 6 页 · Seedance 2.0 技术背景

字节的多模态视频生成模型

Seedance 2.0 来自 ByteDance Seed,面向文字/图片/音频/视频输入到高质量视频输出,强调运动稳定、多镜头表达、物理连续和音画同步。

Model Foundation · Input
01
多模态输入
自然语言、参考图、视频片段、音频片段都可以作为生成约束。
02
图生视频
把静态 style frame 推进成短镜头,补齐运动、景别和时间维度。
03
文字生视频
用 prompt 描述角色、场景、动作、镜头和风格生成动态片段。
04
音画联合
官方强调音频、节奏和画面可以作为同一生成任务的一部分。
Generation Quality · Output
05
运动稳定
重点解决主体漂移、动作断裂、镜头跳变和物理不连续。
06
多镜头叙事
适合广告片、短剧、产品片中常见的镜头切换和节奏推进。
07
导演控制
需要明确景别、机位、运动方向、主体稳定和禁动元素。
08
人工验收
商业片仍要逐帧检查品牌、版权、人物、文字和物理细节。
技术背景 · ByteDance Seed / 多模态视频 / 音画同步
SEEDANCE 2.0 · 01
GPT-IMAGE-2 + Seedance 2.0Combo
07 / 29
第 7 页 · GPT-IMAGE-2 与 Seedance 2.0 组合应用

先定静帧,
再推镜头

组合逻辑是:GPT-IMAGE-2 负责锁定风格、主体、构图和品牌语气;Seedance 2.0 负责把这张 style frame 推进成可控短镜头。

把静态图当成“视频首帧合同”:先让画面可控,再让运动发生。
组合应用 · 图像生成 → 图生视频 → 人工验收
产品宣传
先生成产品主视觉,再制作 5-15 秒短视频广告和社媒素材。
概念实现
把概念场景、角色、包装和环境快速变成动态概念片。
设计动效
用静帧验证风格,再让粒子、光影、镜头和材质轻微运动。
短剧预演
用于分镜、场景调性、角色动作和镜头节奏的早期预演。
组合应用 · 产品宣传 / 概念实现 / 设计动效 / 短剧
SEEDANCE 2.0 · 02
Seedance 2.0Applications
08 / 29
第 8 页 · Seedance 2.0 应用场景

让“视觉方向”动起来

Seedance 2.0 的价值不是把图片随机动画化,而是把品牌、产品、角色、场景和叙事节奏转成可预演的动态素材。

01
产品宣传
电商产品片、发布会 teaser、社媒短视频和广告预演。
02
概念实现
把新产品、新包装、新场景快速拍成“看得见”的概念样片。
03
设计动效
用于首屏 hero、KV 动态版、产品光效、材质和镜头实验。
04
短剧预演
验证角色、场景、镜头节奏、情绪和分镜可行性。
应用场景 · 产品宣传 / 概念实现 / 设计动效 / 短剧
SEEDANCE 2.0 · 03
Seedance 2.0Cost & Risk
09 / 29
第 9 页 · Seedance 2.0 使用成本与商用风险

先短镜头验证,
再长内容生产

COST · VIDEO TOKENS
公开报道口径:火山方舟曾披露按视频 token 计费,纯生成与含视频输入价格不同。
具体价格以控制台、合同或企业报价为准
策略
先生成 3-5 秒镜头验证运动,不要一上来做长片。
成本
镜头越长、分辨率越高、失败重试越多,成本和审片时间越高。
RISK · COMMERCIAL USE
商用风险集中在版权、肖像、商标、声音素材、广告法、平台审核和跨境合规。
动态内容比静态图更容易暴露连续性和法律问题
版权
参考图、人物、IP、音乐、声音和训练素材争议都要建立来源记录。
法规
人物肖像、深度合成标识、未成年人、医疗金融等高敏场景需单独审查。
结论:视频阶段负责传播验证,但商用验收要更严格
SEEDANCE 2.0 · 04
CODEX-5.5Technical Principle
10 / 29
第 10 页 · CODEX-5.5 技术原理

从聊天模型到 coding agent

01 · Context
读仓库
理解文件结构、依赖、历史模式、测试和运行环境。
02 · Reasoning
推理规划
把需求拆成可执行步骤,判断影响范围和依赖关系。
03 · Tools
工具调用
通过 shell、文件编辑、浏览器、测试命令形成闭环。
04 · Patch
代码修改
生成 diff、修测试、解释取舍,逐步接近可合入状态。
05 · Verify
验证证据
运行 lint、单测、构建、截图和回归检查。
06 · Review
人审合入
模型提供候选实现,最终合入仍由团队负责。
技术原理 · 上下文窗口 / 推理规划 / 工具调用 / 验证闭环
CODEX-5.5 · 01
CODEX-5.5Interfaces
11 / 29
第 11 页 · CODEX-5.5 应用形态

CLI · Codex App · IDE 插件

CODEX-5.5 可以以不同入口进入研发工作流:命令行适合深度改造,桌面 Codex App 适合长任务和浏览器验证,IDE 插件适合开发者日常补全和局部修改。

CLICodex AppIDE PluginReview
应用形态 · 任务深度不同,人审责任不变
CODEX-5.5 · 02
CODEX-5.5Workflow
12 / 29
第 12 页 · CODEX-5.5 工作流

从 vibe 到可合入,中间要有证据链

01 · Brief
写清任务目标、成功标准、相关文件、禁改范围和交付物。
输入
02 · Explore
让 Codex 先读代码、梳理依赖、定位影响范围,再动手。
理解
03 · Patch
小步修改,保留 diff 可读性,避免跨模块大范围重写。
实现
04 · Verify
运行 lint、测试、构建、浏览器截图,失败就让模型继续修。
证据
05 · Review
人类 reviewer 检查业务、设计、架构、安全和维护成本。
合入
工作流 · Brief → Explore → Patch → Verify → Review
CODEX-5.5 · 03
Prompt PatternHow To Operate
13 / 29
可复制的操作模板

一题三步,
一改三验

不要让 Codex “自由发挥”。每次都把目标、上下文、禁止事项、验收标准和验证命令写进去。

Codex task brief
目标:把设置页补齐空态和错误态。上下文:沿用现有 SettingsLayout、Button、Toast。限制:不要新增 UI 库,不要改接口。输出:小步修改 + 说明影响文件。
Review & verification brief
验收:桌面/移动不遮挡,键盘可达,错误文案清晰。验证:运行 lint、相关测试、浏览器截图。最后列出未验证项和 reviewer 应重点看的风险。
一句 prompt 不够,要给 Codex 一个生产上下文
Pattern · One To Many
Future DirectionWhere It Goes
14 / 29
未来不是更像外包团队

而是更像产品操作系统

A
规则图谱
设计 token、组件边界、交互原则、失败样本和审核结论进入项目规则。
B
多代理流水线
一个代理读需求,一个实现,一个跑测试,一个做设计和可访问性 review。
C
实时预演
设计评审从看稿变成看真实页面,越早暴露交互和边界问题。
真正的未来方向:模型从“帮我写一段代码”,走向“帮团队维护一套可迭代的软件生产系统”。
未来方向 · rules graph / agents / realtime preview
Future · 03
SourcesResearch Notes
15 / 29
资料来源与口径

以官方为主,
模型名保持谨慎

GPT-5.5
Using GPT-5.5: positioned for complex reasoning, coding, agentic workflows and frontier code generation.
developers.openai.com/api/docs/guides/latest-model
Codex Guide
Codex prompting guide: coding agents perform best when tasks include context, verification, environment setup and review expectations.
developers.openai.com/cookbook
Codex Product
OpenAI Codex is described as a coding agent that can write, understand, review and debug code across software tasks.
openai.com / help.openai.com
Vibe Coding
Public research framing uses vibe coding to describe natural-language-driven software creation with humans steering intent and acceptance.
Andrej Karpathy / Collins / public reports
Name Note
This deck treats "GPT-5.5 for Codex" as product-facing wording. Do not assume `gpt-codex-5.5` is a confirmed API model id.
model naming boundary
生成时间: 2026-05-03 · 主题: 靛蓝瓷
Sources · Appendix
Case ShowcaseGallery
16 / 29
案例展示

案例展示

以下案例由gpt-image-2 / seedance2.0 / codex生成

Case GalleryText + ImageEditable
案例展示 · 内容待补充
Cases · Cover
Case 01Showcase
17 / 29
案例 01

新官网项目工业储能板块页面概念

根据我提供这张原型图,帮我出一张介绍格力电器【工业储能】这个业务的专题页。

核心技术 1 张图,1920*600px;产品技术 2 张图,350*350px。
应用场景覆盖绿色交通安全高效运营 8 张图,以及智慧城市新能源升级、电网调频、风光能源消纳、工商业削峰填谷等场景。
同时延展工程机械动力系统、家庭储能系统、轨交机车动力系统、港口与岸电储能系统、机房基站备电系统、石油化工配套储能、光储充一体化充电站和科研实证储能应用。
工业储能
Case 01Industrial Energy Storage
工业储能专题页原型图
格力电器工业储能专题页概念图
案例展示 · 01
Industrial Energy Storage Page
Case 02Showcase
18 / 29
案例 02

新官网项目工业制品相关板块视觉方案

参考我提供的素材风格,帮我制作不同业务的 banner:高端装备(高端智能装备机床)、电机、压缩机、工业储能、电容、半导体器件(工业芯片)。

工业制品板块
Case 02Industrial Visuals
工业储能视觉方案
半导体器件视觉方案
精密铸造视觉方案
高端装备视觉方案
电容视觉方案
案例展示 · 02
Industrial Visual System
Case 03Showcase
19 / 29
案例 03

双联名概念海报快速生成

帮我制作一张格力电器和 DeepSeek V4 的联名合作海报,讲述算力空调这一概念;帮我制作一张格力电器和莫氏鸡煲的联名合作海报,讲述电磁炉新品与地道鸡煲风味的跨界概念。

Case 03Co-brand Concept
格力电器与 DeepSeek V4 算力空调联名海报
格力电器与莫氏鸡煲联名合作海报
案例展示 · 03
Co-brand Poster Concepts
Case 04Showcase
20 / 29
案例 04

新产品电商详情页卖点、概念、视觉生成

参考格力家用脱谷机与大松轻食饭煲产品图,将产品真实质感化后生成电商长图详情页。

两组连屏图覆盖产品展示、功能卖点、细节特写、厨房使用、多空间适配、24 小时保温与礼盒送礼场景,用统一暖调产品摄影建立可复用的详情页视觉模板。
E-commerce DetailLong-scroll VisualWarm Product Photo
Case 04E-commerce Detail Page
格力家用脱谷机电商详情页视觉
大松轻食饭煲电商详情页视觉
案例展示 · 04
Product Detail Visual
Case 05Showcase
21 / 29
案例 05

产品动画分镜生成

帮我针对这款产品做一个动画分镜,表达格力家用脱谷机 3D 环流柔碾技术。

以 6 个镜头串联产品亮相、环流柔碾、轻柔脱壳、脱壳率 >99%、米粒通透与营养保留,强调低碰撞低破损、膳食纤维更完整。
16:94K QualityStoryboard
Case 05Product Animation
格力家用脱谷机 3D 环流柔碾技术动画 storyboard
案例展示 · 05
GREE Rice Huller Storyboard
Case 06Showcase
22 / 29
案例 06

家用空调爆炸视图海报

帮我制作一张海报:格力家用空调内外机爆炸视图海报,高科技 3D 渲染,摄影棚灯光。

每一个零件都蕴含着支撑沉浸式体验的前沿科技与匠心设计。格力家用空调内机外机的垂直堆叠爆炸视图,展示多层不同的内部组件。
Exploded View3D RenderStudio Light
Case 06Air Conditioner Poster
格力家用空调内外机爆炸视图海报
案例展示 · 06
GREE Air Conditioner Exploded View
Case 07Showcase
23 / 29
案例 07

静帧变镜头 Seedance2.0 快速输出宣传视频

Seedance 2.0 采用统一的多模态音视频联合生成架构,支持文字、图片、音频、视频输入。

模型强调运动稳定、物理还原、音画同步和导演级控制,适合把静态风格帧快速扩展成可预览、可迭代的产品宣传镜头。
Image To VideoMotion StableDirector Control
Case 07Seedance 2.0 Video
Seedance 2.0 Shot 02 XRay Heating 生成界面截图
案例展示 · 07
Seedance 2.0 Promotional Video
Case 08Showcase
24 / 29
案例 08

gpt-image-2 与 Seedance2.0 配合工业级输出

GPT Image 2 是静帧编译器,用它锁方向、锁风格、锁品牌约束。

Seedance 2.0 是镜头推进器,用它验证运动、节奏和动态传播。设计师的价值变得不在速度,而在判断、取舍和沉淀。
Static FrameMotion LensIndustrial Output
Case 08Image + Video Pipeline
格力米饭更香甜动画广告分镜脚本
案例展示 · 08
GPT Image 2 + Seedance 2.0
Case 09Showcase
25 / 29
案例 09

codex 快速生成系统级交互原型

Codex 可以帮助团队快速生成系统级交互原型,将传统“需求梳理—页面设计—前端开发—联调验证”的流程压缩为一套可迭代的 AI 协同工作流。

使用时,只需先把业务目标、用户角色、核心流程、页面模块、交互规则、视觉风格和技术栈整理成结构化提示词,Codex 就可以基于需求快速生成前端页面、组件结构、路由逻辑、表单校验、状态切换、模拟数据和基础交互效果。
相比单页静态原型,Codex 更适合生成接近真实系统的高保真交互原型。
System PrototypeAI WorkflowInteractive Demo
Case 09Codex Prototype
https://catalpachan.github.io/gree-edgeless-website/
案例展示 · 09
System-level Interactive Prototype
Case 10Showcase
26 / 29
案例 10

Codex 接入 Vibe Coding 前端工作流

把前端设计从“手动写页面”升级为“用自然语言驱动设计与代码同步生成”的协作模式。

设计师或产品经理先用提示词描述业务场景、页面结构、组件规范、交互逻辑、视觉风格和响应式要求,再让 Codex 基于现有项目、设计系统或参考截图生成可运行的前端页面。
Codex 可以读取、编辑和运行代码,并支持在云端处理开发任务;前端设计用例也强调,可将设计稿、截图和设计说明转化为符合项目设计系统的响应式 UI,并通过 Playwright 等方式进行视觉校验和多轮迭代。
Vibe CodingFrontend WorkflowPlayable Prototype
Case 10Codex Frontend Workflow
https://catalpachan.github.io/aps-prototype/login.html
案例展示 · 10
Vibe Coding Frontend Workflow
Case 11Showcase
27 / 29
案例 11

Codex 与 Three.js 结合用于设备数字孪生 BI 看板开发

快速完成从“设备建模、场景搭建、数据接入”到“交互看板生成”的前端工程闭环。

开发时,团队可以先把设备结构、运行状态、关键指标、告警规则、交互方式和看板布局整理成结构化需求,再由 Codex 生成前端项目框架、Three.js 三维场景代码、设备模型加载逻辑、相机视角、灯光材质、动画效果以及 BI 数据面板组件。
Codex 可用于编写、修改、运行和调试代码,也适合根据设计说明或截图生成响应式前端界面;Three.js 则提供 WebGL/WebGPU、Controls、Animation、模型加载等能力,适合在浏览器中构建设备三维可视化场景。
Digital TwinThree.jsBI Dashboard
Case 11Three.js BI Prototype
https://jinwan.catalpachan.com/
案例展示 · 11
Three.js Digital Twin BI Dashboard
SummaryClosing
28 / 29
总结

AI 正在重塑各岗位的工作流

这不是未来趋势,而是已经发生的现实变化。无论是设计、研发、运营、产品、管理还是业务岗位,AI 都在帮助我们提升效率、降低技术门槛、拓展能力边界。

WorkflowInnovationValue Creation
01 · 能力边界被拓展
未来,技术实现的难度将被不断拉平,很多过去受限于专业能力、开发周期和资源成本的想法,都将通过 AI 更快落地。
02 · 价值判断被重估
真正决定个人和团队价值的,不再只是“会不会做”,而是“能不能想到、敢不敢创新、能不能把想法转化为成果”。
03 · 把 AI 变成工作伙伴
希望每个岗位都积极拥抱 AI,把 AI 当作效率工具和创新引擎,在实际业务中主动探索、持续实践,用 AI 推动技术革新、流程优化和价值创造。
未来的核心竞争力,将属于那些既懂业务、又有创造力,并能善用 AI 放大自身能力的人。
AIGC 模型能力与商用边界
Summary · AI Workflow
ThanksClosing
29 / 29
THANK YOU

感谢观看

计算机中心  陈梓峰
AIGC 模型能力与商用边界
End · Thanks