AI Design Workflow2026.05

Vol.01

GPT-IMAGE-2 · SEEDANCE 2.0 · GPT-CODEX-5.5

AIGC 与 Vibe Coding 研究

从想法变方案最终落地产品全流程

生成图像、生成视频、生成软件。重点讨论能力边界、技术原理、成本模型、商用风险,以及它们如何进入设计和产品工作流。

Internal TalkDesign / Product / Growth20 min

AIGC 模型能力与商用边界

GPT-IMAGE-2 · SEEDANCE 2.0 · GPT-CODEX-5.5

GPT-IMAGE-2Capability Boundary

02 / 30

第 2 页 · GPT-IMAGE-2 能力边界

它擅长生成视觉,
不负责最终判断

GPT-IMAGE-2 适合把文字意图、参考图和局部编辑需求转成高质量静态视觉,但商业交付还要靠设计、法务和业务共同验收。

Input

Text+图

支持文本提示、参考图和局部编辑,适合从意图到视觉草案。

Output

4K

可输出多尺寸静态图,适合主视觉、KV、产品图和概念稿。

Strength

Style

强在语义理解、风格迁移、参考图融合和视觉探索速度。

Boundary

Text

精确文字、Logo、复杂版式和跨批次一致性仍需要人工控制。

Not For

Final

不应直接作为最终广告资产上线,必须经过版权、品牌和法律审核。

Ops

Net

网络、额度、区域可用性和接口变化会影响生产稳定性。

能力边界 · 静态视觉生成 / 局部编辑 / 人工验收

GPT-IMAGE-2 · 01

GPT-IMAGE-2Technical Principle

03 / 30

第 3 页 · GPT-IMAGE-2 技术原理

它不是图库检索, 而是视觉语义到像素的编译。

技术上可以理解为:模型把文本意图、参考图片、局部约束、质量和尺寸参数共同编码,再生成一张可继续编辑的静态图像。

技术原理 · 指令遵循 / 参考图融合 / 局部编辑 / 多规格输出

GPT-IMAGE-2 · 02

GPT-IMAGE-2Applications

04 / 30

第 4 页 · GPT-IMAGE-2 核心应用场景

从灵感草图到商业视觉

CREATIVE · EARLY STAGE

Brief → 参考图 → GPT-IMAGE-2 → 方向筛选

快在探索,慢在取舍

概念

把抽象创意转成 3-6 个可讨论的视觉方向。

风格

快速比较材质、色彩、场景、人物和品牌语气。

分镜

生成海报、场景板、广告分镜首帧和概念验证图。

COMMERCIAL · DELIVERY STAGE

母版 → 局部编辑 → 多比例 → 人工修订 → 发布

快在扩展,严在验收

产品图

包装、材质、使用场景、电商主图和社媒变体。

营销

Campaign KV、渠道适配、节日海报和本地化创意。

素材库

沉淀 prompt、参考图、失败样本和可复用视觉配方。

应用场景 · 概念板 / 产品图 / Campaign KV / 本地化素材

GPT-IMAGE-2 · 03

GPT-IMAGE-2Cost & Risk

05 / 30

第 5 页 · GPT-IMAGE-2 成本与商用风险

先小样试错,
再高质确认

成本由输入 token、参考图、输出尺寸、质量档位和迭代次数共同决定。商用时还要预留网络稳定性、版权来源、肖像权、商标、广告法和平台审核风险。

风险 · 网络 / 版权 / 肖像 / 商标 / 法律法规

GPT-IMAGE-2 · 04

Seedance 2.0ByteDance Background

06 / 30

第 6 页 · Seedance 2.0 技术背景

字节的多模态视频生成模型

Seedance 2.0 来自 ByteDance Seed,面向文字/图片/音频/视频输入到高质量视频输出,强调运动稳定、多镜头表达、物理连续和音画同步。

Model Foundation · Input

01

多模态输入

自然语言、参考图、视频片段、音频片段都可以作为生成约束。

02

图生视频

把静态 style frame 推进成短镜头,补齐运动、景别和时间维度。

03

文字生视频

用 prompt 描述角色、场景、动作、镜头和风格生成动态片段。

04

音画联合

官方强调音频、节奏和画面可以作为同一生成任务的一部分。

Generation Quality · Output

05

运动稳定

重点解决主体漂移、动作断裂、镜头跳变和物理不连续。

06

多镜头叙事

适合广告片、短剧、产品片中常见的镜头切换和节奏推进。

07

导演控制

需要明确景别、机位、运动方向、主体稳定和禁动元素。

08

人工验收

商业片仍要逐帧检查品牌、版权、人物、文字和物理细节。

技术背景 · ByteDance Seed / 多模态视频 / 音画同步

SEEDANCE 2.0 · 01

GPT-IMAGE-2 + Seedance 2.0Combo

07 / 30

第 7 页 · GPT-IMAGE-2 与 Seedance 2.0 组合应用

先定静帧,
再推镜头

组合逻辑是:GPT-IMAGE-2 负责锁定风格、主体、构图和品牌语气;Seedance 2.0 负责把这张 style frame 推进成可控短镜头。

把静态图当成“视频首帧合同”:先让画面可控,再让运动发生。

组合应用 · 图像生成 → 图生视频 → 人工验收

产品宣传

先生成产品主视觉,再制作 5-15 秒短视频广告和社媒素材。

概念实现

把概念场景、角色、包装和环境快速变成动态概念片。

设计动效

用静帧验证风格,再让粒子、光影、镜头和材质轻微运动。

短剧预演

用于分镜、场景调性、角色动作和镜头节奏的早期预演。

组合应用 · 产品宣传 / 概念实现 / 设计动效 / 短剧

SEEDANCE 2.0 · 02

Seedance 2.0Applications

08 / 30

第 8 页 · Seedance 2.0 应用场景

让“视觉方向”动起来

Seedance 2.0 的价值不是把图片随机动画化,而是把品牌、产品、角色、场景和叙事节奏转成可预演的动态素材。

01

产品宣传

电商产品片、发布会 teaser、社媒短视频和广告预演。

02

概念实现

把新产品、新包装、新场景快速拍成“看得见”的概念样片。

03

设计动效

用于首屏 hero、KV 动态版、产品光效、材质和镜头实验。

04

短剧预演

验证角色、场景、镜头节奏、情绪和分镜可行性。

应用场景 · 产品宣传 / 概念实现 / 设计动效 / 短剧

SEEDANCE 2.0 · 03

Seedance 2.0Cost & Risk

09 / 30

第 9 页 · Seedance 2.0 使用成本与商用风险

先短镜头验证,
再长内容生产

COST · VIDEO TOKENS

公开报道口径:火山方舟曾披露按视频 token 计费,纯生成与含视频输入价格不同。

具体价格以控制台、合同或企业报价为准

策略

先生成 3-5 秒镜头验证运动,不要一上来做长片。

成本

镜头越长、分辨率越高、失败重试越多,成本和审片时间越高。

RISK · COMMERCIAL USE

商用风险集中在版权、肖像、商标、声音素材、广告法、平台审核和跨境合规。

动态内容比静态图更容易暴露连续性和法律问题

版权

参考图、人物、IP、音乐、声音和训练素材争议都要建立来源记录。

法规

人物肖像、深度合成标识、未成年人、医疗金融等高敏场景需单独审查。

结论:视频阶段负责传播验证,但商用验收要更严格

SEEDANCE 2.0 · 04

CODEX-5.5Technical Principle

10 / 30

第 10 页 · CODEX-5.5 技术原理

从聊天模型到 coding agent

01 · Context

读仓库

理解文件结构、依赖、历史模式、测试和运行环境。

02 · Reasoning

推理规划

把需求拆成可执行步骤,判断影响范围和依赖关系。

03 · Tools

工具调用

通过 shell、文件编辑、浏览器、测试命令形成闭环。

04 · Patch

代码修改

生成 diff、修测试、解释取舍,逐步接近可合入状态。

05 · Verify

验证证据

运行 lint、单测、构建、截图和回归检查。

06 · Review

人审合入

模型提供候选实现,最终合入仍由团队负责。

技术原理 · 上下文窗口 / 推理规划 / 工具调用 / 验证闭环

CODEX-5.5 · 01

CODEX-5.5Interfaces

11 / 30

第 11 页 · CODEX-5.5 应用形态

CLI · Codex App · IDE 插件

CODEX-5.5 可以以不同入口进入研发工作流:命令行适合深度改造,桌面 Codex App 适合长任务和浏览器验证,IDE 插件适合开发者日常补全和局部修改。

CLICodex AppIDE PluginReview

应用形态 · 任务深度不同,人审责任不变

CODEX-5.5 · 02

CODEX-5.5Workflow

12 / 30

第 12 页 · CODEX-5.5 工作流

从 vibe 到可合入,中间要有证据链

01 · Brief

写清任务目标、成功标准、相关文件、禁改范围和交付物。

输入

02 · Explore

让 Codex 先读代码、梳理依赖、定位影响范围,再动手。

理解

03 · Patch

小步修改,保留 diff 可读性,避免跨模块大范围重写。

实现

04 · Verify

运行 lint、测试、构建、浏览器截图,失败就让模型继续修。

证据

05 · Review

人类 reviewer 检查业务、设计、架构、安全和维护成本。

合入

工作流 · Brief → Explore → Patch → Verify → Review

CODEX-5.5 · 03

Prompt PatternHow To Operate

13 / 30

可复制的操作模板

一题三步,
一改三验

不要让 Codex “自由发挥”。每次都把目标、上下文、禁止事项、验收标准和验证命令写进去。

Codex task brief

目标:把设置页补齐空态和错误态。上下文:沿用现有 SettingsLayout、Button、Toast。限制:不要新增 UI 库,不要改接口。输出:小步修改 + 说明影响文件。

Review & verification brief

验收:桌面/移动不遮挡,键盘可达,错误文案清晰。验证:运行 lint、相关测试、浏览器截图。最后列出未验证项和 reviewer 应重点看的风险。

一句 prompt 不够,要给 Codex 一个生产上下文

Pattern · One To Many

Future DirectionWhere It Goes

14 / 30

未来不是更像外包团队

而是更像产品操作系统

A

规则图谱

设计 token、组件边界、交互原则、失败样本和审核结论进入项目规则。

B

多代理流水线

一个代理读需求,一个实现,一个跑测试,一个做设计和可访问性 review。

C

实时预演

设计评审从看稿变成看真实页面,越早暴露交互和边界问题。

真正的未来方向:模型从“帮我写一段代码”,走向“帮团队维护一套可迭代的软件生产系统”。

未来方向 · rules graph / agents / realtime preview

Future · 03

SourcesResearch Notes

15 / 30

资料来源与口径

以官方为主,
模型名保持谨慎

GPT-5.5

Using GPT-5.5: positioned for complex reasoning, coding, agentic workflows and frontier code generation.

developers.openai.com/api/docs/guides/latest-model

Codex Guide

Codex prompting guide: coding agents perform best when tasks include context, verification, environment setup and review expectations.

developers.openai.com/cookbook

Codex Product

OpenAI Codex is described as a coding agent that can write, understand, review and debug code across software tasks.

openai.com / help.openai.com

Vibe Coding

Public research framing uses vibe coding to describe natural-language-driven software creation with humans steering intent and acceptance.

Andrej Karpathy / Collins / public reports

Name Note

This deck treats "GPT-5.5 for Codex" as product-facing wording. Do not assume `gpt-codex-5.5` is a confirmed API model id.

model naming boundary

生成时间: 2026-05-03 · 主题: 靛蓝瓷

Sources · Appendix

Case ShowcaseGallery

16 / 30

案例展示

以下案例由gpt-image-2 / seedance2.0 / codex生成

Case GalleryText + ImageEditable

案例展示 · 内容待补充

Cases · Cover

Case 01Showcase

17 / 30

案例 01

新官网项目工业储能板块页面概念

根据我提供这张原型图，帮我出一张介绍格力电器【工业储能】这个业务的专题页。

核心技术 1 张图，1920*600px；产品技术 2 张图，350*350px。

应用场景覆盖绿色交通安全高效运营 8 张图，以及智慧城市新能源升级、电网调频、风光能源消纳、工商业削峰填谷等场景。

同时延展工程机械动力系统、家庭储能系统、轨交机车动力系统、港口与岸电储能系统、机房基站备电系统、石油化工配套储能、光储充一体化充电站和科研实证储能应用。

工业储能

Case 01Industrial Energy Storage

案例展示 · 01

Industrial Energy Storage Page

Case 02Showcase

18 / 30

案例 02

新官网项目工业制品相关板块视觉方案

参考我提供的素材风格，帮我制作不同业务的 banner：高端装备（高端智能装备机床）、电机、压缩机、工业储能、电容、半导体器件（工业芯片）。

工业制品板块

Case 02Industrial Visuals

案例展示 · 02

Industrial Visual System

Case 03Showcase

19 / 30

案例 03

双联名概念海报快速生成

帮我制作一张格力电器和 DeepSeek V4 的联名合作海报，讲述算力空调这一概念；帮我制作一张格力电器和莫氏鸡煲的联名合作海报，讲述电磁炉新品与地道鸡煲风味的跨界概念。

Case 03Co-brand Concept

案例展示 · 03

Co-brand Poster Concepts

Case 04Showcase

20 / 30

案例 04

新产品电商详情页卖点、概念、视觉生成

参考格力家用脱谷机与大松轻食饭煲产品图，将产品真实质感化后生成电商长图详情页。

两组连屏图覆盖产品展示、功能卖点、细节特写、厨房使用、多空间适配、24 小时保温与礼盒送礼场景，用统一暖调产品摄影建立可复用的详情页视觉模板。

E-commerce DetailLong-scroll VisualWarm Product Photo

Case 04E-commerce Detail Page

案例展示 · 04

Product Detail Visual

Case 05Showcase

21 / 30

案例 05

产品动画分镜生成

帮我针对这款产品做一个动画分镜，表达格力家用脱谷机 3D 环流柔碾技术。

以 6 个镜头串联产品亮相、环流柔碾、轻柔脱壳、脱壳率 >99%、米粒通透与营养保留，强调低碰撞低破损、膳食纤维更完整。

16:94K QualityStoryboard

Case 05Product Animation

案例展示 · 05

GREE Rice Huller Storyboard

Case 06Showcase

22 / 30

案例 06

家用空调爆炸视图海报

帮我制作一张海报：格力家用空调内外机爆炸视图海报，高科技 3D 渲染，摄影棚灯光。

每一个零件都蕴含着支撑沉浸式体验的前沿科技与匠心设计。格力家用空调内机外机的垂直堆叠爆炸视图，展示多层不同的内部组件。

Exploded View3D RenderStudio Light

Case 06Air Conditioner Poster

案例展示 · 06

GREE Air Conditioner Exploded View

Case 07Showcase

23 / 30

案例 07

静帧变镜头 Seedance2.0 快速输出宣传视频

Seedance 2.0 采用统一的多模态音视频联合生成架构，支持文字、图片、音频、视频输入。

模型强调运动稳定、物理还原、音画同步和导演级控制，适合把静态风格帧快速扩展成可预览、可迭代的产品宣传镜头。

Image To VideoMotion StableDirector Control

Case 07Seedance 2.0 Video

Seedance 2.0 Shot 02 XRay Heating 生成界面截图

案例展示 · 07

Seedance 2.0 Promotional Video

Case 08Showcase

24 / 30

案例 08

gpt-image-2 与 Seedance2.0 配合工业级输出

GPT Image 2 是静帧编译器，用它锁方向、锁风格、锁品牌约束。

Seedance 2.0 是镜头推进器，用它验证运动、节奏和动态传播。设计师的价值变得不在速度，而在判断、取舍和沉淀。

Static FrameMotion LensIndustrial Output

Case 08Image + Video Pipeline

案例展示 · 08

GPT Image 2 + Seedance 2.0

Case 09Showcase

25 / 30

案例 09

codex 快速生成系统级交互原型

Codex 可以帮助团队快速生成系统级交互原型，将传统“需求梳理—页面设计—前端开发—联调验证”的流程压缩为一套可迭代的 AI 协同工作流。

使用时，只需先把业务目标、用户角色、核心流程、页面模块、交互规则、视觉风格和技术栈整理成结构化提示词，Codex 就可以基于需求快速生成前端页面、组件结构、路由逻辑、表单校验、状态切换、模拟数据和基础交互效果。

相比单页静态原型，Codex 更适合生成接近真实系统的高保真交互原型。

System PrototypeAI WorkflowInteractive Demo

Case 09Codex Prototype

https://catalpachan.github.io/gree-edgeless-website/

案例展示 · 09

System-level Interactive Prototype

Case 10Showcase

26 / 30

案例 10

Codex 接入 Vibe Coding 前端工作流

把前端设计从“手动写页面”升级为“用自然语言驱动设计与代码同步生成”的协作模式。

设计师或产品经理先用提示词描述业务场景、页面结构、组件规范、交互逻辑、视觉风格和响应式要求，再让 Codex 基于现有项目、设计系统或参考截图生成可运行的前端页面。

Codex 可以读取、编辑和运行代码，并支持在云端处理开发任务；前端设计用例也强调，可将设计稿、截图和设计说明转化为符合项目设计系统的响应式 UI，并通过 Playwright 等方式进行视觉校验和多轮迭代。

Vibe CodingFrontend WorkflowPlayable Prototype

Case 10Codex Frontend Workflow

https://catalpachan.github.io/aps-prototype/login.html

案例展示 · 10

Vibe Coding Frontend Workflow

Case 11Showcase

27 / 30

案例 11

Codex 与 Three.js 结合用于设备数字孪生 BI 看板开发

快速完成从“设备建模、场景搭建、数据接入”到“交互看板生成”的前端工程闭环。

开发时，团队可以先把设备结构、运行状态、关键指标、告警规则、交互方式和看板布局整理成结构化需求，再由 Codex 生成前端项目框架、Three.js 三维场景代码、设备模型加载逻辑、相机视角、灯光材质、动画效果以及 BI 数据面板组件。

Codex 可用于编写、修改、运行和调试代码，也适合根据设计说明或截图生成响应式前端界面；Three.js 则提供 WebGL/WebGPU、Controls、Animation、模型加载等能力，适合在浏览器中构建设备三维可视化场景。

Digital TwinThree.jsBI Dashboard

Case 11Three.js BI Prototype

https://jinwan.catalpachan.com/

案例展示 · 11

Three.js Digital Twin BI Dashboard

Case 12Showcase

28 / 30

案例 12

格力职业技术学院前端验证原型

基于 Next.js 快速完成从“页面结构搭建、功能流程验证、交互体验还原”到“前端原型交付”的工程闭环。

在前端验证阶段，团队可以先将学院门户、教学资源、专业介绍、招生就业、校园服务、后台管理等核心业务内容整理成结构化需求，再基于 Next.js 快速生成页面路由、组件结构、响应式布局、数据展示模块和交互逻辑。

Next.js 适合用于搭建高性能、可扩展的前端验证原型，支持组件化开发、页面级路由、服务端渲染、静态页面生成和接口联调，能够帮助团队快速完成从设计稿到可运行页面的转化。

通过前端原型，可以提前验证页面布局、业务流程、交互体验和展示效果，为后续正式开发、需求评审和演示汇报提供直观依据。

Next.jsFrontend PrototypePortal Verification

Case 12Gree Vocational College

https://zhgpt.catalpachan.com/

案例展示 · 12

Next.js Frontend Verification Prototype

SummaryClosing

29 / 30

总结

AI 正在重塑各岗位的工作流

这不是未来趋势，而是已经发生的现实变化。无论是设计、研发、运营、产品、管理还是业务岗位，AI 都在帮助我们提升效率、降低技术门槛、拓展能力边界。

WorkflowInnovationValue Creation

01 · 能力边界被拓展

未来，技术实现的难度将被不断拉平，很多过去受限于专业能力、开发周期和资源成本的想法，都将通过 AI 更快落地。

02 · 价值判断被重估

真正决定个人和团队价值的，不再只是“会不会做”，而是“能不能想到、敢不敢创新、能不能把想法转化为成果”。

03 · 把 AI 变成工作伙伴

希望每个岗位都积极拥抱 AI，把 AI 当作效率工具和创新引擎，在实际业务中主动探索、持续实践，用 AI 推动技术革新、流程优化和价值创造。

未来的核心竞争力，将属于那些既懂业务、又有创造力，并能善用 AI 放大自身能力的人。

AIGC 模型能力与商用边界

Summary · AI Workflow

ThanksClosing

30 / 30

THANK YOU

感谢观看

计算机中心陈梓峰

AIGC 模型能力与商用边界

End · Thanks

AIGC 与 Vibe Coding 研究

从想法变方案最终落地产品全流程

它擅长生成视觉,不负责最终判断

它不是图库检索, 而是视觉语义到像素的编译。

从灵感草图到商业视觉

先小样试错,再高质确认

字节的多模态视频生成模型

先定静帧,再推镜头

让“视觉方向”动起来

先短镜头验证,再长内容生产

从聊天模型到 coding agent

CLI · Codex App · IDE 插件

从 vibe 到可合入,中间要有证据链

一题三步,一改三验

而是更像产品操作系统

以官方为主,模型名保持谨慎

案例展示

新官网项目工业储能板块页面概念

新官网项目工业制品相关板块视觉方案

双联名概念海报快速生成

新产品电商详情页卖点、概念、视觉生成

产品动画分镜生成

家用空调爆炸视图海报

静帧变镜头 Seedance2.0 快速输出宣传视频

gpt-image-2 与 Seedance2.0 配合工业级输出

codex 快速生成系统级交互原型

Codex 接入 Vibe Coding 前端工作流

Codex 与 Three.js 结合用于设备数字孪生 BI 看板开发

格力职业技术学院前端验证原型

AI 正在重塑各岗位的工作流

感谢观看

它擅长生成视觉,
不负责最终判断

先小样试错,
再高质确认

先定静帧,
再推镜头

先短镜头验证,
再长内容生产

一题三步,
一改三验

以官方为主,
模型名保持谨慎