多视角并行实验 · Case Study

huashu-md-html v2.0 launch film 项目 · 2026-05-11 6 位艺术家视角的并行 director's notes + HTML + 关键帧实验

背景

用户要求「为 huashu-md-html v2.0 制作 30 秒升级宣传片」时，主线程先产出了 v5 基线（Anthropic / Penguin Classics 出版社品位）。但用户认为可以做得更好，给了 critical instruction：

「调用不同的 subagent 分别再去生成 6 个全然不同的表达方式和视觉设计的版本。你可以试试启用不同的导演和艺术家。然后全都完成后，再评判审校。」

这是首次系统化的「多视角并行 director's notes」实验，验证了一套可复用的工作流。

6 个视角的选择逻辑

不要随便选 6 个 designer——他们必须视觉差异度极高，避免趋同。

最终选择的 6 个视角（含选择理由）：

视角	流派	美学锚点	跟其他视角的差异
v5 基线	现代出版社	Anthropic 赤陶橙 + Penguin Classics 衬线 + Vignelli grid	安全的「品位」选择
v5a Wes Anderson	电影章节美学	The French Dispatch 杂志感 + 1960 Olivetti 工业目录	对称构图 + 章节卡片 + 装饰边框
v5b Saul Bass	60s 影片标题艺术	cut-paper + Trajan caps + 流动几何	剪纸 silhouette + 大字 + 强对角线
v5c 王家卫	港式新浪潮	《花样年华》《2046》 letterboxing + 中文衬线	慢拍 + 雾化光晕 + 中文为主
v5d Massimo Vignelli	1970 现代主义	Knoll identity manual + NYC Subway map	严格 grid + 3 色铁律 + 拒绝装饰
v5e Kenya Hara	极简日式	MUJI 海报 + 《白》	留白哲学 + 无 chrome + ma 间
v5f Yayoi Kusama	装置艺术	Infinity Mirror Rooms + Polka Dot Obsession	obsessive 重复 + 单一强色 + 圆点

选择原则：

3 个不同地理文化（西方电影 / 日本设计 / 港式中文）
3 个不同年代（1960s / 1970s / 2010s+）
3 个不同载体（电影 / 平面设计 / 装置艺术）
每个都有「跟训练语料里通用 SaaS 美学完全相反」的视觉签名

实施流程

Step 1 · 为每个视角写独立 brief（约 15 分钟）

每个 brief 包含 8 个固定字段：

1. 项目背景（同一份）
2. 必读参考（同一份 v5-director-notes.md 作方法论模板）
3. 你要做的事（4 项交付清单）
4. 该艺术家 DNA（核心字段 6 项）：
   - 色板（具体 HEX）
   - 字体（具体名字 + 替代方案）
   - 视觉语言（核心几条）
   - 招牌元素（identifiable signatures）
   - 节奏（区别其他视角）
   - 反 AI slop 强化版（在该风格语境下的禁区）
5. 30 秒结构参考（4-6 个 shot 草拟）
6. destination cards 设计要求（保持真实可读）
7. 关键约束（30s / 1920×1080 / file:// / Google Fonts CDN）
8. 输出验证清单 + 完成报告格式

关键：每个 brief 必须强调「不要重复 v5 的美学」——否则 subagent 会被 v5 director-notes 影响而趋同。

Step 2 · 并行启动 6 个 subagent（同一 message 中 6 个 Agent tool calls）

Agent({ subagent_type: "general-purpose", run_in_background: true, name: "v5a-anderson", ... })
Agent({ subagent_type: "general-purpose", run_in_background: true, name: "v5b-bass", ... })
// ... 6 个

后台运行，预期 30-60 分钟。

Step 3 · 等待期间的 idle work

不要 polling agent 状态。subagent 完成会自动 task-notification。等待期间做：

修主线程的 v5 基线 bug
写 review framework（每个版本要打的分维度 / Q&A）
沉淀方法论到 skill（这正是这份 case study 的来源）
准备 final summary 文档骨架

Step 4 · 失败处理（约 16% 失败率，可接受）

实战观测：6 个 subagent 中约 1 个会因网络或 token 超限失败（Bass 首轮 socket error）。处理：

收到 completion notification 时立即检查该 agent 的输出文件夹
缺少关键交付物 → 重启该 agent（同样 brief，可标注「上次失败，请重新执行」）
部分完成（如有 html 没截图）→ 主线程补 Playwright 截图，不重启 agent

Step 5 · 6 版本完成后系统审校

审校 framework（5 维度 + 3 顶层问 + use case 分配）：

5 维度评分（每维 1-10）：
- Distinctiveness 视觉差异化
- Coherence 美学一致性
- Anti-slop 反 AI slop 执行
- Story arc 节奏与故事弧
- Pause-and-look 细节密度

3 顶层问：
- Q1 截图分享？（能在社交平台触发暂停）
- Q2 记一句话？（能留下命题级记忆）
- Q3 跨时代？（5 年后回看不显廉价）

use case 分配（按平台和受众）：
- 公众号 / X / B 站 / 朋友圈 / Dribbble / 客户演示 / 私域 / ...

详见 assets/director-notes-samples/launch-film-30s-sample.md 的同目录 REVIEW.md。

实验产出（事实）

文档量

v5 基线 director-notes：11500 字
6 视角 director-notes 各 4000-12000 字
总文档量：约 55000-70000 字
5 大部分结构齐全：6/6 版本

HTML 实施

每版独立 animation.html，30 秒，1920×1080
文件大小 28-74KB
全部 file:// 可打开（不依赖 server）

关键帧

每版 10-18 张 PNG，覆盖完整 30 秒故事弧
总截图量：80+ 张
平均每张 PNG 大小：100-200KB

时长

6 个 subagent 并行运行：约 12-15 分钟（duration_ms 显示）
主线程并行 idle work（修 v5 + 写方法论）：同期完成
整体「从启动 6 视角到所有 deliverable 到位」：约 60 分钟

关键洞察（写给 huashu-design 的未来用户）

洞察 1 · 「先写万字 director's notes」方法论完全 reproducible

6 个 subagent 都按 5 大部分结构产出了 4000-12000 字的完整 spec，且实施 HTML 时都达到了 marketing-ready 质量。这证明方法论本身不依赖单一执行者的天赋——只要 brief 给得清楚，多个独立执行者能产出一致的高质量结果。

洞察 2 · 「视角」必须具体到「作品 + 年份」

每个 brief 里都列出具体作品对话：

Anderson → The French Dispatch (2021) + Moonrise Kingdom (2012) + Penguin Classics dust jackets + 1960s Olivetti catalogues
WKW → In the Mood for Love (2000) + 2046 (2004)
Vignelli → 1972 NYC Subway map + Knoll identity manual + The Vignelli Canon
Hara → MUJI brand 1995-2023 + 《白》 + Junya Ishigami transparency
Kusama → Infinity Mirrored Rooms (2013-2023) + Polka Dot Obsession 装置

实战结果：所有 subagent 都准确捕捉到了该作品的核心 visual DNA，而不是流派的「平均值」。

洞察 3 · 反 AI slop 的「风格强化版本」是关键

通用 anti-slop（紫渐变 / emoji / SVG 人物）适用所有版本。但每个风格还要写「专属 anti-slop」：

Bass: 不用 Helvetica（太干净，Bass 是粗犷）
Vignelli: 不用圆角（所有 corner 90°）
Hara: 不用任何渐变 + 不用 sans display
Kusama: 不用现代 SaaS look
Anderson: 不用 cyber 配色
WKW: 不用 Inter（WKW 用衬线）

加了这些后，6 个版本风格纯度极高，无一相互趋同。

洞察 4 · 多视角的真正价值不是「选 winner」

最初设想是 A/B test 选最好的版本。实际审校时发现：6 个版本各自有清晰 use case：

v5 基线 → 产品页 / 微信读书（信息密度高）
Anderson → 公众号长文头图（翻杂志感强）
WKW → B 站 / 中文文化向（怀旧温度）
Vignelli → 设计圈 / Dribbble（每帧都是印刷海报）
Hara → 客户演示 / 静态截图（极简哲学）
Kusama → X 短视频 / 病毒传播（视觉冲击）

结论：marketing 不是 single-shot，是 platform-specific multiplex。6 视角并行的真正价值是让一个项目有 6 个差异化武器，不是让 5 个版本上不了台面。

洞察 5 · subagent 的失败率 ~16% 是可接受的

6 个里 1 个失败（Bass 首轮 socket error）。处理代价：重启 + 5 分钟简化版 brief，再等 12-15 分钟。对比 vs. 等 1 个 agent 顺序跑 6 个版本（90+ 分钟）——并行 + 重试明显更经济。

洞察 6 · 主线程在等待期间必须做 substantive idle work

subagent 完成需要 12-15 分钟。这段时间主线程绝不该空闲：

修主版本 bug（用户已经反馈的）
写 review framework（等审校时填）
沉淀方法论到 skill（如这份 case study）
准备 final summary（用户回来一目了然）

这是 parallel multi-agent workflow 的「主线程职责」——不是 PM 等结果，是 orchestrator 同步推进。

何时启用「多视角并行」

场景	是否启用	原因
用户明确说「想看不同方向」「再多做几个版本」	✅ 立刻启用	直接需求
第一版做出来用户不满意但说不清要啥	✅ 启用	A/B 选优于「我猜你要啥」
项目准备多平台分发（X / 公众号 / B 站 / 朋友圈）	✅ 启用	每平台一个版本
客户没拍板风格但有预算（time + token）	✅ 启用	反复改 = 5 倍代价
用户已经给了明确风格参考且只要 1 个版本	❌ 不启用	浪费
任务是简单 motion graphic / icon 动画	❌ 不启用	过度工程化
时间紧 < 30 分钟	❌ 不启用	subagent 跑不完

完整方法论流程图

用户 brief（含质量预期）
       ↓
[主线程] 写 v5 基线 director's notes（万字级 5 大部分）
       ↓
[主线程] 实施 v5 HTML + 截关键帧（marketing baseline）
       ↓
[决策点] 是否启用多视角？
       ↓ YES
[主线程] 选 6 个差异化视角 + 写 6 份独立 brief（每份 8 字段）
       ↓
[6 subagents 并行]
   ├── v5a brief → director-notes + html + keyframes + README
   ├── v5b brief → ...
   ├── v5c brief → ...
   ├── v5d brief → ...
   ├── v5e brief → ...
   └── v5f brief → ...
       ↓
[主线程同步做] 修 v5 bug · 写 review framework · 沉淀方法论
       ↓
[全 6 通知到达]
       ↓
[主线程] 失败检测 + 重试 / 补截图
       ↓
[主线程] 5 维度评分 + 3 顶层问 + use case 分配
       ↓
[主线程] 写 final REVIEW.md
       ↓
[交付] 6 完整版本 + review + 平台分发推荐

多视角并行实验 · Case Study ​

背景 ​

6 个视角的选择逻辑 ​

实施流程 ​

Step 1 · 为每个视角写独立 brief（约 15 分钟） ​

Step 2 · 并行启动 6 个 subagent（同一 message 中 6 个 Agent tool calls） ​

Step 3 · 等待期间的 idle work ​

Step 4 · 失败处理（约 16% 失败率，可接受） ​

Step 5 · 6 版本完成后系统审校 ​

实验产出（事实） ​

文档量 ​

HTML 实施 ​

关键帧 ​

时长 ​

关键洞察（写给 huashu-design 的未来用户） ​

洞察 1 · 「先写万字 director's notes」方法论完全 reproducible ​

洞察 2 · 「视角」必须具体到「作品 + 年份」 ​

洞察 3 · 反 AI slop 的「风格强化版本」是关键 ​

洞察 4 · 多视角的真正价值不是「选 winner」 ​

洞察 5 · subagent 的失败率 ~16% 是可接受的 ​

洞察 6 · 主线程在等待期间必须做 substantive idle work ​

何时启用「多视角并行」 ​

完整方法论流程图 ​

相关文档 ​