Skip to content

多视角并行实验 · Case Study

huashu-md-html v2.0 launch film 项目 · 2026-05-11 6 位艺术家视角的并行 director's notes + HTML + 关键帧实验


背景

用户要求「为 huashu-md-html v2.0 制作 30 秒升级宣传片」时,主线程先产出了 v5 基线(Anthropic / Penguin Classics 出版社品位)。但用户认为可以做得更好,给了 critical instruction:

「调用不同的 subagent 分别再去生成 6 个全然不同的表达方式和视觉设计的版本。你可以试试启用不同的导演和艺术家。然后全都完成后,再评判审校。」

这是首次系统化的「多视角并行 director's notes」实验,验证了一套可复用的工作流。


6 个视角的选择逻辑

不要随便选 6 个 designer——他们必须视觉差异度极高,避免趋同。

最终选择的 6 个视角(含选择理由):

视角流派美学锚点跟其他视角的差异
v5 基线现代出版社Anthropic 赤陶橙 + Penguin Classics 衬线 + Vignelli grid安全的「品位」选择
v5a Wes Anderson电影章节美学The French Dispatch 杂志感 + 1960 Olivetti 工业目录对称构图 + 章节卡片 + 装饰边框
v5b Saul Bass60s 影片标题艺术cut-paper + Trajan caps + 流动几何剪纸 silhouette + 大字 + 强对角线
v5c 王家卫港式新浪潮《花样年华》《2046》 letterboxing + 中文衬线慢拍 + 雾化光晕 + 中文为主
v5d Massimo Vignelli1970 现代主义Knoll identity manual + NYC Subway map严格 grid + 3 色铁律 + 拒绝装饰
v5e Kenya Hara极简日式MUJI 海报 + 《白》留白哲学 + 无 chrome + ma 间
v5f Yayoi Kusama装置艺术Infinity Mirror Rooms + Polka Dot Obsessionobsessive 重复 + 单一强色 + 圆点

选择原则

  1. 3 个不同地理文化(西方电影 / 日本设计 / 港式中文)
  2. 3 个不同年代(1960s / 1970s / 2010s+)
  3. 3 个不同载体(电影 / 平面设计 / 装置艺术)
  4. 每个都有「跟训练语料里通用 SaaS 美学完全相反」的视觉签名

实施流程

Step 1 · 为每个视角写独立 brief(约 15 分钟)

每个 brief 包含 8 个固定字段:

1. 项目背景(同一份)
2. 必读参考(同一份 v5-director-notes.md 作方法论模板)
3. 你要做的事(4 项交付清单)
4. 该艺术家 DNA(核心字段 6 项):
   - 色板(具体 HEX)
   - 字体(具体名字 + 替代方案)
   - 视觉语言(核心几条)
   - 招牌元素(identifiable signatures)
   - 节奏(区别其他视角)
   - 反 AI slop 强化版(在该风格语境下的禁区)
5. 30 秒结构参考(4-6 个 shot 草拟)
6. destination cards 设计要求(保持真实可读)
7. 关键约束(30s / 1920×1080 / file:// / Google Fonts CDN)
8. 输出验证清单 + 完成报告格式

关键:每个 brief 必须强调「不要重复 v5 的美学」——否则 subagent 会被 v5 director-notes 影响而趋同。

Step 2 · 并行启动 6 个 subagent(同一 message 中 6 个 Agent tool calls)

js
Agent({ subagent_type: "general-purpose", run_in_background: true, name: "v5a-anderson", ... })
Agent({ subagent_type: "general-purpose", run_in_background: true, name: "v5b-bass", ... })
// ... 6 个

后台运行,预期 30-60 分钟。

Step 3 · 等待期间的 idle work

不要 polling agent 状态。subagent 完成会自动 task-notification。等待期间做:

  • 修主线程的 v5 基线 bug
  • 写 review framework(每个版本要打的分维度 / Q&A)
  • 沉淀方法论到 skill(这正是这份 case study 的来源)
  • 准备 final summary 文档骨架

Step 4 · 失败处理(约 16% 失败率,可接受)

实战观测:6 个 subagent 中约 1 个会因网络或 token 超限失败(Bass 首轮 socket error)。处理:

  1. 收到 completion notification 时立即检查该 agent 的输出文件夹
  2. 缺少关键交付物 → 重启该 agent(同样 brief,可标注「上次失败,请重新执行」)
  3. 部分完成(如有 html 没截图)→ 主线程补 Playwright 截图,不重启 agent

Step 5 · 6 版本完成后系统审校

审校 framework(5 维度 + 3 顶层问 + use case 分配):

5 维度评分(每维 1-10):
- Distinctiveness 视觉差异化
- Coherence 美学一致性
- Anti-slop 反 AI slop 执行
- Story arc 节奏与故事弧
- Pause-and-look 细节密度

3 顶层问:
- Q1 截图分享?(能在社交平台触发暂停)
- Q2 记一句话?(能留下命题级记忆)
- Q3 跨时代?(5 年后回看不显廉价)

use case 分配(按平台和受众):
- 公众号 / X / B 站 / 朋友圈 / Dribbble / 客户演示 / 私域 / ...

详见 assets/director-notes-samples/launch-film-30s-sample.md 的同目录 REVIEW.md。


实验产出(事实)

文档量

  • v5 基线 director-notes:11500 字
  • 6 视角 director-notes 各 4000-12000 字
  • 总文档量:约 55000-70000 字
  • 5 大部分结构齐全:6/6 版本

HTML 实施

  • 每版独立 animation.html,30 秒,1920×1080
  • 文件大小 28-74KB
  • 全部 file:// 可打开(不依赖 server)

关键帧

  • 每版 10-18 张 PNG,覆盖完整 30 秒故事弧
  • 总截图量:80+ 张
  • 平均每张 PNG 大小:100-200KB

时长

  • 6 个 subagent 并行运行:约 12-15 分钟(duration_ms 显示)
  • 主线程并行 idle work(修 v5 + 写方法论):同期完成
  • 整体「从启动 6 视角到所有 deliverable 到位」:约 60 分钟

关键洞察(写给 huashu-design 的未来用户)

洞察 1 · 「先写万字 director's notes」方法论完全 reproducible

6 个 subagent 都按 5 大部分结构产出了 4000-12000 字的完整 spec,且实施 HTML 时都达到了 marketing-ready 质量。这证明方法论本身不依赖单一执行者的天赋——只要 brief 给得清楚,多个独立执行者能产出一致的高质量结果

洞察 2 · 「视角」必须具体到「作品 + 年份」

每个 brief 里都列出具体作品对话:

  • Anderson → The French Dispatch (2021) + Moonrise Kingdom (2012) + Penguin Classics dust jackets + 1960s Olivetti catalogues
  • WKW → In the Mood for Love (2000) + 2046 (2004)
  • Vignelli → 1972 NYC Subway map + Knoll identity manual + The Vignelli Canon
  • Hara → MUJI brand 1995-2023 + 《白》 + Junya Ishigami transparency
  • Kusama → Infinity Mirrored Rooms (2013-2023) + Polka Dot Obsession 装置

实战结果:所有 subagent 都准确捕捉到了该作品的核心 visual DNA,而不是流派的「平均值」。

洞察 3 · 反 AI slop 的「风格强化版本」是关键

通用 anti-slop(紫渐变 / emoji / SVG 人物)适用所有版本。但每个风格还要写「专属 anti-slop」

  • Bass: 不用 Helvetica(太干净,Bass 是粗犷)
  • Vignelli: 不用圆角(所有 corner 90°)
  • Hara: 不用任何渐变 + 不用 sans display
  • Kusama: 不用现代 SaaS look
  • Anderson: 不用 cyber 配色
  • WKW: 不用 Inter(WKW 用衬线)

加了这些后,6 个版本风格纯度极高,无一相互趋同。

洞察 4 · 多视角的真正价值不是「选 winner」

最初设想是 A/B test 选最好的版本。实际审校时发现:6 个版本各自有清晰 use case

  • v5 基线 → 产品页 / 微信读书(信息密度高)
  • Anderson → 公众号长文头图(翻杂志感强)
  • WKW → B 站 / 中文文化向(怀旧温度)
  • Vignelli → 设计圈 / Dribbble(每帧都是印刷海报)
  • Hara → 客户演示 / 静态截图(极简哲学)
  • Kusama → X 短视频 / 病毒传播(视觉冲击)

结论:marketing 不是 single-shot,是 platform-specific multiplex。6 视角并行的真正价值是让一个项目有 6 个差异化武器,不是让 5 个版本上不了台面。

洞察 5 · subagent 的失败率 ~16% 是可接受的

6 个里 1 个失败(Bass 首轮 socket error)。处理代价:重启 + 5 分钟简化版 brief,再等 12-15 分钟。对比 vs. 等 1 个 agent 顺序跑 6 个版本(90+ 分钟)——并行 + 重试明显更经济。

洞察 6 · 主线程在等待期间必须做 substantive idle work

subagent 完成需要 12-15 分钟。这段时间主线程绝不该空闲:

  • 修主版本 bug(用户已经反馈的)
  • 写 review framework(等审校时填)
  • 沉淀方法论到 skill(如这份 case study)
  • 准备 final summary(用户回来一目了然)

这是 parallel multi-agent workflow 的「主线程职责」——不是 PM 等结果,是 orchestrator 同步推进。


何时启用「多视角并行」

场景是否启用原因
用户明确说「想看不同方向」「再多做几个版本」✅ 立刻启用直接需求
第一版做出来用户不满意但说不清要啥✅ 启用A/B 选优于「我猜你要啥」
项目准备多平台分发(X / 公众号 / B 站 / 朋友圈)✅ 启用每平台一个版本
客户没拍板风格但有预算(time + token)✅ 启用反复改 = 5 倍代价
用户已经给了明确风格参考且只要 1 个版本❌ 不启用浪费
任务是简单 motion graphic / icon 动画❌ 不启用过度工程化
时间紧 < 30 分钟❌ 不启用subagent 跑不完

完整方法论流程图

用户 brief(含质量预期)

[主线程] 写 v5 基线 director's notes(万字级 5 大部分)

[主线程] 实施 v5 HTML + 截关键帧(marketing baseline)

[决策点] 是否启用多视角?
       ↓ YES
[主线程] 选 6 个差异化视角 + 写 6 份独立 brief(每份 8 字段)

[6 subagents 并行]
   ├── v5a brief → director-notes + html + keyframes + README
   ├── v5b brief → ...
   ├── v5c brief → ...
   ├── v5d brief → ...
   ├── v5e brief → ...
   └── v5f brief → ...

[主线程同步做] 修 v5 bug · 写 review framework · 沉淀方法论

[全 6 通知到达]

[主线程] 失败检测 + 重试 / 补截图

[主线程] 5 维度评分 + 3 顶层问 + use case 分配

[主线程] 写 final REVIEW.md

[交付] 6 完整版本 + review + 平台分发推荐

相关文档

  • 完整方法论:references/launch-film-director-notes.md
  • 单视角样本:assets/director-notes-samples/launch-film-30s-sample.md(v5 基线)
  • 实战项目位置:作者本地 demos 目录(含 6 + 1 视角全套文件,未随仓库分发)
  • 审校 review:作者本地 REVIEW.md(未随仓库分发)

Last updated: 2026-05-11Real case study: huashu-md-html v2.0 launch film 6-perspective parallel experiment

基于 MIT License 发布