Optimized the root .gitignore to exclude virtual environments, node modules, and temp folders to ensure clean and lightweight version tracking. Co-authored-by: Cursor <cursoragent@cursor.com>
2.3 KiB
2.3 KiB
网页资产提取总流程(编排)
本文件只负责流程编排、工具选择和用户交互节奏。
具体生成规则请分别读取子文档:
- 主题生成:
skills/web-page-workflow/theme-generation.md - 文档生成:
skills/web-page-workflow/doc-generation.md - 数据生成:
skills/web-page-workflow/data-generation.md
输出目录约束
- 主题:
src/themes/<theme-key>/ - 文档:
src/docs/ - 数据:
src/database/
工具策略
默认优先使用本项目 MCP。
仅在以下场景切换/补充 Firecrawl MCP:
- 本项目 MCP 调用失败
- 链接发现不足(少于 5 条)
- 需要批量抓取或结构化抽取
- 用户明确要求使用 Firecrawl
标准执行顺序
- 发现页面:用
get_page_map获取链接集合,必要时firecrawl_map补齐。 - 确认范围:默认执行“主题 + 文档 + 数据”,可按用户要求裁剪。
- 主题生成:读取
theme-generation.md。 - 文档生成:读取
doc-generation.md。 - 数据生成:读取
data-generation.md。 - 交付总结:列出产物路径、已完成项、待确认项。
默认方案(用户未明确需求)
- 提取主题并生成
DESIGN.md - 生成页面地图与项目概览文档
- 识别并输出数据模型
用户交互话术
初始确认
您好,我可以帮您从网页提取主题、文档和数据。
我会按以下顺序执行:
1) 主题提取与规范文档
2) 项目文档生成
3) 数据模型生成
请先提供网页 URL(一个或多个都可以)。
需求确认
已发现 [X] 个相关页面。
默认将执行:主题 + 文档 + 数据。
如果你只需要其中一部分,请直接告诉我(例如“只做主题”)。
进度通知
正在处理...
✓ 已完成页面发现
✓ 已完成主题生成
⏳ 正在生成文档与数据模型...
完成总结
✅ 已完成资产提取。
产物路径:
- 主题:src/themes/<theme-key>/
- 文档:src/docs/
- 数据:src/database/
如需继续,我可以按指定 URL 生成还原页面。
执行原则
- 先确认范围,再写文件。
- 页面抓取不稳定时,先报告不确定项,再让用户决定是否补充链接/截图。
- 主题、文档、数据之间保持命名一致与语义一致。