添加-会议纪要skill-v0.5,索引版本

This commit is contained in:
闫旭隆
2025-12-01 09:31:29 +08:00
parent 882945348b
commit 5f329d7b4c
33 changed files with 5409 additions and 0 deletions

279
.claude/skills/CLAUDE.md Normal file
View File

@ -0,0 +1,279 @@
# Claude Code Skill 规范开发指南
本指南融合官方 skill-creator 指南与实践经验,为 Skill 开发提供完整的方法论和最佳实践。
## 一、Skill 基础概念
### 1.1 什么是 Skill
Skill 是模块化的自包含包,通过提供专业化知识、工作流程和工具来扩展 Claude 的能力。将 Skill 视为特定领域或任务的"入职指南"——它们将 Claude 从通用代理转变为配备了模型无法完全拥有的程序性知识的专业代理。
### 1.2 Skill 提供的能力
1. **专业化工作流** - 特定领域的多步骤过程
2. **工具集成** - 处理特定文件格式或 API 的指令
3. **领域专业知识** - 公司特定知识、模式、业务逻辑
4. **捆绑资源** - 用于复杂和重复任务的脚本、参考资料和资源
### 1.3 渐进式披露原则
Skill 使用三级加载系统高效管理上下文:
1. **元数据(name + description)** - 始终在Claude code主窗口的上下文中(~100 词)
2. **SKILL.md 主体** - 当 Skill 触发时(<3k )
3. **捆绑资源** - 根据 Claude 需要加载(脚本可以在不读入上下文窗口的情况下执行)
## 二、Skill 目录结构
### 2.1 标准结构
```
skill-name/
├── SKILL.md (必需)
│ ├── YAML frontmatter 元数据(必需)
│ │ ├── name: (必需)
│ │ └── description: (必需)
│ └── Markdown 指令(必需)
└── 捆绑资源(可选)
├── scripts/ - 可执行代码(Python/Bash 等)
├── references/ - 详细执行指南、领域知识、复杂流程说明(供按需查阅)
├── assets/ - 项目类型配置、业务规则等数据性文件
├── templates/ - 文档模板、输出格式模板
├── examples/ - 示例文档、参考案例(不在执行时加载)
└── temp/ - Agent 间传递数据的临时文件
```
### 2.2 各目录职责
#### SKILL.md (必需)
- **元数据**: YAML frontmatter 中的 `name` `description` 决定 Skill 触发时机,使用第三人称描述
- **内容**: 只包含执行流程概要关键步骤必要的调用格式
- **风格**: 使用祈使/不定式形式( "To accomplish X, do Y"),客观指导性语言
#### scripts/ (可选)
- **用途**: 确定性可靠的可执行代码,不依赖 Claude Code 能力
- **优势**: Token 高效,可不加载到上下文直接执行
- **适用**: 重复编写的相同代码
#### references/ (可选)
- **用途**: 详细执行指南领域知识复杂流程说明,按需加载
- **最佳实践**: 大文件(>10k 词)在 SKILL.md 中提供 grep 搜索模式
- **避免重复**: 详细信息放这里,核心精要放 SKILL.md
#### assets/ (可选)
- **用途**: 配置、业务规则等数据文件,用于输出而非加载到上下文
- **示例**: 模板、图标、样板代码、字体
#### templates/ (可选)
- **用途**: 文档模板、输出格式模板
#### examples/ (可选)
- **用途**: 示例文档、参考案例,供用户参考,不在执行时加载
#### temp/ (可选)
- **用途**: Agents 间数据交换的临时文件
## 三、Skill 创建流程
### 步骤 1: 理解 Skill 使用场景
通过用户示例或验证的生成示例,理解 Skill 的具体使用方式。
**关键问题**:
- Skill 应支持什么功能?
- 典型使用示例有哪些?
- 什么样的用户请求应触发此 Skill?
**目标**: 对 Skill 应支持的功能有清晰认识。
### 步骤 2: 规划可重用资源
分析示例,识别可重用的资源:
**分析方法**:
1. 考虑如何从头执行示例
2. 识别重复执行时需要的脚本、详细的参考资料和资源
**示例**:
- **pdf-editor**: 旋转 PDF 需重写代码 → `scripts/rotate_pdf.py`
- **webapp-builder**: 前端样板重复使用 → `assets/hello-world/` 模板
- **big-query**: 表模式需重复查询的详细指南 → `references/schema.md`
**输出**: 可重用资源列表 (scripts/references/assets)。
### 步骤 3: 初始化 Skill
运行 `init_skill.py` 脚本创建新 Skill 目录和模板:
```bash
scripts/init_skill.py <skill-name> --path <output-directory>
```
自动生成 SKILL.md 模板和示例资源目录,然后根据需要自定义或删除。
### 步骤 4: 编辑 Skill
**原则**: 专注于对 Claude 有益且非显而易见的信息。
#### 4.1 实现可重用资源
实现步骤 2 识别的 `scripts/``references/``assets/` 文件,可能需要用户提供素材。删除不需要的示例文件。
#### 4.2 编写 SKILL.md
**风格**: 祈使/不定式形式,客观指导性语言。
**内容**:
1. Skill 的目的(几句话)
2. 触发时机
3. 使用方法(引用所有可重用资源)
### 步骤 5: 迭代优化
实际使用 → 发现问题 → 更新资源 → 测试验证
## 四、多 Agents 协作最佳实践
### 4.1 Agents 创建准则
#### 4.1.1 Agent 定义位置
Agents 在全局 `.claude/agents/` 目录下创建,每个 agent 一个独立的 markdown 文件:
```
.claude/
└── agents/
├── req_interviewer.md
├── pm_reviewer.md
└── domain_expert_reviewer.md
```
**Agent 文件结构**:
```markdown
---
name: agent_name
description: Agent 的简要描述和触发时机
---
# Agent 名称
## 职责
[agent 的核心职责描述]
## 固化规则
[agent 内部固化的执行规则、工具使用规范、评估标准]
## 工作流程
1. [步骤1]
2. [步骤2]
...
## 输入参数
- 参数1: [说明,通常是标识符或文件路径]
- 参数2: [说明]
## 输出格式
- **推荐**: 直接返回完整结果文字
- **备选**: 结果极大时写入 `temp/` 文件并返回路径
## 可用工具
[列出 agent 可使用的工具]
```
**SKILL.md 中引用 Agents**:
在 SKILL.md 中通过 Task tool 调用已定义的 agents,使用 `subagent_type` 参数指定 agent 名称。
#### 4.1.2 Agent 设计原则
**自治性**:
- Agent 内部固化所有执行规则、工具使用规范、评估标准
- 配置文件由 Agent 自己读取,不依赖主窗口传递
- 业务逻辑在 Agent 定义中完整描述
**职责单一**:
- 每个 Agent 只负责一个明确的任务阶段
- 避免创建"万能 Agent",职责重叠会导致混乱
**数据自给**:
- Agent 的行为准则应在自己的定义md文件中写定必要时从 `references/``assets/` 读取所需配置
- 主窗口只传递标识符(如项目类型)和文件路径
#### 4.1.3 Agent 命名规范
- 使用 `snake_case` 命名: `req_interviewer`, `domain_expert_reviewer`
- 名称应体现职责: `{角色}_{动作}``{领域}_{专家}`
- 避免泛化名称: 用 `pm_reviewer` 而非 `reviewer1`
### 4.2 主窗口职责
**定位**: 主窗口是流程协调者,不是数据中转站。
**职责**:
- 只传递协调必要信息(如项目类型标识符、文件路径)
- 不传递 agents 的行为规则、配置内容或完整数据
- 根据工作流程依次调用 agents
- 汇总 agents 返回的概要信息呈现给用户
### 4.3 数据传递优化
**主窗口 → agents**:
- 主窗口只给 Agent 传递必须的、需要从主窗口上下文获取到的信息精要或标识符
- agents 的行为规范或详细指南(不依赖主窗口上下文的)应该在 Agent 内部固化写入,不应依赖主窗口通过 prompt 传递
**agents → 主窗口**:
- **推荐**: 直接通过 prompt 返回完整文字结果(高效)
- **备选**: 结果极大时才写入 `temp/` 文件(需在主窗口 prompt 中提示读取)
**agents → agents**:
- 通过 `temp/` 文件传递数据
- 主窗口只传文件路径,作为协调的中转站
**核心原则**: 主窗口传标识符,Agent 读详细配置;Agent 间传文件路径;Agent 向主窗口直接返回文字。
## 五、SKILL.md 设计最佳实践
### 5.1 渐进式披露与信息组织
**SKILL.md 只包含**:
- 执行流程概要
- 关键步骤
- 必要的调用格式
**详细内容分类**:
- 复杂执行细节 → `references/`
- 示例案例 → `examples/`
- 配置数据 → `assets/`
- 输出模板 → `templates/`
**信息分配原则**(避免重复):
1. 核心工作流指导 → SKILL.md
2. 详细参考材料 → references/
3. 配置和数据 → assets/
4. 输出模板 → templates/
**效果**: 保持 SKILL.md 精简清晰,详细信息按需加载。
## 六、参考资源
- [代理技能 - Claude Code Docs](https://code.claude.com/docs/en/skills?utm_source=chatgpt.com)
- [Claude Agent Skills: A First Principles Deep Dive](https://leehanchung.github.io/blogs/2025/10/26/claude-skills-deep-dive/)

View File

@ -0,0 +1,204 @@
# {PROJECT_NAME} 架构分析报告
> 生成时间: {TIMESTAMP}
> 分析工具: Claude Code - Codebase Architecture Analyzer
---
## 一、项目概览
### 1.1 基本信息
- **项目类型**: {PROJECT_TYPE}
- **主要语言**: {PRIMARY_LANGUAGE} ({PRIMARY_FILE_COUNT} 个文件)
- **次要语言**: {SECONDARY_LANGUAGE} ({SECONDARY_FILE_COUNT} 个文件)
- **代码规模**: 约 {TOTAL_LINES} 行代码
### 1.2 技术栈
**后端**:
{BACKEND_STACK}
**前端**:
{FRONTEND_STACK}
**数据库**:
{DATABASE_STACK}
**基础设施**:
{INFRASTRUCTURE_STACK}
### 1.3 子系统组成
{SUBSYSTEMS_LIST}
---
## 二、系统架构
### 2.1 架构图
```mermaid
{SYSTEM_ARCHITECTURE_DIAGRAM}
```
### 2.2 子系统详情
{SUBSYSTEMS_DETAILS}
### 2.3 通信机制
{COMMUNICATION_MECHANISMS}
---
## 三、核心业务流程
### 3.1 识别的架构模式
**核心模式**: {DETECTED_PATTERN}
{PATTERN_DESCRIPTION}
### 3.2 业务流程图
```mermaid
{WORKFLOW_DIAGRAM}
```
### 3.3 执行单元清单
{EXECUTION_UNITS_LIST}
### 3.4 关键决策点
{DECISION_POINTS}
---
## 四、数据流分析
### 4.1 数据流序列图
```mermaid
{SEQUENCE_DIAGRAM}
```
### 4.2 核心数据模型
{DATA_MODELS_LIST}
### 4.3 数据转换链路
{DATA_TRANSFORMATION_CHAIN}
---
## 五、快速上手指南
### 5.1 环境要求
{ENVIRONMENT_REQUIREMENTS}
### 5.2 安装步骤
```bash
{INSTALLATION_STEPS}
```
### 5.3 启动命令
```bash
{STARTUP_COMMANDS}
```
### 5.4 核心入口文件
{ENTRY_POINTS_LIST}
---
## 六、代码位置索引
### 6.1 核心业务逻辑
{CORE_LOGIC_INDEX}
### 6.2 API 端点
{API_ENDPOINTS_INDEX}
### 6.3 数据模型定义
{DATA_MODELS_INDEX}
### 6.4 配置文件
{CONFIG_FILES_INDEX}
---
## 七、代码质量概览
### 7.1 统计指标
- 总文件数: {TOTAL_FILES}
- 代码行数: {CODE_LINES}
- 注释行数: {COMMENT_LINES}
- 空行数: {BLANK_LINES}
### 7.2 目录结构树
```
{DIRECTORY_TREE}
```
---
## 八、外部资源
### 8.1 文档链接
{DOCUMENTATION_LINKS}
### 8.2 学术论文
{PAPERS_LIST}
### 8.3 参考资料
{REFERENCES_LIST}
---
## 九、注意事项
### 9.1 已知限制
{KNOWN_LIMITATIONS}
### 9.2 待验证事项
{TODO_VERIFY}
---
## 附录
### A. 依赖清单
{DEPENDENCIES_LIST}
### B. 环境变量
{ENVIRONMENT_VARIABLES}
### C. 分析方法
本报告基于以下方法生成:
- 静态代码分析AST 解析)
- 配置文件解析
- 目录结构分析
- 模式匹配识别
所有结论均基于代码事实,标注了具体的文件位置以供验证。

View File

@ -0,0 +1,24 @@
sequenceDiagram
participant U as 用户
participant F as {FRONTEND_NAME}
participant B as {BACKEND_NAME}
participant C as {CORE_LOGIC_NAME}
participant D as {DATABASE_NAME}
U->>F: {USER_ACTION}
Note over F: {FRONTEND_PROCESSING}
F->>B: {API_REQUEST}<br/>{REQUEST_PAYLOAD}
Note over B: {BACKEND_PROCESSING}
B->>C: {CORE_INVOCATION}<br/>{INVOCATION_PARAMS}
Note over C: {CORE_PROCESSING}
C->>D: {DATA_OPERATION}
D-->>C: {DATA_RESPONSE}
C-->>B: {CORE_RESULT}
B-->>F: {API_RESPONSE}
Note over F: {FRONTEND_RENDERING}
F-->>U: {USER_RESULT}

View File

@ -0,0 +1,204 @@
# Phase 4: 数据流追踪指南
**执行时间**:约 1-2 分钟
**目标**:追踪核心数据的转换链路
---
## ⚠️ 重要约束
**在调用 Task tool 时,必须在 prompt 开头包含以下约束:**
```
⚠️ 重要约束:本次分析只返回文本结果,禁止生成任何文件(.md, .txt 等)。
所有 Mermaid 图表、数据模型清单、转换链路都应包含在你的文本回复中,不要使用 Write 或其他文件创建工具。
```
**Explore agent 只返回文本结果,不要生成任何文件。**
---
## 分析步骤
### 步骤 1: 识别核心数据模型
使用 Grep 工具搜索数据模型定义:
#### Python 项目
```bash
# Pydantic 模型
grep -r "class.*BaseModel" --include="*.py"
# Dataclass
grep -r "@dataclass" --include="*.py"
# SQLAlchemy 模型
grep -r "class.*Base" --include="*.py"
```
#### TypeScript 项目
```bash
# Interface 定义
grep -r "interface.*{" --include="*.ts"
# Type 别名
grep -r "type.*=" --include="*.ts"
# Class 定义
grep -r "export class" --include="*.ts"
```
#### Go 项目
```bash
# Struct 定义
grep -r "type.*struct" --include="*.go"
```
### 步骤 2: 追踪数据转换
1. **定位数据入口**
- 从 API 端点的请求体开始
- 识别请求参数的类型定义
2. **追踪转换链路**
- 读取每个业务函数的参数类型和返回值类型
- 记录每次类型转换的代码位置
- 识别数据验证、清洗、增强步骤
3. **标注关键转换点**
- 序列化/反序列化
- 数据库 ORM 映射
- DTOData Transfer Object转换
- 业务逻辑处理
### 步骤 3: 生成序列图
使用 `assets/sequence.mermaid` 模板生成 Mermaid 序列图。
**⚠️ sequenceDiagram 语法约束(版本 11.x**
- `alt/loop/par` 块必须正确配对 `end`
- 使用 `<br/>` 换行
---
## 预期输出格式
### 1. Mermaid 序列图
```mermaid
sequenceDiagram
participant U as 用户
participant F as Frontend
participant B as Backend
participant R as Researcher
participant W as Writer
U->>F: 输入查询 "AI 发展趋势"
F->>B: POST /api/research<br/>{query, depth: 3}
Note over B: 构造 ResearchTask
B->>R: invoke(ResearchTask)
R->>R: 搜索引擎调用
R-->>B: SearchResults (10 个文档)
B->>W: 传递 SearchResults
W->>W: GPT-4 生成报告
W-->>B: Report (2000 字)
B->>F: 返回 HTML
F->>U: 展示报告
```
### 2. 数据模型清单
列出所有核心数据模型及其位置:
```
核心数据模型:
1. ResearchTask (models/task.py:8)
- 用途: 用户查询任务
- 字段: query: str, depth: int, filters: Optional[List[str]]
2. SearchResults (models/results.py:15)
- 用途: 搜索结果集合
- 字段: documents: List[Document], total: int, timestamp: datetime
3. Report (models/report.py:22)
- 用途: 最终生成的报告
- 字段: content: str, score: float, metadata: Dict[str, Any]
```
### 3. 数据转换链路
```
数据流转路径:
用户输入 (str)
→ ResearchTask (构造于 backend/routes.py:42)
→ SearchResults (返回于 agents/researcher.py:67)
→ Report (生成于 agents/writer.py:89)
→ HTML (渲染于 backend/routes.py:58)
→ 前端展示
```
---
## 分析技巧
### 1. 类型提示追踪
Python 示例:
```python
# 从函数签名追踪类型流转
def process_query(task: ResearchTask) -> SearchResults:
# task 类型: ResearchTask
results = search_engine.search(task.query)
# results 类型: SearchResults
return results
```
TypeScript 示例:
```typescript
// 从接口定义追踪
interface ApiRequest {
query: string;
depth: number;
}
async function handleRequest(req: ApiRequest): Promise<Report> {
// req 类型: ApiRequest
const results = await research(req);
// results 类型: Report
return results;
}
```
### 2. ORM 映射识别
SQLAlchemy 示例:
```python
# 数据库模型 → Pydantic 模型
class UserDB(Base):
__tablename__ = "users"
id = Column(Integer, primary_key=True)
class UserSchema(BaseModel):
id: int
# 从 UserDB 转换到 UserSchema
```
### 3. DTO 转换模式
```python
# 请求 DTO → 领域对象 → 响应 DTO
RequestDTO DomainModel ResponseDTO
```
---
## 注意事项
1. **关注核心路径**:只追踪主要业务流程的数据转换,忽略辅助功能
2. **最多 5 层深度**:避免追踪过深导致图表过于复杂
3. **标注转换位置**:每次类型转换都记录文件名和行号
4. **区分同步/异步**:在序列图中用实线(同步)和虚线(异步)区分

View File

@ -0,0 +1,452 @@
# 使用示例
本文档提供实际使用场景的示例。
## 示例 1: 分析 Multi-Agent AI 项目
### 项目结构
```
ai-research-assistant/
├── frontend/
│ ├── src/
│ │ ├── components/
│ │ └── main.tsx
│ └── package.json
├── backend/
│ ├── app/
│ │ ├── main.py
│ │ └── routes.py
│ └── requirements.txt
└── agents/
├── graph.py
└── nodes.py
```
### 用户操作
```
用户: 理解项目
```
### Skill 执行过程
#### Phase 1: 快速扫描 (30秒)
```
⏳ 正在扫描项目结构...
✓ 检测到配置文件:
- backend/requirements.txt (Python)
- frontend/package.json (JavaScript)
✓ 读取依赖:
- Python: fastapi, langgraph, openai
- JavaScript: react, typescript
✓ 扫描目录:
- frontend/ (82 个 .tsx 文件)
- backend/ (45 个 .py 文件)
- agents/ (8 个 .py 文件)
✓ 快速扫描完成
项目类型: AI 驱动的 Web 应用
主语言: Python (后端 + AI)
次要语言: TypeScript (前端)
核心框架: FastAPI + LangGraph + React
架构: 前后端分离 + Multi-Agent
```
#### Phase 2: 系统架构分析 (2分钟)
```
⏳ 调用 Explore sub-agent 分析系统架构...
[Sub-agent 执行]
- 搜索 API 端点: @app.post, @router.
- 发现端点: /api/research, /api/status
- 搜索 WebSocket: WebSocket(
- 发现: /ws 实时通信端点
- 搜索数据库: Redis, PostgreSQL
- 发现: Redis 缓存, PostgreSQL 持久化
✓ 系统架构分析完成
识别出 3 个子系统:
├─ Frontend (frontend/)
│ ├─ 技术: React 18 + TypeScript
│ └─ 入口: src/main.tsx:1
├─ Backend (backend/)
│ ├─ 技术: FastAPI + Python 3.11
│ └─ 入口: app/main.py:1
└─ Agent Layer (agents/)
├─ 技术: LangGraph 0.2.5
└─ 入口: graph.py:1
通信机制:
- Frontend → Backend: WebSocket (/ws)
- Frontend → Backend: HTTP POST (/api/research)
- Backend → Agent Layer: 直接调用 invoke()
- Agent Layer → Redis: 缓存中间结果
- Agent Layer → PostgreSQL: 持久化数据
```
**生成的架构图**:
```mermaid
graph TB
User[用户] --> Frontend[前端<br/>React + TypeScript]
Frontend -->|WebSocket /ws| Backend[后端 API<br/>FastAPI]
Frontend -->|POST /api/research| Backend
Backend -->|invoke| AgentLayer[Agent 编排层<br/>LangGraph]
AgentLayer -->|缓存| Redis[(Redis)]
AgentLayer -->|持久化| DB[(PostgreSQL)]
style AgentLayer fill:#f9f,stroke:#333,stroke-width:3px
```
**代码位置索引**:
- Frontend 入口: `frontend/src/main.tsx:1`
- Backend 入口: `backend/app/main.py:1`
- API 定义: `backend/app/routes.py:42`
- Agent 调用: `backend/app/routes.py:58`
#### Phase 3: 核心流程提取 (5分钟)
```
⏳ 检测到 agents/ 目录,正在深度分析 Multi-Agent 编排...
⏳ 调用 Explore sub-agent 提取工作流...
[Sub-agent 执行]
- 搜索 StateGraph 定义
- 发现: agents/graph.py:23
- 提取 Agent 节点:
* researcher (agents/nodes.py:45)
* writer (agents/nodes.py:78)
* reviewer (agents/nodes.py:112)
- 分析流转规则:
* researcher → writer (顺序)
* writer → reviewer (顺序)
* reviewer → researcher (条件: quality < 7)
* reviewer → END (条件: quality >= 7)
✓ Multi-Agent 编排流程解析完成
识别出 3 个 Agent:
1. Researcher (agents/nodes.py:45)
- 职责: 调用搜索 API 收集资料
- 输入: ResearchTask
- 输出: List[Document]
2. Writer (agents/nodes.py:78)
- 职责: 基于资料生成报告
- 输入: List[Document]
- 输出: Report
3. Reviewer (agents/edges.py:12)
- 职责: 评估报告质量
- 决策: quality < 7 → 返回 Researcher
quality >= 7 → 结束流程
```
**生成的流程图**:
```mermaid
stateDiagram-v2
[*] --> Researcher: 用户查询
Researcher --> Writer: 研究完成
Writer --> Reviewer: 生成草稿
Reviewer --> Researcher: 质量不足<br/>评分 < 7
Reviewer --> [*]: 质量通过
note right of Researcher
agents/nodes.py:45
调用 Tavily 搜索 API
返回 List[Document]
end note
note right of Writer
agents/nodes.py:78
基于搜索结果
调用 GPT-4 生成报告
end note
note right of Reviewer
agents/edges.py:12
评估报告质量
决定是否重新研究
end note
```
#### Phase 4: 数据流追踪 (1分钟)
```
⏳ 追踪数据流...
✓ 识别核心数据模型:
- ResearchTask (models/task.py:8)
- SearchResults (models/results.py:15)
- Report (models/report.py:22)
✓ 数据转换链路:
用户输入 (str)
→ ResearchTask (models/task.py:8)
→ SearchResults (agents/researcher.py:45)
→ Report (agents/writer.py:78)
→ HTML (backend/routes.py:65)
```
**生成的序列图**:
```mermaid
sequenceDiagram
participant U as 用户
participant F as Frontend
participant B as Backend
participant R as Researcher
participant W as Writer
U->>F: 输入查询 "AI 发展趋势"
F->>B: POST /api/research<br/>{query, depth: 3}
Note over B: 构造 ResearchTask
B->>R: invoke(ResearchTask)
R->>R: 调用搜索引擎
R-->>B: SearchResults (10 文档)
B->>W: 传递 SearchResults
W->>W: GPT-4 生成报告
W-->>B: Report (2000 字)
B->>F: 返回 HTML
F->>U: 展示报告
```
#### Phase 5: 生成报告 (30秒)
```
⏳ 生成最终报告...
✓ 分析完成!
报告已保存: PROJECT_ARCHITECTURE.md
核心发现:
- 采用 LangGraph 编排 Multi-Agent 工作流
- 支持条件路由和循环优化
- 数据流: 查询 → 搜索 → 写作 → 审核 → 报告
快速上手:
1. 安装依赖: pip install -r backend/requirements.txt
2. 配置环境: cp .env.example .env
3. 启动后端: cd backend && uvicorn app.main:app --reload
4. 启动前端: cd frontend && npm install && npm start
5. 访问: http://localhost:3000
```
---
## 示例 2: 分析微服务项目
### 项目结构
```
ecommerce-platform/
├── docker-compose.yml
├── services/
│ ├── api-gateway/
│ ├── user-service/
│ ├── order-service/
│ └── notification-service/
└── shared/
```
### 用户操作
```
用户: 分析代码库架构
```
### 执行过程(简化版)
```
[30s] ✓ 检测到 docker-compose.yml
识别为微服务架构
发现 4 个服务: api-gateway, user-service, order-service, notification-service
[2min] ✓ 服务调用拓扑图已生成
api-gateway → user-service (HTTP GET /users/:id)
api-gateway → order-service (HTTP POST /orders)
api-gateway → notification-service (HTTP POST /notify)
[5min] ✓ 报告已保存: PROJECT_ARCHITECTURE.md
```
**生成的架构图**:
```mermaid
graph TB
Client[客户端] --> Gateway[API Gateway<br/>:8000]
Gateway -->|GET /users/:id| UserSvc[User Service<br/>:8001]
Gateway -->|POST /orders| OrderSvc[Order Service<br/>:8002]
Gateway -->|POST /notify| NotifySvc[Notification Service<br/>:8003]
UserSvc --> UserDB[(User DB<br/>PostgreSQL)]
OrderSvc --> OrderDB[(Order DB<br/>PostgreSQL)]
style Gateway fill:#ff6b6b
style UserSvc fill:#4ecdc4
style OrderSvc fill:#45b7d1
style NotifySvc fill:#f9ca24
```
---
## 示例 3: 分析 ETL 数据管道
### 项目结构
```
data-pipeline/
├── pipeline.py
├── extractors/
├── transformers/
└── loaders/
```
### 执行结果
```
[30s] ✓ 检测到 ETL 模式
识别函数: extract_from_csv, transform_data, load_to_database
[3min] ✓ 数据管道流程图已生成
```
**生成的流程图**:
```mermaid
flowchart LR
CSV[CSV 文件] --> Extract[Extract<br/>提取数据]
Extract --> Clean[Clean<br/>去重]
Clean --> Enrich[Enrich<br/>添加元数据]
Enrich --> Validate[Validate<br/>校验]
Validate --> DB[(PostgreSQL)]
Validate --> S3[(S3 存储)]
```
---
## 示例 4: 只分析特定模块
### 用户操作
```
用户: 只分析 agents/ 目录的工作流编排
```
### 执行过程
```
✓ 限定分析范围: agents/
[跳过 Phase 1, Phase 2]
[3min] ✓ 深度分析 agents/ 目录完成
识别出 LangGraph 编排:
- 3 个 Agent 节点
- 2 个条件分支
- 1 个循环优化路径
流程图已生成(仅包含 agents/ 的逻辑)
```
---
## 示例 5: 更新现有分析
### 场景
项目代码已更新,需要重新分析。
### 用户操作
```
用户: 更新架构分析报告
```
### 执行过程
```
✓ 检测到已存在 PROJECT_ARCHITECTURE.md
[对比文件时间戳]
- agents/graph.py 已修改2 天前)
- backend/routes.py 未修改
⏳ 只重新分析有变更的部分...
[2min] ✓ 增量分析完成
- Agent 层新增 1 个节点: Optimizer
- 流程图已更新
✓ 报告已更新: PROJECT_ARCHITECTURE.md
```
---
## 最佳实践
### 1. 项目克隆后立即分析
```bash
git clone https://github.com/user/project.git
cd project
# 打开 Claude Code
```
```
理解项目
```
优势:快速建立项目全景认知。
### 2. 结合其他 Skills
```
理解项目,然后生成开发者入门文档
```
先分析架构,再基于分析结果生成文档。
### 3. 针对性分析
```
只分析后端的 API 路由和业务逻辑
```
节省时间,聚焦关键部分。
---
## 故障排除示例
### 问题: 无法识别自定义框架
**场景**: 公司内部自研框架
**解决方案**:
手动提示:
```
这个项目使用了内部框架 InternalFlow它的工作流定义在 workflows/ 目录,
请分析 workflows/ 中的 YAML 文件来理解流程编排。
```
---
## 更多示例
查看 `patterns.md` 了解各种架构模式的详细识别案例。

View File

@ -0,0 +1,511 @@
# 架构分析方法论
本文档提供代码库架构分析的核心方法论和最佳实践。
## 目录
- [1. 子系统边界识别](#1-子系统边界识别)
- [2. 工作流模式识别](#2-工作流模式识别)
- [3. 通信机制识别](#3-通信机制识别)
- [4. Mermaid 图表选择策略](#4-mermaid-图表选择策略)
- [5. 业务函数识别规则](#5-业务函数识别规则)
---
## 1. 子系统边界识别
### 规则 1: 目录命名模式
通过目录名称识别子系统:
| 目录模式 | 子系统类型 | 常见技术栈 |
|---------|-----------|-----------|
| `frontend/`, `ui/`, `web/`, `client/` | 前端子系统 | React, Vue, Angular |
| `backend/`, `api/`, `server/` | 后端子系统 | FastAPI, Express, Django |
| `agent/`, `agents/`, `workers/` | Agent 系统 | LangGraph, CrewAI, Celery |
| `services/` + 多个子目录 | 微服务集群 | Spring Boot, Go microservices |
| `database/`, `models/`, `schema/` | 数据层 | SQLAlchemy, Prisma |
| `shared/`, `common/`, `lib/` | 共享库 | 工具函数、类型定义 |
### 规则 2: 独立配置文件识别
每个子系统通常有独立的配置文件:
```
frontend/
├── package.json → 独立的 Node.js 项目
├── tsconfig.json
└── vite.config.js
backend/
├── requirements.txt → 独立的 Python 项目
├── pyproject.toml
└── Dockerfile
```
**识别方法**
```bash
# 查找独立的依赖文件
find . -name "package.json" -o -name "requirements.txt" -o -name "go.mod"
```
### 规则 3: Docker Compose 服务划分
分析 `docker-compose.yml` 识别服务边界:
```yaml
services:
frontend: # 前端服务
build: ./frontend
api: # API 服务
build: ./backend
worker: # 后台任务
build: ./worker
db: # 数据库
image: postgres:15
```
每个 service 通常对应一个独立的子系统。
---
## 2. 工作流模式识别
### 模式 1: Multi-Agent 编排
**特征**
- 导入 `langgraph`, `crewai`, `autogen`
- 存在 `StateGraph()`, `Crew()`, `Sequential()` 调用
- 使用 `add_node()`, `add_edge()` 方法
**提取方法**
1. **定位编排定义**
```bash
grep -r "StateGraph\|Crew\|AutoGen" --include="*.py"
```
2. **提取 Agent 节点**
```python
# 示例代码
graph = StateGraph(AgentState)
graph.add_node("researcher", research_agent) # Agent 1
graph.add_node("writer", writing_agent) # Agent 2
graph.add_node("reviewer", review_agent) # Agent 3
```
3. **分析状态流转**
```python
graph.add_edge("researcher", "writer") # 顺序流转
graph.add_conditional_edges("writer", should_revise, {
"revise": "researcher", # 条件分支
"finish": END
})
```
**生成图表类型**: `stateDiagram-v2`
---
### 模式 2: 数据管道ETL/Pipeline
**特征**
- 目录名包含 `pipeline`, `etl`, `workflow`
- 函数名包含 `extract`, `transform`, `load`
- 使用 Airflow, Prefect, Dagster 框架
**提取方法**
1. **识别管道阶段**
```python
# 示例代码
def run_pipeline(source):
raw = extract(source) # 阶段 1
clean = transform(raw) # 阶段 2
load(clean) # 阶段 3
```
2. **追踪数据转换**
- 输入CSV 文件
- → DataFrame (pandas)
- → 清洗后 DataFrame
- → PostgreSQL 表
**生成图表类型**: `flowchart LR` (从左到右)
---
### 模式 3: 事件驱动架构
**特征**
- 使用 `EventEmitter`, `event_bus`, `@subscribe`
- 发布订阅模式:`emit()`, `on()`, `subscribe()`
- 消息队列RabbitMQ, Kafka, Redis Pub/Sub
**提取方法**
1. **识别事件定义**
```python
# 发布事件
event_bus.emit("order_created", order)
```
2. **识别订阅者**
```python
@event_bus.on("order_created")
def handle_order(order):
send_confirmation(order)
@event_bus.on("order_created")
def update_inventory(order):
inventory.decrease(order.items)
```
**生成图表类型**: `graph TB` (显示发布-订阅关系)
---
### 模式 4: 微服务调用链
**特征**
- `docker-compose.yml` 中有多个 services
- 使用 `requests.get()`, `httpx.get()` 调用其他服务
- gRPC 调用:`stub.MethodCall()`
**提取方法**
1. **识别服务间调用**
```python
# api-gateway 调用其他服务
user = requests.get("http://user-service/users/{id}")
order = requests.post("http://order-service/orders", ...)
```
2. **绘制调用拓扑**
- api-gateway → user-service
- api-gateway → order-service
- order-service → payment-service
**生成图表类型**: `graph TB` (服务拓扑)
---
### 模式 5: 传统分层架构MVC
**特征**
- 目录结构:`controllers/`, `services/`, `models/`
- 装饰器:`@app.route`, `@Controller`
- ORM 使用SQLAlchemy, Sequelize
**提取方法**
1. **识别三层结构**
- Controller: 处理 HTTP 请求
- Service: 业务逻辑
- Model: 数据模型
2. **追踪调用链**
```
routes.py (@app.route)
→ UserService.create()
→ User model
→ Database
```
**生成图表类型**: `graph TD` (分层图)
---
## 3. 通信机制识别
### HTTP/REST API
**搜索关键词**
```bash
# 服务端
grep -r "@app\.(get|post|put|delete)" --include="*.py"
grep -r "router\.(get|post)" --include="*.js"
grep -r "@RestController" --include="*.java"
# 客户端
grep -r "axios\.(get|post)" --include="*.js"
grep -r "requests\.(get|post)" --include="*.py"
grep -r "fetch(" --include="*.ts"
```
### WebSocket
**搜索关键词**
```bash
grep -r "WebSocket\|socket.io\|ws://" --include="*.{py,js,ts}"
```
### 消息队列
**搜索关键词**
```bash
# RabbitMQ
grep -r "pika\|RabbitMQ" --include="*.py"
# Kafka
grep -r "kafka\|KafkaProducer" --include="*.{py,java}"
# Redis Pub/Sub
grep -r "redis.*publish\|redis.*subscribe" --include="*.py"
```
### gRPC
**搜索关键词**
```bash
grep -r "grpc\|\.proto" --include="*.{py,go,java}"
```
---
## 4. Mermaid 图表选择策略
根据识别到的模式选择合适的图表类型:
| 场景 | 图表类型 | 适用情况 |
|------|---------|---------|
| 状态转换明显Multi-Agent | `stateDiagram-v2` | 有明确的状态节点和转换条件 |
| 顺序+条件流程(业务流程) | `flowchart TD` | 顺序执行 + if/else 分支 |
| 数据管道ETL | `flowchart LR` | 线性的数据转换流程 |
| 系统拓扑(微服务) | `graph TB` | 多个系统/服务的交互关系 |
| 时序交互API 调用) | `sequenceDiagram` | 多个参与者的时序消息传递 |
| 并发任务 | `graph TB` + subgraph | 多个并行任务分组 |
### 语法注意事项
**⚠️ Mermaid 语法约束(基于版本 11.x**
- **stateDiagram-v2**: 禁用 `--` 分隔符(会报错 "No such shape: divider"
- **stateDiagram-v2**: 不支持 `<br/>` 标签
- **sequenceDiagram**: `alt/loop/par` 块必须正确配对 `end`
- **所有类型**: 避免过深嵌套的控制结构
**stateDiagram-v2 限制**
- ❌ 不支持 `<br/>` 标签,使用 `note` 块代替
- ❌ 不支持 `--` 分隔符
- ❌ 标签文本避免 `!=`, `==` 等比较运算符
- ✅ 复杂信息放在 `note right/left of NodeName` 块中
**flowchart/graph**
- ✅ 可使用 `<br/>` 换行
- ✅ 支持富文本标签
- ✅ 使用 `style` 设置节点颜色
### 示例:选择决策树
```
检测到的特征:
├─ 有状态变量 + 转换逻辑?
│ → 是:使用 stateDiagram-v2
│ → 否:继续判断
├─ 有多个参与者 + 时序消息?
│ → 是:使用 sequenceDiagram
│ → 否:继续判断
├─ 线性数据转换?
│ → 是:使用 flowchart LR
│ → 否:继续判断
└─ 默认:使用 graph TB 或 flowchart TD
```
---
## 5. 业务函数识别规则
### 排除辅助函数
**规则**:以下函数不算业务逻辑
```python
# 1. 私有函数(下划线开头)
def _internal_helper():
pass
# 2. 工具函数
def format_date(date):
pass
def validate_email(email):
pass
# 3. Getter/Setter
def get_user():
pass
def set_config():
pass
# 4. 过短的函数(< 5 行)
def simple_wrapper():
return another_function()
```
### 识别业务函数
**特征 1函数名包含业务关键词**
```python
业务动词:
- process_*, handle_*, execute_*, run_*
- create_*, update_*, delete_*
- generate_*, analyze_*, calculate_*
- search_*, fetch_*, query_*
- build_*, transform_*, convert_*
```
**特征 2处理核心数据模型**
```python
# 函数参数或返回值包含核心数据类
def process_order(order: Order) -> OrderResult: # ✓ 业务函数
...
def format_string(s: str) -> str: # ✗ 工具函数
...
```
**特征 3函数体较长> 10 行)**
通常业务逻辑较复杂,函数体较长。
**特征 4调用外部服务或数据库**
```python
def create_user(data):
user = User(**data)
db.session.add(user) # ✓ 数据库操作
db.session.commit()
send_email(user.email) # ✓ 外部服务
return user
```
---
## 6. 调用链追踪深度控制
### 最大深度策略
**问题**:递归追踪可能陷入无限循环
**解决方案**:限制最大深度
```python
MAX_DEPTH = 5 # 最多追踪 5 层
def trace_calls(func_name, current_depth=0):
if current_depth >= MAX_DEPTH:
return
calls = extract_function_calls(func_name)
for call in calls:
trace_calls(call, current_depth + 1)
```
### 广度优先 vs 深度优先
**广度优先BFS**
- 优先展示同一层级的所有函数
- 适合识别并发任务
**深度优先DFS**
- 优先追踪单一调用链
- 适合追踪数据转换流程
**推荐**:对于流程分析,使用 **广度优先**。
---
## 7. 最佳实践
### ✅ 应该做的
1. **先宽后深** - 先了解整体结构,再深入细节
2. **只读分析** - 不修改任何代码
3. **标注位置** - 所有结论都附带文件:行号
4. **可视化优先** - 用图表表达复杂关系
5. **分阶段输出** - 边分析边展示进度
### ❌ 不应该做的
1. **不要臆测** - 所有结论必须基于代码事实
2. **不要分析 node_modules/** - 跳过第三方依赖
3. **不要暴露敏感信息** - 不读取 `.env`, `secrets.yaml`
4. **不要过度深入** - 不需要分析每一个辅助函数
5. **不要修改代码** - 纯只读分析
---
## 8. 故障排除
### 问题 1: 找不到入口点
**症状**:无法识别主函数
**解决方案**
```bash
# 多种方式查找
grep -r "if __name__ == '__main__'" --include="*.py"
grep -r "@app.route\|@app.post" --include="*.py"
grep -r "func main()" --include="*.go"
ls -la | grep -i "main\|index\|app"
```
### 问题 2: 调用链太复杂
**症状**:函数调用超过 100 层
**解决方案**
- 只追踪业务函数,忽略工具函数
- 限制最大深度为 5
- 聚焦核心路径(最常用的调用链)
### 问题 3: 动态导入无法追踪
**症状**Python 的 `importlib`, JavaScript 的 `require(variable)`
**解决方案**
- 结合运行时日志分析
- 搜索字符串模式猜测可能的模块名
- 在报告中标注"动态导入,无法静态分析"
---
## 9. 工具推荐
### Python 项目
- `ast` 模块 - 解析 Python AST
- `radon` - 复杂度分析
- `pydeps` - 依赖可视化
### JavaScript/TypeScript 项目
- `@typescript-eslint/parser` - 解析 TS AST
- `madge` - 依赖关系图
- `dependency-cruiser` - 依赖验证
### Go 项目
- `go-callvis` - 调用图可视化
- `gocyclo` - 圈复杂度
### 通用工具
- `tree` - 目录结构可视化
- `tokei` - 代码统计
- `cloc` - 代码行数统计
---
## 10. 参考资源
- **C4 模型**: 系统架构可视化的四层模型
- **UML 类图**: 面向对象系统的标准表示
- **事件风暴**: 领域驱动设计的建模方法
- **架构决策记录 (ADR)**: 记录架构决策的最佳实践

View File

@ -0,0 +1,641 @@
# 常见架构模式参考
本文档提供各种架构模式的识别方法和 Mermaid 模板。
## 目录
- [1. Multi-Agent 架构](#1-multi-agent-架构)
- [2. 微服务架构](#2-微服务架构)
- [3. 事件驱动架构](#3-事件驱动架构)
- [4. 数据管道ETL](#4-数据管道etl)
- [5. 分层架构MVC](#5-分层架构mvc)
- [6. CQRS 架构](#6-cqrs-架构)
---
## 1. Multi-Agent 架构
### 模式 1.1: LangGraph 编排
**代码特征**
```python
from langgraph.graph import StateGraph, END
# 定义状态
class AgentState(TypedDict):
query: str
data: List[str]
result: str
# 创建图
graph = StateGraph(AgentState)
# 添加节点Agent
graph.add_node("researcher", research_agent)
graph.add_node("writer", writing_agent)
# 添加边(流转规则)
graph.add_edge("researcher", "writer")
graph.add_conditional_edges(
"writer",
should_continue,
{
"continue": "researcher",
"end": END
}
)
# 设置入口
graph.set_entry_point("researcher")
```
**识别方法**
1. 搜索 `from langgraph``StateGraph`
2. 提取所有 `add_node()` 调用 → Agent 清单
3. 提取所有 `add_edge()``add_conditional_edges()` → 流转规则
4. 读取每个 Agent 函数的实现
**Mermaid 模板**
```mermaid
stateDiagram-v2
[*] --> Researcher: 用户查询
Researcher --> Writer: 数据收集完成
Writer --> QualityChecker: 生成草稿
QualityChecker --> Researcher: 质量不足<br/>评分 < 7
QualityChecker --> [*]: 质量通过
note right of Researcher
文件: agents/researcher.py:45
职责: 调用搜索 API 收集资料
输入: ResearchTask
输出: List[Document]
end note
note right of Writer
文件: agents/writer.py:78
职责: 基于资料生成报告
输入: List[Document]
输出: Report
end note
```
**关键信息提取**
- Agent 名称
- 文件位置(文件:行号)
- 职责描述
- 输入/输出类型
- 条件分支逻辑
---
### 模式 1.2: CrewAI 编排
**代码特征**
```python
from crewai import Agent, Task, Crew
# 定义 Agent
researcher = Agent(
role="Researcher",
goal="Collect comprehensive information",
tools=[search_tool]
)
writer = Agent(
role="Writer",
goal="Write engaging articles",
tools=[writing_tool]
)
# 定义任务
research_task = Task(
description="Research AI trends",
agent=researcher
)
writing_task = Task(
description="Write article based on research",
agent=writer
)
# 创建 Crew
crew = Crew(
agents=[researcher, writer],
tasks=[research_task, writing_task],
process=Process.sequential
)
```
**识别方法**
1. 搜索 `from crewai``Agent(`
2. 提取所有 `Agent()` 定义
3. 提取所有 `Task()` 定义
4. 分析 `Crew()` 的 process 类型sequential/hierarchical
**Mermaid 模板**
```mermaid
flowchart TD
Start([开始]) --> Task1[Research Task<br/>Agent: Researcher]
Task1 --> Task2[Writing Task<br/>Agent: Writer]
Task2 --> End([结束])
style Task1 fill:#e1f5ff
style Task2 fill:#fff4e1
```
---
### 模式 1.3: AutoGen 多智能体
**代码特征**
```python
from autogen import AssistantAgent, UserProxyAgent
# 定义 Agent
assistant = AssistantAgent(
name="assistant",
llm_config={"config_list": config_list}
)
user_proxy = UserProxyAgent(
name="user_proxy",
code_execution_config={"work_dir": "coding"}
)
# 发起对话
user_proxy.initiate_chat(
assistant,
message="Analyze this dataset"
)
```
**Mermaid 模板**
```mermaid
sequenceDiagram
participant User as UserProxy
participant Asst as AssistantAgent
User->>Asst: 发起任务
Asst->>Asst: 生成代码
Asst->>User: 返回代码
User->>User: 执行代码
User->>Asst: 反馈执行结果
Asst->>User: 最终答案
```
---
## 2. 微服务架构
### 模式 2.1: Docker Compose 微服务
**代码特征**
```yaml
# docker-compose.yml
services:
api-gateway:
build: ./api-gateway
ports:
- "8000:8000"
user-service:
build: ./services/user-service
environment:
- DATABASE_URL=postgres://...
order-service:
build: ./services/order-service
notification-service:
build: ./services/notification-service
```
```python
# api-gateway/routes.py
@app.post("/orders")
def create_order(order_data):
# 调用 user-service
user = requests.get(f"http://user-service:8001/users/{user_id}")
# 调用 order-service
order = requests.post("http://order-service:8002/orders", json=order_data)
# 调用 notification-service
requests.post("http://notification-service:8003/notify", json={
"user_id": user_id,
"order_id": order["id"]
})
return order
```
**识别方法**
1. 读取 `docker-compose.yml`,提取所有 services
2. 在每个服务的代码中搜索 `requests.get|post`, `httpx.`
3. 提取目标 URL识别服务间调用关系
**Mermaid 模板**
```mermaid
graph TB
Client[客户端] --> Gateway[API Gateway<br/>:8000]
Gateway -->|GET /users/:id| UserSvc[User Service<br/>:8001]
Gateway -->|POST /orders| OrderSvc[Order Service<br/>:8002]
Gateway -->|POST /notify| NotifySvc[Notification Service<br/>:8003]
UserSvc --> UserDB[(User DB<br/>PostgreSQL)]
OrderSvc --> OrderDB[(Order DB<br/>PostgreSQL)]
style Gateway fill:#ff6b6b
style UserSvc fill:#4ecdc4
style OrderSvc fill:#45b7d1
style NotifySvc fill:#f9ca24
```
**关键信息提取**
- 服务名称
- 端口号
- 服务间调用关系from → to
- 数据库连接
---
### 模式 2.2: Kubernetes 微服务
**代码特征**
```yaml
# k8s/user-service.yaml
apiVersion: v1
kind: Service
metadata:
name: user-service
spec:
selector:
app: user-service
ports:
- port: 8001
```
**识别方法**
1. 查找 `k8s/`, `kubernetes/`, `.yaml` 文件
2. 提取所有 `kind: Service` 定义
---
## 3. 事件驱动架构
### 模式 3.1: 事件总线Event Bus
**代码特征**
```python
# event_bus.py
class EventBus:
def __init__(self):
self._listeners = {}
def on(self, event_name, handler):
self._listeners.setdefault(event_name, []).append(handler)
def emit(self, event_name, data):
for handler in self._listeners.get(event_name, []):
handler(data)
# handlers.py
@event_bus.on("order_created")
def send_confirmation_email(order):
email.send(order.customer_email, ...)
@event_bus.on("order_created")
def update_inventory(order):
inventory.decrease(order.items)
@event_bus.on("order_created")
def log_order(order):
logger.info(f"Order {order.id} created")
# service.py
def create_order(order_data):
order = Order(**order_data)
db.save(order)
event_bus.emit("order_created", order) # 发布事件
```
**识别方法**
1. 搜索 `emit(`, `publish(`, `dispatch(`
2. 搜索 `@on(`, `@subscribe(`, `.on(`
3. 提取事件名称和对应的处理器
**Mermaid 模板**
```mermaid
graph TB
OrderService[Order Service] -->|emit| Event[order_created 事件]
Event --> Handler1[send_confirmation_email<br/>handlers.py:15]
Event --> Handler2[update_inventory<br/>handlers.py:28]
Event --> Handler3[log_order<br/>handlers.py:42]
Handler1 --> EmailSvc[Email Service]
Handler2 --> InventoryDB[(Inventory DB)]
Handler3 --> Logger[Logger]
style Event fill:#ffd93d,stroke:#333,stroke-width:3px
```
---
### 模式 3.2: 消息队列RabbitMQ/Kafka
**代码特征**
```python
# producer.py
import pika
connection = pika.BlockingConnection(pika.ConnectionParameters('localhost'))
channel = connection.channel()
channel.queue_declare(queue='tasks')
def publish_task(task_data):
channel.basic_publish(
exchange='',
routing_key='tasks',
body=json.dumps(task_data)
)
# consumer.py
def callback(ch, method, properties, body):
task = json.loads(body)
process_task(task)
channel.basic_consume(
queue='tasks',
on_message_callback=callback,
auto_ack=True
)
```
**Mermaid 模板**
```mermaid
graph LR
Producer[任务生产者] -->|发布| Queue[(RabbitMQ<br/>tasks 队列)]
Queue -->|消费| Consumer1[Worker 1]
Queue -->|消费| Consumer2[Worker 2]
Queue -->|消费| Consumer3[Worker 3]
style Queue fill:#ff6b6b
```
---
## 4. 数据管道ETL
### 模式 4.1: 顺序管道
**代码特征**
```python
def run_pipeline(source_file):
# Step 1: Extract
raw_data = extract_from_csv(source_file)
# Step 2: Transform
cleaned_data = remove_duplicates(raw_data)
enriched_data = add_metadata(cleaned_data)
validated_data = validate_schema(enriched_data)
# Step 3: Load
load_to_database(validated_data)
load_to_s3(validated_data)
```
**Mermaid 模板**
```mermaid
flowchart LR
CSV[CSV 文件] --> Extract[Extract<br/>提取数据]
Extract --> Clean[Clean<br/>去重]
Clean --> Enrich[Enrich<br/>添加元数据]
Enrich --> Validate[Validate<br/>校验]
Validate --> DB[(PostgreSQL)]
Validate --> S3[(S3 存储)]
style Extract fill:#e1f5ff
style Clean fill:#fff4e1
style Enrich fill:#e8f5e8
style Validate fill:#ffe1e1
```
---
### 模式 4.2: Airflow DAG
**代码特征**
```python
from airflow import DAG
from airflow.operators.python import PythonOperator
dag = DAG('data_pipeline', schedule_interval='@daily')
extract_task = PythonOperator(
task_id='extract',
python_callable=extract_data,
dag=dag
)
transform_task = PythonOperator(
task_id='transform',
python_callable=transform_data,
dag=dag
)
load_task = PythonOperator(
task_id='load',
python_callable=load_data,
dag=dag
)
extract_task >> transform_task >> load_task
```
**Mermaid 模板**
```mermaid
graph LR
Start([每日触发]) --> Extract[Extract Task]
Extract --> Transform[Transform Task]
Transform --> Load[Load Task]
Load --> End([完成])
```
---
## 5. 分层架构MVC
### 模式 5.1: 三层架构
**代码特征**
```python
# routes.py (Controller 层)
@app.route("/users", methods=["POST"])
def create_user():
data = request.json
user = UserService.create(data) # 调用 Service 层
return jsonify(user.to_dict())
# services/user_service.py (Service 层)
class UserService:
@staticmethod
def create(data):
# 业务逻辑
if not validate_email(data["email"]):
raise ValueError("Invalid email")
user = User(**data) # 使用 Model 层
db.session.add(user)
db.session.commit()
return user
# models/user.py (Model 层)
class User(db.Model):
id = db.Column(db.Integer, primary_key=True)
email = db.Column(db.String(120), unique=True)
name = db.Column(db.String(80))
```
**Mermaid 模板**
```mermaid
graph TD
Client[HTTP 客户端] -->|POST /users| Controller[Controller<br/>routes.py]
Controller --> Service[Service 层<br/>user_service.py]
Service --> Model[Model 层<br/>user.py]
Model --> DB[(Database)]
Service --> Validator[验证器<br/>validate_email]
style Controller fill:#ff6b6b
style Service fill:#4ecdc4
style Model fill:#45b7d1
```
---
## 6. CQRS 架构
### 模式 6.1: 命令查询分离
**代码特征**
```python
# commands/create_order.py (写操作)
class CreateOrderCommand:
def execute(self, order_data):
order = Order(**order_data)
write_db.save(order)
event_bus.emit("order_created", order)
# queries/get_order.py (读操作)
class GetOrderQuery:
def execute(self, order_id):
return read_db.query(Order).filter_by(id=order_id).first()
```
**Mermaid 模板**
```mermaid
graph TB
Client[客户端]
Client -->|写操作| CommandHandler[Command Handler]
CommandHandler --> WriteDB[(Write DB<br/>PostgreSQL)]
CommandHandler -->|发布事件| EventBus[Event Bus]
Client -->|读操作| QueryHandler[Query Handler]
QueryHandler --> ReadDB[(Read DB<br/>Redis/Elasticsearch)]
EventBus -->|同步| ReadDB
style CommandHandler fill:#ff6b6b
style QueryHandler fill:#4ecdc4
```
---
## 7. 混合架构识别
### 示例:微服务 + 事件驱动 + CQRS
**特征**
- 多个独立服务(微服务)
- 服务间通过事件通信(事件驱动)
- 每个服务内部 CQRS命令查询分离
**Mermaid 模板**
```mermaid
graph TB
subgraph "Order Service"
OrderCmd[Command Handler]
OrderQuery[Query Handler]
OrderWriteDB[(Write DB)]
OrderReadDB[(Read DB)]
end
subgraph "Inventory Service"
InvCmd[Command Handler]
InvQuery[Query Handler]
InvWriteDB[(Write DB)]
InvReadDB[(Read DB)]
end
EventBus[Event Bus<br/>RabbitMQ]
OrderCmd --> OrderWriteDB
OrderCmd --> EventBus
OrderQuery --> OrderReadDB
EventBus -->|order_created| InvCmd
InvCmd --> InvWriteDB
InvQuery --> InvReadDB
style EventBus fill:#ffd93d
```
---
## 8. 模式识别决策树
```
1. 检测 docker-compose.yml 或 k8s/ 目录
→ 是: 可能是微服务架构
→ 否: 继续
2. 检测 agents/ 目录 OR langgraph/crewai 导入
→ 是: Multi-Agent 架构
→ 否: 继续
3. 检测 emit/publish/subscribe
→ 是: 事件驱动架构
→ 否: 继续
4. 检测 extract/transform/load 函数
→ 是: 数据管道架构
→ 否: 继续
5. 检测 routes/ + services/ + models/
→ 是: 分层架构MVC
→ 否: 继续
6. 默认: 通用应用,分析主要调用链
```
---
## 9. 使用建议
1. **不要生搬硬套** - 并非所有项目都符合标准模式
2. **可以组合** - 一个项目可能同时使用多种模式
3. **关注核心** - 识别最重要的架构特征
4. **标注依据** - 在报告中注明识别依据(代码位置)
---
## 10. 扩展阅读
- **Martin Fowler's Architecture Patterns**: https://martinfowler.com/architecture/
- **Microservices Patterns**: https://microservices.io/patterns/
- **Event Driven Architecture**: https://martinfowler.com/articles/201701-event-driven.html

View File

@ -0,0 +1,408 @@
# 快速扫描指南
本指南提供项目快速扫描的详细步骤。
## 目标
在 30 秒内识别:
- 项目类型
- 主要编程语言
- 核心框架
- 子系统组成
---
## 步骤 1: 运行技术栈检测脚本(推荐)
**使用自动化脚本**
```bash
python ~/.claude/skills/codebase-architecture-analyzer/scripts/detect_tech_stack.py .
```
**脚本输出示例**
```json
{
"project_path": "/path/to/project",
"stacks": [
{
"language": "Python",
"frameworks": ["FastAPI", "LangGraph"],
"config_file": "pyproject.toml",
"version": "3.11"
},
{
"language": "TypeScript",
"frameworks": ["React", "Next.js"],
"version": ">=18"
}
],
"docker": {
"containerized": true,
"compose": true,
"services": ["backend", "frontend", "redis"]
}
}
```
**从输出提取信息**
- `stacks[].language` - 主要编程语言
- `stacks[].frameworks` - 核心框架列表
- `stacks[].version` - 语言/运行时版本
- `docker.services` - Docker 服务列表(如果有)
**脚本支持的语言**
- Python (FastAPI, Django, Flask, LangGraph, CrewAI)
- JavaScript/TypeScript (React, Vue, Next.js, Express, NestJS)
- Go (Gin, Gorilla Mux, Fiber)
- Rust (Actix Web, Rocket, Axum)
- Java (Spring Boot, Quarkus)
---
## 步骤 1.5: 分析依赖关系(可选,用于深度分析)
**使用依赖分析脚本**
```bash
python ~/.claude/skills/codebase-architecture-analyzer/scripts/extract_dependencies.py .
```
**脚本输出示例**
```json
{
"project_path": ".",
"analyses": [
{
"language": "Python",
"files_analyzed": 45,
"total_imports": 23,
"third_party_imports": ["fastapi", "pydantic", "langchain", "openai"],
"declared_dependencies": ["fastapi", "pydantic", "langchain", "openai", "requests"],
"undeclared_usage": [],
"unused_dependencies": ["requests"]
},
{
"language": "JavaScript/TypeScript",
"dependencies": ["react", "next", "tailwindcss"],
"dev_dependencies": ["typescript", "@types/react", "eslint"],
"total_dependencies": 6
}
]
}
```
**关键信息提取**
- `third_party_imports` - 实际使用的第三方包
- `declared_dependencies` - 在配置文件中声明的依赖
- `undeclared_usage` - **缺失的依赖**(代码中使用了,但未在 requirements.txt/pyproject.toml 中声明)
- `unused_dependencies` - **冗余的依赖**(声明了但代码中未使用)
**使用场景**
**推荐使用**(当满足以下条件时):
- 需要验证依赖完整性
- 准备部署到生产环境
- 项目有复杂的依赖关系
- 发现依赖相关的 bug
⚠️ **可跳过**(当满足以下条件时):
- 快速了解项目即可
- 项目很小(< 10 个文件
- 只关注整体架构
**输出解读**
1. **缺失依赖警告**如果 `undeclared_usage` 不为空说明需要更新 requirements.txt
2. **冗余依赖清理**如果 `unused_dependencies` 不为空可以移除不需要的依赖
3. **依赖健康度**`total_imports` vs `declared_dependencies` 的比例
---
## 步骤 2: 检测技术栈(手动方法)
如果脚本无法运行或需要更详细分析使用以下手动方法
### Python 项目
**识别文件**
```bash
# 优先级从高到低
1. pyproject.toml # 现代 Python 项目Poetry/Hatch
2. setup.py # 传统 Python 包
3. requirements.txt # 依赖清单
4. Pipfile # Pipenv 项目
5. environment.yml # Conda 项目
```
**提取信息**
```bash
# 从 pyproject.toml 提取
cat pyproject.toml | grep "python =" # Python 版本
cat pyproject.toml | grep "\[tool.poetry.dependencies\]" -A 20 # 依赖
# 从 requirements.txt 提取
cat requirements.txt | grep -E "fastapi|django|flask|langgraph"
```
---
### JavaScript/TypeScript 项目
**识别文件**
```bash
1. package.json # Node.js 项目
2. yarn.lock # Yarn 包管理
3. pnpm-lock.yaml # pnpm 包管理
4. tsconfig.json # TypeScript 配置
```
**提取信息**
```bash
# 从 package.json 提取
cat package.json | grep "\"react\"\|\"vue\"\|\"express\"\|\"next\""
```
---
### Go 项目
**识别文件**
```bash
1. go.mod # Go modules
2. go.sum # 依赖锁文件
```
**提取信息**
```bash
cat go.mod | grep "require" -A 20
```
---
### Rust 项目
**识别文件**
```bash
1. Cargo.toml # Rust 项目配置
2. Cargo.lock # 依赖锁文件
```
---
### Java 项目
**识别文件**
```bash
1. pom.xml # Maven 项目
2. build.gradle # Gradle 项目
```
---
## 步骤 3: 扫描目录结构
### 列出顶层目录
```bash
ls -d */ | head -20
```
### 识别子系统模式
| 目录名 | 子系统类型 |
|-------|-----------|
| `frontend/`, `ui/`, `web/`, `client/` | 前端 |
| `backend/`, `api/`, `server/` | 后端 |
| `agents/`, `workers/` | Agent 系统 |
| `services/` + 多个子目录 | 微服务 |
| `src/components/` | React/Vue 组件 |
| `app/` | Next.js/Django 应用 |
---
## 步骤 4: 检测关键配置文件
### Docker 相关
```bash
# docker-compose.yml → 多服务架构
cat docker-compose.yml | grep "services:" -A 50
# Dockerfile → 容器化应用
ls -la | grep Dockerfile
```
### 环境配置
```bash
# .env.example → 环境变量配置
cat .env.example | grep -E "DATABASE_URL|REDIS_URL|API_KEY"
```
---
## 步骤 5: 识别项目规模
### 统计代码文件
```bash
# 统计各语言文件数量
find . -type f -name "*.py" | wc -l
find . -type f -name "*.ts" -o -name "*.tsx" | wc -l
find . -type f -name "*.go" | wc -l
```
### 估算代码规模
```bash
# 使用 cloc如果已安装
cloc . --exclude-dir=node_modules,venv,.git
```
---
## 输出格式模板
```
✓ 项目类型: [AI 研究助手 / Web 应用 / CLI 工具 / ...]
✓ 主语言: Python 3.11 (156 个文件)
✓ 次要语言: TypeScript (89 个文件)
✓ 核心框架:
- 后端: FastAPI 0.104.1
- 前端: React 18.2.0
- AI: LangGraph 0.2.5
✓ 子系统:
- frontend/ (React + TypeScript)
- backend/ (FastAPI + Python)
- agents/ (LangGraph)
✓ 容器化: 是docker-compose.yml
✓ 代码规模: 约 12,500 行
```
---
## 常见框架识别规则
### Python Web 框架
```python
依赖中包含:
- fastapi FastAPI
- django Django
- flask Flask
- starlette Starlette
- aiohttp aiohttp
```
### Python AI 框架
```python
依赖中包含:
- langgraph LangGraph
- crewai CrewAI
- autogen AutoGen
- langchain LangChain
- transformers Hugging Face
```
### JavaScript 框架
```json
dependencies 中包含:
- "react" React
- "vue" Vue.js
- "next" Next.js
- "express" Express.js
- "nestjs" NestJS
```
---
## 快速判断项目类型
### CLI 工具
**特征**
- 存在 `cli.py`, `main.py`, `cmd/` 目录
- 依赖包含 `click`, `typer`, `argparse`
- `pyproject.toml` 中有 `[project.scripts]`
### Web 应用
**特征**
- 存在 `routes.py`, `views.py`, `app.py`
- 依赖包含 `fastapi`, `django`, `express`
- 存在 `assets/`, `static/` 目录
### AI/ML 项目
**特征**
- 存在 `models/`, `agents/`, `pipelines/`
- 依赖包含 `tensorflow`, `pytorch`, `langchain`
- 存在 `notebooks/` 目录Jupyter
### 数据工程项目
**特征**
- 存在 `etl/`, `pipelines/`, `dags/`
- 依赖包含 `airflow`, `prefect`, `dbt`
- 存在 `sql/`, `queries/` 目录
---
## 故障排除
### 问题 1: 无法识别项目类型
**解决方案**
1. 查看 README.md 的描述
2. 搜索常见入口文件`main.*`, `index.*`, `app.*`
3. 查看 git 提交历史`git log --oneline | head -20`
### 问题 2: 多语言混合项目
**解决方案**
- 统计各语言文件数量确定主次
- 识别前后端分离`frontend/` + `backend/`
---
## 完整示例
```bash
# 1. 检测配置文件
ls -la | grep -E "package.json|pyproject.toml|go.mod|Cargo.toml"
# 输出: pyproject.toml, package.json (前后端分离项目)
# 2. 读取 Python 依赖
cat pyproject.toml | grep -A 30 dependencies
# 输出: fastapi, langgraph, openai (AI Web 应用)
# 3. 读取 JS 依赖
cat package.json | grep -A 20 dependencies
# 输出: react, typescript (React 前端)
# 4. 扫描目录
ls -d */
# 输出: frontend/, backend/, agents/, docs/
# 5. 统计代码
find backend -name "*.py" | wc -l # 156 个文件
find frontend -name "*.ts*" | wc -l # 89 个文件
# 最终识别结果:
✓ 项目类型: AI 驱动的 Web 应用
✓ 主语言: Python (后端 + AI)
✓ 次要语言: TypeScript (前端)
✓ 核心框架: FastAPI + LangGraph + React
✓ 架构: 前后端分离 + Multi-Agent
```

View File

@ -0,0 +1,259 @@
# Phase 5: 报告生成指南
**执行时间**:约 30 秒
**目标**:汇总所有分析结果,生成完整的架构分析报告
---
## 生成步骤
### 步骤 1: 收集所有分析结果
从前 4 个 Phase 收集以下信息:
1. **Phase 1 - 快速扫描**
- 项目类型
- 主要编程语言
- 核心框架
- 子系统列表
- 代码规模
2. **Phase 2 - 系统架构**
- 系统架构 Mermaid 图
- 子系统清单(名称、路径、技术栈、入口文件)
- 通信关系列表
3. **Phase 3 - 核心流程**
- 工作流 Mermaid 图stateDiagram-v2 / flowchart
- 执行单元清单Agent / 服务 / 函数)
- 关键决策点
4. **Phase 4 - 数据流**
- 序列图 Mermaid
- 数据模型清单
- 数据转换链路
### 步骤 2: 使用模板生成报告
使用 `assets/report.md` 模板,将收集的信息填充到相应章节。
### 步骤 3: 添加快速上手指南
从项目文件中提取以下信息:
1. **环境要求**
- 从 README.md 或 pyproject.toml 提取
- Python/Node.js 版本要求
- 系统依赖Docker、Redis 等)
2. **安装步骤**
- 依赖安装命令
- 环境变量配置
- 数据库初始化
3. **启动命令**
- 开发环境启动命令
- 生产环境部署命令
- 测试运行命令
4. **核心入口文件**
- 主入口文件路径
- 配置文件路径
- 关键模块路径
### 步骤 4: 生成代码位置索引
汇总所有关键文件的位置:
```
代码位置索引:
├─ 入口文件
│ ├─ 后端入口: backend/app/main.py:1
│ └─ 前端入口: frontend/src/main.tsx:1
├─ 核心模块
│ ├─ Agent 编排: agents/graph.py:23
│ ├─ 研究 Agent: agents/nodes.py:45
│ └─ 写作 Agent: agents/nodes.py:78
├─ API 端点
│ ├─ 研究 API: backend/app/routes.py:42
│ └─ WebSocket: backend/app/routes.py:58
└─ 数据模型
├─ ResearchTask: models/task.py:8
└─ Report: models/report.py:22
```
### 步骤 5: 保存报告
将生成的报告保存到项目根目录:
- **保存路径**: `PROJECT_ARCHITECTURE.md`
---
## 报告结构模板
```markdown
# [项目名] 架构分析报告
> 生成时间: [YYYY-MM-DD HH:MM:SS]
> 分析工具: Claude Code - Codebase Architecture Analyzer
---
## 一、项目概览
**项目类型**: [自动推断]
**主要语言**: [Python 3.11]
**核心框架**: [FastAPI + LangGraph]
**代码规模**: [156 个 Python 文件, 89 个 TypeScript 文件]
**子系统**:
- frontend/ (React + TypeScript)
- backend/ (FastAPI + Python)
- agents/ (LangGraph)
---
## 二、系统架构
### 2.1 架构图
```mermaid
[Phase 2 生成的 Mermaid 图]
```
### 2.2 子系统详情
[Phase 2 生成的子系统清单]
### 2.3 通信机制
[Phase 2 生成的通信关系列表]
---
## 三、核心业务流程
### 3.1 流程图
```mermaid
[Phase 3 生成的 Mermaid 图]
```
### 3.2 执行单元清单
[Phase 3 生成的 Agent/服务/函数清单]
### 3.3 关键决策点
[Phase 3 识别的条件分支和路由规则]
---
## 四、数据流分析
### 4.1 序列图
```mermaid
[Phase 4 生成的 Mermaid 序列图]
```
### 4.2 数据模型清单
[Phase 4 生成的数据模型列表]
### 4.3 数据转换链路
[Phase 4 追踪的数据流转路径]
---
## 五、快速上手指南
### 5.1 环境要求
- Python 3.11+
- Node.js 18+
- Docker (可选)
### 5.2 安装步骤
```bash
# 1. 安装后端依赖
pip install -r backend/requirements.txt
# 2. 安装前端依赖
cd frontend && npm install
# 3. 配置环境变量
cp .env.example .env
```
### 5.3 启动命令
```bash
# 启动后端
cd backend && uvicorn app.main:app --reload
# 启动前端
cd frontend && npm start
```
### 5.4 核心入口文件
- 后端入口: `backend/app/main.py`
- 前端入口: `frontend/src/main.tsx`
- Agent 编排: `agents/graph.py`
---
## 六、代码位置索引
[Phase 2-4 汇总的所有关键文件位置]
---
## 附录:分析方法说明
本报告由 Claude Code 的 `codebase-architecture-analyzer` Skill 自动生成。
分析方法:
- Phase 1: 快速扫描(识别技术栈)
- Phase 2: 系统架构分析Explore sub-agent
- Phase 3: 核心流程提取(智能模式识别)
- Phase 4: 数据流追踪(类型追踪)
- Phase 5: 报告生成(本文档)
```
---
## 输出示例
执行完成后,向用户显示:
```
✓ 分析完成!
报告已保存: PROJECT_ARCHITECTURE.md
核心发现:
- 采用 LangGraph 编排 Multi-Agent 工作流
- 支持条件路由和循环优化
- 数据流: 查询 → 搜索 → 写作 → 审核 → 报告
快速上手:
1. 安装依赖: pip install -r requirements.txt
2. 配置环境: cp .env.example .env
3. 启动后端: uvicorn app.main:app --reload
4. 启动前端: cd frontend && npm start
```
---
## 注意事项
1. **Mermaid 图表检查**:确保所有 Mermaid 代码块语法正确
2. **代码位置准确性**:所有文件路径和行号必须准确
3. **快速上手可用性**:安装步骤必须可执行,不能遗漏关键步骤
4. **避免敏感信息**:不要在报告中包含 `.env` 文件内容或 API 密钥

View File

@ -0,0 +1,124 @@
# Phase 2: 系统架构分析指南
**执行时间**:约 2 分钟
**目标**:识别子系统边界和通信机制
---
## ⚠️ 重要约束
**Explore agent 只返回文本结果,不要生成任何文件。**
---
## 分析方法
使用 **Task tool** 调用内置的 **Explore sub-agent** 进行深度分析。
### 步骤 1: 启动 Task tool
指定以下参数:
- `subagent_type: Explore`
- `description: "系统架构分析"`
- `prompt`: 包含下面的详细任务
### 步骤 2: Sub-agent 任务定义
```
⚠️ 重要约束:本次分析只返回文本结果,禁止生成任何文件(.md, .txt 等)。
所有 Mermaid 图表、清单、分析结论都应包含在你的文本回复中,不要使用 Write 或其他文件创建工具。
分析项目的子系统划分和通信机制:
1. 子系统边界识别
- 扫描顶层目录,识别 frontend/, backend/, agents/ 等模式
- 查找独立配置文件package.json, requirements.txt
- 解析 docker-compose.yml 中的 services
2. API 端点定位
- 搜索:@app.(get|post|put|delete)
- 搜索:@router., app.route
- 提取端点路径和处理函数位置
3. 通信协议识别
- HTTP: requests.get/post, axios, fetch
- WebSocket: WebSocket, socket.io
- 消息队列: RabbitMQ, Kafka, Redis pub/sub
- gRPC: grpc, .proto
4. 数据库连接
- PostgreSQL: psycopg2, SQLAlchemy
- Redis: redis.Redis
- MongoDB: pymongo
输出格式:
- 子系统清单(名称、路径、技术栈、入口文件:行号)
- 通信关系from → to, 协议, 端点)
- 生成 Mermaid graph TB 架构图(使用 `<br/>` 换行)
```
### 步骤 3: 执行过程
1. **Explore sub-agent 自动执行**:使用 Glob、Grep、Read 工具搜索代码
2. **接收结果**sub-agent 返回分析报告
3. **验证结果**:检查是否包含所有子系统和通信关系
---
## 预期输出格式
### 1. Mermaid 系统架构图
```mermaid
graph TB
User[用户] --> Frontend[前端<br/>React + TypeScript]
Frontend -->|HTTP POST /api/research| Backend[后端 API<br/>FastAPI]
Frontend -->|WebSocket /ws| Backend
Backend -->|invoke| AgentLayer[Agent 编排层<br/>LangGraph]
AgentLayer -->|缓存| Redis[(Redis)]
AgentLayer -->|持久化| DB[(PostgreSQL)]
style AgentLayer fill:#f9f,stroke:#333,stroke-width:3px
```
### 2. 代码位置索引
- Frontend 入口: `frontend/src/main.tsx:1`
- Backend 入口: `backend/app/main.py:1`
- API 定义: `backend/app/routes.py:42`
- Agent 调用: `backend/app/routes.py:58`
### 3. 子系统清单
```
识别出 3 个子系统:
├─ Frontend (frontend/)
│ ├─ 技术: React 18 + TypeScript
│ └─ 入口: src/main.tsx:1
├─ Backend (backend/)
│ ├─ 技术: FastAPI + Python 3.11
│ └─ 入口: app/main.py:1
└─ Agent Layer (agents/)
├─ 技术: LangGraph 0.2.5
└─ 入口: graph.py:1
```
### 4. 通信机制
```
- Frontend → Backend: WebSocket (/ws)
- Frontend → Backend: HTTP POST (/api/research)
- Backend → Agent Layer: 直接调用 invoke()
- Agent Layer → Redis: 缓存中间结果
- Agent Layer → PostgreSQL: 持久化数据
```
---
## 注意事项
1. **配置文件优先**:优先解析 docker-compose.yml它通常包含完整的服务拓扑
2. **多种通信协议**:一个项目可能同时使用 HTTP、WebSocket、消息队列
3. **入口文件定位**:确保记录每个子系统的主入口文件和行号
4. **Mermaid 样式**:使用 `style` 语法突出显示核心子系统

View File

@ -0,0 +1,582 @@
# 工作流提取详细指南
本指南提供通用的工作流提取算法,适用于各种架构模式。
## ⚠️ 重要约束
**在调用 Task tool 时,必须在 prompt 开头包含以下约束:**
```
⚠️ 重要约束:本次分析只返回文本结果,禁止生成任何文件(.md, .txt 等)。
所有 Mermaid 图表、清单、分析结论都应包含在你的文本回复中,不要使用 Write 或其他文件创建工具。
```
**Explore agent 只返回文本结果,不要生成任何文件。**
---
## 核心思想
**不预设架构类型,而是从代码中提取执行流程特征。**
---
## 算法概览
```
1. 定位入口点CLI/Web/定时任务)
2. 提取函数调用链(递归追踪)
3. 识别业务函数(排除辅助函数)
4. 分析流程模式(顺序/分支/循环/并发)
5. 生成 Mermaid 图表
```
---
## 步骤 1: 定位入口点
### 1.1 CLI 应用
**Python**:
```bash
grep -rn "if __name__ == '__main__'" --include="*.py"
grep -rn "@click.command\|@click.group" --include="*.py"
grep -rn "argparse.ArgumentParser" --include="*.py"
```
**示例**:
```python
# main.py:45
if __name__ == "__main__":
main() # ← 入口函数
```
**Go**:
```bash
grep -rn "func main()" --include="*.go"
```
---
### 1.2 Web 应用
**FastAPI/Flask**:
```bash
grep -rn "@app\.(get|post|put|delete)" --include="*.py"
grep -rn "@router\." --include="*.py"
```
**示例**:
```python
# routes.py:42
@app.post("/api/research") # ← 入口点
def research_endpoint(query: str):
...
```
**Express.js**:
```bash
grep -rn "app\.(get|post)" --include="*.js"
grep -rn "router\." --include="*.js"
```
---
### 1.3 定时任务
**Celery**:
```bash
grep -rn "@celery.task\|@shared_task" --include="*.py"
```
**Airflow**:
```bash
grep -rn "DAG(" --include="*.py"
```
**Cron/APScheduler**:
```bash
grep -rn "@schedule\|@cron" --include="*.py"
```
---
### 1.4 消息消费者
**RabbitMQ/Kafka**:
```bash
grep -rn "basic_consume\|KafkaConsumer" --include="*.py"
```
**示例**:
```python
# consumer.py:25
def callback(ch, method, properties, body): # ← 入口点
process_message(body)
```
---
## 步骤 2: 提取函数调用链
### 2.1 读取入口函数
从步骤 1 识别的入口点开始:
```python
# 示例routes.py:42
@app.post("/api/research")
def research_endpoint(query: str):
task = create_task(query) # 调用 1
results = executor.run(task) # 调用 2
return format_response(results) # 调用 3
```
**提取调用清单**:
```
research_endpoint
├── create_task
├── executor.run
└── format_response
```
---
### 2.2 递归追踪
读取 `executor.run` 的实现:
```python
# executor.py:78
def run(self, task):
data = self.fetch_data(task) # 调用 2.1
processed = self.process(data) # 调用 2.2
return self.finalize(processed) # 调用 2.3
```
**更新调用树**:
```
research_endpoint
├── create_task
├── executor.run
│ ├── fetch_data
│ ├── process
│ └── finalize
└── format_response
```
---
### 2.3 控制递归深度
**问题**: 可能陷入无限递归
**解决方案**: 限制最大深度
```python
MAX_DEPTH = 5 # 最多追踪 5 层
def trace_calls(func_name, depth=0):
if depth >= MAX_DEPTH:
return []
calls = extract_calls_from_function(func_name)
result = []
for call in calls:
result.append(call)
result.extend(trace_calls(call, depth + 1))
return result
```
---
## 步骤 3: 识别业务函数
### 3.1 排除辅助函数
**规则**:
| 函数特征 | 是否保留 |
|---------|---------|
| 私有函数 `_helper()` | ❌ 排除 |
| 工具函数 `format_date()` | ❌ 排除 |
| Getter/Setter | ❌ 排除 |
| 函数体 < 5 | 排除 |
| 包含业务关键词 | 保留 |
| 调用数据库/外部 API | 保留 |
| 处理核心数据模型 | 保留 |
---
### 3.2 业务关键词清单
```python
BUSINESS_KEYWORDS = [
# 处理动词
"process", "handle", "execute", "run",
# CRUD 操作
"create", "update", "delete", "query", "fetch",
# 业务逻辑
"calculate", "analyze", "generate", "transform",
"search", "filter", "validate", "verify",
# 工作流
"orchestrate", "coordinate", "schedule"
]
```
**示例判断**:
```python
process_order() # 包含 "process"
create_user() # 包含 "create"
analyze_data() # 包含 "analyze"
format_string() # 工具函数
_internal_helper() # 私有函数
get_config() # Getter
```
---
### 3.3 检测数据库/API 调用
**数据库调用**:
```python
def create_user(data):
user = User(**data)
db.session.add(user) # ✅ 数据库操作
db.session.commit()
return user
```
**外部 API 调用**:
```python
def fetch_weather(city):
response = requests.get( # ✅ 外部 API
f"https://api.weather.com/{city}"
)
return response.json()
```
**搜索模式**:
```bash
# 数据库
grep -n "db\.session\|query(\|execute(" file.py
# HTTP 请求
grep -n "requests\.\|httpx\.\|fetch(" file.py
```
---
## 步骤 4: 分析流程模式
### 4.1 顺序流程
**代码特征**:
```python
def process():
step1()
step2()
step3()
```
**识别**: 连续的函数调用无分支
**生成图表**: `flowchart TD` (从上到下)
---
### 4.2 条件分支
**代码特征**:
```python
def process(data):
if validate(data):
path_a()
else:
path_b()
```
**识别**: `if/else`, `match/case`, 三元运算符
**生成图表**: `flowchart TD` (带菱形决策节点)
---
### 4.3 循环优化
**代码特征**:
```python
def optimize(data):
while not is_good_enough(data):
data = improve(data)
return data
```
**识别**: `while` + 条件判断
**生成图表**: `flowchart TD` (带循环边)
---
### 4.4 状态机
**代码特征**:
```python
state = "init"
if state == "init":
state = "processing"
elif state == "processing":
if condition:
state = "done"
else:
state = "error"
```
**识别**: 状态变量 + 状态转换逻辑
**生成图表**: `stateDiagram-v2`
---
### 4.5 并发编排
**Python asyncio**:
```python
results = await asyncio.gather(
task1(),
task2(),
task3()
)
```
**JavaScript Promise.all**:
```javascript
const results = await Promise.all([
fetchUser(),
fetchOrders(),
fetchProducts()
]);
```
**识别**: `asyncio.gather`, `Promise.all`, `WaitGroup`
**生成图表**: `graph TB` + subgraph (并行任务分组)
---
### 4.6 图编排LangGraph
**代码特征**:
```python
graph = StateGraph(State)
graph.add_node("a", func_a)
graph.add_node("b", func_b)
graph.add_edge("a", "b")
graph.add_conditional_edges("b", router, {
"continue": "a",
"end": END
})
```
**识别**: `add_node`, `add_edge`, `add_conditional_edges`
**生成图表**: `stateDiagram-v2`
---
## 步骤 5: 生成 Mermaid 图表
** Mermaid 语法约束版本 11.x**
- **stateDiagram-v2**: 禁用 `--` 分隔符不支持 `<br/>`
- **sequenceDiagram**: `alt/loop/par` 块必须正确配对 `end`
- **所有类型**: 使用 `<br/>` 换行stateDiagram-v2 除外
### 5.1 选择图表类型
```python
def select_diagram_type(flow_pattern):
if flow_pattern == "state_machine":
return "stateDiagram-v2"
elif flow_pattern == "concurrent":
return "graph TB" # 带 subgraph
elif flow_pattern == "sequential_with_conditions":
return "flowchart TD"
elif flow_pattern == "linear_pipeline":
return "flowchart LR"
else:
return "graph TB" # 默认
```
---
### 5.2 生成状态图Multi-Agent
**输入数据**:
```python
nodes = [
{"name": "researcher", "file": "agents/nodes.py", "line": 45},
{"name": "writer", "file": "agents/nodes.py", "line": 78}
]
edges = [
{"from": "researcher", "to": "writer"},
{
"from": "writer",
"to": "researcher",
"condition": "quality < 7"
}
]
```
**生成代码**:
```python
def generate_state_diagram(nodes, edges):
mermaid = "stateDiagram-v2\n"
mermaid += f" [*] --> {nodes[0]['name']}\n"
for edge in edges:
if "condition" in edge:
mermaid += f" {edge['from']} --> {edge['to']}: {edge['condition']}\n"
else:
mermaid += f" {edge['from']} --> {edge['to']}\n"
# 添加注释
for node in nodes:
mermaid += f"\n note right of {node['name']}\n"
mermaid += f" {node['file']}:{node['line']}\n"
mermaid += f" end note\n"
return mermaid
```
---
### 5.3 生成流程图(顺序+分支)
**输入数据**:
```python
steps = [
{"name": "extract", "type": "process"},
{"name": "validate", "type": "decision"},
{"name": "transform", "type": "process"},
{"name": "load", "type": "process"}
]
connections = [
{"from": "extract", "to": "validate"},
{"from": "validate", "to": "transform", "condition": "valid"},
{"from": "validate", "to": "error_handler", "condition": "invalid"}
]
```
**生成代码**:
```python
def generate_flowchart(steps, connections):
mermaid = "flowchart TD\n"
# 定义节点
for step in steps:
if step["type"] == "decision":
mermaid += f" {step['name']}{{{step['name']}}}\n" # 菱形
else:
mermaid += f" {step['name']}[{step['name']}]\n" # 矩形
# 连接
for conn in connections:
if "condition" in conn:
mermaid += f" {conn['from']} -->|{conn['condition']}| {conn['to']}\n"
else:
mermaid += f" {conn['from']} --> {conn['to']}\n"
return mermaid
```
---
## 完整示例
### 示例代码
```python
# routes.py:42
@app.post("/api/research")
def research_endpoint(query: str):
task = create_research_task(query)
results = execute_research(task)
return results
# research.py:15
def execute_research(task):
# 并发搜索
search_results = asyncio.gather(
search_google(task.query),
search_arxiv(task.query)
)
# 生成报告
if len(search_results) > 5:
report = generate_detailed_report(search_results)
else:
report = generate_summary(search_results)
return report
```
---
### 提取结果
**入口点**: `research_endpoint` (routes.py:42)
**调用链**:
```
research_endpoint
├── create_research_task
└── execute_research
├── search_google (并发)
├── search_arxiv (并发)
└── generate_detailed_report OR generate_summary (条件)
```
**流程模式**: 顺序 + 并发 + 条件分支
---
### 生成 Mermaid 图
```mermaid
flowchart TD
Start([API 请求]) --> CreateTask[创建研究任务]
CreateTask --> Concurrent{并发搜索}
Concurrent --> Google[搜索 Google]
Concurrent --> ArXiv[搜索 ArXiv]
Google --> Merge[合并结果]
ArXiv --> Merge
Merge --> Decision{结果数量}
Decision -->|> 5 篇| Detailed[生成详细报告]
Decision -->|≤ 5 篇| Summary[生成摘要]
Detailed --> End([返回结果])
Summary --> End
```
## 最佳实践
1. **先广度后深度** - 先了解整体流程
2. **限制递归深度** - 避免无限循环
3. **过滤辅助函数** - 只关注业务逻辑
4. **标注代码位置** - 便于验证
5. **可视化优先** - 图表比文字更直观

View File

@ -0,0 +1,266 @@
#!/usr/bin/env python3
"""
技术栈检测脚本
用法: python detect_tech_stack.py [项目路径]
输出: JSON 格式的技术栈信息
"""
import json
import sys
from pathlib import Path
from typing import Dict, List, Optional
def detect_python_stack(project_path: Path) -> Optional[Dict]:
"""检测 Python 技术栈"""
result = {"language": "Python", "frameworks": [], "dependencies": []}
# 查找配置文件
pyproject = project_path / "pyproject.toml"
requirements = project_path / "requirements.txt"
setup_py = project_path / "setup.py"
if pyproject.exists():
content = pyproject.read_text(encoding='utf-8')
result["config_file"] = "pyproject.toml"
# 检测 Python 版本
if 'python = "^' in content:
version = content.split('python = "^')[1].split('"')[0]
result["version"] = version
# 检测框架
if "fastapi" in content.lower():
result["frameworks"].append("FastAPI")
if "django" in content.lower():
result["frameworks"].append("Django")
if "flask" in content.lower():
result["frameworks"].append("Flask")
if "langgraph" in content.lower():
result["frameworks"].append("LangGraph")
if "crewai" in content.lower():
result["frameworks"].append("CrewAI")
elif requirements.exists():
content = requirements.read_text(encoding='utf-8')
result["config_file"] = "requirements.txt"
# 检测框架
for line in content.split('\n'):
line = line.strip().lower()
if line.startswith('fastapi'):
result["frameworks"].append("FastAPI")
elif line.startswith('django'):
result["frameworks"].append("Django")
elif line.startswith('flask'):
result["frameworks"].append("Flask")
elif line.startswith('langgraph'):
result["frameworks"].append("LangGraph")
else:
return None
return result
def detect_javascript_stack(project_path: Path) -> Optional[Dict]:
"""检测 JavaScript/TypeScript 技术栈"""
package_json = project_path / "package.json"
if not package_json.exists():
return None
result = {"language": "JavaScript/TypeScript", "frameworks": [], "dependencies": []}
try:
import json as json_module
content = json_module.loads(package_json.read_text(encoding='utf-8'))
# 检测框架
deps = {**content.get("dependencies", {}), **content.get("devDependencies", {})}
if "react" in deps:
result["frameworks"].append("React")
if "@types/react" in deps:
result["language"] = "TypeScript"
if "vue" in deps:
result["frameworks"].append("Vue.js")
if "next" in deps:
result["frameworks"].append("Next.js")
if "express" in deps:
result["frameworks"].append("Express.js")
if "@nestjs/core" in deps:
result["frameworks"].append("NestJS")
# 检测 Node 版本
if "engines" in content and "node" in content["engines"]:
result["version"] = content["engines"]["node"]
except Exception as e:
print(f"Error parsing package.json: {e}", file=sys.stderr)
return None
return result
def detect_go_stack(project_path: Path) -> Optional[Dict]:
"""检测 Go 技术栈"""
go_mod = project_path / "go.mod"
if not go_mod.exists():
return None
result = {"language": "Go", "frameworks": [], "dependencies": []}
content = go_mod.read_text(encoding='utf-8')
# 检测 Go 版本
for line in content.split('\n'):
if line.strip().startswith('go '):
result["version"] = line.strip().split()[1]
break
# 检测框架
if "gin-gonic/gin" in content:
result["frameworks"].append("Gin")
if "gorilla/mux" in content:
result["frameworks"].append("Gorilla Mux")
if "fiber" in content:
result["frameworks"].append("Fiber")
return result
def detect_rust_stack(project_path: Path) -> Optional[Dict]:
"""检测 Rust 技术栈"""
cargo_toml = project_path / "Cargo.toml"
if not cargo_toml.exists():
return None
result = {"language": "Rust", "frameworks": [], "dependencies": []}
content = cargo_toml.read_text(encoding='utf-8')
# 检测框架
if "actix-web" in content:
result["frameworks"].append("Actix Web")
if "rocket" in content:
result["frameworks"].append("Rocket")
if "axum" in content:
result["frameworks"].append("Axum")
return result
def detect_java_stack(project_path: Path) -> Optional[Dict]:
"""检测 Java 技术栈"""
pom_xml = project_path / "pom.xml"
build_gradle = project_path / "build.gradle"
if pom_xml.exists():
result = {"language": "Java", "frameworks": [], "build_tool": "Maven"}
content = pom_xml.read_text(encoding='utf-8')
# 检测框架
if "spring-boot" in content:
result["frameworks"].append("Spring Boot")
if "quarkus" in content:
result["frameworks"].append("Quarkus")
return result
elif build_gradle.exists():
result = {"language": "Java", "frameworks": [], "build_tool": "Gradle"}
content = build_gradle.read_text(encoding='utf-8')
# 检测框架
if "spring-boot" in content:
result["frameworks"].append("Spring Boot")
return result
return None
def detect_docker_usage(project_path: Path) -> Dict:
"""检测 Docker 使用情况"""
docker_compose = project_path / "docker-compose.yml"
dockerfile = project_path / "Dockerfile"
result = {"containerized": False, "services": []}
if docker_compose.exists():
result["containerized"] = True
result["compose"] = True
# 简单解析 services
content = docker_compose.read_text(encoding='utf-8')
in_services = False
for line in content.split('\n'):
if line.strip() == "services:":
in_services = True
continue
if in_services and line.startswith(' ') and ':' in line and not line.strip().startswith('#'):
service_name = line.strip().rstrip(':')
if service_name and not service_name.startswith('-'):
result["services"].append(service_name)
elif dockerfile.exists():
result["containerized"] = True
result["compose"] = False
return result
def main():
# 获取项目路径
if len(sys.argv) > 1:
project_path = Path(sys.argv[1])
else:
project_path = Path.cwd()
if not project_path.exists():
print(f"Error: Path {project_path} does not exist", file=sys.stderr)
sys.exit(1)
# 检测各种技术栈
stacks = []
python_stack = detect_python_stack(project_path)
if python_stack:
stacks.append(python_stack)
js_stack = detect_javascript_stack(project_path)
if js_stack:
stacks.append(js_stack)
go_stack = detect_go_stack(project_path)
if go_stack:
stacks.append(go_stack)
rust_stack = detect_rust_stack(project_path)
if rust_stack:
stacks.append(rust_stack)
java_stack = detect_java_stack(project_path)
if java_stack:
stacks.append(java_stack)
# 检测 Docker
docker_info = detect_docker_usage(project_path)
# 输出结果
result = {
"project_path": str(project_path),
"stacks": stacks,
"docker": docker_info
}
print(json.dumps(result, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()

View File

@ -0,0 +1,167 @@
#!/usr/bin/env python3
"""
依赖提取脚本
用法: python extract_dependencies.py [项目路径]
输出: JSON 格式的依赖信息
"""
import ast
import json
import sys
from pathlib import Path
from typing import Dict, List, Set
def extract_python_imports(file_path: Path) -> Set[str]:
"""从 Python 文件提取 import"""
imports = set()
try:
with open(file_path, 'r', encoding='utf-8') as f:
tree = ast.parse(f.read(), filename=str(file_path))
for node in ast.walk(tree):
if isinstance(node, ast.Import):
for alias in node.names:
# 只保留顶层包名
module = alias.name.split('.')[0]
imports.add(module)
elif isinstance(node, ast.ImportFrom):
if node.module:
module = node.module.split('.')[0]
imports.add(module)
except Exception as e:
print(f"Warning: Failed to parse {file_path}: {e}", file=sys.stderr)
return imports
def analyze_python_project(project_path: Path) -> Dict:
"""分析 Python 项目的依赖"""
all_imports = set()
file_count = 0
# 遍历所有 Python 文件
for py_file in project_path.rglob("*.py"):
# 跳过虚拟环境和 node_modules
if any(part in py_file.parts for part in ['venv', 'env', '.venv', 'node_modules', '__pycache__']):
continue
file_count += 1
imports = extract_python_imports(py_file)
all_imports.update(imports)
# 读取声明的依赖
declared_deps = set()
requirements_txt = project_path / "requirements.txt"
if requirements_txt.exists():
for line in requirements_txt.read_text(encoding='utf-8').split('\n'):
line = line.strip()
if line and not line.startswith('#'):
# 去掉版本号
dep = line.split('==')[0].split('>=')[0].split('~=')[0].strip()
declared_deps.add(dep)
pyproject_toml = project_path / "pyproject.toml"
if pyproject_toml.exists():
content = pyproject_toml.read_text(encoding='utf-8')
# 简单提取(不使用 toml 库)
in_deps = False
for line in content.split('\n'):
if '[tool.poetry.dependencies]' in line or '[project.dependencies]' in line:
in_deps = True
continue
if in_deps and line.strip().startswith('['):
break
if in_deps and '=' in line:
dep = line.split('=')[0].strip().strip('"')
if dep != 'python':
declared_deps.add(dep)
# Python 标准库(部分常见的)
stdlib = {
'os', 'sys', 'json', 'time', 'datetime', 'collections', 'itertools',
'functools', 'pathlib', 're', 'math', 'random', 'typing', 'abc',
'asyncio', 'logging', 'unittest', 'argparse', 'subprocess', 'io',
'copy', 'pickle', 'sqlite3', 'http', 'urllib', 'email', 'uuid'
}
# 区分第三方包和标准库
third_party = all_imports - stdlib
return {
"language": "Python",
"files_analyzed": file_count,
"total_imports": len(all_imports),
"third_party_imports": list(sorted(third_party)),
"declared_dependencies": list(sorted(declared_deps)),
"undeclared_usage": list(sorted(third_party - declared_deps)),
"unused_dependencies": list(sorted(declared_deps - third_party))
}
def analyze_javascript_project(project_path: Path) -> Dict:
"""分析 JavaScript 项目的依赖"""
package_json = project_path / "package.json"
if not package_json.exists():
return None
try:
import json as json_module
content = json_module.loads(package_json.read_text(encoding='utf-8'))
dependencies = content.get("dependencies", {})
dev_dependencies = content.get("devDependencies", {})
return {
"language": "JavaScript/TypeScript",
"dependencies": list(dependencies.keys()),
"dev_dependencies": list(dev_dependencies.keys()),
"total_dependencies": len(dependencies) + len(dev_dependencies)
}
except Exception as e:
print(f"Error parsing package.json: {e}", file=sys.stderr)
return None
def main():
# 获取项目路径
if len(sys.argv) > 1:
project_path = Path(sys.argv[1])
else:
project_path = Path.cwd()
if not project_path.exists():
print(f"Error: Path {project_path} does not exist", file=sys.stderr)
sys.exit(1)
results = []
# 分析 Python
python_result = analyze_python_project(project_path)
if python_result["files_analyzed"] > 0:
results.append(python_result)
# 分析 JavaScript
js_result = analyze_javascript_project(project_path)
if js_result:
results.append(js_result)
# 输出结果
output = {
"project_path": str(project_path),
"analyses": results
}
print(json.dumps(output, indent=2, ensure_ascii=False))
if __name__ == "__main__":
main()

View File

@ -0,0 +1,165 @@
---
name: codebase-architecture-analyzer
description: 用于理解开源项目。当用户说"理解项目"、"分析代码库"、"项目架构"、"梳理架构"时自动触发。自动识别技术栈、子系统边界、核心业务流程,生成 Mermaid 架构图和流程图。
allowed-tools: [Read, Glob, Grep, Bash, Task]
---
# 代码库架构分析 Skill
你是架构逆向工程专家,能从源代码反向推导系统架构和业务逻辑流程。
## 核心任务
- 📊 识别子系统边界frontend/backend/agent/database
- 🔄 追踪核心业务流程(工作流编排/数据管道/事件驱动)
- 📈 生成 Mermaid 架构图和流程图
- 🧠 智能模式识别Multi-Agent/微服务/分层架构)
- 📝 生成项目理解报告
---
## 执行流程
### ⚠️ 路径使用规范
所有脚本路径**必须使用波浪号 `~` 表示法**(跨平台兼容):
```bash
export PYTHONIOENCODING=utf-8 && python ~/.claude/skills/codebase-architecture-analyzer/scripts/detect_tech_stack.py .
```
**说明**
- `~/.claude/...` 在 Windows/macOS/Linux 均可正确解析
- `export PYTHONIOENCODING=utf-8` 用于处理中文/emoji 输出
---
### Phase 1: 快速扫描
**目标**:识别项目类型和主要组成
**执行步骤**
1. **运行技术栈检测脚本**
- 使用 Bash 工具执行:`export PYTHONIOENCODING=utf-8 && python ~/.claude/skills/codebase-architecture-analyzer/scripts/detect_tech_stack.py .`
- 脚本会输出 JSON 格式的技术栈信息语言、框架、Docker 配置等)
- 解析 JSON 结果获取:
- 主要编程语言Python/JavaScript/Go/Rust/Java
- 核心框架FastAPI/React/Django/LangGraph 等)
- Docker 服务配置
2. **分析依赖关系**
- 使用 Bash 工具执行:`export PYTHONIOENCODING=utf-8 && python ~/.claude/skills/codebase-architecture-analyzer/scripts/extract_dependencies.py .`
- 脚本会分析实际使用的依赖 vs 声明的依赖
- 识别:
- 第三方依赖列表
- 缺失的依赖声明(使用了但未声明)
- 未使用的依赖(声明了但未使用)
3. **扫描目录结构**
- 使用 Glob 工具识别顶层目录frontend/, backend/, agents/, services/ 等)
- 确认子系统边界
4. **统计代码规模**
- 使用 Bash 工具执行:`find . -type f -name "*.py" | wc -l`(针对主要语言)
- 估算项目规模
**详细指南**: `reference/quick-scan.md`
---
### Phase 2: 系统架构分析
**目标**:识别子系统边界和通信机制
**执行步骤**
1. **先读取详细指南**:使用 Read 工具读取 `~/.claude/skills/codebase-architecture-analyzer/reference/system-analysis.md`
2. **按照指南执行分析**:使用 Task tool 调用 Explore sub-agent 进行分析
**预期输出**
- Mermaid graph TB 系统架构图
- 子系统清单(名称、路径、技术栈、入口文件:行号)
- 通信关系列表
---
### Phase 3: 核心流程提取
**目标**:识别项目的核心业务逻辑编排
**执行步骤**
1. **先读取详细指南**:使用 Read 工具读取 `~/.claude/skills/codebase-architecture-analyzer/reference/workflow-extraction.md`
2. **智能路由策略**:根据 Phase 1 的扫描结果自动选择分析重点
- 检测到 agents/ + (langgraph/crewai/autogen) → Multi-Agent 工作流编排
- 检测到 docker-compose.yml 多服务 → 微服务调用链
- 检测到 airflow/workflow/pipeline → 数据管道流程
- 检测到 EventEmitter/event_bus → 事件驱动流程
- 其他 → 通用业务流程调用链
3. **按照指南执行分析**:使用 Task tool 调用 Explore sub-agent 进行分析
**预期输出**
- Mermaid 流程图stateDiagram-v2 / flowchart TD
- 执行单元清单Agent/服务/函数,含文件:行号、职责、输入/输出)
- 关键决策点(条件函数、分支路径)
---
### Phase 4: 数据流追踪
**目标**:追踪核心数据的转换链路
**执行步骤**
1. **先读取详细指南**:使用 Read 工具读取 `~/.claude/skills/codebase-architecture-analyzer/reference/data-flow-analysis.md`
2. **按照指南执行分析**:使用 Task tool 调用 Explore sub-agent 进行分析
**预期输出**
- Mermaid 序列图
- 数据模型清单(名称、文件:行号、用途、字段)
- 数据转换链路
---
### Phase 5: 生成最终报告
**目标**:汇总所有分析结果,生成 Markdown 报告文件
**执行步骤**
1. **先读取详细指南**:使用 Read 工具读取 `~/.claude/skills/codebase-architecture-analyzer/reference/report-generation.md`
2. **收集所有Phase的结果**:汇总 Phase 1-4 的分析数据
3. **该阶段必须生成报告文件**:在项目根目录下创建真实的 `PROJECT_ARCHITECTURE.md`文件并使用Write工具写入
**报告内容**
- 项目概览Phase 1 结果)
- 系统架构Phase 2 架构图 + 子系统详情)
- 核心业务流程Phase 3 流程图 + 执行单元清单)
- 数据流分析Phase 4 序列图 + 数据模型清单)
- 快速上手指南(环境要求、安装步骤、启动命令)
- 代码位置索引(所有关键文件清单)
**完成后告知用户**
```
✅ 分析完成!报告已保存: PROJECT_ARCHITECTURE.md
```
---
## 方法论参考
执行过程中根据需要查阅以下文档:
- **reference/knowledge.md** - 架构分析方法论子系统识别规则、通信机制识别、Mermaid 图表选择策略、业务函数识别规则)
- **reference/patterns.md** - 常见架构模式参考Multi-Agent、微服务、事件驱动、ETL、MVC、CQRS
- **reference/examples.md** - 实际使用案例5 个完整示例)
---
## 注意事项
1. **只读分析** - 本 Skill 不会修改任何代码文件
2. **敏感信息** - 不会在报告中暴露 `.env` 等敏感文件内容
3. **私有仓库** - 不会访问网络,仅分析本地代码
4. **自动跳过** - 自动跳过 node_modules, venv, .git 等常见依赖目录
---
现在开始分析当前项目。

View File

@ -0,0 +1,283 @@
# 会议纪要_工程部分(2025-11-18)
## 一、会议信息
- **会议时间:** 2025-11-18
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉、刘志豪
- **请假人员:** 无
---
## 二、工作内容
### 1. 重点项目进展(上周回顾)
| 项目名称 | 负责人 | 截止时间 | 项目进展情况 |
|---------|--------|----------|---------|
| 会议纪要流程文档和现场测试 | 江争达/郝倩玉 | 11月18日 | 现场演示暴露严重质量问题:P0项目数量错误(4个显示2个)、合并逻辑不可控、P0定义错误,闫旭隆/连云波接手 |
| 公众号/网站信息获取优化和新需求开发 | 江争达/陶西平/刘志豪 | 11月15日 | 上周无进展,需求对接环节停滞,需求文档流转混乱、原始需求缺失,已转交郝倩玉统一负责 |
| 服务器选型方案 | 江争达 | 11月15日 | 方案存在严重逻辑混乱和前后矛盾问题,直接购买铭凡MS-S1 MAX(14999元) |
| 开发规范-需求文档生成Skill | 连云波/闫旭隆 | 11月18日 | 闫旭隆完成1.0版本,整体框架获认可,需优化sub_agent内部Prompt臃肿、交互时间和生成的领域专家 |
| DeepResearch框架讨论 | 连云波/闫旭隆/刘志豪 | 11月15日 | 框架讨论完成,安定医院方第一阶段聚焦文献研究和假设生成首先确定需求文档后讨论做一个最小通用的deepresearch-skill |
| 客户风险推送需求文档 | 江争达/郝倩玉 | 11月18日 | 已完成测试和部署,采用天眼查方案,通过隔天换名单解决500/1000企业监测限制 |
| 发票处理需求文档 | 江争达/郝倩玉 | 11月18日 | 需求、开发、使用文档均已完成并部署,基于Python脚本实现,反馈基本满意 |
### 2. 会议重点问题及解决方案
#### 问题1: 会议纪要流程开发规范违规及质量问题
**问题描述:**
江争达在没有需求文档的情况下就开始开发,违反了多次强调的开发规范。现场演示暴露严重问题:
- 闫旭隆周报中2个P0项目,会议仪表盘显示了4个,存在漏项
- P0项目合并逻辑不清晰,大模型自动合并无法确认是否可控
- 个人工作内容中P0项目重复或分类错误
- 周报提取质量问题,详细工作内容未标明优先级导致P0项目识别错误
- P0项目定义错误:将"下周规划要完成的"都标为P0,但P0应该是"无论如何都要完成的重大战略性任务"
**解决方案:**
1. 必须编写需求文档,所有P0项目开发前必须有需求文档(面向用户+面向大模型两类)
2. 保留工作过程和原始版本,不要只提交结果,便于复盘和改进
3. 建立周报、日报、会议仪表盘的完整生成流程文档
4. 在详细工作内容中标明任务优先级(P0/P1/P2),避免映射错误
5. 学习项目管理知识,理解P0项目的正确定义
6. 建立前后校验机制,确保数据一致性
**责任人:** 闫旭隆、连云波
**截止时间:** 2025-11-25
#### 问题2: 公众号需求对接流转混乱
**问题描述:**
需求文档有两个版本:刘志豪写的"面向大模型"版本不可用于与用户确认,陶西平生成的"面向用户"版本缺少原始需求记录。刘志豪周五请假,江争达无法对接原始需求导致工作停滞。工作交接不清晰,没有追根到底确认原始需求文档。
**解决方案:**
1. 明确由郝倩玉负责所有市场部需求对接(包括会议纪要需求),没有郝倩玉确认的需求任何人不准开发
2. 郝倩玉需要找刘志豪要原始需求(富有最初提的三条需求:多层分级、人事变动、每周考核汇总)
3. 整合需求1.0文档 + 新提需求 + 信息聚合会议需求
4. 生成可用的需求文档(面向用户可理解、面向大模型可开发)
5. 下周过一遍需求文档和开发文档
6. 江争达配合郝倩玉完成开发文档
**责任人:** 郝倩玉、江争达、陶西平、刘志豪
**截止时间:** 2025-11-25(下周会议审核需求和开发文档)
#### 问题3: 服务器选型方案逻辑混乱不可用
**问题描述:**
江争达汇报的服务器选型方案存在严重问题:
- 没有总体规划文档,直接分成三个独立方案,缺少整体需求和分类说明
- 前后矛盾:软件需求要求CUDA驱动,但推荐的英伟达/名牌服务器不支持X86架构和标准CUDA
- 需求冲突:要求小型尺寸(家用主机)但又要扩展性,自组装没有扩展性
- 噪音问题:5090显卡长时间运行噪音大,不适合办公环境
- 显存不足:16GB显存只是最低要求,上下文一加载就不够用
- 缺少基础知识:不理解MoE模型、高带宽内存、内存带宽瓶颈等底层机制
**解决方案:**
1. 江争达退出服务器选型工作
2. 直接购买铭凡MS-S1 MAX服务器,领导已看过10+测评视频
**责任人:** 连云波、江争达
**截止时间:** 待定
#### 问题4: 需求文档-skill待优化
**问题描述:**
当前需求文档的skill存在交互时间过长、输出报告冗余过多、领域专家生成不准确、sub_agent内部提示词臃肿等问题。
**解决方案:**
1. 规范输出报告模板,从模板上避免冗余
2. 增强最后重复校验机制,避免生成报告冗余过多
3. 生成领域专家提示词改进增加一个AI专家角色
4. 可以在sub_agent内部增加使用web_search的提示词
5. 精简sub_agent内部提示词
6. 在专家评审阶段之后增加用户选项:由专家直接汇总/由用户确认,节省用户操作时间
7. 增加一个向Claude code提问该问题的功能
**责任人:** 闫旭隆
**截止时间:** 2025-11-25
#### 问题5: 客户风险推送企业监测数量限制
**问题描述:**
天眼查账户只支持500个企业监测,但需求是1000个企业监测。
**解决方案:**
1. 采用更换500个企业名单方案(通过批量导入模板)
2. 使用定时任务自动换名单
3. 可以通过浏览器自动化,实现自动换名单
4. 推送频率建议:2天一次,避免被认为是"钻漏洞"
**责任人:** 江争达/郝倩玉
**截止时间:** 2025-11-22(本周内)
### 3. 下周工作安排
| 项目名称 | 负责人 | 本周目标 | 优先级 | 截止时间 |
| ---------------------------------------- | -------------------- | --------------------------- | ------ | -------- |
| 会议纪要流程文档和现场测试 | 连云波/郝倩玉/闫旭隆 | 完善需求文档,建立标准模板和校验机制编写Skill | P0 | 2025-11-25 |
| 公众号/网站信息获取优化和新需求开发 | 郝倩玉/江争达/陶西平/刘志豪 | 确认需求文档,完成开发文档,准备开发 | P0 | 2025-11-25 |
| 数字人需求文档 | 江争达 | 整理需求文档 | P0 | 2025-11-25 |
| 需求澄清Skill优化 | 闫旭隆 | 根据会上建议改进skill设计以及最后的需求文档质量 | P0 | 持续优化 |
| DeepResearch文献研究模块开发 | 连云波/闫旭隆/刘志豪 | 生成安定医院方的需求文档制作deepresearch最小流程通用skill | P1 | 明天启动会后 |
| 招投标文件Skill开发 | 郝倩玉/闫旭隆 | 需求确认 | P1 | 明天启动会后 |
| 客户风险推送自动化 | 江争达/郝倩玉 | 确认切换采集监控用户方案 | P1 | 2025-11-25 |
| 服务器选型方案 | 连云波、江争达 | 尽快采购 | P1 | 待定 |
| 问答系统V1.1问题跟踪 | 江争达/闫旭隆/陶西平 | 持续优化 | P1 | 持续优化 |
| RAG参数优化和PDF转换智能体(会议未讨论) | 闫旭隆/江争达 | | | |
### 4. 组内成员工作进展
#### 江争达
**上周完成:**
- ✅ 会议纪要模板初步开发(周报、日报模板设计、会议仪表盘初步生成)
**进行中:**
- 🔄 会议纪要需求文档编写(重新规范)
- 🔄 公众号需求文档协助(转交郝倩玉主导)
- 🔄 服务器选型(已退出,转交领导)
**收到的反馈/学习建议:**
- 严厉批评:没有需求文档就开发,违反基本规范
- 工作质量不负责,自检流于形式
- P0项目定义错误,缺少项目管理知识:P0是"无论如何都要完成的战略任务",不是"计划完成的任务"
- 缺少工作流程记录,无法追溯问题
- 服务器选型方案逻辑混乱,基础知识不扎实(不理解MoE模型、高带宽内存、内存带宽瓶颈等)
- 需求文档要分两类:面向用户的(人能看懂)和面向大模型的(用于开发)
- 需求文档是"需求草稿",只有用户确认后才能标记为"需求文档已完成"
**下周任务:**
- [ ] P0完成数字人需求文档
- [ ] P0配合郝倩玉完成公众号开发文档
- [ ] P1 | 确认客户风险推送自动化系统切换采集监控用户方案
- [ ] P1 | 确认服务器采购时间
- [ ] P1问答系统V1.1问题分析和优化(会议未讨论)
#### 闫旭隆
**上周完成:**
- ✅ 需求澄清Skill 1.0版本开发
- ✅ Claude Code Skill开发规范检查skill制作及经验分享
- ✅ DOCX文件操作技术方案验证(占位符方法)
**进行中:**
- 🔄 需求澄清Skill优化(精简Prompt、减少交互时间.......)
- 🔄 最小模块DeepResearch需求文档
**收到的反馈/学习建议:**
- 需求澄清Skill整体框架优秀,交互流程设计合理,多角色评审机制从不同视角完善需求
- 需要优化:Prompt过于臃肿(Token消耗大,Skill像"检索机"而非"智能体")、交互时间过长(40+分钟)、领域专家识别不准(生成了"医疗信息化专家"而非"医疗科研专家")
- Skill规范文档很有价值,帮助团队理解底层机制
- Prompt应遵循"首要原则":判断什么是清楚的、什么是不清楚的,只补充不清楚的部分
**下周任务:**
- [ ] P0优化需求澄清Skill
- [ ] P0待需求文档确认后开始会议纪要skill制作
- [ ] P1做安定医院方的DeepResearch需求文档开发Deepresearch最小通用skill
- [ ] P1跟进开发招投标文件Skill
- [ ] P1问答系统V1.1问题分析和优化
#### 郝倩玉
**上周完成:**
- ✅ “小红书新手摄影博主文案生成智能体”前期网页界面优化等问题已解决,已完成搭建。
- ✅完成发票处理/客户风险推送系统开发需求对接,其中发票处理系统已完成需求、开发、测试工作, 客户风险推送项目涉及天眼查方案部分已进行测试。
- ✅推进招投标文件自动处理与生成智能体开发需求对接、流程梳理等相关工作。
**进行中:**
- 🔄 接手负责市场部需求确认工作
- 🔄 招投标文件自动处理与生成智能体开发需求文档撰写
**收到的反馈/学习建议:**
- 发票处理项目完成度高,获得认可(基于纯代码实现Python脚本,基本功能满意)
- 客户风险推送方案可行,需后续进行优化
**下周任务:**
- [ ] P0作为需求确认总负责人,把关组内所有需求文档质量
- [ ] P0会议纪要需求文档撰写完成与连总确认无误后发闫旭隆编写Skill
- [ ] P1招投标文件自动处理与生成智能体开发需求文档、技术文档撰写确认无误后发闫旭隆开发
- [ ] P1与刘志豪、黄富有明确公众号项目需求推进需求文档确认
#### 刘志豪
**上周完成:**
- ✅ 参与公众号需求对接(周五请假,工作未交接)
- ✅ DeepResearch项目skill简单测试版本开发
**进行中:**
- 🔄 公众号需求(转交郝倩玉)
- 🔄 DeepResearch项目(准备参与)
**收到的反馈/学习建议:**
- 需求对接工作交接不清晰
- 原始需求记录需要移交给郝倩玉
**下周任务:**
- [ ] P0向郝倩玉移交公众号原始需求记录(富有最初提的三条需求:多层分级、人事变动、每周考核汇总)
- [ ] P1参与DeepResearch项目的讨论和开发,持续优化DeepResearch的skill改进
#### 陶西平
**上周完成:**
- ✅ 协助公众号需求文档初版生成(面向用户版本)
- ✅ 针对图定制数字人平台相关调研
**进行中:**
- 🔄 针对视频定制数字人平台相关调研
- 🔄 针对企业定制化前端web开源框架调研
- 🔄 公众号项目支持
**下周任务:**
- [ ] P0配合郝倩玉/江争达完成公众号新需求确认
- [ ] P1完成针对视频定制数字人生成平台相关调研学习阶段必须完成个人任务
- [ ] P1针对企业定制化前端web开源框架调研学习阶段必须完成个人任务
---
## 三、会议总结
**核心主题:** 强化开发规范,确保所有P0项目必须有需求文档,没有需求不准开发;提升工作质量意识,自检要真正有效不能流于形式;规范需求对接流程,郝倩玉统一负责市场部需求对接;技术深度学习,做技术选型和调研必须理解底层原理
**关键决策:**
2. 郝倩玉成为需求对接总负责人,所有市场部需求(包括会议纪要需求)必须经她确认,没有确认任何人不准开发
3. 会议纪要项目重新规范开发流程,下周现场测试,必须编写需求文档并建立校验机制
4. 明天安定医院启动会,DeepResearch和招投标项目正式启动
5. 闫旭隆的需求澄清Skill获得认可,作为开发规范核心工具,需优化后进入实际应用
6. 需求文档要分两类:面向用户的(人能看懂)和面向大模型的(用于开发),只有用户确认后才算完成
**下周重点:**
1. 会议纪要现场测试和全员评审,验证数据一致性和P0项目识别准确性
2. 公众号需求确认和开发文档完成,下周会议过一遍需求和开发文档
3. 安定医院项目启动,DeepResearch第一阶段开发(文献研究和假设生成)
4. 招投标文件Skill开发和部署,使用DOCX操作+占位符方法
5. 数字人需求确认和技术调研,独立完成调研确保充分可用
6. 所有P0项目必须有完整需求文档才能开发,严格执行开发规范
---
**纪要整理人:** Claude AI
**纪要时间:** 2025-11-18
**下次会议:** 2025-11-25

View File

@ -0,0 +1,26 @@
# 周报 - 2025年11月第4周11月18日-11月24日
## 一、P0任务完成情况
| 任务 | 状态 | 备注 |
|------|------|------|
| 数字人需求文档 | 已完成 | - |
| 公众号/网站信息获取优化和新需求开发 | 进行中 | 需求未确认 |
## 二、遇到的问题
1. **公众号/网站信息获取优化和新需求开发**:需求未确认
## 三、详细工作内容
- 数字人生成需求文档(已完成)
- 天眼查批量删除需求文档(已完成)
- 日报/日报汇总模板需求文档(初版已完成)
- 数字人生成调研报告(修改中)
- 问答系统V1.1前端重构,调研中,未形成报告(进行中)
### 下周计划
- 数字人生成视频
- 问答系统V1.1前端重构方案
- 完成天眼查批量删除功能

View File

@ -0,0 +1,43 @@
# 周报 - 2025年11月第4周11月19日-11月25日
## 一、P0任务完成情况
| 任务 | 状态 | 备注 |
| ---------------------------------------- | ------ | ------------------------------------------------------------ |
| 会议纪要需求文档撰写 | 已完成 | 会议纪要需求文档已完成,连总已审核确认,示例样本已协助旭隆生成 |
| 运营商信息精准爬取系统需求对接确认 | — | 富有、琳贤对项目需求尚未明确,需与窦主任沟通明确后再进行反馈(反馈时间待定) |
| 投标商务应答文件自动生成系统需求文档确认 | 已完成 | 投标商务应答文件自动生成系统需求文档已完成并确认,已发开发人员(旭隆) |
## 二、遇到的问题
问题1运营商信息精准爬取系统中需求方的需求不明确且不实际
解决方法:已进行多轮沟通,并提供可借鉴思路,待对方明确需求后再择期启动项目
## 三、详细工作内容
### -[✅] 会议纪要需求文档
-[✅] 会议纪要需求文档已完成,连总已审核确认,示例样本已协助旭隆生成
### -[✅] 运营商信息精准爬取系统
-[✅] 已进行多轮沟通,富有、琳贤对项目需求尚未明确,需与窦主任沟通明确后再进行反馈(反馈时间待定)
### -[✅] 投标商务应答文件自动生成系统需求文档确认
-[✅] 投标商务应答文件自动生成系统需求文档已完成并确认,已发开发人员旭隆
## 下周计划
- 与旭隆沟通投标商务应答文件自动生成系统需求文档的技术可行性,协助撰写技术实现文档
- 运营商信息精准爬取系统需求跟进

View File

@ -0,0 +1,49 @@
# 周报 - 2025年11月第4周11月19日-11月25日
## 一、P0任务完成情况
| 任务 | 状态 | 备注 |
| ------------------------------ | ------ | --------- |
| 需求澄清-需求文档skill优化测试 | 已完成 | 11-21完成 |
| 会议纪要生成Skill编写 | 已完成 | 11-25完成 |
## 二、遇到的问题
## 三、详细工作内容
### -[✅]需求澄清-需求文档skill优化、测试、视频录制
- 规范最终模板,在保证全面的基础上避免过多冗余
- 生成领域专家提示词改进增加一个AI专家角色
- 只保留核心问题精简sub_agent内部提示词在sub_agent内部增加使用web_search的提示词
- 增加向Claude code提问中断进入交互-确认继续访谈的功能
- 在专家评审阶段之后增加用户选项:由专家直接汇总/由用户确认,节省用户操作时间
### -[✅]安定医院Deepresearch项目讨论以及需求文档初稿
- 使用需求文档skill制作安定医院Deepresearch需求文档初稿录制视频作为skill演示
### -[✅]会议纪要skill开发
- 整理工程类、学习类、Q&A资源库会议纪要的生成逻辑映射关系及优先级、矛盾处理逻辑
- 设计“主窗口区分工程类/学习类项目,调配 + 会议转写文本索引处理Agent + 搜索Agent”整体架构实现开发
### -[✅]医院数据治理体系数智化转型PPT
- 制作PPT
## 下周计划
- 优化会议纪要生成skill优化SKILL.md及Agent内部提示词和映射逻辑优先级
- 实现安定医院Deepresearch-Skill-MVP阶段开发

View File

@ -0,0 +1,26 @@
# 周报 - 2025年11月第4周11月19日-11月25日
## 一、任务完成情况
| 任务 | 状态 | 备注 |
|------|------|------|
| 数字人调研 | 进行中 | 完成基本调研,生成调研报告草稿 |
| 前端框架调研 | 进行中 | 完成对claudecode frontend-design skill 和 web-artifacts-builder skill 以及gemini3 pro 相关调研 |
## 二、遇到的问题
## 三、详细工作内容
- 学习使用web-artifacts-builder、frontend-analysis、gemini3pro构建个性化组件
- 学习Frontend Design Skill和web-artifacts-builder skill如何通过prompt对页面的美学进行约束的以及构建前端页面的流程
- 本地部署lobe-chat和nextchat这两个前端开源框架并且尝试在框架上构建个性化组件
- 本地部署cc-switch生成cc-switch使用结果文档
- 收集cswitch相关信息
- 对ppt和数字人视频相结合进行调研和尝试构建了ppt与数字人结合的短视频
## 下周计划
- 完成数字人调研报告
- 完成ppt与数字人结合调研
- 持续优化工作流
- 学习主流ai技术对于前端方面的知识

View File

@ -0,0 +1,205 @@
# Q&A资源库类会议纪要 (2025-11-25)
## 一、会议信息
- **会议时间:** 2025-11-25
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉
- **请假人员:** 刘志豪
---
## 二、工作问题 Q&A
### 1. 项目会议纪要Skill开发
**Q1: 会议纪要Skill数据映射逻辑复杂怎么办**
**A:**
- 参考会议转写文本进行状态更新,会议转写内容优先级最高
- 优化架构主窗口负责协调每个子Agent获得全量上下文独立处理一个功能模块
- 不再使用分块索引搜索,改用主窗口直接处理全文,提高准确性
- 负责人字段需要根据会议讨论更新,不能仅沿用上周数据
**Q2: Read工具读取会议转写文本受token限制每次约300行如何处理大文件**
**A:**
- Read工具可以通过指定offset和limit参数分多次读取完整文件
- prompt第一句话就要求"用Read工具读取全文",上下文保持干净
- 可以指定按1000行分块读取强制要求"必须全部读完"
- 改用全文加载方案主窗口直接读取全文每个子Agent都获得全量上下文
### 2. 项目:需求文档质量提升
**Q3: 需求文档罗列了大量默认功能,如何区分默认需求与核心需求?**
**A:**
- 使用"如果不提是否就不实现"原则筛选需求——不提就不实现才叫需求
- 需求要聚焦核心难点,排除默认功能(如"PPT能动"、"有声音"等)
- 深度挖掘用户真实需求,不能停留在表面功能罗列
- 需求文档要明确:既不能太普通(默认功能),也不能太拔尖(无法实现)
- 先明确当前遇到的核心问题,再提炼需求
**Q4: 需求文档Skill生成的领域专家不相关如医疗信息化专家如何优化**
**A:**
- 优化专家生成提示词增加AI专家作为固定专家
- 改进领域专家识别逻辑,确保生成相关领域专家
- 增加专家评审后的博弈机制,多轮评审提高质量
- 未来可扩展为多轮博弈:一个专家读另一个专家的评审,相互质证
### 3. 项目Skill开发效率
**Q5: Skill每次测试需要启动半小时如何提升测试效率**
**A:**
- 开发Skill测试工具类似skill-quality-checker
- 自动提取各个逻辑分支,检查边界信息传递是否正确
- 人工测试聚焦于效果验证,自动化测试负责逻辑验证
- 使用调试输出来追踪异常情况
- 赋予Agent测试人员职能自动定位问题反馈边界错误
**Q6: 开发复杂Skill时逻辑混乱前后矛盾怎么办**
**A:**
- 开发前必须先绘制流程图,画大图把逻辑连线的过程就是思考过程
- 人脑记不住多个逻辑线,视觉理解优于文字
- 开发流程断了一环(如缺少流程图),后面优化就很难
- 流程图帮助发现逻辑漏洞和前后矛盾
### 4. 项目:需求对接管理
**Q7: 需求方需求不明确且不实际,项目无法推进怎么办?**
**A:**
- 等待需求方与决策者(如窦主任)沟通明确需求后再启动
- 需求方向建议:要么做深度分析,要么做广度覆盖,不可能比业务员更了解业务细节
- 不是所有需求都要开发,不明确的需求宁可暂停
- 提供可借鉴思路,但决策权留给需求方
---
## 三、重点工作方法
### 方法1: 全量上下文优于分块搜索
**方法描述:**
在会议纪要Skill架构讨论中强调准确性优先于效率。在上下文允许的情况下每个子Agent都应获得全量上下文独立处理功能模块而非通过分块索引搜索。主窗口负责协调子Agent获得全文处理避免语义检索导致的信息丢失。子Agent返回精简结果给主窗口汇总保证准确性。
**适用场景:** Claude Code Skill架构设计、大文本处理
**关键要点:**
- 准确性优先于效率
- 主窗口协调子Agent独立处理
- 子Agent返回精简结果
- 避免语义检索的信息丢失
---
### 方法2: 需求提炼的层次性原则
**方法描述:**
需求分析要区分默认需求与核心需求。默认需求如PPT能动、有声音无需单独列出应聚焦于用户真实痛点和技术难点。判断标准"不提就不实现"才叫需求。需求排列要考虑优先级,避免罗列所有功能,需深度挖掘比用户想得更深远的需求。
**适用场景:** 需求文档撰写、需求评审
**关键要点:**
- "不提就不实现"才叫需求
- 默认能实现的不是需求
- 深度挖掘比用户想得更深远
- 需求分层次,聚焦核心难点
---
### 方法3: 开发流程图先行
**方法描述:**
在开发复杂逻辑前必须先绘制流程图。人脑记不住多个逻辑线,画大图把逻辑连线的过程就是思考过程,避免前后矛盾。流程图断了一环,后面优化就很难。视觉理解优于文字,尤其涉及空间关系的逻辑。
**适用场景:** Skill开发、复杂系统设计
**关键要点:**
- 先画图再写代码
- 连线过程就是思考过程
- 视觉理解优于文字
- 避免开发流程断环
---
### 方法4: Agent设计的自治性原则
**方法描述:**
Agent内部应固化所有执行规则、工具使用规范、评估标准配置文件由Agent自己读取不依赖主窗口传递。主窗口只传递标识符如项目类型和文件路径不传递Agent的行为规则或配置内容。Agent间通过temp/文件传递数据Agent向主窗口直接返回文字结果。
**适用场景:** 多Agent系统设计、Skill架构
**关键要点:**
- 主窗口传标识符Agent读详细配置
- Agent间传文件路径
- Agent向主窗口返回文字结果
- Agent内部固化执行规则
---
### 方法5: 需求访谈的动态提问法
**方法描述:**
不规定具体问题只规定目标和方法论把提问空间留给大模型。提供示例、原则、访谈目标让Agent动态生成问题。增加交互澄清机制检测用户回答包含问号、疑问性语句或明确说"需要帮助"时,立即切换到自由对话,讨论明确后再返回访谈。
**适用场景:** 需求澄清Skill、用户访谈
**关键要点:**
- 规定目标而非具体问题
- 把提问空间留给大模型
- 增加交互澄清机制
- 检测用户困惑并及时切换
---
### 方法6: 专家评审的多轮博弈机制
**方法描述:**
引入多个领域专家Agent固定AI专家+动态识别领域专家)并行评审需求文档第一版。专家评审后可选自动整合或用户确认,节省时间。未来可扩展为多轮博弈:一个专家读另一个专家的评审,相互质证,充分交流后质量更高。
**适用场景:** 需求文档评审、多角色协作
**关键要点:**
- 固定AI专家+动态领域专家
- 可选自动整合或用户确认
- 多轮博弈相互质证
- 充分交流提高质量
---
### 方法7: 模型差异化使用策略
**方法描述:**
不同任务使用不同模型专家评审等需要深度thinking的任务用Opus文字简单处理用Sonnet更快。Opus的thinking开到middle时能力接近Sonnet但token消耗降低48%。在Agent定义时可指定模型优化性能和成本。
**适用场景:** Skill性能优化、成本控制
**关键要点:**
- 深度思考用Opus
- 简单处理用Sonnet
- thinking设置影响能力和消耗
- Agent定义时指定模型
---
### 方法8: 会议纪要驱动工作流
**方法描述:**
会议纪要是团队所有人智慧的结晶,后续所有工作都围绕它展开:项目管理、学习安排、任务分配。甚至可以根据会议纪要生成人员招聘要求,因为工作要求都在里面。会议纪要质量直接影响后续执行,好的会议纪要员能把逻辑理得清晰、任务安排妥当。
**适用场景:** 团队协作、项目管理
**关键要点:**
- 会议纪要是团队智慧结晶
- 后续工作围绕会议纪要展开
- 纪要质量影响执行效果
- 可驱动项目管理和任务分配
---
**纪要整理人:** Claude
**纪要时间:** 2025-11-25
**下次会议:** 2025-12-02

View File

@ -0,0 +1,255 @@
# 工程类会议纪要 (2025-11-25)
## 一、会议信息
- **会议时间:** 2025-11-25
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 负责人 | 截止时间 | 项目进展情况 |
|---------|--------|----------|-------------|
| 会议纪要流程文档和现场测试 | 连云波/郝倩玉/闫旭隆 | 11月25日 | 郝倩玉完成需求文档撰写并获连总确认闫旭隆完成Skill第一版编写。会议讨论发现存在数据映射逻辑复杂、架构不够优雅等问题需优化为全量加载方案 |
| 公众号/网站信息获取优化和新需求开发 | 郝倩玉/江争达/陶西平/刘志豪 | 11月25日 | 需求方(富有、琳贤)反馈现有方案"为了做而做",需求不明确,项目暂停等待窦主任明确需求后再推进 |
| 数字人需求文档 | 江争达 | 11月25日 | 已完成初版,但会议中被严厉批评:需求提炼能力不足,罗列默认功能而非核心难点,未深度挖掘用户痛点,需重新整理 |
| 需求澄清Skill优化 | 闫旭隆 | 持续优化 | 已完成1.0版本优化测试,增加交互澄清、专家自动整合等功能,会议演示效果良好,建议增加专家多轮博弈机制 |
### 2. 重点项目问题及解决方案
#### 问题1: 会议纪要Skill数据映射和逻辑复杂性问题
**问题描述:**
会议纪要Skill第一版实现中存在多个问题
- 数据映射逻辑复杂,
- 负责人变更逻辑处理不当
- 项目进展状态更新需参考会议转写但未实现
- 上周会议纪要和本周会议讨论内容的优先级和整合逻辑不清晰
- 分块索引搜索方案可能影响准确性和搜索命中率
**解决方案:**
1. 参考会议转写文本进行状态更新,会议转写内容优先级最高
2. 优化架构主窗口负责协调每个子Agent获得全量上下文独立处理一个功能模块
3. 不再使用分块索引搜索,改用主窗口直接处理全文,提高准确性
4. 负责人字段需要根据会议讨论更新,不能仅沿用上周数据
5. Read工具可通过指定offset和limit参数分多次读取完整文件
**责任人:** 闫旭隆、郝倩玉
**截止时间:** 2025-12-02
#### 问题2: 数字人PPT需求文档质量问题
**问题描述:**
江争达提交的数字人PPT需求文档存在严重问题
- 需求提炼能力不足,未区分默认需求与核心难点需求
- 罗列了大量无价值的默认功能(如"动态切换"、"PPT能动"等)
- 未深度挖掘用户真实痛点
- 需求描述不明确,如"动态切换"实际含义不清
**解决方案:**
1. 需求要聚焦核心难点,排除默认功能
2. 使用"如果不提是否就不实现"原则筛选需求
3. 深度挖掘用户真实需求,不能停留在表面功能罗列
4. 需求文档要明确:既不能太普通(默认功能),也不能太拔尖(无法实现)
5. 先明确目前数字人生成PPT讲座中遇到的核心问题再提炼需求
6. 结合窦主任的个性特点设计内容,不要过于死板
**责任人:** 江争达、郝倩玉
**截止时间:** 2025-12-02
#### 问题3: 公众号/网站信息获取需求未确认
**问题描述:**
公众号/网站信息获取优化和新需求开发项目,需求方(富有、林贤)的需求不明确,他们认为现有方案"为了做而做",对市场发展没有实际用处,需要重新思考需求逻辑。
**解决方案:**
1. 等待需求方与窦主任沟通明确需求后再启动
2. 可考虑整合公众号和网站信息到一个邮件中
3. 需求方向建议:要么做深度分析,要么做广度覆盖,不可能比业务员更了解业务细节
**责任人:** 郝倩玉、江争达
**截止时间:** 待定(等待需求明确)
#### 问题4: Skill测试效率低下问题
**问题描述:**
需求文档Skill每次测试需要启动半小时发现问题后修改再测试非常费时缺乏自动化测试机制。
**解决方案:**
1. 开发Skill测试工具类似skill-quality-checker
2. 自动提取各个逻辑分支,检查边界信息传递是否正确
3. 人工测试聚焦于效果验证,自动化测试负责逻辑验证
4. 使用调试输出来追踪异常情况
**责任人:** 闫旭隆、江争达
**截止时间:** 待定
#### 问题5: 日报驱动系统架构设计不系统
**问题描述:**
江争达提出通过会议纪要驱动日报的需求,但缺乏系统化的需求分析和架构设计,只关注点上的问题,未考虑整体框架。
**解决方案:**
1. 先明确根本目的:提高工作效率、提高学习能力等
2. 研究Linear项目管理工具的MCP集成
3. 设计语音交互日报填写流程每天5分钟语音交流完成日报
4. 通过项目管理工具自动生成日报和周报
5. 学习学习型组织建设理论构建AI Native团队框架
6. 先搭建框架(横纵梁柱),再逐步实现各个功能点
**责任人:** 江争达
**截止时间:** 待定(长期探索)
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|---------|--------|-------------|--------|----------|
| 🔴 会议纪要Skill架构优化 | 闫旭隆 | 简化架构改用主窗口全量加载会议转写子Agent负责不同功能模块提升准确性 | P0 | 2025-12-02 |
| 🔴 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉、江争达 | 完成1.0版本,发布给团队成员试用,收集反馈并优化 | P0 | 2025-12-02 |
| 🔴 数字人PPT需求文档重写 | 郝倩玉 | 重新提炼核心需求,区分默认需求与核心难点需求,深度挖掘用户痛点 | P0 | 2025-12-02 |
| 问答系统V1.1前端重构方案 | 江争达 | 完成需求文档和前端重构方案使用Claude/Gemini生成前端页面参考麦肯锡等优秀网站设计风格 | P1 | 2025-12-02 |
| 问答系统V1.0测试推动 | 江争达 | 推动市场部及内部同事测试问答系统V1.0,收集用户反馈和问题 | P1 | 2025-12-02 |
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆 | 郝倩玉确认需求文档并设计Skill架构闫旭隆负责后期调试 | P1 | 2025-12-02 |
| PDF Skill技术调研 | 江争达 | 调研Claude Code的PDF Skill功能探索PDF文件的处理能力 | P1 | 2025-12-02 |
| Cosmos文献综述流程整理 | 陶西平 | 整理Cosmos文献综述的完整流程和Agent编排生成流程文档供PPT使用 | P1 | 2025-11-26上午 |
| 日报驱动系统需求研究 | 江争达 | 研究Linear项目管理工具探索通过会议纪要自动驱动日报和周报的系统化需求 | P2 | 待定 |
| cc-switch并行测试 | 陶西平 | 确认cc-switch是否支持多终端并行运行测试多模型切换场景能力 | P2 | 待定 |
| Skill Plugin管理系统搭建 | 江争达 | 学习并搭建内部Skill Marketplace管理团队开发的所有Skill | P2 | 待定 |
| Skill自动化测试工具开发 | 闫旭隆、江争达 | 开发Skill测试工具自动化检测Skill逻辑分支、边界信息传递等问题 | P2 | 待定 |
### 4. 组内成员工作进展
#### 江争达
**上周完成:**
- ✅ 数字人生成需求文档初版
- ✅ 天眼查批量删除需求文档
- ✅ 日报/日报汇总模板需求文档初版
**进行中:**
- 🔄 数字人生成调研报告修改中
- 🔄 问答系统V1.1前端重构调研
**收到的反馈/学习建议:**
- **严厉批评:** 数字人PPT需求文档质量问题严重需求提炼能力不足罗列所有功能而非核心难点
- **批评:** 未区分默认需求与核心需求,需求描述不明确让人看不懂
- **建议:** 需求调研应先识别当前最迫切的问题,区分默认需求与核心难点需求
- **建议:** 深度挖掘背后逻辑,理解需求真实含义,需求文档要让非技术人员也能看懂
- **建议:** 避免与大模型拍脑袋对话生成需求,要有自己的理解和整合能力
**下周任务:**
- [ ] 🔴 P0试用需求澄清Skill并提供反馈
- [ ] P1问答系统V1.1前端重构方案
- [ ] P1PDF Skill技术调研
- [ ] P2日报驱动系统需求研究
- [ ] P2Skill Plugin管理系统搭建
#### 闫旭隆
**上周完成:**
- ✅ 需求澄清-需求文档skill优化测试 (11-21完成)
- ✅ 会议纪要生成Skill编写 (11-25完成)
- ✅ 安定医院Deepresearch项目需求文档初稿
- ✅ 医院数据治理体系数智化转型PPT
**进行中:**
- 🔄 会议纪要Skill架构优化
**收到的反馈/学习建议:**
- **批评:** 未绘制流程图导致思考过程不清晰,开发流程断了一环
- **建议:** 需要绘制流程图梳理复杂逻辑关系,避免依赖抽象记忆
- **建议:** 简化架构,尝试全量加载转写文本而非分块索引搜索,提高准确性
- **表扬:** 会议纪要Skill整体可用大的要点逻辑清楚基本实现70%核心功能
- **表扬:** 需求文档Skill迭代版本增加了交互澄清、专家自动整合等功能演示效果良好
**下周任务:**
- [ ] 🔴 P0会议纪要Skill架构优化
- [ ] 🔴 P0需求澄清Skill测试与推广
- [ ] P1招投标文件Skill架构设计和调试
- [ ] P2Skill自动化测试工具开发
#### 郝倩玉
**上周完成:**
- ✅ 会议纪要需求文档撰写(连总已审核确认)
- ✅ 投标商务应答文件自动生成系统需求文档确认(已发闫旭隆)
- ✅ 运营商信息精准爬取系统多轮沟通(待需求方明确)
**进行中:**
- 🔄 招投标文件Skill架构设计
- 🔄 运营商信息精准爬取系统需求跟进
**收到的反馈/学习建议:**
- **任务分配:** 负责PDF Skill调研的需求整理工作
- **任务分配:** 负责招投标文件Skill的需求文档确认和架构设计
- **任务分配:** 负责天眼查自动化需求的沟通确认,推动窦主任明确做深还是做广
**下周任务:**
- [ ] 🔴 P0试用需求澄清Skill并提供反馈
- [ ] 🔴 P0数字人PPT需求文档重写
- [ ] P1招投标文件Skill架构设计
- [ ] P1运营商信息精准爬取系统需求跟进
#### 陶西平
**上周完成:**
- ✅ 学习使用web-artifacts-builder、frontend-analysis、gemini3pro构建个性化组件
- ✅ 本地部署lobe-chat和nextchat前端开源框架
- ✅ 本地部署cc-switch生成使用结果文档
- ✅ PPT与数字人视频结合调研构建了结合短视频
**进行中:**
- 🔄 数字人调研报告草稿
- 🔄 前端框架调研
**收到的反馈/学习建议:**
- **批评:** 数字人PPT需求文档存在严重问题需求提炼能力不足无法区分默认需求与核心难点需求
- **批评:** 对"动态切换PPT"需求理解浅薄,未理解背后技术实现逻辑
- **建议:** 需求提炼要先调研当前遇到的问题,按优先级排列
- **建议:** 需求文档要体现难点和第一阶段核心点,不要放置小功能到核心需求里
- **建议:** 每一步工作都要做扎实,经得起推敲
**下周任务:**
- [ ] P1Cosmos文献综述流程整理11-26上午前完成
- [ ] P1完成数字人调研报告
- [ ] P1完成PPT与数字人结合调研
- [ ] P2cc-switch并行测试
---
## 三、会议总结
**核心议题:** 会议纪要Skill架构优化、需求文档质量提升、需求澄清Skill推广
**关键决策:**
1. **会议纪要Skill架构优化方案:** 主窗口负责协调每个子Agent获得全量上下文独立处理一个功能模块放弃复杂的语义检索方案
2. **会议纪要Skill必须参考会议转写更新项目进展状态:** 不能只依赖周报
3. **需求文档不要罗列默认功能:** 只提炼核心难点需求,深度挖掘用户真实痛点
4. **数字人项目第一阶段采用公开虚拟形象:** 不用个人数字人,简化开发难度
5. **需求文档Skill增加专家博弈机制:** 采用多轮评审而非一次性评审
6. **问答系统前端重构方案:** 采用Gemini或Claude参考麦肯锡风格生成整套设计方案
7. **测试Skill的Skill需要开发自动化测试工具:** 提升Skill开发效率
8. **使用cc-switch作为多模型终端管理工具:** 为未来部署国内模型做准备
9. **不同任务使用不同模型优化:** 专家评审用Opus简单处理用Sonnet
10. **公众号信息获取项目等待富有确认需求后再继续:** 避免无效开发
**下周工作重点:**
1. 🔴 会议纪要Skill架构优化简化为全量加载方案提升准确性
2. 🔴 需求澄清Skill 1.0版本推广,团队成员试用并反馈
3. 🔴 数字人PPT需求文档重写聚焦核心难点需求
4. 问答系统V1.1前端重构方案完成
5. 招投标文件Skill架构设计启动
6. Cosmos文献综述流程整理明天上午前完成
---
**纪要整理人:** Claude
**纪要时间:** 2025-11-25
**下次会议:** 2025-12-02

View File

@ -0,0 +1,335 @@
# Q&A资源库类会议纪要生成逻辑
## 一、输出结构总览
```
Q&A资源库类会议纪要
├── 一、会议信息
├── 二、工作问题 Q&A
│ ├── 1. 项目名称1
│ │ ├── 主要问题
│ │ └── 解决方案
│ ├── 2. 项目名称2
│ └── ...
└── 三、重点工作方法
├── 方法1
│ ├── 方法描述
│ ├── 适用场景
│ └── 关键要点
├── 方法2
└── ...
```
---
## 核心定位说明 ⭐⭐⭐
**Q&A资源库类会议纪要是二次提取产物**
- **执行时机**:在工程类和学习研究类会议纪要生成之后执行
- **核心目的**知识沉淀构建可复用的Q&A资源库
- **数据来源**
- "工作问题 Q&A":从已生成的工程类/学习研究类纪要中提取
- "重点工作方法":从会议转写+周报中新提取
**依赖文件**
- 已生成的工程类会议纪要(必需)
- 已生成的学习研究类会议纪要(可选)
- 会议转写文件(用于提取工作方法)
- 成员周报(用于提取工作方法)
---
## 二、章节数据来源与处理动作
### 第一部分:会议信息
#### 输出格式
```markdown
一、会议信息
- 会议时间2025-11-18
- 参会人员:连云波、江争达、闫旭隆、陶西平、郝倩玉
- 记录整理人Claude
```
#### 数据来源映射
| 字段 | 主要来源 | 处理逻辑 |
|------|---------|---------|
| 会议时间 | 已生成的工程类会议纪要 | 直接复用"会议信息"章节的会议时间 |
| 参会人员 | 已生成的工程类会议纪要 | 直接复用"会议信息"章节的参会人员 |
| 记录整理人 | 固定值 | 固定为"Claude" |
#### 需要的动作
1. 读取已生成的工程类会议纪要文件
2. 提取"一、会议信息"章节内容
3. 直接复用,格式保持一致
---
### 第二部分:工作问题 Q&A
#### 输出格式
```markdown
## 二、工作问题 Q&A
### 1. 项目名称:会议纪要信息提取
- **主要问题:** 转写说话人识别不准确,导致无法正确归属发言内容
- **解决方案:**
1. 采用语义分析替代说话人标记
2. 通过上下文推断发言者身份
3. 结合周报内容进行交叉验证
---
### 2. 项目名称Skill架构设计
- **主要问题:** Agent间数据传递方式不清晰
- **解决方案:**
1. 主窗口传递标识符和文件路径
2. Agent通过temp/目录交换数据
3. Agent直接返回文字结果给主窗口
```
#### 数据来源映射
**核心原则**:二次提取,从已生成纪要中汇总
| 字段 | 数据来源(优先级从高到低) | 提取逻辑 |
|------|---------------------------|---------|
| 项目名称 | 工程类纪要"问题及解决方案"章节标题 | 提取"问题N: XXX"中的项目/问题名称 |
| 主要问题 | 工程类纪要"问题描述"字段 | 直接提取精简为1-2句话 |
| 解决方案 | 工程类纪要"解决方案"列表 | 直接提取,保持列表格式 |
**补充来源**(学习研究类纪要):
| 字段 | 数据来源 | 提取逻辑 |
|------|---------|---------|
| 项目名称 | 学习研究类纪要的议题标题 | 从学习议题中识别问题讨论部分 |
| 主要问题 | "关键讨论成果"中的Q&A | 提取讨论中的问题部分 |
| 解决方案 | "关键讨论成果"中的答案/共识 | 提取讨论中形成的解决方案 |
#### 需要的动作
**动作1提取工程类纪要中的问题主窗口执行**
- 读取已生成的工程类会议纪要
- 定位"### 2. 重点项目问题及解决方案"章节
- 解析每个问题块,提取:
- 问题标题(作为项目名称)
- 问题描述(精简为主要问题)
- 解决方案列表
- 责任人(可选,用于追溯)
- 截止时间(可选,用于追溯)
**动作2提取学习研究类纪要中的Q&A主窗口执行可选**
- 读取已生成的学习研究类会议纪要(如存在)
- 定位每个议题的"关键讨论成果"部分
- 识别Q&A格式内容
- 问题:通常以"Q:"、"问题"、""等标识
- 答案/方案:紧随问题之后的回答内容
**动作3提取成员反馈中的问题主窗口执行可选**
- 从工程类纪要"### 4. 组内成员工作进展"中提取
- 识别"收到的反馈/学习建议"部分中包含的问题和建议
- 转化为Q&A格式
**动作4合并去重主窗口执行**
- 将所有来源的问题进行语义匹配
- 相似度 > 80% 视为同一问题,合并解决方案
- 按项目分组,同一项目的多个问题归类在一起
**动作5格式化输出主窗口执行**
- 按项目编号组织输出
- 格式:### {序号}. 项目名称:{project_name}
- 包含:主要问题 + 解决方案列表
---
### 第三部分:重点工作方法
#### 输出格式
```markdown
## 三、重点工作方法
- **方法 1语义分析替代说话人标记**
- 当转写文本说话人识别不准确时,通过分析发言内容的语义特征来判断发言者
- 适用场景:会议转写处理、发言归属分析
- 关键要点:
- 关注发言中的人称代词和上下文
- 结合周报内容进行交叉验证
- 利用任务分配信息推断发言者
- **方法 2渐进式披露原则**
- Skill设计中采用三级加载系统元数据→主体→资源按需加载
- 适用场景Claude Code Skill开发、大型项目架构
- 关键要点:
- 元数据始终在上下文中(~100词
- 主体内容触发时加载(<3k词
- 详细资源按需读取
```
#### 数据来源映射
**核心原则**:会议转写 + 周报,两者结合
| 字段 | 数据来源 | 提取逻辑 |
|------|---------|---------|
| 方法标题 | 会议转写中的方法分享 + 周报经验总结 | 从分享内容中提炼方法名称 |
| 方法描述 | 会议转写详细讲解 + 周报总结描述 | 合并两者,形成完整描述 |
| 适用场景 | 会议讨论上下文 + 周报应用场景 | 从讨论中识别方法的适用范围 |
| 关键要点 | 会议讲解要点 + 周报经验要点 | 提炼为3-5条核心要点 |
#### 需要的动作
**动作1从会议转写提取方法分享调用 Agent**
- 调用 transcript_searcher Agent
- 搜索意图:提取会议中分享的工作方法、技巧、最佳实践
- 识别特征:
- "方法是..."、"技巧是..."、"经验是..."
- "我的做法是..."、"建议..."、"注意..."
- 总结性、经验性、指导性语句
- 提取字段:方法名称、详细描述、提出人
```python
Task(
subagent_type="transcript_searcher",
description="提取工作方法",
prompt="""提取会议中分享的工作方法、技巧、最佳实践。
识别特征:
- 方法论讲解("方法是..."、"技巧是..."
- 经验分享("我的做法是..."、"建议..."
- 总结性语句("总结一下..."、"关键是..."
需提取字段:
- 方法名称(简短标题)
- 方法描述(详细说明)
- 提出人(从上下文推断)
- 相关项目(方法关联的项目)
返回JSON格式。
"""
)
```
**动作2从周报提取经验总结主窗口执行**
- 遍历所有周报
- 从"详细工作内容"中识别方法论/经验总结内容
- 识别特征:
- 带有"方法"、"技巧"、"经验"等关键词的段落
- 总结性、归纳性描述
- 可复用的工作模式
- 提取:方法标题、描述、作者
**动作3合并整理主窗口执行**
- 将会议方法与周报方法进行语义匹配
- 相似方法合并,补充细节
- 为每个方法生成完整结构:
- 方法标题
- 方法描述(合并会议详细讲解 + 周报简要描述)
- 适用场景(从会议讨论上下文推断)
- 关键要点提炼为3-5条
**动作4格式化输出主窗口执行**
- 按方法编号组织输出
- 格式:- **方法 {序号}{方法标题}**
- 包含:描述 + 适用场景 + 关键要点列表
---
## 三、关键数据优先级规则总结
| 字段 | 数据来源 | 优先级规则 | 说明 |
|------|---------|-----------|------|
| **会议信息** | 工程类纪要 | **直接复用** | 无需重新提取 |
| **Q&A-项目名称** | 工程类纪要 > 学习类纪要 | **工程类优先** | 工程类问题更明确 |
| **Q&A-主要问题** | 工程类纪要 > 学习类纪要 | **工程类优先** | 工程类描述更完整 |
| **Q&A-解决方案** | 工程类纪要 + 学习类纪要 | **互补合并** | 合并所有解决方案 |
| **方法-标题** | 会议转写 > 周报 | **会议优先** | 会议分享通常更正式 |
| **方法-描述** | 会议转写 + 周报 | **互补合并** | 会议详细 + 周报简要 |
| **方法-适用场景** | 会议讨论上下文 | **仅会议** | 从讨论中推断 |
| **方法-关键要点** | 会议转写 + 周报 | **互补合并** | 提炼核心要点 |
---
## 四、特殊情况处理
**情况1工程类纪要不存在**
```
处理无法生成Q&A资源库类纪要提示用户先生成工程类纪要
原因工程类纪要是Q&A的主要数据来源
```
**情况2学习研究类纪要不存在**
```
处理正常生成仅使用工程类纪要作为Q&A数据来源
说明:学习研究类纪要是可选补充来源
```
**情况3工程类纪要中无问题章节**
```
处理:
- 如果学习研究类纪要存在且有Q&A → 使用学习研究类纪要
- 如果都没有 → "二、工作问题 Q&A"章节输出"本次会议无记录的问题讨论"
```
**情况4会议中无方法分享**
```
处理:
- 如果周报中有经验总结 → 使用周报内容
- 如果都没有 → "三、重点工作方法"章节输出"本次会议无记录的方法分享"
```
**情况5同一问题在多个来源中重复**
```
工程类纪要和学习研究类纪要都有同一问题
处理:
- 语义匹配后合并
- 问题描述取更完整的版本
- 解决方案列表合并去重
```
**情况6方法分享过于零散**
```
会议中零散提到多个小技巧,但没有系统性方法
处理:
- 相关技巧归类合并为一个"方法"
- 标题使用归纳性名称(如"XX相关技巧汇总"
```
---
## 五、执行流程总结
```
Phase 1: 检查依赖
├── 检查工程类会议纪要是否存在(必需)
├── 检查学习研究类会议纪要是否存在(可选)
└── 检查会议转写和周报文件(用于提取方法)
Phase 2: 提取会议信息
└── 从工程类纪要复用"会议信息"章节
Phase 3: 提取工作问题 Q&A
├── 从工程类纪要提取"问题及解决方案"
├── 从学习研究类纪要提取"关键讨论成果"中的Q&A可选
├── 从成员反馈中提取问题建议(可选)
└── 合并去重,按项目分组
Phase 4: 提取重点工作方法
├── 调用Agent从会议转写提取方法分享
├── 从周报提取经验总结
└── 合并整理,生成完整方法结构
Phase 5: 最终输出
├── 组装所有章节
└── 写入文件output/Q&A资源库类会议纪要_{date}_第X次周会.md
```
---
## 六、输出文件命名规则
- **文件名格式**`Q&A资源库类会议纪要_{date}_第X次周会.md`
- **日期格式**YYYY-MM-DD
- **周会次数**:与工程类纪要保持一致
**示例**`Q&A资源库类会议纪要_2025-11-18_第二次周会.md`

View File

@ -0,0 +1,415 @@
# 工程类会议纪要生成逻辑梳理
## 一、输出结构总览
```
工程类会议纪要
├── 一、会议信息
├── 二、工作内容
│ ├── 1. 重点项目进展情况汇总(表格)
│ ├── 2. 重点项目问题及解决方案
│ ├── 3. 下周工作安排(表格)
│ └── 4. 组内成员工作进展
└── 三、会议总结
```
---
## 项目类型区分规则
**核心问题**:周报中没有"学习类"/"工程类"标签,两类项目都混在"P0任务完成情况"和"详细工作内容"中。
**区分方法**
1. **资料库指引** ⭐:项目在 `input/成员本周资料库/` 下有对应md文件 → 学习研究类
2. **语义判断**:根据任务性质(知识获取/技能提升 vs 产出交付/功能实现)语义判断
**背景**成员会以周报为顶层讲到学习内容时打开资料库里的md进行分享资料库中的项目通常是学习研究类。
**本文档仅处理工程类项目**,学习研究类项目参见 `学习研究类会议纪要生成逻辑.md`
---
## 二、章节数据来源与处理动作
### 第一部分:会议信息
#### 输出格式
```markdown
一、会议信息
- 会议名称:日期+第X次周会
- 会议时间2025-11-18
- 参会人员:连云波、江争达、闫旭隆、陶西平、郝倩玉
- 记录整理人Claude
```
#### 数据来源映射
| 字段 | 主要来源 | 处理逻辑 |
|------|---------|---------|
| 会议名称 | 自动生成 | 根据会议时间生成"YYYY-MM-DD_第X次周会" |
| 会议时间 | 会议转写文件名 | 从文件名提取日期:"20251118134948-转写..." → "2025-11-18" |
| 参会人员 | 成员周报文件名列表 | 提取所有周报的作者名:`20251118-闫旭隆周报.md` → "闫旭隆"<br>**规则**:交了周报的人即为参会人员 |
| 记录整理人 | 固定值 | 固定为"Claude" |
#### 需要的动作
1. 解析会议转写文件名,提取日期并格式化为"YYYY-MM-DD"
2. 遍历周报文件名,提取所有姓名并去重,组成参会人员列表
3. 自动计算会议次数(根据历史纪要数量)或默认显示"第X次周会"
4. 记录整理人固定填写"Claude"
---
### 第二部分-1重点项目进展情况汇总表格⭐核心追踪
> ⚠️ **仅处理工程类项目**,学习研究类项目由 Phase 4 单独生成纪要
#### 输出格式
```markdown
| 项目名称 | !!!原负责人 | 截止时间 | 项目进展情况 |
|---------|--------|----------|-------------|
| 开发规范建立 | 连云波、闫旭隆 | 11月18日 | 闫旭隆完成需求文档Skill开发 |
| 会议纪要流程 | 江争达 | 11月18日 | 未完成(上周计划本周未在周报中体现) |
```
#### 数据来源映射
**核心原则****仅展示P0项目****必须包含上周计划的所有P0任务**非P0任务不在此处展示
| 表格列 | 数据来源 | 处理规则 |
|--------|---------|---------|
| 项目名称 | ⭐ 上周纪要"下周工作安排"中的**仅P0任务**<br>⭐ 本周成员周报"P0任务完成情况"表格 | **取并集**上周P0 本周P0<br>上周P0必须全部出现<br>⭐**非P0任务不在此处展示** |
| 负责人 | • 上周纪要"下周工作安排"中的负责人<br>• 本周周报作者姓名若该P0只出现在成员周报里 | 多人负责时合并显示 |
| 截止时间 | • 本周成员周报"P0任务"中的备注/时间<br>• 上周纪要"下周工作安排"中的截止时间**(!!注明,都保留)** | **周报优先** > 上周纪要<br>周报中有则用周报,无则用上周纪要 |
| 项目进展情况 | ⭐⭐ 本周成员周报"P0任务"的状态列 | **有且仅有**本周周报,**不参考会议转写(!!参考会议转写更新最新状态)**<br>• 如果周报中有该P0 → 填写状态+备注<br>• 如果周报中无该P0 → 自动填写"未完成(上周计划本周未在周报中体现)" |
#### 数据交叉验证规则 ⭐⭐⭐
**规则1强制包含上周P0任务**
```
上周纪要"下周工作安排"中的所有P0任务必须在本周进展汇总中出现
- 如果该任务在本周周报中有 → 填写周报中的进展情况
- 如果该任务在本周周报中无 → 自动标记"未完成(上周计划本周未在周报中体现)"
```
**规则2新增本周P0任务**
```
本周周报"P0任务"中新出现的任务(上周纪要中没有):
- 必须添加到本周进展汇总中
- 不能忽略
```
**规则3项目匹配逻辑**
```
交给Claude根据语义判断"上周任务A"与"本周任务B"是否为同一项目:
- 示例:"需求文档Skill开发" ≈ "开发规范-需求文档生成阶段Skill"
```
#### 特殊情况处理
**情况1负责人变更**
```
上周项目A - 负责人:张三
本周项目A - 负责人:李四
处理:标注"已转交给李四"
```
**情况2任务名称差异较大**
```
上周:会议纪要流程文档
本周会议纪要Skill需求文档
如果语义相似度 < 85%
→ 认为是两个不同任务
→ 都要在进展汇总中显示
```
**情况3截止时间冲突**
```
上周项目A - 截止时间11月18日
本周项目A - 截止时间11月25日
处理以本周周报为准11月25日
```
---
### 第二部分-2重点项目问题及解决方案
#### 输出格式
```markdown
#### 问题1: 会议纪要信息提取准确性问题
**问题描述:** XXX
**解决方案:**
1. ...
2. ...
**责任人:** XXX
**截止时间:** XXX
```
#### 数据来源映射
**核心原则**:会议转写与周报是互补关系,需合并两者信息
| 字段 | 数据来源(互补关系) | 提取与合并逻辑 |
|------|---------------------|---------------|
| 项目名称 | 会议转写问题讨论上下文 + 周报"遇到的问题" | 从问题描述中推断所属项目,两者互相验证 |
| 问题描述 | 会议转写问题阐述 + 周报"遇到的问题" | 合并两者:周报提供问题初步描述,会议提供详细讨论和分析 |
| 解决方案 | 会议转写讨论结论 + 周报"解决方法" | 合并两者:周报可能有初步方案,会议讨论后确定最终方案 |
| 责任人 | 会议转写上下文推断 + 周报作者 | 会议中明确分配的责任人,若无则用周报作者(问题提出人) |
| 截止时间 | 会议转写上下文推断 + 会议转写时间 | 会议中提取明确时间,无则默认下周周会前(写具体日期) |
#### 需要的动作
**动作1从周报提取问题**
- 遍历所有周报,读取"二、遇到的问题"章节
- 提取:问题描述、解决方法(如已填写)
- 关联问题提出人
**动作2从会议转写提取问题讨论**
- 语义识别问题讨论片段(提出问题→分析→讨论→方案)
- 提取:问题完整描述、原因分析、讨论要点、确定方案
- **责任人**:从会议上下文推断(识别"XX负责"、"XX去做"等)
- **截止时间**:从会议中提取明确时间,无则默认下周周会前(写具体日期,如"11月25日"
**动作3问题去重与合并 ⭐互补关系**
- 将周报问题与会议讨论问题进行语义匹配,注意去重
- **合并信息**
- 问题描述:周报的简洁描述 + 会议的详细分析 → 综合描述
- 解决方案:周报的初步方法 + 会议的讨论结论 → 最终方案
- 责任人:优先使用会议上下文推断的责任人,无则用周报作者
- 截止时间:使用会议中提取的时间,写具体日期
**动作4结构化输出**
- 按项目分组问题
- 格式化:问题描述简洁、解决方案分点列表
---
### 第二部分-3下周工作安排表格⭐核心
> ⚠️ **仅处理工程类项目**,学习研究类项目由 Phase 4 单独生成纪要
#### 输出格式
```markdown
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|---------|--------|----------|--------|----------|
| 🔴 Deepresearch Skill开发 | 闫旭隆 | 实现知识图谱增量更新 | P0 | 11月25日 |
| 招投标技术方案调研 | 闫旭隆 | 调研文档处理能力 | P1 | 11月30日 |
```
#### 数据来源映射
**核心原则**:会议转写与周报是互补关系,去重合并;冲突时以会议为准
| 表格列 | 数据来源(互补关系) | 提取与合并逻辑 |
|--------|---------------------|---------------|
| 项目名称 | 会议转写任务安排讨论 + 成员周报"下周计划" | 合并两者任务,注意语义去重 |
| 负责人 | 会议中明确分配 + 周报作者 | 冲突时会议优先;无冲突时取并集;会议未提及的周报任务用周报作者 |
| 下周会前目标 | 会议讨论的具体目标 + 周报"下周计划"描述 | 合并两者描述,冲突时会议优先,周报补充细节 |
| 优先级 | ⭐⭐会议转写语义推断 + 周报标记(若有) | **核心**从会议讨论的重要性、紧急程度、领导强调程度语义判断P0/P1/P2会议未提及的周报任务默认P1 |
| 截止时间 | 会议转写明确时间 + 周报时间 | 冲突时会议优先,无冲突时取更明确的;都无则推断(默认下次周会前,写具体日期) |
#### 需要的动作
**动作1从会议转写提取任务安排**
- 语义识别任务分配片段("下周XX负责XX"、"XX需要完成XX"、"这个很重要"
- 提取:任务名称、具体目标、负责人、截止时间
- **优先级判断规则**
- 领导明确说"P0"或"优先"、"重点"、"紧急" → P0
- 领导反复强调、讨论时间长、要求本周完成 → P0
- 一般性安排、探索性任务、长期任务 → P1
- 探索性任务、长期优化、低优先级事项 → P2
- 无法判断 → 默认P1
**动作2从周报提取下周计划**
- 遍历所有周报,读取"下周计划"章节
- 提取:任务名称、任务描述
- 注意:周报往往不全且无优先级标记
**动作3任务合并与去重 ⭐互补关系**
- 语义匹配去重,注意识别同一任务
- **互补合并**:会议任务 + 周报任务 → 去重后的完整任务列表
- **冲突处理规则**
- 同一任务的负责人冲突 → 以会议为准
- 同一任务的优先级冲突 → 以会议为准
- 同一任务的截止时间冲突 → 以会议为准(写具体日期,如"11月25日"
- 会议未提及但周报有的任务 → 保留默认P1
- **截止时间处理**:都无明确时间时,默认下次周会前,写具体日期
- 计算逻辑:本次会议时间 + 7天假设周会频率为每周一次
- 示例本次会议2025-11-18 → 默认截止时间2025-11-25
**动作4优先级排序 ⭐⭐⭐核心规则**
```
核心规则P0任务必须排在P1任务之前P1任务必须排在P2任务之前
排序逻辑:
1. 先按优先级分组P0组、P1组、P2组
2. 组内按截止时间排序(紧急的在前)
3. P0任务标记🔴emoji
输出顺序:[P0任务1] [P0任务2] ... [P1任务1] [P1任务2] ... [P2任务1] [P2任务2] ...
```
---
### 第二部分-4组内成员工作进展
> ⚠️ **下周任务仅列工程类项目**,学习研究类项目由 Phase 4 单独生成纪要
#### 输出格式
```markdown
#### 闫旭隆
**上周完成:**
- ✅ 需求文档生成Skill的MVP开发
- ✅ Skill开发规范总结
**进行中:**
- 🔄 Deepresearch框架学习
**收到的反馈/学习建议:**
- 项目理解Skill框架获得认可
- 需继续深入Claude Code优化研究
**下周任务:**
- [ ] 🔴 P0|Deepresearch Skill开发
- [ ] P1|招投标技术方案调研
```
#### 数据来源映射
| 部分 | 主要来源 | 备选来源 | 提取逻辑 |
|------|---------|---------|---------|
| 上周完成 | 周报"P0任务完成情况"+"详细工作内容" | 无备选 | 提取状态为"已完成"或✅的项 |
| 进行中 | 周报"详细工作内容"中未完成项 | 会议讨论的进行中工作 | 提取状态为"进行中"或🔄的项 |
| 收到反馈 | 会议转写中领导对该成员的评价 | - | ⭐根据语义理解提取反馈(不依赖转写说话人识别) |
| 下周任务 | 会议分配给该成员的任务 | 周报"下周计划" | ⭐以会议为准按P0→P1→P2排序<br>**合并规则**<br>1. 会议中明确分配给该成员的任务(带优先级)<br>2. 周报"下周计划"中的任务会议未提及的默认P1<br>3. 语义去重后按优先级排序 |
#### 需要的动作
**动作1为每个成员提取周报信息**
- 提取"上周完成"P0任务状态="已完成"的项 + 详细工作内容✅项
- 提取"进行中":详细工作内容🔄项 + 未完成的P0任务
- 提取"下周任务""下周计划"章节的所有条目
**动作2从会议转写提取个人反馈**
- 在会议转写中搜索:涉及成员姓名的对话片段
- ⭐**注意**:转写说话人识别不可靠,根据语义理解谁在给谁反馈(批评/表扬语气、内容逻辑)
- 语义理解:正面评价、建议、批评
- 提取并整理为1-3条关键反馈
**动作3下周任务合并与排序 ⭐⭐⭐**
- 从"下周工作安排"表格中筛选该成员负责的任务
- 与成员周报"下周计划"合并去重
- **核心规则**:每个成员的"下周任务"内部也要按P0→P1→P2排序
- 格式:`- [ ] 🔴 P0|任务名称`(无空格)
---
### 第三部分:会议总结
#### 输出格式
```markdown
三、会议总结
**核心议题:** 开发规范建设、会议纪要流程规范化、Deepresearch框架选型
**关键决策:**
1. 暂停江争达参与开发规范建设,要求先系统学习
2. 采用闫旭隆的项目理解框架作为开发规范正面案例
3. 会议纪要本周进行现场测试
**下周工作重点:**
1. 会议纪要现场测试
2. Deepresearch Skill开发
3. 市场部需求对接
```
#### 数据来源映射
| 部分 | 主要来源 | 备选来源 | 提取逻辑 |
|------|---------|---------|---------|
| 核心议题 | 会议转写中讨论最多的2-4个主题通常是P0优先级 | "重点项目进展"的项目列表 | 统计高频关键词或主题提取3-5个 |
| 关键决策 | 会议转写中的决策性语句 | - | 识别"决定"、"确定"、"采用"等关键词 |
| 下周重点 | 已生成的"下周工作安排"中P0任务 | 会议结尾总结部分 | 提取P0任务归纳为3-5条 |
#### 需要的动作
**动作1提取核心议题**
- 方法1对会议转写进行主题建模识别讨论最多的3-5个主题
- 方法2统计项目名称出现频率提取讨论时长最长的话题
**动作2识别关键决策**
- 在会议转写中语义搜索决策性语句
- 特征:"决定..."、"确定..."、"采用..."、"要求..."
- 提取3-5条最重要的决策
**动作3生成下周重点**
- 从"下周工作安排"表格提取所有P0任务
- 按项目或主题归类
- 归纳为3-5条工作重点
---
## 三、关键的跨章节关联
### 1. 任务追踪线索(纵向连续性)
```
上周纪要"下周工作安排"
本周"重点项目进展情况汇总"(对应完成情况)
本周"组内成员工作进展"(个人维度的完成情况)
本周"下周工作安排"(新的计划)
```
**处理逻辑**
- 建立任务ID映射表
- 追踪任务状态变化:计划→进行中→已完成
- 标记未完成任务的延续
### 2. 问题闭环(横向关联)
```
"重点项目问题及解决方案"
"下周工作安排"(问题的解决任务)
```
### 3. 优先级一致性(全局规则)⭐⭐⭐
**所有涉及任务的地方必须遵循优先级排序原则:**
- 重点项目进展:**仅显示P0任务**
- 下周工作安排P0在前P1居中P2在后非P0任务也会出现
- 组内成员进展每人的下周任务也按P0→P1→P2排序**非P0任务会出现在这里**
- 会议总结:下周重点 = P0任务
---
## 四、关键数据优先级规则总结
| 字段/章节 | 数据来源 | 优先级规则 | 说明 |
|----------|---------|-----------|------|
| **项目进展-项目名称** | 上周纪要P0 + 本周周报P0 | **取并集仅P0** | 上周P0必须全部出现非P0任务不展示 |
| **项目进展-负责人** | 上周纪要 + 本周周报 | 哪里有就填哪个 | 多人时合并显示 |
| **项目进展-截止时间** | 本周周报 / 上周纪要 | **周报优先** | 周报可能更准确 |
| **项目进展-进展情况** | 本周周报 | **仅周报** | 不参考会议转写 |
| **问题方案-问题描述** | 会议转写 + 周报 | **互补合并** | 周报提供问题简述,会议提供详细分析和方案 |
| **下周安排-任务** | ⭐会议转写 + 周报 | **互补合并** | 两者去重合并冲突时会议为准包含P0/P1/P2 |
| **下周安排-优先级** | ⭐会议转写语义推断 + 周报标记 | **会议判断为主** | 会议语义判断P0/P1/P2会议未提及的周报任务默认P1 |
| **下周安排-负责人/时间** | 会议 + 周报 | **冲突时会议为准** | 同一任务的字段冲突时,以会议为准 |
| **成员进展-下周任务** | 会议分配 + 周报计划 | **会议为准,合并去重** | 包含P0/P1/P2任务按优先级排序 |
| **成员进展-反馈** | 会议转写 | 仅会议 | 语义提取,不依赖说话人识别 |

View File

@ -0,0 +1,191 @@
# 学习研究类会议纪要生成逻辑
## 一、输出结构总览
```
学习研究类会议纪要
├── 一、会议信息
└── 二、学习研究内容
├── 1. 议题标题1 (分享人)
│ ├── 背景与目的
│ ├── 核心议题概述
│ ├── 关键讨论成果
│ └── 下一步研究方向
├── 2. 议题标题2 (分享人)
└── ...
```
---
## 项目类型区分规则 ⭐⭐⭐
**核心问题**:周报中没有"学习类"标签,工程类和学习研究类项目都混在"P0任务完成情况"和"详细工作内容"中。
**区分方法**
1. **资料库指引** ⭐:项目在 `input/成员本周资料库/` 下有对应md文件 → 学习研究类
2. **语义判断**:根据任务描述的性质(知识获取/技能提升 vs 产出交付/功能实现)语义判断
**资料库路径**`D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\input\成员本周资料库\`
**背景**成员会以周报为顶层讲到对应学习内容时打开资料库里的md进行分享。
---
## 二、章节数据来源与处理动作
### 第一部分:会议信息
#### 输出格式
```markdown
一、会议信息
- 会议时间2025-11-18
- 参会人员:连云波、江争达、闫旭隆、陶西平、郝倩玉
- 记录整理人Claude
```
#### 数据来源映射
| 字段 | 主要来源 | 处理逻辑 |
|------|---------|---------|
| 会议时间 | 会议转写文件名 | 从文件名提取日期:"20251118134948-转写..." → "2025-11-18" |
| 参会人员 | 成员周报文件名列表 | 提取所有周报的作者名:`20251118-闫旭隆周报.md` → "闫旭隆"<br>**规则**:固定"连云波"+交了周报的人即为参会人员 |
| 记录整理人 | 固定值 | 固定为"Claude" |
#### 需要的动作
1. 解析会议转写文件名,提取日期并格式化为"YYYY-MM-DD"
2. 遍历周报文件名,提取所有姓名并去重,组成参会人员列表
3. 自动计算会议次数(根据历史纪要数量)或默认显示"第X次周会"
4. 记录整理人固定填写"Claude"
---
### 第二部分:学习研究内容
#### 输出格式
```markdown
### 1. 议题标题 (分享人)
**背景与目的:**
- 学习来源及理论背景
- 研究目的与问题背景
**核心议题概述:**
- 核心观点或理论要点
- 关键技术或方法论
**关键讨论成果:**
- 会议讨论中的Q&A
- 成员反馈与建议
- 形成的共识或结论
**下一步研究方向:**
- 方向1具体方向描述
- 方向2具体方向描述
- 方向3具体方向描述
```
#### 数据来源映射
**核心原则**:三个数据源是互补关系,需要合并整合
| 字段 | 数据来源(互补关系) | 提取与合并逻辑 |
|------|---------------------|---------------|
| 议题标题 | 周报"P0任务完成情况"+"详细工作内容" + 会议转写议题识别 | 从会议转写识别讨论主题,与周报学习内容匹配去重 |
| 分享人 | 周报项目所属作者+会议转写上下文推断 | 从会议转写识别发言人,匹配周报作者 |
| 背景与目的 | 周报项目内容描述 + 资料库文档上下文需要Agent总结精要 | 周报提供学习目的,资料库提供理论背景 |
| 核心议题概述 | 周报学习项目总结 + 资料库文档上下文需要Agent总结精要 | 资料库提供详细理论要点,周报提供简要总结 |
| 关键讨论成果 | ⭐会议转写讨论片段 + 周报反思 | 会议转写提取Q&A和讨论结论周报补充个人反思 |
| 下一步研究方向 | 会议转写讨论结论 + 周报下周计划 | 会议讨论中形成的研究方向,结合周报计划 |
#### 需要的动作
**说明**动作1-3由主窗口在 Phase 1.5 执行动作4-5由 Phase 4 执行。
**动作1扫描资料库主窗口执行**
- `Glob: input/成员本周资料库/*.md`
- **轻量读取**:只读取文件名 + 前100行标题、摘要
- ⚠️ 不读取完整内容,避免污染上下文
- 提取:文件名、文档标题、简要描述
- 作为"确定学习研究类"的强指引
**动作2遍历周报提取项目主窗口执行**
- 遍历所有周报的"P0任务完成情况"+"详细工作内容"
- 对每个项目判断类型:
- 检查资料库是否有对应md → `has_library_file=true`
- 语义判断是否为学习研究类(知识获取/技能提升 vs 产出交付/功能实现)
- 提取:项目名、成员、周报描述
**动作3合并去重主窗口执行**
- 资料库有 + 周报有 → 学习研究类(资料库里有的周报一定有)
- 资料库无 + 周报有(语义判断为学习类) → 学习研究类
- 去重后构建 `learning_projects` 列表:
```python
learning_projects = [
{
"name": "Claude Code Skill学习",
"member": "闫旭隆",
"has_library_file": true,
"library_path": "input/成员本周资料库/xxx.md",
"weekly_content": "周报描述..."
}
]
```
**动作4提取详细内容调用 transcript_searcher Agent**
- 主窗口传递 `learning_projects` 给 Agent
- Agent 根据 `has_library_file` 字段决定内容来源:
- `true`:读取 `library_path` 资料库md + 会议转写
- `false`:仅从会议转写上下文推断
- Agent 提取:议题标题、分享人、背景与目的、核心议题概述、关键讨论成果、下一步研究方向
- **合并规则**
- 背景与目的:周报学习目的 + 资料库/会议背景
- 核心议题概述:资料库核心内容(有资料库时)或会议推断(无资料库时)
- 关键讨论成果会议Q&A + 反馈 + 共识
- 下一步方向:会议讨论结论 + 周报下周计划
**动作5结构化输出主窗口执行**
- 遍历 Agent 返回的 topics按模板格式化
- 按议题组织内容通常2-5个议题
- 按讨论顺序或重要性排序
- 每个议题独立成节,格式统一
---
## 三、关键数据优先级规则总结
| 字段 | 数据来源 | 优先级规则 | 说明 |
|------|---------|-----------|------|
| **议题标题** | 会议转写 + 周报 | **会议优先** | 会议中讨论的主题更准确,周报标题作为补充 |
| **分享人** | 会议转写推断 + 周报作者 | **会议为准** | 从会议上下文识别实际分享人 |
| **背景与目的** | 周报 + 资料库 | **互补合并** | 周报提供学习目的,资料库提供理论背景 |
| **核心议题概述** | 资料库 + 周报 | **资料库优先** | 资料库提供详细理论,周报提供简要概括 |
| **关键讨论成果** | 会议转写 + 周报 | **会议为主** | 会议讨论内容是核心,周报反思作为补充 |
| **下一步方向** | 会议转写 + 周报 | **会议优先** | 会议讨论中形成的方向更明确,周报计划作为补充 |
---
## 四、特殊情况处理
**情况1资料库文件过大**
```
资料库中PDF/论文超过50页
处理:只提取摘要、引言、结论章节,不读取全文
```
**情况2多人分享同一主题**
```
会议中多人共同讨论一个理论/项目
处理:分享人标注为"张三、李四",合并所有人的观点到一个议题
```
**情况3周报学习内容会议未讨论**
```
周报中提到的学习内容,但会议中未讨论
处理:保留该议题,标注"(未在会议中讨论)",内容仅基于周报和资料库
```
**情况4会议讨论内容周报未提及**
```
会议中临时讨论的学习内容,但周报中未记录
处理:保留该议题,基于会议转写提取背景和讨论内容
```

View File

@ -0,0 +1,900 @@
---
name: meeting-minutes-generator-v1
description: 会议纪要生成器。当用户说"生成会议纪要"、"生成本周纪要"、"会议纪要"时自动触发。根据会议转写、成员周报、上周纪要生成三类结构化会议纪要工程类、学习研究类、Q&A资源库类。
---
# 会议纪要生成器
你是专业的会议纪要生成专家负责编排整个生成流程调度agents合并多源数据输出三类结构化会议纪要。
## 固化路径配置
```
输入文件位置:
- 会议转写D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\input\本周会议转写文本\*.txt
- 成员周报D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\input\成员本周周报\*.md
- 上周纪要D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\input\上周会议纪要\*.md
- 成员资料库D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\input\成员本周资料库\*.md
临时文件:
- 索引文件D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\temp\transcript_index.json
输出位置:
- 工程类output\工程类会议纪要_{date}_第X次周会.md
- 学习研究类output\学习研究类会议纪要_{date}_第X次周会.md
- Q&A资源库类output\Q&A资源库类会议纪要_{date}_第X次周会.md
```
## 整体流程概览
```
Phase 1: 准备阶段(读取输入、构建索引、区分项目类型)
├─ 1.1 初始化目录temp/、output/
├─ 1.2 读取所有成员周报 → members_data
├─ 1.3 读取上周会议纪要 → last_week_p0_tasks
├─ 1.4 提取会议日期 → meeting_date, default_deadline
├─ 1.5 调用 transcript_indexer Agent → 构建语义索引
└─ 1.6 项目类型区分 ⭐新增
├─ 扫描资料库(轻量读取,仅标题+前100行
├─ 遍历周报项目 + 语义判断
├─ 合并去重
└─ 输出engineering_projects + learning_projects
Phase 2: 工程类会议纪要生成(仅处理 engineering_projects
├─ 2.1 会议信息(主窗口直接生成)
├─ 2.2 重点项目进展汇总主窗口用周报仅P0工程类
├─ 2.3 重点项目问题及解决方案Agent搜索 + 主窗口合并)
├─ 2.4 下周工作安排Agent搜索 + 主窗口排序,仅工程类)
├─ 2.5 组内成员工作进展并行Agents + 主窗口整合,下周任务仅工程类)⭐
└─ 2.6 会议总结Agent搜索 + 主窗口归纳)
Phase 3: 工程类纪要输出
└─ 组装所有章节并写入文件
Phase 4: 学习研究类会议纪要生成(仅当 learning_projects 非空时执行)
├─ 4.1 提取学习研究内容(调用 transcript_searcher
├─ 4.2 整合生成纪要(主窗口)
└─ 4.3 输出学习研究类纪要文件
Phase 5: Q&A资源库类会议纪要生成二次提取在 Phase 3/4 之后执行)
├─ 前置检查:工程类纪要是否存在(必需)
├─ 5.1 复用会议信息(主窗口)
├─ 5.2 提取工作问题 Q&A主窗口
├─ 5.3 提取重点工作方法调用Agent + 主窗口)
└─ 5.4 输出Q&A资源库类纪要文件
```
---
## Phase 1: 准备阶段
### 步骤 1.1: 初始化目录
**操作**:确保必要目录存在
1. 检查/创建 `temp/` 目录(用于存放索引文件)
2. 检查/创建 `output/` 目录(用于存放输出文件)
**路径**
- temp: `D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\temp\`
- output: `D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\output\`
---
### 步骤 1.2: 读取成员周报
**操作**
1. Glob查找周报文件`D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\input\成员本周周报\*.md`
2. 对每个周报文件:
- 从文件名提取成员姓名(如 `20251118-闫旭隆周报.md` → "闫旭隆"
- Read读取完整内容
- 提取关键信息:
- P0任务列表从"P0任务完成情况"表格)
- 遇到的问题(从"二、遇到的问题"章节)
- 下周计划(从"下周计划"章节)
- 已完成任务(从详细工作内容提取带✅的项)
- 进行中任务(从详细工作内容提取带🔄的项)
**构建数据**
- 为每个成员构建包含上述信息的数据结构
- 汇总参会人员列表(所有交周报的成员姓名)
### 步骤 1.3: 读取上周会议纪要
**操作**
1. Glob查找上周纪要`D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\input\上周会议纪要\*.md`(应只有一个)
2. Read读取文件
3. 提取"三、下周工作安排"表格中的**所有P0任务**
- 项目名称
- 负责人
- 截止时间
**构建数据**保存上周P0任务列表供后续追踪
### 步骤 1.4: 提取会议日期
**操作**
1. Glob查找会议转写文件`D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\input\本周会议转写文本\*.txt`
2. 从文件名提取日期并格式化:
-`20251118134948-转写...txt` → "2025-11-18"
3. 计算默认截止时间:会议日期 + 7天假设周会频率
> ⚠️ **注意**:本步骤只需从 Glob 返回的文件名中提取日期,**不要使用 Read 工具读取转写文件内容**。转写文件内容由步骤1.5的 transcript_indexer Agent 处理。
### 步骤 1.5: 构建会议转写索引
**操作**:调用 transcript_indexer Agent
```python
Task(
subagent_type="transcript_indexer",
description="构建会议转写索引",
prompt="构建会议转写索引"
)
```
**Agent输出**
- 文件:`D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\temp\transcript_index.json`
- 返回:简要摘要(如 "✅ 索引构建完成共N块识别M个主题"
- 分块参数每块300行50行重叠即每块从+250位置开始
**验证**:检查索引文件是否存在
---
### 步骤 1.6: 项目类型区分 ⭐新增
**操作**
1. 扫描资料库:`Glob: input/成员本周资料库/*.md`
2. **轻量读取资料库**(仅用于判断,避免污染上下文):
- 只读取文件名 + 前100行标题、摘要
- 提取:文件名、文档标题、简要描述
- ⚠️ 不读取完整内容,详细内容由 Phase 4 Agent 按需读取
3. 遍历 `members_data` 中所有项目P0任务 + 详细工作内容)
4. 对每个项目判断类型:
- 资料库有对应md → 学习研究类
- 语义判断(知识获取/技能提升 vs 产出交付/功能实现)
5. 合并去重(资料库有的周报一定有)
**构建数据**
```python
# 工程类项目(供 Phase 2-3 使用)
engineering_projects = [
{"name": "项目A", "member": "闫旭隆", "p0_tasks": [...], "problems": [...]}
]
# 学习研究类项目(供 Phase 4 使用)
learning_projects = [
{
"name": "Claude Code Skill学习",
"member": "闫旭隆",
"has_library_file": True,
"library_path": "input/成员本周资料库/xxx.md",
"weekly_content": "周报描述..."
}
]
```
**判断结果**
- `learning_projects` 非空 → Phase 4 执行
- `learning_projects` 为空 → Phase 4 跳过
---
## Phase 2: 工程类会议纪要生成
> ⚠️ **本阶段仅处理工程类项目**`engineering_projects`),学习研究类项目由 Phase 4 处理
### 步骤 2.1: 生成"一、会议信息"
**数据来源**:主窗口已有数据(会议日期、参会人员)
**处理逻辑**
- 填充会议时间
- 填充参会人员列表(用顿号分隔)
- 记录整理人固定为"Claude"
**无需Agent**,主窗口直接生成 ✅
---
### 步骤 2.2: 生成"### 1. 重点项目进展情况汇总"
**核心原则**:⭐ **仅展示工程类P0任务非P0任务和学习研究类项目不在此处展示**
**数据来源**
1. 上周纪要的P0任务
2. 本周周报的P0任务
**处理逻辑**
**1. 收集所有P0任务取并集**
- 上周P0任务必须全部包含初始状态标记为"待查询"
- 本周周报的P0任务语义去重后添加
- 语义匹配规则:任务相似度 >85% 认为是同一任务
**2. 查询进展情况**
- 在本周周报中找到该任务 → 填写周报中的状态和备注
- 在本周周报中未找到 → 标记"未完成(上周计划本周未在周报中体现)"
- 负责人处理:合并上周和本周的负责人(多人时用顿号分隔)
- 截止时间:周报优先,周报无则用上周纪要
**3. 生成表格**
- 输出格式:| 项目名称 | 负责人 | 截止时间 | 项目进展情况 |
- 按项目顺序排列
**无需Agent**,主窗口直接处理 ✅
---
### 步骤 2.3: 生成"### 2. 重点项目问题及解决方案"
**核心原则**:会议转写与周报互补,合并信息
#### 2.3.1: 提取会议问题讨论调用Agent
**操作**:调用 transcript_searcher Agent
```python
# 准备已知问题列表(来自周报)
known_problems = []
for member, data in members_data.items():
for problem in data["problems"]:
known_problems.append({
"member": member,
"description": problem["description"],
"solution": problem.get("solution", "")
})
# 调用Agent
Task(
subagent_type="transcript_searcher",
description="提取问题讨论",
prompt=f"""提取会议中讨论的所有问题及解决方案。
会议日期:{meeting_date}
默认截止时间:{default_deadline}(下次周会前)
已知问题(来自周报):
{json.dumps(known_problems, ensure_ascii=False, indent=2)}
请提取会议中讨论的问题,包括:
- 问题标题
- 问题详细描述
- 解决方案(列表形式)
- 责任人(从讨论上下文语义推断)
- 截止时间明确时间或null无明确时间则使用默认截止时间
返回JSON格式类型2提取问题讨论
"""
)
```
**Agent返回**JSON字符串实际数据在`data`字段内):
```json
{
"search_intent": "提取问题讨论",
"matched_blocks": [2, 4],
"data": {
"problems": [
{
"problem_title": "会议纪要信息提取准确性问题",
"problem_description": "...",
"solutions": ["方案1", "方案2"],
"assignees": ["江争达", "郝倩玉"],
"deadline": "2025-11-25"
}
]
}
}
```
#### 2.3.2: 合并周报与会议问题(主窗口)
**处理逻辑**
**1. 合并去重**
- 将会议提取的问题与周报问题进行语义匹配(相似度>80%
- 匹配成功:合并信息
- 问题描述:会议的详细描述 + 周报的简述
- 解决方案:合并两者的方案列表
- 责任人:以会议判断为准
- 截止时间:会议优先,无则用默认截止时间
- 未匹配:保留为独立问题
**2. 补充周报独有问题**
- 周报中的问题在会议中未讨论 → 添加到问题列表
- 解决方案:若周报有则填写,无则标记"待讨论"
- 责任人:问题提出人(周报作者)
- 截止时间:默认截止时间
**3. 生成输出**
- 按问题编号生成章节
- 格式:#### 问题N: 标题
- 包含:问题描述、解决方案列表、责任人、截止时间
---
### 步骤 2.4: 生成"### 3. 下周工作安排"
**核心原则**:仅工程类项目,会议+周报互补冲突时会议优先按P0→P1→P2排序
#### 2.4.1: 提取会议任务安排调用Agent
**操作**
```python
Task(
subagent_type="transcript_searcher",
description="提取任务安排",
prompt=f"""提取会议中讨论的下周工作安排。
会议日期:{meeting_date}
默认截止时间:{default_deadline}(下次周会前)
已知P0任务上周计划
{json.dumps([t["name"] for t in last_week_p0_tasks], ensure_ascii=False)}
请提取任务安排,包括:
- 任务名称
- 负责人
- 任务描述
- 优先级从讨论语气判断P0/P1/P2
- P0领导明确强调"优先"、"重点"、"紧急",或反复讨论
- P1一般性安排、常规任务
- P2探索性任务、长期优化、低优先级
- 截止时间明确时间或null
返回JSON格式类型1提取任务安排
"""
)
```
**Agent返回**(实际数据在`data`字段内):
```json
{
"search_intent": "提取任务安排",
"matched_blocks": [1, 3, 5],
"data": {
"tasks": [
{
"task_name": "Deepresearch Skill开发",
"assignees": ["闫旭隆"],
"description": "实现知识图谱增量更新",
"priority": "P0",
"deadline": null
}
]
}
}
```
#### 2.4.2: 合并周报与会议任务(主窗口)
**处理逻辑**
**1. 整合任务列表**
- 会议任务直接添加保留Agent判断的优先级和截止时间
- 周报任务会议未提及的添加默认优先级P1默认截止时间
- 去重规则:语义匹配,相似度>85%认为同一任务
**2. 冲突处理**
- 同一任务的负责人冲突 → 以会议为准
- 同一任务的优先级冲突 → 以会议为准
- 同一任务的截止时间冲突 → 以会议为准
**3. 保存数据**
- 保存合并后的任务列表 `next_week_tasks`
- ⭐ 重要步骤2.5和2.6会使用这个列表
#### 2.4.3: 优先级排序
**核心规则**P0任务在前P1居中P2在后
**排序步骤**
1. 按优先级分组P0组、P1组、P2组
2. 组内按截止时间排序(早的在前)
3. 合并P0 + P1 + P2
**生成表格**
- 表头:| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
- P0任务前加 🔴 emoji
- 负责人多人时用顿号分隔
---
### 步骤 2.5: 生成"### 4. 组内成员工作进展"
**核心原则**:并行提取反馈,主窗口整合;**下周任务仅列工程类项目**
#### 2.5.1: 并行提取成员反馈调用多个Agents
**操作**:一次性并行调用多个 transcript_searcher Agents
```python
# 为每个成员并行调用Agent
feedback_agents = []
for member in attendees:
member_data = members_data[member]
feedback_agents.append(
Task(
subagent_type="transcript_searcher",
description=f"提取{member}反馈",
prompt=f"""提取会议中对 {member} 的反馈(表扬/批评/建议)。
{member}的周报信息:
- P0任务{[t['name'] for t in member_data['p0_tasks']]}
- 遇到问题:{[p['description'] for p in member_data['problems']]}
请提取会议中对该成员的反馈,包括:
- 反馈类型(表扬/批评/建议)
- 反馈内容
注意:
1. 不依赖说话人标记,通过语义识别(讨论该成员的工作、对该成员的评价)
2. 如果会议中未提及该成员,返回空列表
返回JSON格式类型4提取成员反馈
"""
)
)
# 等待所有Agent返回
feedback_results = [agent.result for agent in feedback_agents]
```
**Agent返回示例**(实际数据在`data`字段内):
```json
{
"search_intent": "提取江争达的反馈",
"matched_blocks": [2, 4],
"data": {
"member": "江争达",
"feedbacks": [
{"type": "批评", "content": "..."},
{"type": "建议", "content": "..."}
]
}
}
```
#### 2.5.2: 整合成员信息(主窗口)
**处理逻辑**
对每个成员,整合以下信息生成章节:
**1. 上周完成**
- 从周报提取已完成任务列表(带✅标记的项)
**2. 进行中**
- 从周报提取进行中任务列表(带🔄标记的项)
**3. 收到的反馈/学习建议**
- 从并行Agent返回结果中匹配该成员的反馈
- 如无反馈则显示"- 无"
**4. 下周任务**
-`next_week_tasks` 筛选该成员负责的任务
- 合并周报"下周计划"中的任务(语义去重)
- 按优先级排序P0 → P1 → P2
- 格式:`- [ ] 🔴 P0|任务名称`P0任务加红点无空格
**生成格式**
- 每个成员一个四级标题
- 四个子部分按上述顺序排列
---
### 步骤 2.6: 生成"三、会议总结"
**核心原则**:提取决策 + 归纳总结
#### 2.6.1: 提取关键决策调用Agent
**操作**
```python
Task(
subagent_type="transcript_searcher",
description="提取决策事项",
prompt="""提取会议中的所有关键决策。
特征词:"决定"、"确定"、"采用"、"要求"、"必须"、"不准"
请提取决策事项,包括:
- 决策内容
- 决策上下文
返回JSON格式类型3提取决策事项
"""
)
```
**Agent返回**(实际数据在`data`字段内):
```json
{
"search_intent": "提取决策事项",
"matched_blocks": [3, 6],
"data": {
"decisions": [
{
"decision": "采用Claude Code Skill架构",
"context": "Deepresearch框架选型讨论"
}
]
}
}
```
#### 2.6.2: 归纳总结(主窗口)
**处理逻辑**
**1. 核心议题**
-`next_week_tasks` 提取项目名称
- 统计高频项目(简化项目名,提取核心关键词)
- 选取出现频率最高的前3个项目
- 用顿号连接
**2. 关键决策**
- 直接使用Agent提取的决策列表
- 按序号格式化输出
**3. 下周工作重点**
-`next_week_tasks` 筛选所有P0任务
- 按序号列表格式输出
**生成格式**
- 章节标题:## 三、会议总结
- 三个子部分:核心议题、关键决策、下周工作重点
---
## Phase 3: 最终输出
### 步骤 3.1: 组装完整文档
**操作**
- 按顺序拼接所有生成的章节
- 标题格式:# 工程类会议纪要-{日期}-第X次周会
- 章节顺序:
1. 一、会议信息
2. 二、工作内容包含4个子章节
3. 三、会议总结
- 添加页脚信息:纪要整理人、纪要时间、下次会议时间
### 步骤 3.2: 写入文件
**操作**
- 确定文件名:`工程类会议纪要_{日期}_第X次周会.md`
- 输出路径:`D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\output\`
- 使用Write工具写入文件
### 步骤 3.3: 返回结果
**返回给用户**
- 显示完成状态
- 汇总统计信息:
- 会议时间
- 参会人数
- P0任务数
- 问题讨论数
- 下周任务总数
- 显示输出文件路径
---
## Phase 4: 学习研究类会议纪要生成
> ⚠️ **仅当 `learning_projects` 非空时执行本阶段**
### 步骤 4.1: 提取学习研究内容(调用 Agent
**操作**
```python
Task(
subagent_type="transcript_searcher",
description="提取学习研究讨论",
prompt=f"""提取会议中的学习研究类讨论内容。
学习研究类项目列表:
{json.dumps(learning_projects, ensure_ascii=False)}
请为每个项目提取:
- 议题标题(会议中讨论的主题)
- 分享人(语义推断)
- 背景与目的
- 核心议题概述
- 关键讨论成果Q&A、反馈、共识
- 下一步研究方向
注意:
1. has_library_file=true 的项目,核心内容从资料库提取
2. has_library_file=false 的项目,从会议转写上下文推断
3. 资料库路径已固化Agent 自行读取
返回JSON格式类型5提取学习研究内容
"""
)
```
**Agent 返回**
```json
{
"search_intent": "提取学习研究内容",
"matched_blocks": [2, 5],
"data": {
"topics": [
{
"title": "Claude Code Skill开发规范",
"presenter": "闫旭隆",
"background": "...",
"overview": "...",
"discussions": ["Q1...", "A1..."],
"next_steps": ["方向1", "方向2"]
}
]
}
}
```
### 步骤 4.2: 整合生成纪要(主窗口)
**处理逻辑**
1. **会议信息**:复用 Phase 2.1 的数据
2. **学习研究内容**:遍历 Agent 返回的 `data.topics`,按模板格式化
**输出格式**(每个议题):
```markdown
### {序号}. {title} ({presenter})
**背景与目的:**
- {background}
**核心议题概述:**
- {overview}
**关键讨论成果:**
- {discussions 列表}
**下一步研究方向:**
- {next_steps 列表}
```
### 步骤 4.3: 输出学习研究类纪要文件
**操作**
- 确定文件名:`学习研究类会议纪要_{日期}_第X次周会.md`
- 输出路径:`D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\output\`
- 使用 Write 工具写入文件
**返回给用户**
- 显示学习研究类纪要完成状态
- 显示议题数量
- 显示输出文件路径
---
## Phase 5: Q&A资源库类会议纪要生成
> ⚠️ **二次提取产物**:在 Phase 3工程类和 Phase 4学习研究类之后执行
>
> **依赖**:已生成的工程类会议纪要(必需)
### 前置检查
**操作**
1. 检查 `output/` 目录下是否存在本次会议的工程类纪要文件
2. 如不存在 → 提示用户先生成工程类纪要,跳过 Phase 5
3. 如存在 → 继续执行
---
### 步骤 5.1: 复用会议信息(主窗口)
**数据来源**:已生成的工程类会议纪要
**操作**
1. 读取工程类纪要文件
2. 提取"一、会议信息"章节内容
3. 直接复用,格式保持一致
**无需Agent**,主窗口直接处理 ✅
---
### 步骤 5.2: 提取工作问题 Q&A主窗口
**核心原则**:从已生成的纪要文件中提取,非原始转写
#### 5.2.1: 从工程类纪要提取问题
**操作**
1. 定位"### 2. 重点项目问题及解决方案"章节
2. 解析每个问题块:
- 问题标题(作为项目名称)
- 问题描述(精简为主要问题)
- 解决方案列表
#### 5.2.2: 从学习研究类纪要提取 Q&A可选
**操作**(如学习研究类纪要存在):
1. 定位每个议题的"关键讨论成果"部分
2. 识别 Q&A 格式内容
#### 5.2.3: 合并去重
**处理逻辑**
- 语义匹配(相似度 > 80%)视为同一问题,合并解决方案
- 按项目分组,同一项目多个问题归类在一起
- 格式化输出:`### {序号}. 项目名称:{project_name}`
**无需Agent**,主窗口直接处理 ✅
---
### 步骤 5.3: 提取重点工作方法调用Agent + 主窗口)
**核心原则**:会议转写 + 周报,两者结合
#### 5.3.1: 从会议转写提取方法分享调用Agent
**操作**
```python
Task(
subagent_type="transcript_searcher",
description="提取工作方法",
prompt="""提取会议中分享的工作方法、技巧、最佳实践。
识别特征:
- 方法论讲解("方法是..."、"技巧是..."
- 经验分享("我的做法是..."、"建议..."
- 总结性语句("总结一下..."、"关键是..."
需提取字段:
- 方法名称(简短标题)
- 方法描述(详细说明)
- 提出人(从上下文推断)
- 相关项目
返回JSON格式类型6提取工作方法
"""
)
```
**Agent返回**(实际数据在`data`字段内):
```json
{
"search_intent": "提取工作方法",
"matched_blocks": [2, 5],
"data": {
"methods": [
{
"name": "语义分析替代说话人标记",
"description": "通过分析发言内容的语义特征来判断发言者",
"presenter": "连云波",
"related_project": "会议纪要信息提取"
}
]
}
}
```
#### 5.3.2: 从周报提取经验总结(主窗口)
**操作**
- 遍历 `members_data` 中"详细工作内容"
- 识别方法论/经验总结内容(带"方法"、"技巧"、"经验"等关键词的段落)
#### 5.3.3: 合并整理(主窗口)
**处理逻辑**
- 将会议方法与周报方法进行语义匹配
- 相似方法合并,补充细节
- 为每个方法生成完整结构:
- 方法标题
- 方法描述(合并会议详细讲解 + 周报简要描述)
- 适用场景(从会议讨论上下文推断)
- 关键要点提炼为3-5条
**输出格式**
```markdown
- **方法 {序号}{方法标题}**
- {方法描述}
- 适用场景:{场景描述}
- 关键要点:
- {要点1}
- {要点2}
- {要点3}
```
---
### 步骤 5.4: 输出Q&A资源库类纪要文件
**操作**
1. 组装所有章节:
- 一、会议信息(复用)
- 二、工作问题 Q&A
- 三、重点工作方法
2. 确定文件名:`Q&A资源库类会议纪要_{日期}_第X次周会.md`
3. 输出路径:`D:\AA_Work\skills合集\AIEC-团队开发规范Skills\.claude\skills\meeting-minutes-generator-v1\output\`
4. 使用 Write 工具写入文件
**特殊情况处理**
| 情况 | 处理方式 |
|------|---------|
| 工程类纪要无问题章节 | Q&A章节输出"本次会议无记录的问题讨论" |
| 会议中无方法分享 | 若周报有经验总结则使用,否则输出"本次会议无记录的方法分享" |
**返回给用户**
- 显示Q&A资源库类纪要完成状态
- 显示Q&A数量、方法数量
- 显示输出文件路径
---
## 关键辅助函数
### is_same_task(task1, task2)
判断两个任务是否为同一任务(语义相似度 > 85%
### is_similar_problem(desc1, desc2)
判断两个问题是否相似(语义相似度 > 80%
### merge_assignees(list1, list2)
合并负责人列表并去重
### extract_project_name(task_name)
从任务名称提取核心项目关键词
---
## 项目类型区分规则
**核心问题**:周报中没有"学习类"/"工程类"标签,两类项目都混在"P0任务完成情况"和"详细工作内容"中。
**区分方法**
1. **资料库指引** ⭐:项目在 `input/成员本周资料库/` 下有对应md文件 → 学习研究类
2. **语义判断**:根据任务性质(知识获取/技能提升 vs 产出交付/功能实现)语义判断
**背景**成员会以周报为顶层讲到学习内容时打开资料库里的md进行分享资料库中的项目通常是学习研究类。
---
## 注意事项
1. **优先级一致性**
- 项目进展仅P0
- 下周安排P0/P1/P2按顺序
- 成员进展每人下周任务按P0→P1→P2排序
2. **数据互补原则**
- 问题:会议详细分析 + 周报初步描述
- 任务:会议分配 + 周报计划,冲突时会议优先
3. **语义识别**
- 转写说话人标记不可靠
- 责任人、优先级、反馈对象都需语义推断
4. **并行执行**
- 仅步骤2.5成员反馈提取并行4-5个Agents
- 其他步骤串行执行(有数据依赖)
5. **默认值处理**
- 截止时间:会议日期 + 7天
- 优先级会议未提及的周报任务默认P1
6. **Agent返回数据解析**
- 所有transcript_searcher返回的JSON结构为`{search_intent, matched_blocks, data}`
- 实际业务数据在`data`字段内,需通过`result.data.xxx`访问
- 示例:`result.data.problems``result.data.tasks``result.data.decisions`
---
## 根本逻辑文档
本 Skill 的详细执行逻辑(包括每个章节的数据来源、处理规则、输出格式),有任何问题请查阅:
- **工程类**`references/detailed_logic.md`
- **学习研究类**`references/学习研究类会议纪要生成逻辑.md`
- **Q&A资源库类**`references/Q&A资源库类会议纪要生成逻辑.md`

View File

@ -0,0 +1,115 @@
{
"meta": {
"transcript_path": "D:\\AA_Work\\skills合集\\AIEC-团队开发规范Skills\\.claude\\skills\\meeting-minutes-generator-v1\\input\\本周会议转写文本\\20251125135528-信通院云大所市场部-张媛媛预定的会议-转写智能优化版-1.txt",
"total_lines": 1642,
"total_blocks": 7,
"processed_at": "2025-11-25T14:30:00",
"known_entities": {
"people": ["闫旭隆", "江争达", "陶西平", "郝倩玉", "连云波", "张媛媛"],
"projects": [
"会议纪要Skill开发",
"需求文档Skill优化",
"公众号信息获取",
"数字人生成",
"问答系统V1.1",
"DeepResearch",
"招投标文件Skill",
"天眼查自动化",
"日报驱动系统"
]
}
},
"blocks": [
{
"block_id": 1,
"lines": "0-299",
"participants": ["张媛媛", "闫旭隆"],
"topics": ["会议纪要Skill开发现状", "会议仪表盘讨论", "P0项目定义问题"],
"projects": ["会议纪要Skill开发"],
"has_task_assignment": false,
"has_problem_discussion": true,
"has_decision": true,
"has_feedback": true,
"key_phrases": ["会议纪要", "仪表盘", "P0项目", "逻辑复杂", "数据一致性", "负责人变更"],
"summary": "讨论会议纪要Skill的第一版实现效果,发现数据映射、负责人更新、P0项目识别等逻辑问题,需要参考会议转写进行状态更新"
},
{
"block_id": 2,
"lines": "250-549",
"participants": ["张媛媛", "闫旭隆"],
"topics": ["会议纪要数据来源", "主窗口与Agent架构", "转写文本处理方案"],
"projects": ["会议纪要Skill架构优化"],
"has_task_assignment": true,
"has_problem_discussion": true,
"has_decision": true,
"has_feedback": false,
"key_phrases": ["数据来源", "主窗口上下文", "全量加载", "分块读取", "索引构建", "搜索命中率"],
"summary": "讨论Skill架构,分析分块索引搜索vs全量加载方案,建议简化逻辑改用主窗口直接处理全文,提高准确性"
},
{
"block_id": 3,
"lines": "500-799",
"participants": ["张媛媛", "闫旭隆", "江争达"],
"topics": ["会议纪要架构设计", "Agent协作模式", "上下文管理"],
"projects": ["会议纪要Skill重构方案"],
"has_task_assignment": true,
"has_problem_discussion": true,
"has_decision": true,
"has_feedback": false,
"key_phrases": ["主窗口协调", "子Agent全量处理", "并行调用", "功能模块划分", "准确性优先"],
"summary": "确定架构优化方向:主窗口负责协调,每个子Agent获得全量上下文独立处理一个功能模块,提升准确性"
},
{
"block_id": 4,
"lines": "750-1049",
"participants": ["张媛媛", "江争达", "陶西平"],
"topics": ["数字人PPT需求讨论", "需求文档质量问题", "PPT动态切换"],
"projects": ["数字人PPT讲解视频"],
"has_task_assignment": true,
"has_problem_discussion": true,
"has_decision": true,
"has_feedback": true,
"key_phrases": ["需求提炼", "默认需求vs核心需求", "动态切换", "口型对应", "需求层次"],
"summary": "严厉批评数字人需求文档,强调需求提炼能力:区分默认需求与核心难点需求,不能罗列所有功能,需深度挖掘用户真实痛点"
},
{
"block_id": 5,
"lines": "1000-1299",
"participants": ["张媛媛", "江争达"],
"topics": ["日报驱动系统构想", "项目管理工具整合", "AI Native团队建设"],
"projects": ["日报驱动系统", "AI Native组织"],
"has_task_assignment": true,
"has_problem_discussion": true,
"has_decision": false,
"has_feedback": false,
"key_phrases": ["会议纪要驱动日报", "Linear项目管理", "MCP集成", "语音交互", "系统化需求"],
"summary": "讨论通过会议纪要驱动日报的系统化需求,强调需先建立完整框架,整合Linear项目管理工具,实现AI Native自动化工作流"
},
{
"block_id": 6,
"lines": "1250-1549",
"participants": ["张媛媛", "闫旭隆", "陶西平"],
"topics": ["需求文档Skill迭代", "专家评审机制", "模型选择优化"],
"projects": ["需求文档Skill优化", "cc-switch调研"],
"has_task_assignment": true,
"has_problem_discussion": true,
"has_decision": true,
"has_feedback": true,
"key_phrases": ["交互中断", "专家博弈", "领域专家识别", "模型差异化使用", "opus vs sonnet"],
"summary": "演示需求文档Skill优化版本,增加交互澄清、专家自动整合等功能,讨论多轮专家博弈机制和不同模型的差异化使用"
},
{
"block_id": 7,
"lines": "1500-1642",
"participants": ["张媛媛", "江争达", "郝倩玉"],
"topics": ["任务安排", "问答系统测试", "PDF Skill调研", "招投标Skill分工"],
"projects": ["问答系统V1.1", "招投标文件Skill", "PDF处理Skill"],
"has_task_assignment": true,
"has_problem_discussion": false,
"has_decision": true,
"has_feedback": false,
"key_phrases": ["任务分配", "前端重构", "需求确认", "明天会议", "学习资料整理"],
"summary": "布置后续任务:会议纪要生成测试、cosmos流程整理、问答系统前端重构、PDF Skill技术调研、招投标Skill架构设计"
}
]
}

View File

@ -0,0 +1,31 @@
# Q&A共享资源库类会议纪要-{date}-第X次周会
## 一、会议信息
- **会议时间:** {meeting_date}
- **参会人员:** {attendees}
- **记录整理人:** {recorder}
---
## 二、工作问题 Q&A
{qa_sections}
<!-- 格式:
### {序号}. 项目名称:{project_name}
- **主要问题:** {problem_description}
- **解决方案:** {solution_description}
---
-->
---
## 三、重点工作方法
{work_methods}
<!-- 格式:
- **方法 {序号}{方法标题}**
- {方法描述}
- 适用场景:{场景说明}
- 关键要点:{要点列表}
-->

View File

@ -0,0 +1,30 @@
# 学习研究类会议纪要-{date}-第X次周会
## 一、会议信息
- **会议时间:** {meeting_date}
- **参会人员:** {attendees}
- **记录整理人:** {recorder}
---
## 二、学习研究内容
{learning_sections}
<!-- 格式:
### {{序号}}. {{议题标题}} ({{分享人}})
**背景与目的:**
- {背景内容(来源、学习目的、理论或项目背景)}
**核心议题概述:**
- {核心观点或理论要点}
**关键讨论成果:**
- {结论或讨论结果}
**下一步研究方向:**1-3个具体方向
- {方向1}
- {方向2}
- {方向3}
-->

View File

@ -0,0 +1,77 @@
# 工程类会议纪要-{date}-第X次周会
## 一、会议信息
- **会议时间:** {meeting_date}
- **参会人员:** {attendees}
- **记录整理人:** {recorder}
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 负责人 | 截止时间 | 项目进展情况 |
|---------|--------|----------|---------|
{project_rows}
### 2. 重点项目问题及解决方案
{problem_details}
<!-- 样例格式:
#### 项目 {序号}: {项目名称}
**问题1** {问题标题}
- **问题描述:** {描述内容}
- **解决方案:**
1. {方案1}
2. {方案2}
- **需要支持:** {需要的资源或协助}
- **涉及人员:** {相关人员}
……按项目顺序继续
-->
### 3. 下周工作安排
| 项目名称 | 负责人 | 本周目标 | 优先级 | 截止时间 |
|----------|---------|-----------|-----------|-----------|
{team_tasks_rows}
### 4. 组内成员工作进展
{members_section}
<!-- 格式:
#### {姓名}
**上周完成:**
- ✅ {任务描述}
**进行中:**
- 🔄 {任务描述}
**收到的反馈/学习建议:**
- {反馈内容}
**下周任务:**自动排序P0 → P1
- [ ] P0{任务描述}
- [ ] P1{任务描述}
-->
---
## 三、会议总结
**核心议题:** {core_theme}
**关键决策:**
{key_decisions_list}
**下周工作重点:**
{next_week_list}
---

View File

@ -0,0 +1,495 @@
# 工程类会议纪要生成系统 - 架构设计精要
## 一、核心设计原则
### 分阶段生成策略 ⭐⭐⭐
**核心思想**:按照会议纪要的章节顺序,分阶段提取信息并生成,而不是一次性提取所有信息。
**优势**
1. 每阶段任务量适中Agent负载可控
2. 可逐步验证结果质量
3. 出现问题可重新搜索单个阶段
4. 符合人类编写纪要的思维习惯
---
## 二、整体架构概览
```
主窗口 (SKILL.md)
职责:流程编排 + 分阶段调度 + 逐章节生成
Phase 1: 准备阶段
├── 读取周报(主窗口)
├── 读取上周纪要(主窗口)
└── 构建索引Agent: transcript_indexer
输出temp/transcript_index.json
Phase 2: 分章节提取与生成(主窗口调度 + Agent执行
├── 2.1 生成"一、会议信息"(主窗口,无需会议转写)
├── 2.2 生成"二-1. 重点项目进展情况汇总"(主窗口,主要用周报)
├── 2.3 生成"二-2. 重点项目问题及解决方案"
│ ├── 调用Agent提取问题讨论
│ └── 主窗口合并周报问题
├── 2.4 生成"二-3. 下周工作安排"
│ ├── 调用Agent提取任务安排
│ └── 主窗口合并周报计划
├── 2.5 生成"二-4. 组内成员工作进展"
│ ├── 并行调用多个Agent提取成员反馈
│ └── 主窗口整合周报+反馈+任务
└── 2.6 生成"三、会议总结"
├── 调用Agent提取决策
└── 主窗口从已生成内容归纳总结
Phase 3: 最终输出
└── 主窗口组装完整Markdown并输出文件
```
---
## 三、职责分配
### 主窗口 (SKILL.md)
**负责**
- 流程编排(按章节顺序调度)
- 读取小文件(周报、上周纪要)
- 跨源数据合并(会议 + 周报 + 上周纪要)
- 逐章节生成Markdown
- 最终文件组装输出
**不负责**
- 读取大文件(会议转写)
- 分块处理逻辑
- 复杂语义分析
### Agent 1: transcript_indexer
**输入**:无(路径固化)
**职责**:分块读取会议转写,构建语义索引
**输出**
- 文件:`temp/transcript_index.json`
- 返回:摘要文字
### Agent 2: transcript_searcher
**输入**:搜索意图(自然语言)
**职责**:基于索引提取特定信息
**输出**JSON字符串直接返回
**特点**:轻量级,可多次调用
---
## 四、分阶段执行详细设计
### Phase 1: 准备阶段
#### 步骤 1.1: 读取周报和上周纪要(主窗口)
```markdown
**执行**
1. Glob: `input/成员本周周报/*.md`
2. 提取每个周报姓名、P0任务、问题、下周计划
3. Glob: `input/上周会议纪要/*.md`
4. 提取"下周工作安排"表格的P0任务
**输出数据结构**
members_data = {
"闫旭隆": {
"p0_tasks": [...],
"problems": [...],
"next_plan": [...]
},
...
}
last_week_p0_tasks = [...]
```
#### 步骤 1.2: 构建会议转写索引Agent
```markdown
**调用**
Task(
subagent_type="transcript_indexer",
description="构建会议转写索引",
prompt="构建会议转写索引"
)
**Agent处理**
- 分块读取会议转写2000行/块overlap 100
- 为每块打语义标签
- 输出索引到 temp/transcript_index.json
**返回**
"✅ 索引构建完成共8块识别10个主题"
```
---
### Phase 2: 分章节提取与生成
#### 步骤 2.1: 生成"一、会议信息"(主窗口)
```markdown
**数据来源**
- 会议时间:从会议转写文件名提取
- 参会人员:从周报文件名提取
- 记录人:固定"Claude"
**处理**主窗口直接生成无需Agent
**输出**
section_1 = """
一、会议信息
- 会议时间2025-11-18
- 参会人员:闫旭隆、江争达、...
- 记录整理人Claude
"""
```
#### 步骤 2.2: 生成"二-1. 重点项目进展情况汇总"(主窗口)
```markdown
**数据来源**
- 上周P0任务last_week_p0_tasks
- 本周P0任务members_data[*].p0_tasks
**处理**:主窗口直接处理
1. 取并集上周P0 本周P0
2. 对每个P0任务
- 从周报提取进展情况
- 如果周报无记录 → 标记"未完成"
**输出**
section_2_1 = """
### 1. 重点项目进展情况汇总
| 项目名称 | 负责人 | 截止时间 | 项目进展情况 |
|---------|--------|----------|-------------|
| ... | ... | ... | ... |
"""
**注意**此章节不需要会议转写仅展示P0追踪
```
#### 步骤 2.3: 生成"二-2. 重点项目问题及解决方案"Agent + 主窗口)
```markdown
**步骤 2.3.1: 提取会议问题讨论Agent**
调用:
Task(
subagent_type="transcript_searcher",
description="提取问题讨论",
prompt=f"""
提取会议中讨论的所有问题及解决方案。
已知问题(来自周报):{members_data[*].problems}
需提取字段:
- 问题标题
- 问题描述
- 解决方案(列表)
- 责任人
- 截止时间
返回JSON格式。
"""
)
**步骤 2.3.2: 合并数据(主窗口)**
1. 接收Agent返回的problem_results
2. 与周报problems对比去重
3. 互补合并:周报简述 + 会议详细方案
**输出**
section_2_2 = """
### 2. 重点项目问题及解决方案
#### 问题1: ...
**问题描述**: ...
**解决方案**:
1. ...
**责任人**: ...
**截止时间**: ...
"""
```
#### 步骤 2.4: 生成"二-3. 下周工作安排"Agent + 主窗口)
```markdown
**步骤 2.4.1: 提取会议任务安排Agent**
调用:
Task(
subagent_type="transcript_searcher",
description="提取任务安排",
prompt=f"""
提取会议中讨论的下周工作安排。
已知P0任务{last_week_p0_tasks}
需提取字段:
- 任务名称
- 负责人
- 任务描述
- 优先级从讨论语气判断P0/P1/P2
- 截止时间
返回JSON格式。
"""
)
**步骤 2.4.2: 合并数据(主窗口)**
1. 接收task_results
2. 与周报next_plan合并去重
3. 冲突时会议优先
4. 排序P0 → P1 → P2
**输出**
section_2_3 = """
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|---------|--------|------------|--------|----------|
| 🔴 ... | ... | ... | P0 | ... |
| ... | ... | ... | P1 | ... |
"""
**保存**next_week_tasks供后续章节使用
```
#### 步骤 2.5: 生成"二-4. 组内成员工作进展"并行Agent + 主窗口)⭐
```markdown
**步骤 2.5.1: 并行提取成员反馈多个Agent**
一次性并行调用:
for member in members:
Task(
subagent_type="transcript_searcher",
description=f"提取{member}反馈",
prompt=f"""
提取会议中对 {member} 的反馈(表扬/批评/建议)。
{member}的周报内容:{members_data[member]}
需提取字段:
- 反馈类型(表扬/批评/建议)
- 反馈内容
返回JSON格式。
"""
)
**步骤 2.5.2: 整合数据(主窗口)**
对每个成员:
1. 上周完成:从周报提取
2. 进行中:从周报提取
3. 收到反馈从Agent返回提取
4. 下周任务从next_week_tasks筛选该成员 + 周报计划去重
**输出**
section_2_4 = """
### 4. 组内成员工作进展
#### 闫旭隆
**上周完成**:
- ✅ ...
**收到的反馈/学习建议**:
- ...
**下周任务**:
- [ ] 🔴 P0|...
- [ ] P1|...
"""
**并行优势**成员反馈提取互不依赖可同时执行4-5个Agent并行
```
#### 步骤 2.6: 生成"三、会议总结"Agent + 主窗口)
```markdown
**步骤 2.6.1: 提取决策Agent**
调用:
Task(
subagent_type="transcript_searcher",
description="提取决策事项",
prompt="""
提取会议中的所有关键决策。
特征词:"决定"、"确定"、"采用"、"要求"
需提取字段:
- 决策内容
- 决策上下文
返回JSON格式。
"""
)
**步骤 2.6.2: 归纳总结(主窗口)**
1. 核心议题从decision_results + next_week_tasks提取高频项目
2. 关键决策从decision_results提取
3. 下周重点从next_week_tasks提取P0任务
**输出**
section_3 = """
三、会议总结
**核心议题**: ...
**关键决策**:
1. ...
**下周工作重点**:
1. ...
"""
```
---
### Phase 3: 最终输出
```markdown
**执行**:主窗口
**操作**
1. 组装所有章节:
final_content = section_1 + section_2_1 + section_2_2 + ...
2. 格式化检查
3. 写入文件:`output/工程类会议纪要_{date}_第X次周会.md`
```
---
## 五、关键设计决策
### 1. 为什么分阶段而不是一次性提取?
**一次性提取(原方案)**
- 同时发起7-8个Agent任务、问题、决策、4-5个成员反馈
- 任务量大Agent负载重
- 难以验证中间结果
- 出错需全部重来
**分阶段提取(新方案)**
- 每阶段1-2个Agent任务成员反馈可并行
- 任务量适中
- 可逐步验证
- 符合章节生成顺序
### 2. 哪些阶段可以并行?
**可并行**步骤2.5
- 成员反馈提取4-5个Agent同时执行
- 原因:每个成员独立,互不依赖
**必须串行**
- 其他章节(有数据依赖)
- 例如section 2.4生成的next_week_tasks被section 2.5使用
### 3. 数据传递策略
**Agent → 主窗口**
- ✅ 直接返回JSON字符串
- ❌ 不写temp文件除了索引
- 原因:单次提取结果<10k tokens直接传递高效
**主窗口内部**
- 使用变量传递中间结果
- 例如next_week_tasks在步骤2.4生成步骤2.5使用
### 4. 主窗口 vs Agent 决策原则 ⭐本项目专用
```
任务是否需要读取会议转写?
├── 否 → 主窗口直接处理
│ ├── 会议信息(从文件名提取)
│ └── 项目进展(仅用周报,不参考会议转写)
└── 是 → **必须调用 transcript_searcher Agent**
├── Agent读取语义索引temp/transcript_index.json
├── 定位相关块基于has_*字段和语义匹配)
├── 精确读取会议转写片段(基于行号范围)
└── 语义提取信息并返回JSON
⚠️ 重要:
- 本项目所有会议转写信息提取都需要语义理解
- 不存在简单关键词搜索场景
- 不使用Grep工具会议转写72k tokens需深度语义分析
```
---
## 六、完整执行流程总结
```
Phase 1: 准备
├── 主窗口读周报、上周纪要
└── Agent构建索引 → temp/transcript_index.json
Phase 2: 逐章节生成
├── 2.1 会议信息(主窗口直接生成)
├── 2.2 项目进展(主窗口用周报生成)
├── 2.3 问题方案
│ ├── Agent提取会议问题
│ └── 主窗口合并周报问题
├── 2.4 下周安排
│ ├── Agent提取会议任务
│ └── 主窗口合并周报计划
├── 2.5 成员进展
│ ├── 并行Agent提取反馈4-5个
│ └── 主窗口整合周报+反馈+任务
└── 2.6 会议总结
├── Agent提取决策
└── 主窗口归纳总结
Phase 3: 输出
└── 主窗口组装Markdown并写文件
```
**关键特点**
- 分阶段执行任务量可控
- 仅成员反馈提取并行4-5个Agent
- 其他阶段串行确保数据依赖
- 主窗口负责跨源合并与生成
- Agent专注会议转写信息提取
---
## 七、预估Token消耗
```
Phase 1:
- 读周报4个×3k: 12k
- 读上周纪要: 5k
- Agent构建索引: 72k读会议转写
小计: ~89k
Phase 2:
- Agent提取问题: 5k读索引
- Agent提取任务: 5k
- Agent提取决策: 5k
- Agent提取反馈×4: 20k并行
- 主窗口处理: 10k
小计: ~45k
Phase 3:
- 主窗口生成输出: 5k
总计: ~140k tokens远低于200k限制
```
---
## 八、后续优化方向
1. **动态调整**如果某章节提取不理想可重新搜索
2. **增量生成**边提取边展示部分结果给用户
3. **质量检查**主窗口可验证Agent返回的JSON完整性
4. **错误恢复**某Agent失败不影响其他章节生成