需求文档skill回溯专家博弈之前

2025-12-11 14:19:36 +08:00
parent 5f329d7b4c
commit f4314c3ede
117 changed files with 28969 additions and 3325 deletions
--- a/.claude/skills/requirement-generator-v1/temp/review_dev.json
+++ b/.claude/skills/requirement-generator-v1/temp/review_dev.json
@ -0,0 +1,116 @@
+{
+  "reviewer_role": "开发专家",
+  "strengths": [
+    "Multi-Agent架构设计清晰：调度Agent、搜索Agent、分析Agent、报告生成Agent、去重Agent职责划分明确，符合单一职责原则",
+    "并行搜索设计合理：多数据源并行搜索能有效提升效率，时序图清晰展示了协作关系",
+    "分阶段交付策略务实：MVP版本聚焦核心价值验证，第二阶段再引入知识图谱，降低了初期技术风险",
+    "异常处理考虑周全：数据源访问失败、搜索结果为空、文献过多、重复文献等场景都有对应处理方案",
+    "Agent能力边界定义清晰：明确列出了每个Agent'能做'和'不能做'的范围，有助于开发实现"
+  ],
+  "issues": [
+    {
+      "severity": "high",
+      "category": "技术可行性",
+      "description": "外部数据源API访问可行性未验证：PsycINFO、Embase、Cochrane Library等商业数据库需要机构订阅和API授权，CNKI和万方的API调用政策限制严格，个人/小团队难以获得合法稳定的API访问权限",
+      "location": "5.1 外部数据源需求",
+      "suggestion": "1) 在MVP阶段仅使用免费开放API的数据源（如PubMed E-utilities、bioRxiv API）；2) 明确标注各数据源的授权获取方式和成本；3) 对于无法直接API访问的数据源，考虑提供手动导入或浏览器插件辅助方案"
+    },
+    {
+      "severity": "high",
+      "category": "架构合理性",
+      "description": "知识图谱技术选型和存储方案未明确：需求中提到'知识图谱存储系统'但未说明具体技术选型（Neo4j/ArangoDB/RDF Store等）、数据模型设计、以及'语义去重'的具体实现算法",
+      "location": "5.2 系统集成需求 / 8.1 技术约束",
+      "suggestion": "1) 明确知识图谱的技术选型及选型理由；2) 定义知识图谱的本体模型（节点类型、关系类型、属性）；3) 详细说明'实体语义去重'的技术方案（基于规则/向量相似度/LLM判断）"
+    },
+    {
+      "severity": "high",
+      "category": "技术可行性",
+      "description": "实时进度展示的技术实现方式不明确：Multi-Agent并行执行时如何实现'实时'进度反馈？是使用WebSocket、SSE还是轮询？Agent间如何传递进度状态？",
+      "location": "4.1 典型主流程 / 8.2 性能要求",
+      "suggestion": "1) 明确进度反馈的技术实现机制（推荐SSE或WebSocket）；2) 定义进度事件的数据结构；3) 说明Agent间状态同步机制"
+    },
+    {
+      "severity": "medium",
+      "category": "架构合理性",
+      "description": "Agent通信机制未定义：Multi-Agent架构中，Agent之间如何通信？是通过消息队列、直接调用、还是共享内存？调度Agent如何等待并收集所有搜索Agent的结果？",
+      "location": "6.3 Agent间协作关系",
+      "suggestion": "1) 明确Agent间通信的技术方案（推荐消息队列如Redis Stream或进程内事件总线）；2) 定义消息格式和协议；3) 说明并行任务的超时和重试机制"
+    },
+    {
+      "severity": "medium",
+      "category": "性能要求",
+      "description": "'合理时间内完成（允许小时级）'表述模糊：小时级是1小时还是10小时？不同复杂度的研究问题是否有不同的时间预期？",
+      "location": "9.2 非功能验收标准",
+      "suggestion": "1) 按问题复杂度分级定义时间预期（简单问题30分钟内，复杂问题2小时内）；2) 定义超时机制和用户中断接口"
+    },
+    {
+      "severity": "medium",
+      "category": "技术可行性",
+      "description": "证据等级评估的实现复杂度被低估：医学领域的证据等级评估（如GRADE标准）需要专业知识和结构化判断，仅依靠LLM分析可能准确性不足",
+      "location": "3.2 输出 / 6.1 Agent列表",
+      "suggestion": "1) 明确证据等级评估的具体标准（GRADE/Oxford等）；2) 考虑结合文献元数据（研究类型、样本量）进行规则化判断；3) 标注评估结果仅供参考，需人工复核"
+    },
+    {
+      "severity": "medium",
+      "category": "架构合理性",
+      "description": "全文获取服务的可选性带来功能一致性风险：文档标注'文献全文获取服务（可选）'，但分析Agent的深度分析能力高度依赖全文内容，仅靠摘要难以实现高质量分析",
+      "location": "5.2 系统集成需求",
+      "suggestion": "1) 评估仅基于摘要分析的可行性和质量影响；2) 如全文为可选，需在报告中明确标注分析深度受限；3) 考虑使用Unpaywall等开放全文获取渠道"
+    },
+    {
+      "severity": "low",
+      "category": "技术风险",
+      "description": "多数据源返回结果的格式标准化未考虑：不同数据源（PubMed XML、CNKI自有格式等）返回的文献元数据格式差异大，需要统一的数据模型和转换层",
+      "location": "5.1 外部数据源需求",
+      "suggestion": "1) 定义统一的文献元数据模型；2) 每个搜索Agent负责将源格式转换为统一格式；3) 处理字段缺失的情况"
+    },
+    {
+      "severity": "low",
+      "category": "技术可行性",
+      "description": "中英文混合处理的技术挑战未评估：同一研究问题涉及中英文文献时，关键词翻译、术语对齐、结果融合都存在技术难点",
+      "location": "3.1 输入 / 8.4 其他非功能性要求",
+      "suggestion": "1) 明确中英文关键词的翻译/对齐策略；2) 定义中英文文献的融合排序规则；3) 考虑使用医学术语库（如UMLS）辅助术语标准化"
+    }
+  ],
+  "missing_items": [
+    "缺少技术栈选型说明：未明确开发语言、框架、部署环境等基础技术决策",
+    "缺少LLM模型选型和调用方式：Agent的智能能力依赖LLM，但未说明使用哪个模型、API调用方式、Token消耗预估",
+    "缺少错误恢复机制说明：长时间运行的任务如何支持断点续传或中间结果保存",
+    "缺少并发控制策略：10人同时使用时如何管理API调用配额和系统资源",
+    "缺少数据持久化方案：除知识图谱外，研究报告、搜索历史如何存储",
+    "缺少监控和日志方案：分布式Agent系统的问题排查和性能监控机制"
+  ],
+  "tech_risks": [
+    {
+      "risk_level": "high",
+      "description": "商业数据库API访问受限风险",
+      "impact": "PsycINFO、Embase等核心数据源无法接入，导致文献覆盖不全面，核心价值受损",
+      "mitigation": "1) 优先评估各数据源API可用性；2) 准备替代方案（如通过机构账号网页抓取，但需评估合规性）；3) MVP阶段仅承诺PubMed"
+    },
+    {
+      "risk_level": "high",
+      "description": "知识图谱去重准确性风险",
+      "impact": "'语义去重'依赖NLP/向量匹配，可能出现误判（重复未识别或错误合并），影响报告质量",
+      "mitigation": "1) 分层去重：先DOI/PMID精确匹配，再标题相似度，最后语义判断；2) 设置相似度阈值，边界情况保留两者；3) 提供人工复核入口"
+    },
+    {
+      "risk_level": "medium",
+      "description": "LLM调用成本和延迟风险",
+      "impact": "大量文献分析需频繁调用LLM，可能产生高额API费用，且存在速率限制",
+      "mitigation": "1) 预估单次研究的Token消耗和成本；2) 使用分层模型策略（简单任务用小模型）；3) 实现本地缓存避免重复分析"
+    },
+    {
+      "risk_level": "medium",
+      "description": "长时间任务稳定性风险",
+      "impact": "小时级任务期间可能遇到网络中断、进程崩溃，导致研究结果丢失",
+      "mitigation": "1) 实现检查点机制保存中间状态；2) 支持任务恢复和断点续传；3) 设置合理超时，避免无限等待"
+    }
+  ],
+  "suggestions": [
+    "建议增加技术选型章节：明确开发语言（Python推荐）、Agent框架（LangGraph/AutoGen/CrewAI）、知识图谱（Neo4j Community版）、消息队列（Redis）等核心技术决策",
+    "建议增加POC验证步骤：在正式开发前，验证核心数据源API可用性、知识图谱去重效果、LLM分析质量三个关键技术点",
+    "建议细化MVP验收标准：当前验收标准偏定性，建议增加定量指标如'引用准确率>=95%'、'去重准确率>=90%'",
+    "建议增加成本预估：预估MVP和完整版的API调用成本、存储成本、运维成本，确保商业可行性",
+    "建议采用增量式知识图谱更新：每次研究任务后增量更新，而非全量重建，提高效率和数据一致性"
+  ]
+}