# 医疗精神疾病深度研究助手 (DeepResearch Assistant) - 需求文档 **文档版本**: 1.0 **创建时间**: 2025-12-07 **生成方式**: Claude Code 智能需求生成器 **项目类型**: Agent 开发 --- ## 1. 背景与目标 ### 1.1 项目背景 开发一个面向医疗精神疾病领域的深度研究助手(DeepResearch Assistant),帮助科研人员、医学生和医疗信息分析师进行系统性文献调研。该助手能够根据用户提出的研究问题,自动执行多数据源并行搜索,对搜索到的文献进行智能分析,最终生成高质量、结构化的研究报告,确保引用准确、逻辑清晰。 ### 1.2 目标与价值 **核心目标**: 1. **提高文献调研效率**:将传统需要数天的文献调研工作压缩到小时级别完成 2. **提升研究质量**:确保文献覆盖全面、引用准确可追溯、分析逻辑严谨 3. **构建长期知识库**:通过知识图谱积累领域知识,支持持续研究和知识发现 **目标用户**: 1. **科研人员/学者**:进行精神疾病领域的学术研究 2. **医学生/规培医生**:学习精神科知识,辅助学业 3. **医疗信息分析师**:处理大量文献数据,支持机构决策 --- ## 2. 使用场景与触发方式 ### 2.1 典型使用场景 #### 场景一:文献综述撰写 **触发条件**:用户输入研究问题,如"近5年精神分裂症认知功能障碍的非药物治疗进展" **操作步骤**: 1. 用户输入研究问题 2. 系统展示Multi-Agent执行进度:解析问题 -> 制定搜索策略 3. 并行搜索多个数据源,实时显示"正在搜索PubMed..."、"已找到X篇文献" 4. 对文献进行智能分析和综合 5. 将新文献动态加入知识图谱,执行去重 6. 生成结构化研究报告 **预期结果**:获得一份包含背景概述、核心文献分析、证据等级评估、研究结论与知识空白、标准格式引用的完整中文研究报告 #### 场景二:研究题目探索 **触发条件**:用户希望了解某个新研究方向的进展和空白 **操作步骤**: 1. 用户输入探索性问题 2. 系统搜索相关文献并分析研究现状 3. 识别该领域的知识空白和潜在研究方向 4. 生成研究现状与机会分析报告 **预期结果**:了解该方向的研究现状、主要发现、知识空白和潜在研究机会 ### 2.2 使用入口与触发方式 - **主要入口**:通过对话界面以自然语言输入研究问题 - **触发方式**:用户输入研究问题后,系统自动启动Multi-Agent协作流程 - **语言支持**:支持中英文提问 --- ## 3. 输入输出定义 ### 3.1 输入 | 输入项 | 描述 | 格式 | 必填 | |-------|------|------|------| | 研究问题 | 用户以自然语言描述的研究问题 | 自然语言文本(中/英文) | 是 | **输入示例**: - "近5年精神分裂症认知功能障碍的非药物治疗进展" - "抑郁症与肠道菌群的关系研究现状" - "What are the recent advances in cognitive behavioral therapy for PTSD?" ### 3.2 输出 **输出格式**:结构化中文研究报告 **报告结构**: | 章节 | 内容描述 | |-----|---------| | 研究背景与现状概述 | 对研究问题的背景介绍和领域概况 | | 核心文献摘要与分析 | 重要文献的摘要提取和关键发现对比分析 | | 研究方法与证据等级 | 文献的研究方法分类和证据等级评估 | | 研究结论与知识空白 | 综合结论和领域内尚待研究的问题 | | 文献引用列表 | 标准格式的完整引用列表 | --- ## 4. 交互流程说明 ### 4.1 典型主流程 ```mermaid flowchart TD Start([用户输入研究问题]) --> Parse[解析问题/制定搜索策略] Parse --> Search[并行搜索多数据源] Search --> Progress[实时展示搜索进度] Progress --> Analyze[智能文献分析与综合] Analyze --> KG[知识图谱更新与去重] KG --> Generate[生成结构化报告] Generate --> Output([输出研究报告]) ``` **流程说明**: 1. **问题解析**:理解用户研究问题,提取关键词,制定多数据源搜索策略 2. **并行搜索**:同时向多个学术数据源发起检索请求 3. **进度展示**:实时向用户反馈各数据源搜索状态和已找到的文献数量 4. **文献分析**:对检索到的文献进行摘要提取、证据等级评估、关键发现对比 5. **知识图谱更新**:将新文献信息存入知识图谱,执行多级去重 6. **报告生成**:综合分析结果,生成结构化研究报告 ### 4.2 异常与分支流程 | 异常场景 | 处理方式 | |---------|---------| | 某数据源访问失败 | 记录失败原因,继续使用其他数据源,在报告中注明 | | 搜索结果为空 | 建议用户调整研究问题或扩大搜索范围 | | 文献数量过多 | 按相关性和证据等级排序,优先处理高价值文献 | | 重复文献识别 | 通过知识图谱去重机制自动合并 | --- ## 5. 外部系统与数据依赖 ### 5.1 外部数据源需求 | 数据源 | 类型 | 用途 | 优先级 | |-------|------|------|--------| | PubMed/MEDLINE | 生物医学文献数据库 | 获取生物医学研究文献 | 核心 | | PsycINFO | 心理学专业数据库 | 获取心理学/精神科专业文献 | 核心 | | Embase | 欧洲文献数据库 | 获取欧洲文献及药物研究 | 核心 | | Cochrane Library | 循证医学数据库 | 获取系统评价和Meta分析 | 扩展 | | CNKI | 中国知网 | 获取中文学术文献 | 扩展 | | 万方数据 | 中文文献数据库 | 补充中文文献来源 | 扩展 | | bioRxiv/medRxiv | 预印本平台 | 获取最新未发表研究 | 扩展 | | Google Scholar | 综合学术搜索 | 补充其他来源遗漏文献 | 扩展 | ### 5.2 系统集成需求 - **知识图谱存储系统**:用于持久化存储文献、概念、作者、研究时间线等实体及其关系 - **文献全文获取服务**:用于获取文献全文内容(可选) ### 5.3 数据交互时序 ```mermaid sequenceDiagram participant U as 用户 participant O as 调度Agent participant S1 as 搜索Agent-PubMed participant S2 as 搜索Agent-PsycINFO participant S3 as 搜索Agent-Embase participant A as 分析Agent participant KG as 知识图谱 participant R as 报告生成Agent U->>O: 输入研究问题 O->>O: 解析问题/制定策略 par 并行搜索 O->>S1: 搜索PubMed O->>S2: 搜索PsycINFO O->>S3: 搜索Embase S1-->>O: 返回文献列表 S2-->>O: 返回文献列表 S3-->>O: 返回文献列表 end O->>A: 提交文献进行分析 A->>KG: 查询已有知识 KG-->>A: 返回相关知识 A->>KG: 更新新知识(含去重) A-->>O: 返回分析结果 O->>R: 生成研究报告 R-->>U: 输出结构化报告 ``` --- ## 6. 系统模块与Agent角色定义 ### 6.1 Agent列表与核心职能 | Agent名称 | 核心职能 | 主要能力 | |----------|---------|---------| | 调度Agent | 任务分解与协调 | 解析研究问题、制定搜索策略、协调各Agent工作、汇总结果 | | 搜索Agent(多实例) | 数据源检索 | 连接特定数据源、执行检索、返回文献元数据 | | 分析Agent | 文献智能分析 | 摘要提取、证据等级评估、关键发现对比、知识图谱交互 | | 报告生成Agent | 报告撰写 | 综合分析结果、生成结构化报告、格式化引用 | | 去重Agent | 知识图谱去重 | 文献ID去重、实体语义去重、关系级去重 | ### 6.2 Agent能力边界 | Agent | 能做 | 不能做 | |-------|-----|-------| | 调度Agent | 任务分解、进度跟踪、结果汇总 | 直接访问数据源、执行深度分析 | | 搜索Agent | 连接数据源、执行检索 | 分析文献内容、生成报告 | | 分析Agent | 理解文献内容、评估证据等级 | 直接访问数据源、格式化输出 | | 报告生成Agent | 组织报告结构、生成标准引用 | 搜索文献、分析文献内容 | | 去重Agent | 识别重复实体和关系、合并同义词 | 搜索文献、分析文献内容 | ### 6.3 Agent间协作关系 ```mermaid flowchart LR Orchestrator[调度Agent] --> Search1[搜索Agent-PubMed] Orchestrator --> Search2[搜索Agent-PsycINFO] Orchestrator --> Search3[搜索Agent-其他数据源] Orchestrator --> Analyzer[分析Agent] Analyzer <--> KG[(知识图谱)] Analyzer <--> Dedup[去重Agent] Orchestrator --> Reporter[报告生成Agent] subgraph 并行执行 Search1 Search2 Search3 end ``` --- ## 7. 分阶段交付计划 ### 7.1 阶段1:MVP版本 - 实现核心搜索和报告生成能力 **阶段目标**: 验证核心价值,实现基本的多数据源搜索和结构化报告生成能力 **功能清单**: - 3个核心数据源并行搜索(PubMed、PsycINFO、Embase) - 结构化报告生成(固定模板) - Multi-Agent执行进度展示 - 文字形式存储搜索结果(暂不使用知识图谱) ### 7.2 阶段2:完善版本 - 扩展数据源,引入知识图谱与完整去重 **阶段目标**: 扩展全部数据源,引入知识图谱存储与完整的去重机制,提升研究深度 **功能清单**: - 扩展全部数据源(Cochrane、CNKI、万方、预印本、Google Scholar) - 知识图谱存储(文献引用关系、概念/实体关系、作者合作关系、研究时间线) - 完整去重机制(文献ID去重、实体语义去重、关系级去重) - 基于知识图谱的推理与充分性检查 - 报告格式动态调整(根据问题类型灵活调整报告结构) **阶段划分说明**: MVP阶段聚焦核心价值验证(搜索+报告生成),知识图谱及其相关功能(去重、推理)作为整体在第二阶段一起引入,避免功能割裂 --- ## 8. 技术约束与非功能性需求 ### 8.1 技术约束 以下为用户明确要求的技术约束: **知识图谱存储** > 使用知识图谱进行文献存储与动态更新 **全图去重机制** > 建立全图去重机制(文献ID去重+实体语义去重+关系级去重) **Multi-Agent架构** > 采用Multi-Agent架构实现并行处理和进度展示 ### 8.2 性能要求 | 指标 | 要求 | 说明 | |-----|------|------| | 响应时间 | 允许小时级执行 | 追求全面深入的研究结果而非快速响应 | | 进度反馈 | 实时 | Multi-Agent执行过程需实时展示进度 | ### 8.3 安全要求 - 无特殊安全要求,主要处理公开学术文献 - 无需用户认证或敏感数据加密 ### 8.4 其他非功能性要求 | 类别 | 要求 | |-----|------| | 使用规模 | 个人/小团队使用(1-10人) | | 日均查询量 | 10-50次 | | 输出语言 | 报告输出为中文 | | 文献处理 | 支持中英文文献处理 | --- ## 9. 验收标准 ### 9.1 功能验收标准 | 验收项 | 验收标准 | 验证方式 | |-------|---------|---------| | 引用准确性 | 报告中引用的每篇文献都能在对应数据源中找到原文 | 人工抽查验证 | | 报告完整性 | 包含背景、文献分析、证据等级、结论、引用等必要章节 | 结构检查 | | 进度展示 | Multi-Agent执行过程可视化展示,用户能了解当前进度 | 用户体验测试 | | 复杂问题处理 | 能处理多维度、跨领域的精神疾病研究问题 | 复杂问题测试 | | 去重有效性 | 同一文献不重复入库,同义实体能识别合并,关系边不重复 | 知识图谱检查 | ### 9.2 非功能验收标准 | 验收项 | 验收标准 | |-------|---------| | 执行时间 | 完整研究报告生成在合理时间内完成(允许小时级) | | 并发支持 | 支持小团队(1-10人)同时使用 | | 中英文支持 | 能正确处理中英文混合的研究问题和文献 |