需求文档skill回溯专家博弈之前

2025-12-11 14:19:36 +08:00
parent 5f329d7b4c
commit f4314c3ede
117 changed files with 28969 additions and 3325 deletions
--- a/会议转写测试/会议纪要生成效果对比/gemini清洗后/Q&A资源库类会议纪要_2025-12-02_第6次周会.md
+++ b/会议转写测试/会议纪要生成效果对比/gemini清洗后/Q&A资源库类会议纪要_2025-12-02_第6次周会.md
@ -0,0 +1,260 @@
+# Q&A资源库类会议纪要 (2025-12-02)
+
+## 一、会议信息
+
+- **会议时间:** 2025-12-02
+- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
+- **纪要整理人:** Claude
+
+---
+
+## 二、工作问题 Q&A
+
+### 1. 会议纪要Skill相关问题
+
+**Q1: 会议纪要Skill信息提取准确性不足怎么办？**
+
+**问题详情：** 文字转写准确性不够，语义识别困难；缺乏上下文约束能力；分块搜索导致信息遗漏；P0/P1/P2优先级判断不准确。
+
+**A1:**
+1. 将文字转写工具从腾讯会议换成Gemini多模态转写，利用其视觉识别能力提高准确性
+2. 对转写文本进行Clean预处理，去除脏数据和重复内容
+3. 采用全量主上下文窗口处理，不用分块搜索
+4. P0/P1/P2优先级在会议上实时确认，不完全依赖AI判断
+
+---
+
+**Q2: 子Agent分割处理会导致什么问题？**
+
+**问题详情：** 使用多个子Agent并行提取信息后，在主窗口整合时发现信息丢失和逻辑割裂。
+
+**A2:**
+1. 子Agent提取后主窗口无法建立各部分之间的关联性
+2. 建议把Clean后的转写文本直接加载给主上下文全量处理
+3. 将子Agent提取的结果作为增强Prompt传给主上下文，减少信息损失
+4. 非长连续工作场景，主上下文能处理好的就全放主上下文
+
+---
+
+### 2. Sub-agent架构相关问题
+
+**Q3: Sub-agent调用不稳定怎么解决？**
+
+**问题详情：** Sub-agent在项目下使用相对路径调用时几乎无法成功执行，会读取prompt但不执行。
+
+**A3:**
+1. **必须使用绝对路径调用Sub-agent**，相对路径调用不稳定
+2. 采用Agent调Agent的架构，而非Skill调Agent
+3. 定义主Agent后直接选定激活，其他Agent自动成为Sub-agent
+4. 调试阶段可用Skill，调通后将Skill.md移植到Agent中
+
+---
+
+**Q4: Skill和Agent应该如何组织架构？**
+
+**问题详情：** Skill调Agent、Agent调Skill来回嵌套导致逻辑混乱。
+
+**A4:**
+1. **用Agent调Agent，不用Skill调Agent**
+2. 可以用Skill嵌套Skill，虽然上下文长但逻辑控制精确
+3. Sub-agent因不带上下文会导致控制问题，主上下文共享更好
+4. 子项目下用主Agent组织其他Agent更清晰
+
+---
+
+### 3. 数字人PPT相关问题
+
+**Q5: 数字人选型需要注意什么？**
+
+**问题详情：** 老外数字人说流利中文会让人质疑真实性，与追求真实感的目标矛盾。
+
+**A5:**
+1. **不要只看树木不看森林**，老外说流利中文会让人质疑真假
+2. 追求真实性就要用真实可信的形象，用真人录制训练
+3. 数字人必须有手势动作，前十秒不能呆站
+4. 视频结尾加独立告别画面，有始有终
+
+---
+
+**Q6: 数字人平台如何选型？**
+
+**问题详情：** 多个平台费用和能力不同，如何选择。
+
+**A6:**
+1. **优先百度希壤和HeyGen（黑镜）**
+2. 可灵即梦按秒收费太贵
+3. 百度希壤按分钟包价格合理（40块钱10分钟）
+4. 黑镜会员免费生成，只收定制费
+5. 可尝试Gemini VEO 3.1，3.0 Pro后视频能力升级明显
+
+---
+
+### 4. 前端重构相关问题
+
+**Q7: 前端重构应该如何规划？**
+
+**问题详情：** 只重构展示部分可能不够，担心后续架构又要重改。
+
+**A7:**
+1. **重构时必须考虑下一版本的交互逻辑修改**
+2. 后端先不动，用Opus 4.5或Codex做一次Code Review
+3. 将审查发现的问题记录作为重构需求文档
+4. 先审查再动手，避免盲目重构
+
+---
+
+### 5. 需求Skill相关问题
+
+**Q8: 多专家博弈评审机制如何验证效果？**
+
+**问题详情：** 只看到专家提问，看不到响应，无法判断评审水平是否足够。
+
+**A8:**
+1. 将专家评估意见和响应整合成可视化的一问一答文档
+2. 评估提问和响应的水平是否匹配
+3. 水平不匹配则不需要这个环节
+4. 各领域专家的prompt需要专人编写
+
+---
+
+### 6. AI能力边界相关问题
+
+**Q9: AI优先级判断不准怎么办？**
+
+**问题详情：** AI对P0/P1/P2任务优先级判断困难，缺乏人员背景等隐性上下文。
+
+**A9:**
+1. **在会议上实时确认优先级**，不完全依赖AI
+2. 让AI先给出建议排序，人再确认反馈
+3. 将确认过程材料保留，用于后续强化学习
+4. 尝试将潜在上下文逐步显性化
+
+---
+
+## 三、重点工作方法
+
+### 方法1: 多模态视频转写优先法
+- **描述:** 使用Gemini多模态能力处理会议视频转写，相比纯语音识别效率更高。Gemini能识别画面内容、文字和说话人动作，可通过prompt调整提取内容，甚至直接给会议模版让其一步生成会议纪要。
+- **适用场景:** 会议记录、视频内容提取、多信息源整合
+- **关键要点:**
+  - 多模态处理比纯语音识别效率高，能识别背景画面信息
+  - Gemini上下文最长(100万token)，视觉能力最强
+  - 可用Gem自定义功能，预置会议纪要模版后上传视频自动生成
+
+### 方法2: AI工具组合使用策略
+- **描述:** 不同AI工具各有专长，应根据任务特点组合使用：前端用Gemini（多模态强），中间逻辑用Claude（工具调用强），项目修复测试用GPT Codex。
+- **适用场景:** 复杂项目开发、多任务并行处理
+- **关键要点:**
+  - Gemini最全面，多模态尤其视觉能力超强，适合做PPT和视频
+  - Claude工具调用和工具理解能力无人能及，做Agent首选
+  - 选择工具要看任务特点而非盲目追求最聪明的模型
+
+### 方法3: 转写文本预清洗法
+- **描述:** 在处理会议转写前，先用AI对原始转写进行Clean，去除脏数据和重复内容，保证信息全面的同时内容紧凑。
+- **适用场景:** 会议转写处理、长文本预处理、数据清洗
+- **关键要点:**
+  - 原始转写存在逻辑中断、错误，直接处理效果差
+  - Clean后内容紧凑，从3万字可精简到2万字左右
+  - 避免给AI喂垃圾数据，先精加工再处理
+
+### 方法4: 主上下文全量处理法
+- **描述:** 对于信息损失敏感的任务，优先在主上下文窗口全量处理，而非分割给多个子Agent。
+- **适用场景:** 信息整合、关联分析、会议纪要生成
+- **关键要点:**
+  - 子Agent处理会造成逻辑割裂和信息丢失
+  - 主上下文直接生成比提示词生成再整合信息量更大
+  - 非长连续工作场景，主上下文能处理好的就全放主上下文
+
+### 方法5: 人机协作关键节点介入法
+- **描述:** 识别AI难以自主判断的关键节点（如优先级判断），在这些节点让人介入给予关键帮助。
+- **适用场景:** 复杂决策、优先级判断、隐性知识应用
+- **关键要点:**
+  - AI缺乏潜上下文（人员级别、工作年限等），某些判断靠人更有效
+  - 先让AI给建议再人工确认，保留确认记录用于后续训练
+  - 把潜在上下文逐步显性化给AI
+
+### 方法6: 会议实时确认法
+- **描述:** 在会议进行中或刚结束时，实时整理会议纪要并当场确认，不等会后让AI自行判断。
+- **适用场景:** 周会、项目会议、决策会议
+- **关键要点:**
+  - 会议中前半部分已可开始整理
+  - 会上直接确认P0/P1等关键信息
+  - 当场确认效率最高、准确度最高
+
+### 方法7: Sub-Agent绝对路径调用法
+- **描述:** 在项目下调用Sub-Agent时必须使用绝对路径，相对路径调用几乎不成功。
+- **适用场景:** Skill开发、Agent架构设计
+- **关键要点:**
+  - 相对路径调用Sub-Agent几乎不成功
+  - 绝对路径调用测试七八次基本稳定
+  - 不指定目录时AI会优先找全局Agent
+
+### 方法8: Agent调用Agent架构
+- **描述:** 不要在Skill里调用Sub-Agent，而应该用Agent调用Agent。定义主Agent后选定它，再调用的其他Agent就是Sub-Agent。
+- **适用场景:** 复杂Agent系统设计、多Agent协作
+- **关键要点:**
+  - Skill调用Sub-Agent组织会乱
+  - Agent调Agent最容易实现
+  - 避免Skill和Agent互相嵌套调用
+
+### 方法9: Skill嵌套Skill替代Sub-Agent
+- **描述:** 直接用Skill嵌套Skill来组织复杂流程，放弃Sub-Agent。虽然上下文较长，但逻辑控制精确。
+- **适用场景:** 复杂流程自动化、多步骤任务
+- **关键要点:**
+  - Skill套Skill比Sub-Agent清晰得多
+  - 上下文共享使逻辑控制精确
+  - Sub-Agent不带上下文会导致控制问题
+
+### 方法10: 上下文越全越好原则
+- **描述:** 不要过度限定AI做什么，而是给它尽量完整的上下文，让它自己理解并制定方案。
+- **适用场景:** 创意生成、方案设计、内容生成
+- **关键要点:**
+  - Claude生成的提示词不如Gemini直接读文档效果好
+  - 不要规定AI做什么，给全上下文让它自己决定
+  - 启发：上下文管理思路的转变
+
+### 方法11: Playwright+OS Scripts自动化工作流
+- **描述:** 用Playwright MCP控制浏览器操作，当操作超出浏览器范围时用OS Scripts接管，实现完全自动化。
+- **适用场景:** 网页自动化、图片生成、PPT制作
+- **关键要点:**
+  - Playwright控制浏览器内操作
+  - OS Scripts处理系统对话框等浏览器外操作
+  - Python脚本组装最终产出
+
+### 方法12: AI分镜头脚本生成法
+- **描述:** 用Gemini 3生成分镜头脚本，分段生成图片，再通过首尾帧生成连贯视频，最后合成完整视频。
+- **适用场景:** 视频制作、数字人视频、宣传片
+- **关键要点:**
+  - Gemini 3对镜头理解和分镜脚本生成优于其他模型
+  - 先生成分段图片，再用首尾帧生成视频
+  - 分段生成后合并成完整视频
+
+### 方法13: 代码审查驱动重构法
+- **描述:** 重构前先用AI对现有代码做完整审查，记录问题作为需求文档，再逐步重构。
+- **适用场景:** 代码重构、技术债务清理、架构升级
+- **关键要点:**
+  - 先审查再动手，审查结果就是重构需求文档
+  - 用Opus 4.5或Codex做Code Review
+  - 重构时同时考虑下一版本功能需求
+
+### 方法14: AI模拟专家访谈法
+- **描述:** 在需求文档第一版生成时，用AI模拟领域专家来回答访谈问题，实现需求采集流程自动化。
+- **适用场景:** 需求采集、专家访谈、方案设计
+- **关键要点:**
+  - 用AI模拟比我们经验丰富的专家
+  - 专家Agent回答可能更全面
+  - 适用于需求文档初版生成
+
+### 方法15: 字段映射逻辑图驱动开发
+- **描述:** 开发复杂Skill时，先绘制每个输出字段的来源映射逻辑图，明确来源和优先级。
+- **适用场景:** Skill开发、数据处理流程设计
+- **关键要点:**
+  - 每个字段明确来源和优先级
+  - 用可视化逻辑图而非纯文字描述
+  - 解决AI逻辑不连贯问题
+
+---
+
+**纪要整理人:** Claude
+**纪要时间:** 2025-12-02
+**下次会议:** 2025-12-09
--- a/会议转写测试/会议纪要生成效果对比/gemini清洗后/云大所需求相关进度会议纪要_2025-12-02_第6次周会.md
+++ b/会议转写测试/会议纪要生成效果对比/gemini清洗后/云大所需求相关进度会议纪要_2025-12-02_第6次周会.md
@ -0,0 +1,86 @@
+# 云大所需求相关进度会议纪要 (2025-12-02)
+
+## 一、会议信息
+
+- **会议时间:** 2025-12-02
+- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
+- **纪要整理人:** Claude
+
+---
+
+## 二、需求项目进展
+
+| 项目名称 | 负责人 | 本周进展 | 存在问题 | 下周计划 | 优先级 |
+|----------|--------|----------|----------|----------|--------|
+| 投标商务应答自动生成系统 | 郝倩玉、闫旭隆、江争达 | 需求文档已完成，已发闫旭隆确认 | 架构设计待启动 | 从P1提升到P0，完成招投标Skill架构设计 | P0 |
+| 运营商信息精准爬取系统 | 郝倩玉 | 持续跟进需求方反馈 | 需求方具体需求一直不能明确 | 持续跟进需求方反馈 | P1 |
+| 数字人项目 | 江争达、陶西平 | 需求文档已完成删减优化，整合平台选型调研结果 | 1）第二阶段功能规划缺失；2）时长需求不准确（当前3-5分钟，实际应20-30分钟）；3）数字人缺少手势动作；4）老外说流利中文的真实性问题 | 用真人训练生成PPT样本；研究数字人工作流；测试Gemini分镜头视频生成 | P0 |
+| Gartner 报告解读转写系统 | 郝倩玉 | 需求文档已完成，已发闫旭隆 | 无 | 等待技术方案确认 | P1 |
+| 客户风险推送自动化系统 | - | 本次会议未讨论 | - | - | - |
+| 邮件自动处理转发系统 | - | 本次会议未讨论 | - | - | - |
+| 证书信息提取系统 | - | 本次会议未讨论 | - | - | - |
+| 云大阁新报告自动推送 | - | 本次会议未讨论 | - | - | - |
+
+---
+
+## 三、问题与风险
+
+### 1. 投标商务应答自动生成系统
+
+**问题描述：** 需求文档已完成，但架构设计尚未启动
+
+**解决方案：**
+- 从P1提升到P0优先级，加快推进
+- 闫旭隆负责确认需求文档并设计Skill架构
+- 江争达负责后期调试
+
+**责任人：** 郝倩玉、闫旭隆、江争达
+**截止时间：** 2025-12-09
+
+---
+
+### 2. 运营商信息精准爬取系统
+
+**问题描述：** 需求方（富有、琳贤）的具体需求一直不能明确
+
+**解决方案：**
+- 持续跟进，反复沟通
+- 提供可行性方案给对方做参考
+
+**责任人：** 郝倩玉
+**截止时间：** 待定（等待需求方明确）
+
+---
+
+### 3. 数字人项目
+
+**问题描述：**
+1. 需求文档第二阶段功能缺失
+2. 时长需求不准确（3-5分钟 vs 实际20-30分钟）
+3. 数字人形象和动作要求不完整
+4. 真实性考虑不足
+
+**解决方案：**
+1. 补充第二阶段功能详细说明
+2. 时长需求扩展到支持20-30分钟PPT宣讲
+3. 增加手势动作要求，避免呆板
+4. 使用真人录制训练的语音和形象
+5. 视频结尾增加独立告别画面
+
+**责任人：** 江争达、陶西平
+**截止时间：** 2025-12-09
+
+---
+
+## 四、下周重点
+
+1. 🔴 **投标商务应答自动生成系统** - 完成Skill架构设计（P0）
+2. 🔴 **数字人项目** - 用真人训练生成PPT样本；研究数字人工作流；测试Gemini分镜头视频生成（P0）
+3. **运营商信息精准爬取系统** - 持续跟进需求方反馈（P1）
+4. **Gartner报告解读转写系统** - 等待技术方案确认（P1）
+
+---
+
+**纪要整理人:** Claude
+**纪要时间:** 2025-12-02
+**下次会议:** 2025-12-09
--- a/会议转写测试/会议纪要生成效果对比/gemini清洗后/工程类会议纪要_2025-12-02_第6次周会.md
+++ b/会议转写测试/会议纪要生成效果对比/gemini清洗后/工程类会议纪要_2025-12-02_第6次周会.md
@ -0,0 +1,309 @@
+# 工程类会议纪要 (2025-12-02)
+
+## 一、会议信息
+
+- **会议时间:** 2025-12-02
+- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
+- **纪要整理人:** Claude
+
+---
+
+## 二、工作内容
+
+### 1. 重点项目进展情况汇总
+
+| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
+|----------|----------|------------|--------------|
+| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成整体架构改进：从索引搜索改为全量读取方式；完成字段来源映射逻辑图设计；修改负责人字段为"原负责人"，截止时间改为"原截止时间"。存在问题：1）文字语义识别仍是最大问题；2）存在信息遗漏（日报驱动系统未提取）；3）逻辑判断存在矛盾。**解决方案：** 1）转写工具换成Gemini多模态；2）生成Clean后的全量文字稿作为输入；3）全量主上下文窗口处理；4）将Subagent逻辑整合成单一Skill文件 |
+| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 正在进行多专家博弈评审机制验证，已生成专家评审JSON文件。存在问题：1）多专家博弈的prompt可能没写好；2）需验证评审水平是否达标。**解决方案：** 1）把专家评估意见整合成可视化文档（一问一答形式）；2）各领域专家Prompt需专人编写；3）尝试用AI模拟专家回答访谈问题 |
+| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成需求文档删减和优化，保留有用需求，删除默认功能；分阶段规划保持不变；已整合数字人平台选型调研结果。存在问题：1）第二阶段功能规划缺失；2）时长需求定义不准确（当前3-5分钟，实际应为20-30分钟）；3）数字人缺少手势动作；4）老外说流利中文的真实性问题。**解决方案：** 1）补充第二阶段说明；2）时长调整为20-30分钟；3）加入手势要求；4）用真实人容貌训练 |
+| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 未在会议中讨论，需求方尚未明确反馈 |
+| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 正在规划前端展示部分和代码结构重构，保留现有基础功能。存在问题：1）需考虑下一版本交互逻辑更改；2）后端代码质量未知。**解决方案：** 1）重构时考虑下一版本功能需求；2）用Opus 4.5或Codex对后端做Code Review；3）后端先不动，审查后再规划 |
+| 问答系统V1.0测试推动 | 江争达、郝倩玉 | 2025-12-02 | 未在会议中详细讨论，多次与媛媛沟通，相关领导参与测试时间尚未确定 |
+| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 从P1提升到P0，比较紧急。投标商务响应文件自动生成系统需求文档已完成 |
+| Gartner报告解读转写系统需求文档 | 郝倩玉 | 2025-12-02 | 已完成，已发闫旭隆 |
+
+### 2. 重点项目问题及解决方案
+
+#### 问题1: 会议纪要Skill信息提取准确性问题
+
+**问题描述:**
+会议纪要Skill在信息提取时存在以下问题：
+- 文字转写的准确性不够，语义识别困难
+- 缺乏上下文约束能力，无法理解会议背景信息
+- 分块搜索导致信息遗漏，如日报驱动系统未被提取
+- 逻辑判断存在矛盾，如周报显示完成但会议中反映未完成
+- P0/P1/P2优先级判断不准确
+
+**解决方案:**
+1. 将文字转写工具从腾讯会议换成Gemini多模态转写，利用其视觉识别能力提高准确性
+2. 对转写文本进行Clean预处理，去除脏数据和重复内容，保证信息紧凑
+3. 采用全量主上下文窗口处理，将Clean后的转写文本直接加载给主窗口
+4. 将子Agent提取的结果作为增强Prompt传给主上下文，减少信息损失
+5. 尝试用Agent调Agent的架构替代Skill调Agent，使组织逻辑更清晰
+
+**责任人:** 闫旭隆
+**截止时间:** 2025-12-09
+
+#### 问题2: Sub-agent调用不稳定问题
+
+**问题描述:**
+Sub-agent在项目下使用相对路径调用时几乎无法成功执行：
+- 全局下调用Sub-agent能正常执行
+- 项目下使用相对路径调用时，会读取Sub-agent的prompt但不执行
+- 项目下使用绝对路径调用时才能稳定成功
+
+**解决方案:**
+1. Sub-agent调用时必须使用绝对路径
+2. 采用Agent调Agent的架构，而非Skill调Agent
+3. 定义主Agent后直接选定激活，其他Agent自动成为Sub-agent
+4. 调试阶段可用Skill，调通后将Skill.md移植到Agent中
+5. 非必要情况下用Agent组织Agent，不用Skill组织Agent
+
+**责任人:** 闫旭隆
+**截止时间:** 2025-12-09
+
+#### 问题3: 数字人PPT需求文档产出问题
+
+**问题描述:**
+数字人PPT需求文档存在以下问题：
+- 时长需求不准确，只写了3-5分钟，但实际PPT宣讲需要20-30分钟
+- 第二阶段功能需求未写入文档
+- 数字人动作要求不完整，缺少手势动作要求
+- 真实性考虑不足，老外说流利中文会让人质疑真假（本末倒置）
+
+**解决方案:**
+1. 时长需求扩展到支持20-30分钟的PPT宣讲
+2. 将第一阶段和第二阶段功能需求都完整写入文档
+3. 增加数字人手势动作要求，避免前十秒后十秒呆板无动作
+4. 数字人形象选型需考虑真实性，使用真人录制训练的语音和形象
+5. 视频结尾增加数字人独立告别画面，有始有终
+
+**责任人:** 江争达、陶西平
+**截止时间:** 2025-12-09
+
+#### 问题4: 前端重构方案考虑不全面
+
+**问题描述:**
+问答系统v1.1前端重构需要考虑更多因素：
+- 只重构前端展示和代码结构可能不够
+- 需要考虑下一版本的交互逻辑变更
+- 后端代码质量未经审查
+
+**解决方案:**
+1. 重构时需考虑下一版本可能的功能需求和交互逻辑变更
+2. 用Opus 4.5或Codex对后端代码进行一次Code Review审查
+3. 将审查发现的问题记录下来作为后续重构的需求文档
+4. 后端暂不动，先审查再规划
+
+**责任人:** 江争达、陶西平
+**截止时间:** 2025-12-09
+
+#### 问题5: 需求Skill多专家评审效果不明确
+
+**问题描述:**
+需求Skill的多专家博弈评审机制效果无法确认：
+- 只看到专家提问，看不到响应
+- 无法判断专家评估水平是否足够
+- 各领域专家的prompt可能没写好
+
+**解决方案:**
+1. 将专家评估意见和最后响应整合成可视化的一问一答文档
+2. 评估专家提问和响应的水平是否匹配，判断是否有必要保留该环节
+3. 各领域专家由专人负责编写专业的prompt
+4. 第一版需求文档生成时可尝试用AI模拟专家回答访谈问题
+
+**责任人:** 闫旭隆
+**截止时间:** 2025-12-09
+
+#### 问题6: AI优先级判断依赖人工介入
+
+**问题描述:**
+AI对P0/P1/P2任务优先级的判断非常困难，因为缺乏潜在上下文：
+- 不知道团队成员的年龄、级别、工作时间长短
+- 无法理解不同人员分配任务的差异
+- 这些潜在上下文很难完全显性化给AI
+
+**解决方案:**
+1. 在会议上实时确认P0/P1/P2任务优先级
+2. 让AI先给出建议排序，人再确认反馈
+3. 将确认过程的材料保留，用于后续强化学习或微调
+4. 尝试将潜在上下文逐步显性化
+
+**责任人:** 连云波、闫旭隆
+**截止时间:** 2025-12-09
+
+### 3. 下周工作安排
+
+| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
+|----------|--------|--------------|--------|----------|
+| 🔴 会议纪要Skill优化-全量主窗口处理 | 闫旭隆 | 先用现有版本生成会议纪要，然后在主窗口加载会议转写上下文做全量处理；将Subagent逻辑整合成单一Skill文件 | P0 | 2025-12-09 |
+| 🔴 会议转写文本双版本对比 | 闫旭隆 | 分别用腾讯会议版本和Gemini视频转写版本生成转写文本，进行对比分析 | P0 | 2025-12-09 |
+| 🔴 Gemini转写文本测试 | 闫旭隆 | 用Gemini转写文本套到现有Skill生成会议纪要 + 直接用Gemini喂视频一步生成会议纪要 | P0 | 2025-12-09 |
+| 🔴 需求Skill专家交叉回应可视化 | 闫旭隆 | 整理二阶段专家交叉回应模块的可视化效果，把评估意见和响应整合成一问一答文档 | P0 | 2025-12-09 |
+| 🔴 需求Skill流程图优化 | 闫旭隆 | 走一遍需求Skill流程图，查看未来流程需要怎么修改完善 | P0 | 2025-12-09 |
+| 🔴 招投标Skill架构设计 | 闫旭隆、郝倩玉 | 从P1提升到P0，完成招投标Skill的架构设计 | P0 | 2025-12-09 |
+| 🔴 数字人PPT样本生成 | 江争达、陶西平 | 用自己真实人容貌训练出来的语音和视频，生成PPT讲解样本 | P0 | 2025-12-09 |
+| 🔴 数字人工作流研究 | 江争达、陶西平 | 研究数字人生成工作流，包括API调用、网站操作或剪映自动化工具等 | P0 | 2025-12-09 |
+| 🔴 Gemini分镜头视频生成测试 | 江争达、陶西平 | 通过Gemini 3.0生成分镜头脚本和图片，再找平台试生成视频效果 | P0 | 2025-12-09 |
+| 🔴 前端重构-后端代码审查 | 江争达 | 用Codex或Opus 4.5对现有后端代码做Code Review，记录问题作为重构需求 | P0 | 2025-12-09 |
+| 🔴 前端重构方案优化 | 江争达、陶西平 | 用大模型重新生成前端重构方案，对比现有方案差异；考虑下个版本交互逻辑 | P0 | 2025-12-09 |
+| 数字分身需求对接 | 郝倩玉 | 持续跟进需求方反馈，推动需求明确 | P1 | 2025-12-09 |
+| 问答系统V1.0测试推动 | 郝倩玉 | 继续与张媛媛沟通，推动相关领导参与测试 | P1 | 2025-12-09 |
+| 运营商信息精准爬取系统需求跟进 | 郝倩玉 | 持续跟进需求方反馈 | P1 | 2025-12-09 |
+| 天眼查自动更新需求确认 | 闫旭隆 | 确认小童是否还需要天眼查客户数据库自动更新功能 | P1 | 2025-12-09 |
+| 日报驱动项目管理系统开发 | 丁康 | 学习Asana架构和模块，设计日报驱动项目管理系统 | P1 | 待定 |
+| Skill到LangChain架构迁移研究 | 待定 | 研究如何将Claude Code Skill转移到LangChain/LangGraph架构 | P2 | 待定 |
+
+### 4. 组内成员工作进展
+
+#### 闫旭隆
+
+**上周完成:**
+- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制
+- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文
+- ✅ 录制演示视频
+
+**进行中:**
+- 🔄 会议纪要Skill架构优化（全量主窗口处理）
+- 🔄 需求Skill专家博弈机制验证
+
+**收到的反馈/学习建议:**
+- **表扬:** 会议纪要Skill的逻辑映射图做得很重要，有助于保持逻辑一致性和前后连贯性
+- **表扬:** 生成的会议纪要比手动版本更具体详细，主要要点都有提取出来
+- **批评:** 日报驱动系统没有总结出来，逻辑不全，存在信息遗漏问题
+- **建议:** 整个文字转写换成Gemini，因为Gemini多模态能力最强
+- **建议:** 把转写文本Clean一次，去除脏的、重复的内容，直接加载给主上下文
+- **建议:** 尝试用全量主上下文窗口处理，把Skill全部写到主Agent里
+- **建议:** P0/P1/P2优先级判断让AI先给建议，人再确认反馈
+- **建议:** 调试时可以用Skill调用Sub-agent方式，流程调通后把Skill.md移植到Agent中
+
+**下周任务:**
+- [ ] 🔴 P0｜会议纪要Skill优化-全量主窗口处理
+- [ ] 🔴 P0｜会议转写文本双版本对比
+- [ ] 🔴 P0｜Gemini转写文本测试
+- [ ] 🔴 P0｜需求Skill专家交叉回应可视化
+- [ ] 🔴 P0｜需求Skill流程图优化
+- [ ] 🔴 P0｜招投标Skill架构设计
+- [ ] P1｜天眼查自动更新需求确认
+
+#### 江争达
+
+**上周完成:**
+- ✅ 数字人PPT需求文档
+
+**进行中:**
+- 🔄 问答系统v1.1前端重构方案
+- 🔄 PDF Skill技术调研
+- 🔄 Skill Plugin管理系统搭建
+- 🔄 服务器采购
+- 🔄 招投标文件Skill架构调试
+
+**收到的反馈/学习建议:**
+- **批评:** 数字人选型存在"只看树木不看森林"的问题——老外生成流利中文会让人质疑真实性，追求真实却选择最假的表现是本末倒置
+- **建议:** 数字人PPT需求文档中分阶段规划部分，第二阶段内容缺失，建议都写上完整
+- **建议:** 视频时长需求提得不够准确，应该考虑20-30分钟的PPT宣讲场景
+- **建议:** 数字人标准中要把手势动作加进去，前十秒后十秒不能呆板无动作
+- **建议:** 视频结尾可以增加数字人独立的告别画面，有始有终
+- **建议:** 前端重构时要考虑下一版本的交互逻辑更改
+- **建议:** 后端先不动，用Opus 4.5或Codex对后端代码做一次审查
+- **建议:** 通过Gemini 3.0生成分镜头脚本，利用其视觉理解能力生成图片
+
+**下周任务:**
+- [ ] 🔴 P0｜数字人PPT样本生成（真人训练）
+- [ ] 🔴 P0｜数字人工作流研究
+- [ ] 🔴 P0｜Gemini分镜头视频生成测试
+- [ ] 🔴 P0｜前端重构-后端代码审查
+- [ ] 🔴 P0｜前端重构方案优化
+- [ ] P1｜问答系统V1.0测试推动
+- [ ] P1｜PDF Skill技术调研
+- [ ] P1｜服务器采购
+
+#### 郝倩玉
+
+**上周完成:**
+- ✅ 会议纪要Skill架构优化（协助旭隆优化学习类+Q&A类会议纪要Skill逻辑）
+- ✅ Gartner报告解读转写系统需求文档（已发闫旭隆）
+- ✅ 问答系统V1.0测试推动沟通
+
+**进行中:**
+- 🔄 数字分身需求对接（需求方尚未明确）
+- 🔄 招投标文件Skill架构设计
+- 🔄 运营商信息精准爬取系统需求跟进
+
+**收到的反馈/学习建议:**
+- 无（本次会议未针对郝倩玉工作进行专门讨论）
+
+**下周任务:**
+- [ ] 🔴 P0｜招投标Skill架构设计（配合闫旭隆）
+- [ ] P1｜数字分身需求对接
+- [ ] P1｜推动问答系统V1.0测试
+- [ ] P1｜运营商信息精准爬取系统需求跟进
+
+#### 陶西平
+
+**上周完成:**
+- ✅ 数字人PPT需求文档（协助江老师修改）
+- ✅ 学习使用claudecode的document skill
+- ✅ 调研数字人平台公共数字人能力
+- ✅ 根据指定PPT生成数字人结合视频
+
+**进行中:**
+- 🔄 数字人与PPT结合优化
+- 🔄 前端框架重构
+
+**收到的反馈/学习建议:**
+- **建议:** 需求文档分阶段规划中，第一阶段和第二阶段功能都应该写清楚
+- **建议:** 数字人视频时长需求应该考虑20-30分钟的PPT宣讲场景
+- **建议:** 数字人需要添加手势动作，前十秒呆站着讲是有问题的
+- **批评:** 老外数字人说流利中文的问题是"只看树木不看森林"，会让人质疑真实性
+- **建议:** 视频结尾可以加数字人独立的告别画面，有始有终
+- **建议:** 尝试用Gemini VEO 3.1测试视频生成效果
+- **建议:** 可以通过Gemini 3生成分镜头脚本，分段生成图片再合成视频
+- **建议:** 前端重构时要考虑下一版本的交互逻辑更改
+- **建议:** 后端先不动，用Opus 4.5或Codex对后端代码做审查
+
+**下周任务:**
+- [ ] 🔴 P0｜配合江老师数字人PPT样本生成
+- [ ] 🔴 P0｜数字人工作流研究
+- [ ] 🔴 P0｜Gemini分镜头视频生成测试
+- [ ] 🔴 P0｜前端重构方案优化
+- [ ] P1｜完成问答系统前端重构需求文档
+
+---
+
+## 三、会议总结
+
+**核心议题:** 会议纪要Skill架构优化、数字人PPT需求完善、前端重构方案、AI工具选型
+
+**关键决策:**
+
+1. **AI工具选型方案确定:** 前端用Gemini处理多模态任务，中间逻辑用Claude Code，测试和问题修复用GPT Codex
+2. **会议纪要Skill转写工具改用Gemini多模态:** 纯语音识别效率低，Gemini能识别画面内容且错误率低
+3. **会议转写文本必须先Clean处理:** 去除脏数据和重复内容，保证信息紧凑后再输入
+4. **尝试全量主上下文窗口处理:** 子Agent方式会导致信息丢失和逻辑割裂，全量处理信息损失最小
+5. **P0/P1/P2优先级判断需人工确认:** AI缺少隐性上下文，优先级判断需人工在会上辅助
+6. **Agent调Agent优于Skill调Agent:** 定义主Agent后其他都是Sub-agent，组织逻辑更清晰
+7. **Sub-agent调用必须使用绝对路径:** 相对路径调用不稳定
+8. **Skill嵌套Skill比Sub-agent更清晰可控:** 虽然上下文长，但逻辑控制精确
+9. **数字人视频时长需求扩展到20-30分钟:** 这是PPT宣讲的主要需求
+10. **数字人必须包含手势动作:** 前十秒不能呆站，真实性要求
+11. **数字人平台选型优先百度希壤和HeyGen:** 价格合理，可定制
+12. **前端重构前先做后端Code Review:** 用Opus 4.5或Codex审查，后端先不动
+13. **前端重构必须考虑下一版本交互逻辑:** 避免架构调整后又要重改
+14. **日报驱动项目管理系统由丁康负责:** 基于会议纪要生成日报，对接Asana
+15. **Skill迁移到LangChain/LangGraph作为P1-P2研究项目:** 当前Skill用多了后需转化到正式Agent框架
+
+**下周工作重点:**
+
+1. 🔴 会议纪要Skill优化，改用Gemini转写 + 全量主窗口处理
+2. 🔴 需求Skill专家交叉回应可视化整理
+3. 🔴 招投标Skill架构设计（P1提升为P0）
+4. 🔴 数字人PPT样本生成（真人训练）+ 工作流研究
+5. 🔴 前端重构-后端代码审查 + 方案优化
+
+---
+
+**纪要整理人:** Claude
+**纪要时间:** 2025-12-02
+**下次会议:** 2025-12-09