需求文档skill回溯专家博弈之前

This commit is contained in:
闫旭隆
2025-12-11 14:19:36 +08:00
parent 5f329d7b4c
commit f4314c3ede
117 changed files with 28969 additions and 3325 deletions

View File

@ -0,0 +1,156 @@
# Q&A资源库类会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉
---
## 二、工作问题 Q&A
### 1. 会议纪要Skill相关问题
**Q1: 会议纪要语音转写准确性不足怎么解决?**
**问题描述:** 语音识别效率低,文字转写的准确性不足,上下文约束能力差。转写文本有大量重复、错误和逻辑中断。
**解决方案:**
- 使用Gemini多模态能力处理视频转写直接上传视频给Gemini生成会议纪要
- 先清洗转写文本去除重复、脏数据再进行处理生成紧凑的clean版本
- 改为全量读取上下文方式,不用索引搜索,让模型通过语义理解提取信息
- 考虑调用Gemini API在Claude里面处理转写实现自动化
**Q2: 会议纪要P0/P1/P2优先级判断不准确怎么办**
**问题描述:** 模型很难准确判断任务的优先级,因为缺少成员的年龄、级别、工作时间等潜在上下文信息。
**解决方案:**
- 让模型先给出优先级建议,人再进行确认反馈
- 在会上直接确认P0/P1/P2给模型明确的文字信息
- 逐步把潜在上下文显性化,作为输入提供给模型
- 保留确认过程的所有材料,作为后续微调训练数据
### 2. Agent架构相关问题
**Q3: Sub Agent调用时相对路径不可靠怎么办**
**问题描述:** 在项目目录下调用全局Agent时使用相对路径调用不可靠。不指定绝对路径时Sub Agent会读取提示词但不会按照预期执行。
**解决方案:**
- 使用绝对路径调用Sub Agent确保路径指向正确位置
- 建议用Agent调Agent而非Skill调Agent逻辑更清晰
- Skill调Skill在主窗口上下文共享控制更精确
- 调试时用Skill形式调通后再移植到Agent中
**Q4: Skill调Agent和Agent调Agent哪个更好**
**问题描述:** 在编排复杂流程时,需要选择合适的调用方式。
**解决方案:**
- **Agent调Agent更推荐:** 逻辑更清晰,更智能
- **Skill调Skill的优势:** 主窗口上下文共享,控制更精确
- **调试建议:** 调试时用Skill形式上下文可见调通后再移植到Agent
- **架构建议:** 非必要情况下不要在Skill里面调用Sub Agent会导致逻辑割裂
### 3. 需求文档相关问题
**Q5: 需求文档如何区分默认需求和核心需求?**
**问题描述:** 数字人PPT需求文档时间要求不准确3-5分钟应为20-30分钟说明需求理解存在偏差。
**解决方案:**
- 先明确目标用户的真实使用场景如PPT宣讲一般需要20-30分钟
- 区分"不提也会做"的默认需求和"必须明确"的核心需求
- 需求文档要站在其他人角度思考,让非技术人员也能看懂
**Q6: 如何提升需求表达能力?**
**问题描述:** 需求文档分析问题大,不站在其他人角度思考,核心诉求没说清楚。
**解决方案:**
- 给大模型的提示词必须写详细完整,口头表达时可以简略
- 先交代背景和核心诉求,再说具体内容
- 用deep research或GPT做方案校验
- 把方案给大模型审查,看有什么值得借鉴或存在的问题
### 4. 前端重构相关问题
**Q7: 前端重构如何避免二次返工?**
**问题描述:** 前端重构方案只完成了一半,未考虑下一版本的交互逻辑更改。
**解决方案:**
- 在重构时就考虑下一版本的功能需求
- 后端先用代码审查工具审查一遍,记录问题
- 用deep research或GPT生成前端重构方案对比
- 对照流程图验证方案的准确性
---
## 三、重点工作方法
### 方法1: Gemini多模态视频转写方法
**方法描述:** 使用Gemini的多模态能力直接处理会议视频生成会议纪要。
**适用场景:** 会议纪要生成、视频内容提取
**关键要点:**
- 直接上传视频给Gemini配合会议纪要模板
- 多模态能力可以同时处理视频、音频、文字
- 比纯文字转写后再处理效果更好
- API调用成本可接受半小时约6000字2万多token
### 方法2: PPT自动化生成方法
**方法描述:** 使用Gemini 3.0生成分镜脚本和图片,再通过视频生成平台合成视频。
**适用场景:** PPT自动生成、视频内容创作
**关键要点:**
- 先用Gemini生成分镜头脚本
- 让Gemini生成每个分镜的图片
- 使用首尾帧+文字通过VEO 3.1等平台生成视频
- 使用Playwright MCP实现浏览器自动化操作
### 方法3: Agent架构调试方法
**方法描述:** 先用Skill形式调试调通后再移植到Agent中。
**适用场景:** 复杂Agent流程开发
**关键要点:**
- 调试时用Skill形式上下文可见便于定位问题
- 调通后移植到Agent实现上下文隔离
- 使用绝对路径调用Sub Agent
- 建议用Agent调Agent而非Skill调Agent
### 方法4: 需求文档审查方法
**方法描述:** 使用大模型对需求文档进行多角度审查。
**适用场景:** 需求文档质量提升
**关键要点:**
- 先用deep research或GPT生成参考方案
- 把自己的方案给大模型审查
- 对比两个方案的差异
- 关注核心需求而非默认功能
### 方法5: 代码审查方法
**方法描述:** 使用Claude 4.5或GPT codex对代码进行审查。
**适用场景:** 代码重构前的问题发现
**关键要点:**
- 先审查再重构,避免带病开发
- 审查出来的问题记录下来作为需求文档
- 使用专业的code review工具或Agent
- 下一次会议讨论是否需要修改
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-02
**下次会议:** 2025-12-09

View File

@ -0,0 +1,79 @@
# 云大所需求相关进度会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉
---
## 二、需求项目进展
| 项目名称 | 负责人 | 本周进展 | 存在问题 | 下周计划 | 优先级 |
|----------|--------|----------|----------|----------|--------|
| 投标商务应答自动生成系统 | 郝倩玉、闫旭隆、江争达 | 需求文档已完成并已发给闫旭隆确认 | 架构设计尚未开始 | 需求文档确认+Skill架构设计 | P0 |
| 数字人项目 | 江争达、陶西平、郝倩玉 | 江争达展示修改后的需求文档;陶西平完成数字人平台调研 | 时间要求理解错误应为20-30分钟缺少手势动作要求数字分身需求不明确 | 完成真人训练视频样本(百度曦灵/黑镜修改需求文档Gemini分镜脚本测试 | P0 |
| Gartner 报告解读转写系统 | 郝倩玉 | 需求文档已完成 | 架构设计尚未开始 | 架构设计(需求紧急,涉及年末签约) | P0 |
| 运营商信息精准爬取系统 | 郝倩玉 | 进行中,持续跟进 | 需求方需求不明确 | 继续跟进沟通 | P1 |
| 客户风险推送自动化系统 | - | 未讨论 | - | - | - |
| 邮件自动处理转发系统 | - | 未讨论 | - | - | - |
| 证书信息提取系统 | - | 未讨论 | - | - | - |
| 云大阁新报告自动推送 | - | 未讨论 | - | - | - |
---
## 三、问题与风险
### 投标商务应答自动生成系统
**问题描述:** 需求文档已完成,但架构设计尚未开始
**解决方案:**
1. 闫旭隆确认需求文档并设计Skill架构
2. 江争达负责后期调试
**责任人:** 郝倩玉、闫旭隆、江争达
**截止时间:** 2025-12-09
### 数字人项目
**问题1: 需求文档时间要求不准确**
- 问题需求文档写3-5分钟实际需求应为20-30分钟
- 解决方案:修改视频时长要求
**问题2: 缺少手势动作要求**
- 问题:开场和结束时数字人不能呆呆站着
- 解决方案:在验收标准中增加手势动作要求
**问题3: 数字分身需求不明确**
- 问题:合作方需求一直不能明确
- 解决方案:自己调研市面上的方案,做几个版本供选择
**责任人:** 江争达、郝倩玉
**截止时间:** 2025-12-09
### Gartner 报告解读转写系统
**问题描述:** 需求紧急涉及年末签约可能有30万合同
**解决方案:**
1. 本周完成架构设计
2. 优化可以后续迭代,先有个基本架构
**责任人:** 郝倩玉
**截止时间:** 2025-12-09
---
## 四、下周重点
1. 🔴 **投标商务应答自动生成系统** - 需求文档确认 + Skill架构设计
2. 🔴 **数字人项目** - 完成真人训练视频样本(百度曦灵/黑镜)
3. 🔴 **数字人项目** - Gemini 3.0生成分镜脚本测试
4. 🔴 **数字人项目** - 修改需求文档(时长+手势动作)
5. 🔴 **Gartner 报告解读转写系统** - 架构设计
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-02
**下次会议:** 2025-12-09

View File

@ -0,0 +1,246 @@
# 工程类会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|----------|----------|------------|--------------|
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成改进版本,改为全量加载方式(不用索引搜索),绘制了映射逻辑图。领导评价:整体有进步,基本逻辑可以固化下来先用;建议尝试用主窗口全量处理 |
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成二阶段专家博弈机制开发,新增专家交叉评价和交叉回应功能。领导评价:效果不错,专家博弈机制有价值;建议把评估意见和响应打成文档对比验证 |
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已展示修改后的需求文档但需求理解存在偏差。领导反馈时间要求应为20-30分钟而非3-5分钟缺少手势动作要求需要本周完成用真人训练数字人视频样本 |
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 进行中,合作方需求不明确。领导建议:自己调研市面上的方案,做几个版本供选择 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 前端重构方案只完成了一半。领导建议:后端先用代码审查工具审查一遍;前端重构要考虑下一版本的交互逻辑 |
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 需求文档已完成并已发给闫旭隆被提升为P0任务。领导要求需要尽快设计架构 |
### 2. 重点项目问题及解决方案
#### 问题1: 会议纪要语音转写准确性问题
**问题描述:**
语音识别效率低,文字转写的准确性不足,上下文约束能力差。会议中很多语言不清晰,直接搜索提取不出来。转写文本有大量重复、错误和逻辑中断,导致难以阅读和处理。
**解决方案:**
1. 使用Gemini多模态能力处理视频转写直接上传视频给Gemini生成会议纪要
2. 先清洗转写文本去除重复、脏数据再进行处理生成紧凑的clean版本
3. 改为全量读取上下文方式,不用索引搜索,让模型自己通过语义理解提取信息
4. 考虑调用Gemini API在Claude里面处理转写实现自动化
**责任人:** 闫旭隆
**截止时间:** 2025-12-09
#### 问题2: Sub Agent调用机制问题
**问题描述:**
在项目目录下调用全局Agent时使用相对路径调用不可靠。测试发现不指定绝对路径时Sub Agent会读取提示词但不会按照预期执行只有使用绝对路径调用时才能正常工作。
**解决方案:**
1. 使用绝对路径调用Sub Agent确保路径指向正确位置
2. 建议用Agent调Agent而非Skill调Agent逻辑更清晰
3. Skill调Skill在主窗口上下文共享控制更精确
4. 调试时用Skill形式调通后再移植到Agent中
**责任人:** 江争达、闫旭隆
**截止时间:** 2025-12-09
#### 问题3: 数字人PPT需求文档相关问题
**问题描述:**
- 时间要求不准确需求文档中写的3-5分钟视频时长不准确实际需求应该是20-30分钟的PPT宣讲视频
- 缺少手势动作要求:第一阶段需求中没有包含手势动作要求,但开场和结束时数字人不能呆呆站着讲
**解决方案:**
1. 将视频时长要求修改为20-30分钟3-5分钟作为基础能力
2. 在验收标准中增加开场和结束的手势动作要求
3. 前十秒和后十秒必须有手势动作,可以没有躯体动作但手势必须有
**责任人:** 江争达
**截止时间:** 2025-12-09
#### 问题4: 问答系统前端重构方案未完成
**问题描述:**
前端重构方案只完成了一半,只重构了前端展示部分和代码结构,但未考虑下一版本的交互逻辑更改,可能导致架构调整通不过或需要大量修改。
**解决方案:**
1. 用代码审查工具如Claude Code或Opus 4.5)先审查后端代码,找出问题记录下来
2. 在重构时考虑下一版本的功能需求,避免二次返工
3. 用deep research或GPT的research功能生成前端重构方案对比
4. 对照流程图验证方案的准确性
**责任人:** 江争达
**截止时间:** 2025-12-09
#### 问题5: 数字分身需求不明确
**问题描述:**
合作方(通过市场部对接)的需求一直不能明确,杜主任反馈合作方可能用不用还不确定,导致需求对接工作难以推进。
**解决方案:**
1. 自己做几个版本的数字分身方案,让市场部/合作方选择
2. 调研市面上做得好的数字分身案例,分别出方案
3. 持续与相关人员(琳贤等)沟通跟进
**责任人:** 郝倩玉
**截止时间:** 2025-12-09
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|----------|--------|--------------|--------|----------|
| 🔴 会议纪要Skill腾讯会议版本生成 | 闫旭隆 | 用腾讯会议转写文本生成一版会议纪要与Gemini转写版本对比效果 | P0 | 2025-12-09 |
| 🔴 会议纪要Skill Gemini版本生成 | 闫旭隆 | 使用Gemini视频转写功能直接生成会议纪要测试多模态转写效果 | P0 | 2025-12-09 |
| 🔴 需求Skill二阶段专家博弈字段映射 | 闫旭隆 | 整理二阶段专家交叉评价、交叉回应的字段映射逻辑,做可视化效果展示 | P0 | 2025-12-09 |
| 🔴 数字人PPT真人训练视频样本 | 江争达 | 本周完成用真人训练的数字人视频样本,测试百度西林和黑镜两个平台 | P0 | 2025-12-09 |
| 🔴 Gemini 3.0生成分镜脚本测试 | 江争达 | 使用Gemini 3.0生成分镜头脚本和分镜图片再通过VEO 3.1等平台生成视频 | P0 | 2025-12-09 |
| 🔴 数字人PPT需求文档修改 | 江争达 | 根据会议反馈修改需求文档将视频时长从3-5分钟改为20-30分钟增加手势动作要求 | P0 | 2025-12-09 |
| 🔴 问答系统前端重构方案完善 | 江争达 | 继续完善前端重构方案,考虑下一版本交互逻辑的修改,结合大模型审查方案 | P0 | 2025-12-09 |
| 🔴 问答系统后端代码审查 | 江争达 | 使用Claude 4.5或GPT codex等代码审查工具对后端代码进行一遍审查记录问题 | P0 | 2025-12-09 |
| 🔴 招投标文件Skill需求文档确认 | 郝倩玉 | 确认投标商务响应文件自动生成系统的需求文档,确保需求合理明确 | P0 | 2025-12-09 |
| 🔴 Gartner报告解读转写系统架构设计 | 郝倩玉 | 设计Gartner报告解读转写系统的架构需求紧急涉及年末签约 | P0 | 2025-12-09 |
| 🔴 协助会议纪要Skill优化 | 郝倩玉 | 协助闫旭隆优化会议纪要Skill包括学习类和Q&A类会议纪要逻辑 | P0 | 2025-12-09 |
| 🔴 配合前端框架重构 | 陶西平 | 配合江老师完成问答系统前端框架重构相关工作 | P0 | 2025-12-09 |
| 招投标文件Skill架构设计 | 闫旭隆 | 设计招投标文件自动生成系统的Skill架构 | P1 | 2025-12-09 |
| 招投标文件Skill架构调试 | 江争达 | 协助调试招投标文件Skill架构 | P1 | 2025-12-09 |
| 数字分身需求调研与方案 | 郝倩玉 | 调研市面上较好的数字分身版本,制定多个方案供选择 | P1 | 2025-12-09 |
| 日报驱动项目管理系统Skill开发 | 丁康 | 开发日报驱动的项目管理系统Skill包括基于会议纪要生成日报、与MCP对接等功能 | P2 | 待定 |
| Claude Code Skill转LangGraph架构研究 | 郝倩玉 | 研究如何将Claude Code Skill转移到LangGraph低代码架构作为探索性项目 | P2 | 待定 |
### 4. 组内成员工作进展
#### 闫旭隆
**上周完成:**
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文
**进行中:**
- 🔄 会议纪要Skill架构持续优化
**收到的反馈/学习建议:**
- **表扬:** 会议纪要Skill整体有进步基本逻辑可以固化下来先用
- **建议:** 尝试用主窗口全量处理一次可能效果更好不要过于依赖子Agent分块处理
- **建议:** 先清洗转写文本(去除重复、脏数据),再做处理,保证信息全面同时内容紧凑
- **表扬:** 需求Skill的专家博弈机制效果不错
- **建议:** 把专家评估意见和最后响应打成一篇文档对比验证效果
- **建议:** 映射逻辑图很重要要把逻辑写进skill里保持一致性
- **建议:** 会议纪要最核心目的是下周工作安排,所有逻辑都应围绕这个目标展开
**下周任务:**
- [ ] 🔴 P0会议纪要Skill腾讯会议版本生成
- [ ] 🔴 P0会议纪要Skill Gemini版本生成
- [ ] 🔴 P0需求Skill二阶段专家博弈字段映射
- [ ] P1招投标文件Skill架构设计
#### 江争达
**上周完成:**
- ✅ 数字人PPT需求文档初版
**进行中:**
- 🔄 完成问答系统v1.1前端重构方案
- 🔄 Sub Agent调用机制调研测试
**收到的反馈/学习建议:**
- **批评:** 数字人PPT需求文档时间要求不准确3-5分钟应为20-30分钟
- **批评:** 数字人需求缺少手势动作要求,开场和结束不能没有动作
- **建议:** 前端重构要考虑下一版本的交互逻辑
- **建议:** 后端先用代码审查工具如codex审查一遍
- **批评:** Sub Agent调用测试的背景说明不清楚核心诉求没说清楚
- **批评:** 表达能力/提问题表达能力需要提升,不站在其他人角度思考
- **建议:** 给大模型的提示词必须写详细完整,口头表达时可以简略,但给大模型时必须写清楚
- **建议:** 前端重构方案要用deep research或GPT做校验
**下周任务:**
- [ ] 🔴 P0数字人PPT真人训练视频样本
- [ ] 🔴 P0Gemini 3.0生成分镜脚本测试
- [ ] 🔴 P0数字人PPT需求文档修改
- [ ] 🔴 P0问答系统前端重构方案完善
- [ ] 🔴 P0问答系统后端代码审查
- [ ] P1招投标文件Skill架构调试
#### 郝倩玉
**上周完成:**
- ✅ 会议纪要Skill架构优化协助闫旭隆
- ✅ Gartner报告解读转写系统需求对接及文档撰写
**进行中:**
- 🔄 招投标文件Skill架构设计
- 🔄 数字分身需求文档
- 🔄 问答系统V1.0测试推动
**收到的反馈/学习建议:**
- **任务分配:** 招投标文件Skill需求已确认提升为P0
- **任务分配:** Gartner报告解读转写系统需要先设计架构提升为P0
- **建议:** 数字分身需求继续跟进,自己调研市面上的方案,做几个版本供选择
- **建议:** Gartner报告转写系统虽然不难但优化比较难先做出一个基本架构
**下周任务:**
- [ ] 🔴 P0招投标文件Skill需求文档确认
- [ ] 🔴 P0Gartner报告解读转写系统架构设计
- [ ] 🔴 P0协助会议纪要Skill优化
- [ ] P1数字分身需求调研与方案
- [ ] P2Claude Code Skill转LangGraph架构研究
#### 陶西平
**上周完成:**
- ✅ 数字人PPT需求文档协助江老师
- ✅ 学习使用claudecode的document skill使用pdf skill的表单填写功能
- ✅ 调研数字人平台的公共数字人能力
**进行中:**
- 🔄 数字人与ppt结合生成指定PPT的数字人视频
- 🔄 前端框架重构(对问答系统前端功能进行分析)
**收到的反馈/学习建议:**
- **建议:** 数字人PPT需求文档中视频时长需求不准确应该将20-30分钟作为主要需求
- **建议:** 需求文档应考虑数字人手势动作至少前10秒和后10秒要有手势动作
- **建议:** 使用Gemini 3.0生成分镜头脚本和图片再用VEO 3.1等生成视频
**下周任务:**
- [ ] 🔴 P0配合江老师前端框架重构相关工作
- [ ] P1完成数字人调研报告
- [ ] P1完成PPT与数字人结合调研
---
## 三、会议总结
**核心议题:** 会议纪要Skill优化、数字人PPT需求文档、问答系统前端重构、招投标文件Skill架构设计
**关键决策:**
1. **会议纪要Skill方案确定:** 先用当前版本固化流程,后续尝试主窗口全量处理
2. **会议转写方案:** 使用Gemini多模态能力处理视频转写可能是最有效的路径
3. **数字人平台选型:** 重点测试百度曦灵和黑镜两个平台,本周完成真人训练样本
4. **Agent架构决策:** 建议用Agent调Agent而非Skill调Skill更清晰
5. **招投标Skill优先级提升:** 提升为P0因为涉及潜在合同30万
6. **Gartner报告系统优先级提升:** 提升为P0市场部需要年末演示
7. **日报驱动系统负责人确定:** 由丁康负责作为P2任务
8. **PPT自动化方案:** 使用Gemini 3.0生成分镜脚本+图片,再生成视频
9. **数字人PPT讲解时长需求调整:** 从3-5分钟改为支持20-30分钟
10. **前端重构需考虑下一版本交互逻辑**
11. **后端代码先进行审查再重构**
**下周工作重点:**
1. 🔴 会议纪要Skill优化腾讯会议版本 + Gemini版本对比测试
2. 🔴 数字人PPT完成真人训练视频样本百度曦灵/黑镜)
3. 🔴 数字人PPTGemini 3.0生成分镜脚本测试
4. 🔴 问答系统:前端重构方案完善 + 后端代码审查
5. 🔴 招投标文件Skill需求确认 + 架构设计
6. 🔴 Gartner报告解读转写系统架构设计
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-02
**下次会议:** 2025-12-09