需求文档skill回溯专家博弈之前

This commit is contained in:
闫旭隆
2025-12-11 14:19:36 +08:00
parent 5f329d7b4c
commit f4314c3ede
117 changed files with 28969 additions and 3325 deletions

View File

@ -0,0 +1,281 @@
# 工程类会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉、丁康
- **记录整理:** Claude
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
| ------------------------ | -------------- | ---------- | ------------------------------------------------------------ |
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成架构优化改为全量读取会议转写文本不采用索引搜索整理了字段映射逻辑图整个流程已固化。领导评价比上一版有进步整体逻辑可以先固化使用。存在问题文字转写准确性和上下文约束能力是核心瓶颈P0/P1/P2优先级判断难以自动化 |
| 需求澄清Skill测试与推广 | 闫旭隆 | 2025-12-02 | 已完成优化,加入多轮专家博弈机制(独立评审→交叉评价→交叉回应→最终整合),并录制了演示视频。领导建议:验证专家博弈环节的实际效果,将评估意见和响应打成一篇文档进行对照分析 |
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成需求文档整理包含五个第一阶段核心需求。下周行动计划1)时长从3-5分钟改为20-30分钟2)必须加入手势动作要求3)不能使用老外形象说流利中文4)本周尽快用真人训练数字人样本 |
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 相关领导处的需求尚未明确。下一步建议:自己调研市面上做得好的几个版本,分别出方案让需求方选择 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 进行中已完成接口规范文档确认功能模块清单正在对照核实中。领导建议后端代码不要动先用Claude 4.5或Codex做代码审查重构时必须考虑下一版本功能需求 |
### 2. 重点项目问题及解决方案
#### 问题1: 会议纪要文字转写准确性问题
**问题描述:**
会议纪要Skill的最大问题是文字转写的准确性和上下文约束能力不足。语音识别不清晰加上没有很好的上下文约束导致在已经非常清晰的上下文背景下开会时AI无法准确理解和提取信息。
**解决方案:**
1. 考虑使用Gemini进行多模态转写视频+音频+文字利用其100万token的超长上下文能力
2. 将转写文本先进行清洗加工,保证信息全面的同时内容紧凑,去除重复内容,在主窗口+子Agent中加载清洗后的会议转写文本
3. 调用Gemini API在Claude中处理转写后的文本
4. 尝试使用Gemini进行一次性生成会议纪要
**责任人:** 闫旭隆
**截止时间:** 2025-12-09
#### 问题2: 会议纪要P0/P1/P2优先级判断困难
**问题描述:**
AI难以准确判断任务的优先级P0/P1/P2因为缺少关键的潜在上下文信息如成员的年龄、级别、工作时间长短等这些都是分配工作时的潜意识上下文。
**解决方案:**
1. 在会议上直接确认P0/P1/P2优先级给AI一个明确的信号
2. 让AI先给出优先级建议人再给反馈确认
3. 每个人生成一份个人相关的优先级列表后确认
4. 保留确认过程的所有材料作为后续调优或微调的素材
5. 将潜在上下文成员背景信息显性化后提供给AI
**责任人:** 闫旭隆
**截止时间:** 2025-12-09
#### 问题3: Sub Agent在项目目录下调用的路径问题
**问题描述:**
测试发现Sub Agent在项目子目录下调用时存在问题不使用绝对路径时Agent会读取prompt但不执行使用绝对路径指定时才能正常调用。系统似乎默认优先查找全局Agent目录找不到就忽略。
**解决方案:**
1. 在Skill中调用Sub Agent时使用绝对路径指定Agent位置
2. 改用Agent调Agent的方式而非Skill调Agent
3. 定义一个主Agent来调用其他Agent保持逻辑清晰
4. 调试时使用Skill方式便于观察上下文调通后再迁移到Agent调Agent的架构
**责任人:** 江争达
**截止时间:** 2025-12-09
#### 问题4: 问答系统前端重构方案需完善
**问题描述:**
前端重构工作尚未完成,只做了一半。需要确保重构时考虑下一个版本的交互逻辑更改,避免架构调整后又需要重新修改或增加组件。
**解决方案:**
1. 用Opus 4.5或Codex对后端代码进行审查找出问题后记录下来
2. 找一个Code Review的Agent或Skill对代码进行审查
3. 让大模型生成一版前端重构方案,与现有方案对比差异
4. 把下一个版本的功能需求结合这次重构一起考虑
5. 提供示例代码(特别是与后端交互的逻辑代码)给大模型参考
**责任人:** 江争达
**截止时间:** 2025-12-09
#### 问题5: 数字人PPT讲解视频手势动作缺失
**问题描述:**
数字人PPT讲解视频中开场和结尾没有手势动作人物呆呆站着讲解效果不真实。
**解决方案:**
1. 在验收标准中加入手势动作要求
2. 修改数字人在PPT讲解视频中展现形式
3. 测试Veo 3.1的动作生成能力
**责任人:** 陶西平
**截止时间:** 2025-12-09
#### 问题6: 需求表达和背景说明不清晰
**问题描述:**
团队成员在汇报和文档中,需求表达和背景说明不够清晰,不交代核心诉求和问题点,导致其他人或大模型无法理解要解决什么问题。
**解决方案:**
1. 汇报时必须交代核心诉求和问题点
2. 给人可以口头补充,给大模型必须写下来
3. 站在其他人的角度思考,确保表达能被理解
4. 背景说明要特别详细
**责任人:** 全体成员
**截止时间:** 2025-12-09
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
| ----------------------------------------- | -------------- | ------------------------------------------------------------ | ------ | ---------- |
| 🔴 会议纪要Skill全量处理优化 | 闫旭隆、郝倩玉 | 用现版本、Gemini视频生成转写文本+主窗口清洗后加载、Gemini视频直接生成三种方式各生成一版会议纪要进行对比测试 | P0 | 2025-12-09 |
| 🔴 数字人PPT视频样本生成 | 江争达、陶西平 | 用百度曦灵和heygen平台训练自己真人的语音和视频生成数字人PPT讲解视频样本需包含手势动作视频时长支持20-30分钟 | P0 | 2025-12-08 |
| 🔴 Gemini分镜脚本生成测试 | 江争达、陶西平 | 使用Gemini 3.0 Pro生成视频分镜脚本和分镜图片再用VEO 3.1或其他模型生成视频,测试端到端数字人视频生成工作流 | P0 | 2025-12-09 |
| 🔴 问答系统V1.1前端重构 | 江争达、陶西平 | 重构前端展示和代码结构保留基础功能和后端不变需结合下一版本交互逻辑变更一起考虑先用大模型对后端代码进行code review | P0 | 2025-12-09 |
| 🔴 需求澄清Skill专家博弈优化 | 闫旭隆 | 查看专家交叉回应的字段映射,整理可视化效果,评估专家博弈环节对需求文档质量的提升效果 | P0 | 2025-12-09 |
| 🔴 投标商务应答自动生成系统Skill架构设计 | 郝倩玉、闫旭隆 | 设计投标商务应答自动生成系统Skill的架构方案 | P0 | 2025-12-09 |
| 🔴 Gartner报告解读转写Skill架构设计 | 郝倩玉、闫旭隆 | 设计Gartner报告转写Skill的架构涉及后续合同签约需求要求最晚12月中旬必须交付 | P0 | 2025-12-09 |
| 🔴 数字分身方案调研及方案撰写 | 郝倩玉 | 先调研市面上做得好的版本,分别出几个方案让需求方选择 | P0 | 2025-12-09 |
| 日报驱动项目管理系统Skill开发 | 丁康 | 开发基于会议纪要的日报生成系统Skill | P1 | 待定 |
| 完成问答系统前端重构需求文档 | 陶西平 | 完成问答系统前端重构需求文档 | P1 | 2025-12-09 |
| 服务器采购 | 江争达 | 尽快采购,先确认好需要部署哪些软件 | P1 | 2025-12-09 |
| Skill Plugin管理系统搭建 | 江争达 | 学习并搭建内部Skill Marketplace管理团队开发的所有Skill | P2 | 待定 |
| Claude Skill转Langchain/Langgraph架构研究 | 闫旭隆 | 研究如何将Claude Code Skill转移到Langchain/Langgraph的低代码架构做一个小功能进行学习验证 | P2 | 待定 |
### 4. 组内成员工作进展
#### 江争达
**上周完成:**
- ✅ 数字人PPT需求文档
**进行中:**
- 🔄 完成问答系统v1.1前端重构方案
- 🔄 PDF Skill技术调研待开始
- 🔄 Skill Plugin管理系统搭建待开始
- 🔄 服务器采购(待开始)
- 🔄 招投标文件Skill架构调试待开始
- 🔄 日报驱动系统需求研究(待开始)
**收到的反馈/学习建议:**
- **批评:** 需求文档分析存在很大问题,不站在其他人的角度去思考,其他人听不懂你讲什么。核心诉求点没有说清楚,背景不交代清楚导致没人看得懂文档
- **批评:** 表达能力需要提升,没有表达能力就没法跟大模型打交道
- **建议:** 问答系统前端重构方案需要把下个版本可能修改的逻辑先考虑进去
- **建议:** 后端代码先不要动先用Opus 4.5或Codex做一遍代码审查
- **建议:** 前端重构方案需要用大模型重新生成一版,与现有方案对比差异
- **建议:** 提供示例代码,特别是与后端交互的逻辑代码应该提供给大模型参考
- **建议:** Claude 4.5幻觉还是很高的日常问答以GPT o1为主可能会比较好
**下周任务:**
- [ ] 🔴 P0问答系统V1.1前端重构
- [ ] 🔴 P0数字人PPT视频样本生成
- [ ] 🔴 P0Gemini分镜脚本生成测试
- [ ] P1PDF Skill技术调研
- [ ] P1服务器采购
- [ ] P2Skill Plugin管理系统搭建
#### 闫旭隆
**上周完成:**
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制,录制视频
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文录制视频
**进行中:**
- 🔄 招投标文件Skill架构设计
**收到的反馈/学习建议:**
- **表扬:** 会议纪要Skill架构改进获得认可改用全量读取替代索引搜索的方案是正确的字段映射逻辑图也得到肯定
- **表扬:** 会议纪要Skill的测试结果与人工订正版本相比"比上面是有进步了""该有的要点是有"
- **建议:** 尝试使用主窗口全量处理替代分块agent搜索可能效果更好同时建议用Gemini做会议转写测试
- **建议:** 招投标Skill架构设计作为P0任务需要本周完成同时Gartner报告转写也需要先设计架构
- **建议:** 会议纪要的下周工作安排提取是最核心的功能需要重点优化P0/P1优先级判断的准确性
**下周任务:**
- [ ] 🔴 P0会议纪要Skill全量处理优化及gemini方案对比测试
- [ ] 🔴 P0需求澄清多专家博弈阶段效果可视化展示
- [ ] 🔴 P0招投标Skill架构设计
- [ ] 🔴 P0Gartner报告转写Skill架构设计
#### 郝倩玉
**上周完成:**
- ✅ 会议纪要Skill架构优化协助旭隆优化学习类+Q&A类会议纪要Skill逻辑
- ✅ Gartner 报告解读转写系统需求对接及文档撰写,确定版需求文档已发旭隆。
- ✅ 问答系统V1.0测试推动(多次与媛媛沟通)
- ✅数字分身需求对接
**进行中:**
- 🔄 招投标文件Skill架构设计投标商务响应文件自动生成系统需求文档已完成
**收到的反馈/学习建议:**
- **建议:** 招投标Skill架构设计后续需要针对需求部分再次讨论确认因为有些需求不一定合理
- **建议:** Gartner报告转写系统架构设计需要尽快完成因为涉及年末签合同可能有30万的业务机会优先级提升为P0
- **建议:** 数字分身需求方面,由于合作方需求不明确,需要自己先调研市面上比较好的版本,做出多个方案供选择
**下周任务:**
- [ ] 🔴 P0参与优化会议纪要Skill
- [ ] 🔴 P0参与设计招投标Skill架构
- [ ] 🔴 P0参与设计Gartner报告转写Skill架构
- [ ] 🔴 P0数字分身方案调研
#### 陶西平
**上周完成:**
- ✅ 数字人PPT需求文档协助江老师修改需求文档
- ✅ 学习使用Claude Code的document skill使用pdf skill的表单填写功能
- ✅ 调研数字人平台的公共数字人能力,收集总结相关目标数字人平台价格信息
**进行中:**
- 🔄 数字人与ppt结合生成一个基于指定PPT的数字人视频
- 🔄 前端框架重构(对问答系统前端功能进行分析)
**收到的反馈/学习建议:**
- **肯定:** 陶西平提供的数字人调研文档被团队成员引用,作为数字人平台费用对比的基础参考资料
**下周任务:**
- [ ] 🔴 P0数字人PPT视频样本生成
- [ ] 🔴 P0Gemini分镜脚本生成测试
- [ ] P1完成问答系统前端重构需求文档
---
## 三、会议总结
**核心议题:** 会议纪要Skill优化、数字人PPT视频生成、问答系统前端重构、招投标/Gartner报告Skill架构设计
**关键决策:**
1. **会议纪要转写采用Gemini多模态视频处理方案:** 领导测试发现Gemini 3.0 Pro可以直接上传会议视频生成转写文本多模态能力最强上下文最长效果优于纯语音转写
2. . **进展情况以会议转写为优先,周报作为补充:** 会议中发现转写文本更能反映实际进展情况
3. **P0/P1/P2优先级判断需要人工确认:** AI缺乏隐性上下文如成员资历、工作时长等建议先让AI给出优先级建议然后由人工确认
4. **数字人PPT视频主需求调整为支持20-30分钟时长:** 实际使用场景如PPT宣讲、会议发言需要20-30分钟
5. **数字人形象必须使用中国人,不能用老外说流利中文:** 确保形象和语言匹配,追求真实性
6. **数字人视频第一阶段必须包含手势动作:** 开场和结尾的手势动作是必须的,不能呆板站立讲解
7. **本周完成数字人真人训练视频样本:** 要求本周末前用自己真人训练出语音和视频样本
8. **使用Gemini 3.0生成分镜头脚本和图片,再用其他平台生成视频:** 这是目前最有效的动画视频制作路径
9. **前端重构只改展示部分,后端不动但需做代码审查:** 用Codex或大模型做一遍代码审查找出问题记录下来
10. **Sub Agent调用必须使用绝对路径指定:** 项目下的sub agent不指定绝对路径时调用不稳定
11. **推荐使用Agent调用Agent的方式而非Skill调用Sub Agent:** 这样调用更清晰,上下文共享更好
12. **招投标Skill架构设计提升为P0任务:** 因为涉及年末演示和签合同可能有30万收入
13. **Gartner报告转写Skill提升为P0任务:** 同样因为紧急需求
**下周工作重点:**
1. 🔴 会议纪要Skill全量处理优化对比Gemini转写与腾讯会议转写效果
2. 🔴 数字人PPT视频样本生成本周末前完成真人训练
3. 🔴 招投标Skill和Gartner报告转写Skill架构设计
4. 🔴 问答系统V1.1前端重构,需先做代码审查
5. 🔴 需求澄清Skill专家博弈效果验证和流程图梳理
6. 🔴 数字分身方案调研,主动出多个版本供选择
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-02
**下次会议:** 2025-12-09