需求文档skill回溯专家博弈之前
This commit is contained in:
@ -0,0 +1,281 @@
|
||||
# 工程类会议纪要 (2025-12-02)
|
||||
|
||||
## 一、会议信息
|
||||
|
||||
- **会议时间:** 2025-12-02
|
||||
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉、丁康
|
||||
- **记录整理:** Claude
|
||||
|
||||
---
|
||||
|
||||
## 二、工作内容
|
||||
|
||||
### 1. 重点项目进展情况汇总
|
||||
|
||||
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|
||||
| ------------------------ | -------------- | ---------- | ------------------------------------------------------------ |
|
||||
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成架构优化,改为全量读取会议转写文本(不采用索引搜索),整理了字段映射逻辑图,整个流程已固化。领导评价:比上一版有进步,整体逻辑可以先固化使用。存在问题:文字转写准确性和上下文约束能力是核心瓶颈;P0/P1/P2优先级判断难以自动化 |
|
||||
| 需求澄清Skill测试与推广 | 闫旭隆 | 2025-12-02 | 已完成优化,加入多轮专家博弈机制(独立评审→交叉评价→交叉回应→最终整合),并录制了演示视频。领导建议:验证专家博弈环节的实际效果,将评估意见和响应打成一篇文档进行对照分析 |
|
||||
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成需求文档整理,包含五个第一阶段核心需求。下周行动计划:1)时长从3-5分钟改为20-30分钟;2)必须加入手势动作要求;3)不能使用老外形象说流利中文;4)本周尽快用真人训练数字人样本 |
|
||||
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 相关领导处的需求尚未明确。下一步建议:自己调研市面上做得好的几个版本,分别出方案让需求方选择 |
|
||||
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 进行中,已完成接口规范文档确认,功能模块清单正在对照核实中。领导建议:后端代码不要动,先用Claude 4.5或Codex做代码审查;重构时必须考虑下一版本功能需求 |
|
||||
|
||||
### 2. 重点项目问题及解决方案
|
||||
|
||||
#### 问题1: 会议纪要文字转写准确性问题
|
||||
|
||||
**问题描述:**
|
||||
会议纪要Skill的最大问题是文字转写的准确性和上下文约束能力不足。语音识别不清晰,加上没有很好的上下文约束,导致在已经非常清晰的上下文背景下开会时,AI无法准确理解和提取信息。
|
||||
|
||||
**解决方案:**
|
||||
|
||||
1. 考虑使用Gemini进行多模态转写(视频+音频+文字),利用其100万token的超长上下文能力
|
||||
2. 将转写文本先进行清洗加工,保证信息全面的同时内容紧凑,去除重复内容,在主窗口+子Agent中加载清洗后的会议转写文本
|
||||
3. 调用Gemini API在Claude中处理转写后的文本
|
||||
4. 尝试使用Gemini进行一次性生成会议纪要
|
||||
|
||||
**责任人:** 闫旭隆
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题2: 会议纪要P0/P1/P2优先级判断困难
|
||||
|
||||
**问题描述:**
|
||||
AI难以准确判断任务的优先级(P0/P1/P2),因为缺少关键的潜在上下文信息,如成员的年龄、级别、工作时间长短等,这些都是分配工作时的潜意识上下文。
|
||||
|
||||
**解决方案:**
|
||||
|
||||
1. 在会议上直接确认P0/P1/P2优先级,给AI一个明确的信号
|
||||
2. 让AI先给出优先级建议,人再给反馈确认
|
||||
3. 每个人生成一份个人相关的优先级列表后确认
|
||||
4. 保留确认过程的所有材料作为后续调优或微调的素材
|
||||
5. 将潜在上下文(成员背景信息)显性化后提供给AI
|
||||
|
||||
**责任人:** 闫旭隆
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题3: Sub Agent在项目目录下调用的路径问题
|
||||
|
||||
**问题描述:**
|
||||
测试发现Sub Agent在项目子目录下调用时存在问题:不使用绝对路径时,Agent会读取prompt但不执行;使用绝对路径指定时才能正常调用。系统似乎默认优先查找全局Agent目录,找不到就忽略。
|
||||
|
||||
**解决方案:**
|
||||
|
||||
1. 在Skill中调用Sub Agent时使用绝对路径指定Agent位置
|
||||
2. 改用Agent调Agent的方式,而非Skill调Agent
|
||||
3. 定义一个主Agent来调用其他Agent,保持逻辑清晰
|
||||
4. 调试时使用Skill方式(便于观察上下文),调通后再迁移到Agent调Agent的架构
|
||||
|
||||
**责任人:** 江争达
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题4: 问答系统前端重构方案需完善
|
||||
|
||||
**问题描述:**
|
||||
前端重构工作尚未完成,只做了一半。需要确保重构时考虑下一个版本的交互逻辑更改,避免架构调整后又需要重新修改或增加组件。
|
||||
|
||||
**解决方案:**
|
||||
|
||||
1. 用Opus 4.5或Codex对后端代码进行审查,找出问题后记录下来
|
||||
2. 找一个Code Review的Agent或Skill对代码进行审查
|
||||
3. 让大模型生成一版前端重构方案,与现有方案对比差异
|
||||
4. 把下一个版本的功能需求结合这次重构一起考虑
|
||||
5. 提供示例代码(特别是与后端交互的逻辑代码)给大模型参考
|
||||
|
||||
**责任人:** 江争达
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题5: 数字人PPT讲解视频手势动作缺失
|
||||
|
||||
**问题描述:**
|
||||
数字人PPT讲解视频中,开场和结尾没有手势动作,人物呆呆站着讲解,效果不真实。
|
||||
|
||||
**解决方案:**
|
||||
|
||||
1. 在验收标准中加入手势动作要求
|
||||
2. 修改数字人在PPT讲解视频中展现形式
|
||||
3. 测试Veo 3.1的动作生成能力
|
||||
|
||||
|
||||
**责任人:** 陶西平
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题6: 需求表达和背景说明不清晰
|
||||
|
||||
**问题描述:**
|
||||
团队成员在汇报和文档中,需求表达和背景说明不够清晰,不交代核心诉求和问题点,导致其他人或大模型无法理解要解决什么问题。
|
||||
|
||||
**解决方案:**
|
||||
|
||||
1. 汇报时必须交代核心诉求和问题点
|
||||
2. 给人可以口头补充,给大模型必须写下来
|
||||
3. 站在其他人的角度思考,确保表达能被理解
|
||||
4. 背景说明要特别详细
|
||||
|
||||
**责任人:** 全体成员
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
### 3. 下周工作安排
|
||||
|
||||
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|
||||
| ----------------------------------------- | -------------- | ------------------------------------------------------------ | ------ | ---------- |
|
||||
| 🔴 会议纪要Skill全量处理优化 | 闫旭隆、郝倩玉 | 用现版本、Gemini视频生成转写文本+主窗口清洗后加载、Gemini视频直接生成三种方式各生成一版会议纪要进行对比测试 | P0 | 2025-12-09 |
|
||||
| 🔴 数字人PPT视频样本生成 | 江争达、陶西平 | 用百度曦灵和heygen平台训练自己真人的语音和视频,生成数字人PPT讲解视频样本,需包含手势动作,视频时长支持20-30分钟 | P0 | 2025-12-08 |
|
||||
| 🔴 Gemini分镜脚本生成测试 | 江争达、陶西平 | 使用Gemini 3.0 Pro生成视频分镜脚本和分镜图片,再用VEO 3.1或其他模型生成视频,测试端到端数字人视频生成工作流 | P0 | 2025-12-09 |
|
||||
| 🔴 问答系统V1.1前端重构 | 江争达、陶西平 | 重构前端展示和代码结构,保留基础功能和后端不变,需结合下一版本交互逻辑变更一起考虑,先用大模型对后端代码进行code review | P0 | 2025-12-09 |
|
||||
| 🔴 需求澄清Skill专家博弈优化 | 闫旭隆 | 查看专家交叉回应的字段映射,整理可视化效果,评估专家博弈环节对需求文档质量的提升效果 | P0 | 2025-12-09 |
|
||||
| 🔴 投标商务应答自动生成系统Skill架构设计 | 郝倩玉、闫旭隆 | 设计投标商务应答自动生成系统Skill的架构方案 | P0 | 2025-12-09 |
|
||||
| 🔴 Gartner报告解读转写Skill架构设计 | 郝倩玉、闫旭隆 | 设计Gartner报告转写Skill的架构,涉及后续合同签约需求(要求最晚12月中旬必须交付) | P0 | 2025-12-09 |
|
||||
| 🔴 数字分身方案调研及方案撰写 | 郝倩玉 | 先调研市面上做得好的版本,分别出几个方案让需求方选择 | P0 | 2025-12-09 |
|
||||
| 日报驱动项目管理系统Skill开发 | 丁康 | 开发基于会议纪要的日报生成系统Skill | P1 | 待定 |
|
||||
| 完成问答系统前端重构需求文档 | 陶西平 | 完成问答系统前端重构需求文档 | P1 | 2025-12-09 |
|
||||
| 服务器采购 | 江争达 | 尽快采购,先确认好需要部署哪些软件 | P1 | 2025-12-09 |
|
||||
| Skill Plugin管理系统搭建 | 江争达 | 学习并搭建内部Skill Marketplace,管理团队开发的所有Skill | P2 | 待定 |
|
||||
| Claude Skill转Langchain/Langgraph架构研究 | 闫旭隆 | 研究如何将Claude Code Skill转移到Langchain/Langgraph的低代码架构,做一个小功能进行学习验证 | P2 | 待定 |
|
||||
|
||||
### 4. 组内成员工作进展
|
||||
|
||||
#### 江争达
|
||||
|
||||
**上周完成:**
|
||||
|
||||
- ✅ 数字人PPT需求文档
|
||||
|
||||
**进行中:**
|
||||
|
||||
- 🔄 完成问答系统v1.1前端重构方案
|
||||
- 🔄 PDF Skill技术调研(待开始)
|
||||
- 🔄 Skill Plugin管理系统搭建(待开始)
|
||||
- 🔄 服务器采购(待开始)
|
||||
- 🔄 招投标文件Skill架构调试(待开始)
|
||||
- 🔄 日报驱动系统需求研究(待开始)
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
|
||||
- **批评:** 需求文档分析存在很大问题,不站在其他人的角度去思考,其他人听不懂你讲什么。核心诉求点没有说清楚,背景不交代清楚导致没人看得懂文档
|
||||
- **批评:** 表达能力需要提升,没有表达能力就没法跟大模型打交道
|
||||
- **建议:** 问答系统前端重构方案需要把下个版本可能修改的逻辑先考虑进去
|
||||
- **建议:** 后端代码先不要动,先用Opus 4.5或Codex做一遍代码审查
|
||||
- **建议:** 前端重构方案需要用大模型重新生成一版,与现有方案对比差异
|
||||
- **建议:** 提供示例代码,特别是与后端交互的逻辑代码应该提供给大模型参考
|
||||
- **建议:** Claude 4.5幻觉还是很高的,日常问答以GPT o1为主可能会比较好
|
||||
|
||||
**下周任务:**
|
||||
|
||||
- [ ] 🔴 P0|问答系统V1.1前端重构
|
||||
- [ ] 🔴 P0|数字人PPT视频样本生成
|
||||
- [ ] 🔴 P0|Gemini分镜脚本生成测试
|
||||
- [ ] P1|PDF Skill技术调研
|
||||
- [ ] P1|服务器采购
|
||||
- [ ] P2|Skill Plugin管理系统搭建
|
||||
|
||||
#### 闫旭隆
|
||||
|
||||
**上周完成:**
|
||||
|
||||
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制,录制视频
|
||||
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文,录制视频
|
||||
|
||||
**进行中:**
|
||||
|
||||
- 🔄 招投标文件Skill架构设计
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
|
||||
- **表扬:** 会议纪要Skill架构改进获得认可,改用全量读取替代索引搜索的方案是正确的,字段映射逻辑图也得到肯定
|
||||
- **表扬:** 会议纪要Skill的测试结果与人工订正版本相比"比上面是有进步了","该有的要点是有"
|
||||
- **建议:** 尝试使用主窗口全量处理替代分块agent搜索,可能效果更好;同时建议用Gemini做会议转写测试
|
||||
- **建议:** 招投标Skill架构设计作为P0任务需要本周完成,同时Gartner报告转写也需要先设计架构
|
||||
- **建议:** 会议纪要的下周工作安排提取是最核心的功能,需要重点优化P0/P1优先级判断的准确性
|
||||
|
||||
**下周任务:**
|
||||
|
||||
- [ ] 🔴 P0|会议纪要Skill全量处理优化及gemini方案对比测试
|
||||
- [ ] 🔴 P0|需求澄清多专家博弈阶段效果可视化展示
|
||||
- [ ] 🔴 P0|招投标Skill架构设计
|
||||
- [ ] 🔴 P0|Gartner报告转写Skill架构设计
|
||||
|
||||
#### 郝倩玉
|
||||
|
||||
**上周完成:**
|
||||
|
||||
- ✅ 会议纪要Skill架构优化(协助旭隆优化学习类+Q&A类会议纪要Skill逻辑)
|
||||
- ✅ Gartner 报告解读转写系统需求对接及文档撰写,确定版需求文档已发旭隆。
|
||||
- ✅ 问答系统V1.0测试推动(多次与媛媛沟通)
|
||||
- ✅数字分身需求对接
|
||||
|
||||
**进行中:**
|
||||
|
||||
- 🔄 招投标文件Skill架构设计(投标商务响应文件自动生成系统需求文档已完成)
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
|
||||
- **建议:** 招投标Skill架构设计后续需要针对需求部分再次讨论确认,因为有些需求不一定合理
|
||||
- **建议:** Gartner报告转写系统架构设计需要尽快完成,因为涉及年末签合同,可能有30万的业务机会,优先级提升为P0
|
||||
- **建议:** 数字分身需求方面,由于合作方需求不明确,需要自己先调研市面上比较好的版本,做出多个方案供选择
|
||||
|
||||
**下周任务:**
|
||||
|
||||
- [ ] 🔴 P0|参与优化会议纪要Skill
|
||||
- [ ] 🔴 P0|参与设计招投标Skill架构
|
||||
- [ ] 🔴 P0|参与设计Gartner报告转写Skill架构
|
||||
- [ ] 🔴 P0|数字分身方案调研
|
||||
|
||||
#### 陶西平
|
||||
|
||||
**上周完成:**
|
||||
|
||||
- ✅ 数字人PPT需求文档(协助江老师修改需求文档)
|
||||
- ✅ 学习使用Claude Code的document skill,使用pdf skill的表单填写功能
|
||||
- ✅ 调研数字人平台的公共数字人能力,收集总结相关目标数字人平台价格信息
|
||||
|
||||
**进行中:**
|
||||
|
||||
- 🔄 数字人与ppt结合(生成一个基于指定PPT的数字人视频)
|
||||
- 🔄 前端框架重构(对问答系统前端功能进行分析)
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
|
||||
- **肯定:** 陶西平提供的数字人调研文档被团队成员引用,作为数字人平台费用对比的基础参考资料
|
||||
|
||||
**下周任务:**
|
||||
|
||||
- [ ] 🔴 P0|数字人PPT视频样本生成
|
||||
- [ ] 🔴 P0|Gemini分镜脚本生成测试
|
||||
- [ ] P1|完成问答系统前端重构需求文档
|
||||
|
||||
---
|
||||
|
||||
## 三、会议总结
|
||||
|
||||
**核心议题:** 会议纪要Skill优化、数字人PPT视频生成、问答系统前端重构、招投标/Gartner报告Skill架构设计
|
||||
|
||||
**关键决策:**
|
||||
|
||||
1. **会议纪要转写采用Gemini多模态视频处理方案:** 领导测试发现Gemini 3.0 Pro可以直接上传会议视频生成转写文本,多模态能力最强,上下文最长,效果优于纯语音转写
|
||||
2. . **进展情况以会议转写为优先,周报作为补充:** 会议中发现转写文本更能反映实际进展情况
|
||||
3. **P0/P1/P2优先级判断需要人工确认:** AI缺乏隐性上下文(如成员资历、工作时长等),建议先让AI给出优先级建议,然后由人工确认
|
||||
4. **数字人PPT视频主需求调整为支持20-30分钟时长:** 实际使用场景(如PPT宣讲、会议发言)需要20-30分钟
|
||||
5. **数字人形象必须使用中国人,不能用老外说流利中文:** 确保形象和语言匹配,追求真实性
|
||||
6. **数字人视频第一阶段必须包含手势动作:** 开场和结尾的手势动作是必须的,不能呆板站立讲解
|
||||
7. **本周完成数字人真人训练视频样本:** 要求本周末前用自己真人训练出语音和视频样本
|
||||
8. **使用Gemini 3.0生成分镜头脚本和图片,再用其他平台生成视频:** 这是目前最有效的动画视频制作路径
|
||||
9. **前端重构只改展示部分,后端不动但需做代码审查:** 用Codex或大模型做一遍代码审查,找出问题记录下来
|
||||
10. **Sub Agent调用必须使用绝对路径指定:** 项目下的sub agent不指定绝对路径时调用不稳定
|
||||
11. **推荐使用Agent调用Agent的方式,而非Skill调用Sub Agent:** 这样调用更清晰,上下文共享更好
|
||||
12. **招投标Skill架构设计提升为P0任务:** 因为涉及年末演示和签合同,可能有30万收入
|
||||
13. **Gartner报告转写Skill提升为P0任务:** 同样因为紧急需求
|
||||
|
||||
**下周工作重点:**
|
||||
|
||||
1. 🔴 会议纪要Skill全量处理优化,对比Gemini转写与腾讯会议转写效果
|
||||
2. 🔴 数字人PPT视频样本生成,本周末前完成真人训练
|
||||
3. 🔴 招投标Skill和Gartner报告转写Skill架构设计
|
||||
4. 🔴 问答系统V1.1前端重构,需先做代码审查
|
||||
5. 🔴 需求澄清Skill专家博弈效果验证和流程图梳理
|
||||
6. 🔴 数字分身方案调研,主动出多个版本供选择
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-02
|
||||
**下次会议:** 2025-12-09
|
||||
Reference in New Issue
Block a user