248 lines
13 KiB
Markdown
248 lines
13 KiB
Markdown
|
|
# 工程类会议纪要 (2025-12-08)
|
|||
|
|
|
|||
|
|
## 一、会议信息
|
|||
|
|
- **会议时间:** 2025-12-08
|
|||
|
|
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
|
|||
|
|
- **纪要整理人:** Claude
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 二、工作内容
|
|||
|
|
|
|||
|
|
### 1. 重点项目进展情况汇总
|
|||
|
|
|
|||
|
|
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|
|||
|
|
|---------|---------|-----------|-------------|
|
|||
|
|
| 会议纪要Skill架构优化 | 闫旭隆 | 2025-12-02 | 已完成架构重构:从索引搜索改为全量读取会议转写,绘制了字段映射逻辑流程图和Phase2并行执行流程图。存在问题:全量读取资源消耗大、子Agent并行处理可能造成逻辑割裂、语义识别准确性不足。**解决方案:** 1)使用Gemini进行视频转写;2)先对转写文本进行Clean处理;3)尝试主窗口全量处理方案 |
|
|||
|
|
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成多轮博弈机制开发:加入多角色专家评审和交叉回应功能。存在问题:专家prompt编写难度大、评审过程无法直观查看、主Agent可能读取不完整。**解决方案:** 1)将评审过程整合为一问一答文档;2)评估博弈效果,效果不佳则优化或去除 |
|
|||
|
|
| 数字人PPT需求文档 | 江争达(数字人PPT)、郝倩玉(数字分身) | 2025-12-02 | 已完成第一阶段需求文档,包含5个核心需求、质量标准、平台选型调研。存在问题:时长需求定义不准(应为20-30分钟而非3-5分钟)、缺少手势动作、缺少结尾画面。**解决方案:** 1)将主要时长改为20-30分钟;2)增加手势动作要求;3)本周完成百度希壤和黑镜真人训练样本 |
|
|||
|
|
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 已完成部分需求文档:系统架构图、API接口规范、功能清单。存在问题:未完成功能对照、未考虑下一版本需求、后端代码未审查。**解决方案:** 1)用Codex/Opus做后端Code Review;2)用GPT Research生成方案对比;3)考虑下一版本功能需求 |
|
|||
|
|
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 会议中提升为P0任务(涉及30万合同),需本周完成架构设计 |
|
|||
|
|
| 问答系统V1.0测试推动 | 江争达、郝倩玉 | 2025-12-02 | 进行中,多次与媛媛沟通,相关领导参与测试时间尚未确定 |
|
|||
|
|
| Gartner报告解读转写系统 | 郝倩玉 | 2025-12-02 | 需求文档已完成并发给闫旭隆,设为P1任务先做架构设计 |
|
|||
|
|
|
|||
|
|
### 2. 重点项目问题及解决方案
|
|||
|
|
|
|||
|
|
#### 问题1: 会议纪要Skill信息提取准确性问题
|
|||
|
|
|
|||
|
|
**问题描述:**
|
|||
|
|
会议纪要Skill在提取信息时存在准确性问题:
|
|||
|
|
- 转写文本准确性不足,存在错误和语义识别问题
|
|||
|
|
- 上下文约束能力弱,缺少会议背景信息
|
|||
|
|
- 分块索引方式导致信息遗漏,全量读取方案资源消耗大
|
|||
|
|
- Sub-agent并行提取后主窗口整合存在逻辑割裂问题
|
|||
|
|
|
|||
|
|
**解决方案:**
|
|||
|
|
1. 文字转写采用Gemini多模态能力,利用其视频识别能力提升转写准确性
|
|||
|
|
2. 对转写文本进行Clean处理,去除重复和冗余信息后再作为输入
|
|||
|
|
3. 将全量Clean后的转写文本直接加载到主上下文,让主窗口一次性处理
|
|||
|
|
4. 尝试调用Gemini API在Claude内部处理会议纪要生成
|
|||
|
|
5. 测试主上下文全量处理与Sub-agent并行提取两种方案的效果对比
|
|||
|
|
|
|||
|
|
**责任人:** 闫旭隆
|
|||
|
|
**截止时间:** 2025-12-15
|
|||
|
|
|
|||
|
|
#### 问题2: Sub-agent调用路径问题(全局vs项目级)
|
|||
|
|
|
|||
|
|
**问题描述:**
|
|||
|
|
Skill调用自定义Sub-agent时,存在全局路径和项目级路径调用差异问题:
|
|||
|
|
- 使用相对路径时,Claude优先查找全局Agent,找不到会读取项目级Agent的Prompt但不执行
|
|||
|
|
- 使用绝对路径可以成功调用项目级Sub-agent
|
|||
|
|
- 未使用Task规范调用也能成功,但机制不清晰
|
|||
|
|
|
|||
|
|
**解决方案:**
|
|||
|
|
1. 调用项目级Sub-agent时必须使用绝对路径
|
|||
|
|
2. 建议采用Agent调用Agent的方式,而非Skill调用Agent
|
|||
|
|
3. 在子项目下定义主Agent,由主Agent调配各Sub-agent
|
|||
|
|
4. 使用标准的Task调用规范,避免语言描述产生歧义
|
|||
|
|
5. 调试阶段可用Skill加载方式,调通后迁移到Agent架构
|
|||
|
|
|
|||
|
|
**责任人:** 江争达
|
|||
|
|
**截止时间:** 2025-12-15
|
|||
|
|
|
|||
|
|
#### 问题3: 数字人需求文档表达清晰度问题
|
|||
|
|
|
|||
|
|
**问题描述:**
|
|||
|
|
数字人PPT需求文档存在表达不够清晰和具体的问题:
|
|||
|
|
- 时长需求定义为3-5分钟,但实际主要需求应为20-30分钟
|
|||
|
|
- 缺少结尾画面设计
|
|||
|
|
- 非功能性需求中缺少使用界面说明
|
|||
|
|
- 数字人手势动作需求缺失
|
|||
|
|
|
|||
|
|
**解决方案:**
|
|||
|
|
1. 将时长需求调整为20-30分钟作为主要需求,3-5分钟作为初期测试
|
|||
|
|
2. 增加结尾画面设计,数字人独立告别画面
|
|||
|
|
3. 补充使用界面需求,明确工作流、API调用或平台操作方式
|
|||
|
|
4. 在核心质量指标中增加手势动作要求,至少前后十秒要有手势
|
|||
|
|
5. 与GPT/Gemini进行需求方案交叉验证
|
|||
|
|
|
|||
|
|
**责任人:** 陶西平
|
|||
|
|
**截止时间:** 2025-12-15
|
|||
|
|
|
|||
|
|
#### 问题4: 需求文档背景说明不清晰问题
|
|||
|
|
|
|||
|
|
**问题描述:**
|
|||
|
|
技术调研文档和需求文档的背景说明不够清晰:
|
|||
|
|
- 核心诉求和问题点没有交代清楚
|
|||
|
|
- 不站在读者角度思考,导致他人难以理解
|
|||
|
|
- 与大模型交互时无法得到好的答案
|
|||
|
|
|
|||
|
|
**解决方案:**
|
|||
|
|
1. 撰写技术文档时必须站在读者角度思考
|
|||
|
|
2. 把背景、核心诉求、要解决的问题清晰表达出来
|
|||
|
|
3. 对于说不出来的复杂背景说明,先写下来再给大模型
|
|||
|
|
4. 确保文档准备充分后别人才能看得懂
|
|||
|
|
|
|||
|
|
**责任人:** 江争达
|
|||
|
|
**截止时间:** 2025-12-15
|
|||
|
|
|
|||
|
|
### 3. 下周工作安排
|
|||
|
|
|
|||
|
|
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|
|||
|
|
|---------|-------|-------------|-------|---------|
|
|||
|
|
| 🔴 会议纪要Skill优化-Gemini转写对比 | 闫旭隆 | 生成三版会议纪要对比:腾讯会议转写版、Gemini转写版、Gemini直接生成版 | P0 | 2025-12-15 |
|
|||
|
|
| 🔴 需求澄清Skill专家交叉评审可视化 | 闫旭隆 | 整理专家交叉回应效果的可视化展示,呈现专家间的问题、建议、响应过程 | P0 | 2025-12-15 |
|
|||
|
|
| 🔴 招投标文件Skill架构设计 | 闫旭隆 | 完成招投标文件生成Skill的整体架构设计 | P0 | 2025-12-15 |
|
|||
|
|
| 🔴 数字人PPT视频样本生成 | 陶西平 | 使用百度希壤和黑镜平台训练真人数字人,生成包含手势动作的视频样本 | P0 | 2025-12-13 |
|
|||
|
|
| 🔴 数字人视频工作流研究 | 陶西平 | 研究数字人视频生成工作流(API调用/剪映自动化/平台操作),确定技术方案 | P0 | 2025-12-15 |
|
|||
|
|
| 🔴 Gemini 3.0分镜头脚本+视频生成测试 | 陶西平 | 使用Gemini 3.0生成分镜头脚本和图片,通过VEO 3.1生成30秒-2分钟视频 | P0 | 2025-12-15 |
|
|||
|
|
| 🔴 前端重构方案完善 | 江争达 | 用Codex审查后端代码、用GPT Research对比方案、考虑下一版本功能需求 | P0 | 2025-12-15 |
|
|||
|
|
| Gartner报告转写系统架构设计 | 闫旭隆 | 设计Gartner报告转写系统的整体架构 | P1 | 2025-12-15 |
|
|||
|
|
| Claude Code Skill转LangChain研究 | 闫旭隆 | 研究如何将Skill迁移到LangChain/LangGraph的DeepAgent架构 | P1 | 待定 |
|
|||
|
|
| 日报驱动项目管理系统开发 | 丁康 | 学习Asana架构和模块,设计基于会议纪要生成日报并对接Asana MCP的系统 | P1 | 待定 |
|
|||
|
|
| 数字分身需求对接 | 郝倩玉 | 继续与娴霖沟通,如核所需求不明确则自主设计多个版本 | P1 | 2025-12-15 |
|
|||
|
|
| 运营商信息精准爬取系统需求跟进 | 郝倩玉 | 持续跟进需求方需求明确情况 | P1 | 2025-12-15 |
|
|||
|
|
|
|||
|
|
### 4. 组内成员工作进展
|
|||
|
|
|
|||
|
|
#### 闫旭隆
|
|||
|
|
|
|||
|
|
**上周完成:**
|
|||
|
|
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制
|
|||
|
|
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文
|
|||
|
|
- ✅ 录制演示视频
|
|||
|
|
|
|||
|
|
**进行中:**
|
|||
|
|
- 🔄 会议纪要Skill持续优化
|
|||
|
|
|
|||
|
|
**收到的反馈/学习建议:**
|
|||
|
|
- **建议:** 流程图绘制和字段映射逻辑需要写入Skill中,确保Claude逻辑清晰,避免瞎改
|
|||
|
|
- **建议:** 会议转写换成Gemini来做,做一个clean版本作为输入基础
|
|||
|
|
- **建议:** 尝试主上下文窗口全量处理方案,与当前并行子Agent方案对比效果
|
|||
|
|
- **建议:** P0优先级判断让系统给出建议后人工确认,保留确认材料用于后续优化
|
|||
|
|
- **表扬:** 会议纪要Skill新版本相比上一版有明显进步,主要要点已经提取到位
|
|||
|
|
|
|||
|
|
**下周任务:**
|
|||
|
|
- [ ] 🔴 P0|会议纪要Skill优化-Gemini转写对比测试
|
|||
|
|
- [ ] 🔴 P0|需求澄清Skill专家交叉评审可视化
|
|||
|
|
- [ ] 🔴 P0|招投标文件Skill架构设计
|
|||
|
|
- [ ] P1|Gartner报告转写系统架构设计
|
|||
|
|
- [ ] P1|Claude Code Skill转LangChain研究
|
|||
|
|
|
|||
|
|
#### 江争达
|
|||
|
|
|
|||
|
|
**上周完成:**
|
|||
|
|
- ✅ 数字人PPT需求文档
|
|||
|
|
- ✅ Sub-agent调用研究文档
|
|||
|
|
|
|||
|
|
**进行中:**
|
|||
|
|
- 🔄 问答系统v1.1前端重构方案
|
|||
|
|
- 🔄 PDF Skill技术调研
|
|||
|
|
- 🔄 服务器采购
|
|||
|
|
- 🔄 招投标文件Skill架构调试
|
|||
|
|
|
|||
|
|
**收到的反馈/学习建议:**
|
|||
|
|
- **批评:** Sub-agent调研文档背景说明不够清晰,核心诉求和问题点没有交代清楚,90%的重点都说丢了
|
|||
|
|
- **批评:** 表达能力和提问题能力不足,导致与大模型交互时无法得到好的答案
|
|||
|
|
- **建议:** 需要提升需求表达能力,站在读者角度思考,把背景、核心诉求清晰表达出来
|
|||
|
|
- **建议:** 对于说不出来的复杂背景说明,建议先写下来再给大模型
|
|||
|
|
- **建议:** 前端重构方案需要用大模型审查后端代码,找出问题后再决定是否修改
|
|||
|
|
|
|||
|
|
**下周任务:**
|
|||
|
|
- [ ] 🔴 P0|前端重构方案完善(Code Review + 方案对比)
|
|||
|
|
- [ ] P1|问答系统V1.0测试推动
|
|||
|
|
- [ ] P1|PDF Skill技术调研
|
|||
|
|
- [ ] P1|服务器采购
|
|||
|
|
- [ ] P1|招投标文件Skill架构调试
|
|||
|
|
|
|||
|
|
#### 郝倩玉
|
|||
|
|
|
|||
|
|
**上周完成:**
|
|||
|
|
- ✅ 会议纪要Skill架构优化(协助闫旭隆优化学习类+Q&A类逻辑)
|
|||
|
|
- ✅ Gartner报告解读转写系统需求文档
|
|||
|
|
- ✅ 多次与媛媛沟通问答系统测试事宜
|
|||
|
|
|
|||
|
|
**进行中:**
|
|||
|
|
- 🔄 数字分身需求对接(核所需求放缓)
|
|||
|
|
- 🔄 招投标文件Skill架构设计
|
|||
|
|
- 🔄 问答系统V1.0测试推动
|
|||
|
|
- 🔄 运营商信息精准爬取系统需求跟进
|
|||
|
|
|
|||
|
|
**收到的反馈/学习建议:**
|
|||
|
|
- **任务调整:** 数字分身需求因核所需求放缓而面临不确定性,如核所不做则自己做需求,多做几个版本供选择
|
|||
|
|
- **任务安排:** 招投标文件Skill架构设计提升为P0任务,涉及年末收入
|
|||
|
|
- **指导:** 可以尝试学习Skill开发,先试一个小的功能
|
|||
|
|
|
|||
|
|
**下周任务:**
|
|||
|
|
- [ ] 🔴 P0|推动招投标文件Skill架构设计
|
|||
|
|
- [ ] P1|数字分身需求对接(持续跟进或自主设计)
|
|||
|
|
- [ ] P1|运营商信息精准爬取系统需求跟进
|
|||
|
|
- [ ] P1|问答系统V1.0测试推动
|
|||
|
|
- [ ] P2|学习Skill开发
|
|||
|
|
|
|||
|
|
#### 陶西平
|
|||
|
|
|
|||
|
|
**上周完成:**
|
|||
|
|
- ✅ 数字人PPT需求文档(协助江老师修改)
|
|||
|
|
- ✅ 数字人平台选型调研(HeyGen、百度希壤、黑镜等)
|
|||
|
|
|
|||
|
|
**进行中:**
|
|||
|
|
- 🔄 数字人与PPT结合视频生成
|
|||
|
|
- 🔄 前端框架重构分析
|
|||
|
|
|
|||
|
|
**收到的反馈/学习建议:**
|
|||
|
|
- **建议:** 视频时长需求应为20-30分钟(主要需求),而非3-5分钟
|
|||
|
|
- **建议:** 数字人必须要有手势动作,至少前后十秒要有手的动作
|
|||
|
|
- **建议:** 增加结尾画面,数字人独立告别
|
|||
|
|
- **建议:** 测试VEO 3.1的能力,使用Gemini 3.0生成分镜头脚本+图片
|
|||
|
|
- **建议:** 研究可以微调和训练的数字人平台
|
|||
|
|
- **建议:** 前端重构时要考虑下一版本交互逻辑,用Codex审查后端代码
|
|||
|
|
|
|||
|
|
**下周任务:**
|
|||
|
|
- [ ] 🔴 P0|数字人PPT视频样本生成(真人训练,本周周末前)
|
|||
|
|
- [ ] 🔴 P0|数字人视频工作流研究
|
|||
|
|
- [ ] 🔴 P0|Gemini 3.0分镜头脚本+VEO 3.1视频生成测试
|
|||
|
|
- [ ] P1|完成前端框架重构分析
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
## 三、会议总结
|
|||
|
|
|
|||
|
|
**核心议题:** Gemini多模态能力应用、会议纪要Skill优化、数字人视频生成、Agent架构组织
|
|||
|
|
|
|||
|
|
**关键决策:**
|
|||
|
|
1. **采用Gemini 1.5 Pro进行会议视频转写:** 多模态能力最强,转写准确率高,所有成员必须使用
|
|||
|
|
2. **会议转写改为全量读取方式:** 不再使用索引搜索,避免信息遗漏
|
|||
|
|
3. **转写文本需先进行Clean处理:** 去除重复冗余后再提供给主上下文
|
|||
|
|
4. **会议纪要进展情况以会议转写为优先:** 周报为补充
|
|||
|
|
5. **P0/P1/P2优先级判断采用人机协作:** AI给出建议,人工确认
|
|||
|
|
6. **Sub-agent调用必须使用绝对路径:** 相对路径调用不稳定
|
|||
|
|
7. **推荐Agent调用Agent的方式:** 而非Skill调用Agent,组织更清晰
|
|||
|
|
8. **数字人视频时长改为支持20-30分钟:** 这是主要需求场景
|
|||
|
|
9. **招投标Skill架构设计提升为P0任务:** 涉及30万合同,需本周完成
|
|||
|
|
10. **前端开发用Gemini,代码逻辑用Claude Code,测试用GPT Codex:** 不同任务使用不同模型
|
|||
|
|
|
|||
|
|
**下周工作重点:**
|
|||
|
|
1. 🔴 会议纪要Skill优化:生成三版对比(腾讯转写版、Gemini转写版、Gemini直接生成版)
|
|||
|
|
2. 🔴 招投标文件Skill架构设计(本周完成)
|
|||
|
|
3. 🔴 数字人PPT视频样本生成(本周周末前,真人训练)
|
|||
|
|
4. 🔴 Gemini 3.0分镜头脚本+VEO 3.1视频生成测试
|
|||
|
|
5. 🔴 前端重构方案完善(Code Review + 方案对比)
|
|||
|
|
6. 需求澄清Skill专家交叉评审效果可视化
|
|||
|
|
|
|||
|
|
---
|
|||
|
|
|
|||
|
|
**纪要整理人:** Claude
|
|||
|
|
**纪要时间:** 2025-12-08
|
|||
|
|
**下次会议:** 2025-12-15
|