Files
AIEC_Skills/会议转写测试/会议纪要生成效果对比/gemini清洗前/工程类会议纪要_2025-12-08_第6次周会.md
2025-12-11 14:19:36 +08:00

248 lines
13 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 工程类会议纪要 (2025-12-08)
## 一、会议信息
- **会议时间:** 2025-12-08
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
- **纪要整理人:** Claude
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|---------|---------|-----------|-------------|
| 会议纪要Skill架构优化 | 闫旭隆 | 2025-12-02 | 已完成架构重构从索引搜索改为全量读取会议转写绘制了字段映射逻辑流程图和Phase2并行执行流程图。存在问题全量读取资源消耗大、子Agent并行处理可能造成逻辑割裂、语义识别准确性不足。**解决方案:** 1使用Gemini进行视频转写2先对转写文本进行Clean处理3尝试主窗口全量处理方案 |
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成多轮博弈机制开发加入多角色专家评审和交叉回应功能。存在问题专家prompt编写难度大、评审过程无法直观查看、主Agent可能读取不完整。**解决方案:** 1将评审过程整合为一问一答文档2评估博弈效果效果不佳则优化或去除 |
| 数字人PPT需求文档 | 江争达数字人PPT、郝倩玉数字分身 | 2025-12-02 | 已完成第一阶段需求文档包含5个核心需求、质量标准、平台选型调研。存在问题时长需求定义不准应为20-30分钟而非3-5分钟、缺少手势动作、缺少结尾画面。**解决方案:** 1将主要时长改为20-30分钟2增加手势动作要求3本周完成百度希壤和黑镜真人训练样本 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 已完成部分需求文档系统架构图、API接口规范、功能清单。存在问题未完成功能对照、未考虑下一版本需求、后端代码未审查。**解决方案:** 1用Codex/Opus做后端Code Review2用GPT Research生成方案对比3考虑下一版本功能需求 |
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 会议中提升为P0任务涉及30万合同需本周完成架构设计 |
| 问答系统V1.0测试推动 | 江争达、郝倩玉 | 2025-12-02 | 进行中,多次与媛媛沟通,相关领导参与测试时间尚未确定 |
| Gartner报告解读转写系统 | 郝倩玉 | 2025-12-02 | 需求文档已完成并发给闫旭隆设为P1任务先做架构设计 |
### 2. 重点项目问题及解决方案
#### 问题1: 会议纪要Skill信息提取准确性问题
**问题描述:**
会议纪要Skill在提取信息时存在准确性问题
- 转写文本准确性不足,存在错误和语义识别问题
- 上下文约束能力弱,缺少会议背景信息
- 分块索引方式导致信息遗漏,全量读取方案资源消耗大
- Sub-agent并行提取后主窗口整合存在逻辑割裂问题
**解决方案:**
1. 文字转写采用Gemini多模态能力利用其视频识别能力提升转写准确性
2. 对转写文本进行Clean处理去除重复和冗余信息后再作为输入
3. 将全量Clean后的转写文本直接加载到主上下文让主窗口一次性处理
4. 尝试调用Gemini API在Claude内部处理会议纪要生成
5. 测试主上下文全量处理与Sub-agent并行提取两种方案的效果对比
**责任人:** 闫旭隆
**截止时间:** 2025-12-15
#### 问题2: Sub-agent调用路径问题全局vs项目级
**问题描述:**
Skill调用自定义Sub-agent时存在全局路径和项目级路径调用差异问题
- 使用相对路径时Claude优先查找全局Agent找不到会读取项目级Agent的Prompt但不执行
- 使用绝对路径可以成功调用项目级Sub-agent
- 未使用Task规范调用也能成功但机制不清晰
**解决方案:**
1. 调用项目级Sub-agent时必须使用绝对路径
2. 建议采用Agent调用Agent的方式而非Skill调用Agent
3. 在子项目下定义主Agent由主Agent调配各Sub-agent
4. 使用标准的Task调用规范避免语言描述产生歧义
5. 调试阶段可用Skill加载方式调通后迁移到Agent架构
**责任人:** 江争达
**截止时间:** 2025-12-15
#### 问题3: 数字人需求文档表达清晰度问题
**问题描述:**
数字人PPT需求文档存在表达不够清晰和具体的问题
- 时长需求定义为3-5分钟但实际主要需求应为20-30分钟
- 缺少结尾画面设计
- 非功能性需求中缺少使用界面说明
- 数字人手势动作需求缺失
**解决方案:**
1. 将时长需求调整为20-30分钟作为主要需求3-5分钟作为初期测试
2. 增加结尾画面设计,数字人独立告别画面
3. 补充使用界面需求明确工作流、API调用或平台操作方式
4. 在核心质量指标中增加手势动作要求,至少前后十秒要有手势
5. 与GPT/Gemini进行需求方案交叉验证
**责任人:** 陶西平
**截止时间:** 2025-12-15
#### 问题4: 需求文档背景说明不清晰问题
**问题描述:**
技术调研文档和需求文档的背景说明不够清晰:
- 核心诉求和问题点没有交代清楚
- 不站在读者角度思考,导致他人难以理解
- 与大模型交互时无法得到好的答案
**解决方案:**
1. 撰写技术文档时必须站在读者角度思考
2. 把背景、核心诉求、要解决的问题清晰表达出来
3. 对于说不出来的复杂背景说明,先写下来再给大模型
4. 确保文档准备充分后别人才能看得懂
**责任人:** 江争达
**截止时间:** 2025-12-15
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|---------|-------|-------------|-------|---------|
| 🔴 会议纪要Skill优化-Gemini转写对比 | 闫旭隆 | 生成三版会议纪要对比腾讯会议转写版、Gemini转写版、Gemini直接生成版 | P0 | 2025-12-15 |
| 🔴 需求澄清Skill专家交叉评审可视化 | 闫旭隆 | 整理专家交叉回应效果的可视化展示,呈现专家间的问题、建议、响应过程 | P0 | 2025-12-15 |
| 🔴 招投标文件Skill架构设计 | 闫旭隆 | 完成招投标文件生成Skill的整体架构设计 | P0 | 2025-12-15 |
| 🔴 数字人PPT视频样本生成 | 陶西平 | 使用百度希壤和黑镜平台训练真人数字人,生成包含手势动作的视频样本 | P0 | 2025-12-13 |
| 🔴 数字人视频工作流研究 | 陶西平 | 研究数字人视频生成工作流API调用/剪映自动化/平台操作),确定技术方案 | P0 | 2025-12-15 |
| 🔴 Gemini 3.0分镜头脚本+视频生成测试 | 陶西平 | 使用Gemini 3.0生成分镜头脚本和图片通过VEO 3.1生成30秒-2分钟视频 | P0 | 2025-12-15 |
| 🔴 前端重构方案完善 | 江争达 | 用Codex审查后端代码、用GPT Research对比方案、考虑下一版本功能需求 | P0 | 2025-12-15 |
| Gartner报告转写系统架构设计 | 闫旭隆 | 设计Gartner报告转写系统的整体架构 | P1 | 2025-12-15 |
| Claude Code Skill转LangChain研究 | 闫旭隆 | 研究如何将Skill迁移到LangChain/LangGraph的DeepAgent架构 | P1 | 待定 |
| 日报驱动项目管理系统开发 | 丁康 | 学习Asana架构和模块设计基于会议纪要生成日报并对接Asana MCP的系统 | P1 | 待定 |
| 数字分身需求对接 | 郝倩玉 | 继续与娴霖沟通,如核所需求不明确则自主设计多个版本 | P1 | 2025-12-15 |
| 运营商信息精准爬取系统需求跟进 | 郝倩玉 | 持续跟进需求方需求明确情况 | P1 | 2025-12-15 |
### 4. 组内成员工作进展
#### 闫旭隆
**上周完成:**
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文
- ✅ 录制演示视频
**进行中:**
- 🔄 会议纪要Skill持续优化
**收到的反馈/学习建议:**
- **建议:** 流程图绘制和字段映射逻辑需要写入Skill中确保Claude逻辑清晰避免瞎改
- **建议:** 会议转写换成Gemini来做做一个clean版本作为输入基础
- **建议:** 尝试主上下文窗口全量处理方案与当前并行子Agent方案对比效果
- **建议:** P0优先级判断让系统给出建议后人工确认保留确认材料用于后续优化
- **表扬:** 会议纪要Skill新版本相比上一版有明显进步主要要点已经提取到位
**下周任务:**
- [ ] 🔴 P0会议纪要Skill优化-Gemini转写对比测试
- [ ] 🔴 P0需求澄清Skill专家交叉评审可视化
- [ ] 🔴 P0招投标文件Skill架构设计
- [ ] P1Gartner报告转写系统架构设计
- [ ] P1Claude Code Skill转LangChain研究
#### 江争达
**上周完成:**
- ✅ 数字人PPT需求文档
- ✅ Sub-agent调用研究文档
**进行中:**
- 🔄 问答系统v1.1前端重构方案
- 🔄 PDF Skill技术调研
- 🔄 服务器采购
- 🔄 招投标文件Skill架构调试
**收到的反馈/学习建议:**
- **批评:** Sub-agent调研文档背景说明不够清晰核心诉求和问题点没有交代清楚90%的重点都说丢了
- **批评:** 表达能力和提问题能力不足,导致与大模型交互时无法得到好的答案
- **建议:** 需要提升需求表达能力,站在读者角度思考,把背景、核心诉求清晰表达出来
- **建议:** 对于说不出来的复杂背景说明,建议先写下来再给大模型
- **建议:** 前端重构方案需要用大模型审查后端代码,找出问题后再决定是否修改
**下周任务:**
- [ ] 🔴 P0前端重构方案完善Code Review + 方案对比)
- [ ] P1问答系统V1.0测试推动
- [ ] P1PDF Skill技术调研
- [ ] P1服务器采购
- [ ] P1招投标文件Skill架构调试
#### 郝倩玉
**上周完成:**
- ✅ 会议纪要Skill架构优化协助闫旭隆优化学习类+Q&A类逻辑
- ✅ Gartner报告解读转写系统需求文档
- ✅ 多次与媛媛沟通问答系统测试事宜
**进行中:**
- 🔄 数字分身需求对接(核所需求放缓)
- 🔄 招投标文件Skill架构设计
- 🔄 问答系统V1.0测试推动
- 🔄 运营商信息精准爬取系统需求跟进
**收到的反馈/学习建议:**
- **任务调整:** 数字分身需求因核所需求放缓而面临不确定性,如核所不做则自己做需求,多做几个版本供选择
- **任务安排:** 招投标文件Skill架构设计提升为P0任务涉及年末收入
- **指导:** 可以尝试学习Skill开发先试一个小的功能
**下周任务:**
- [ ] 🔴 P0推动招投标文件Skill架构设计
- [ ] P1数字分身需求对接持续跟进或自主设计
- [ ] P1运营商信息精准爬取系统需求跟进
- [ ] P1问答系统V1.0测试推动
- [ ] P2学习Skill开发
#### 陶西平
**上周完成:**
- ✅ 数字人PPT需求文档协助江老师修改
- ✅ 数字人平台选型调研HeyGen、百度希壤、黑镜等
**进行中:**
- 🔄 数字人与PPT结合视频生成
- 🔄 前端框架重构分析
**收到的反馈/学习建议:**
- **建议:** 视频时长需求应为20-30分钟主要需求而非3-5分钟
- **建议:** 数字人必须要有手势动作,至少前后十秒要有手的动作
- **建议:** 增加结尾画面,数字人独立告别
- **建议:** 测试VEO 3.1的能力使用Gemini 3.0生成分镜头脚本+图片
- **建议:** 研究可以微调和训练的数字人平台
- **建议:** 前端重构时要考虑下一版本交互逻辑用Codex审查后端代码
**下周任务:**
- [ ] 🔴 P0数字人PPT视频样本生成真人训练本周周末前
- [ ] 🔴 P0数字人视频工作流研究
- [ ] 🔴 P0Gemini 3.0分镜头脚本+VEO 3.1视频生成测试
- [ ] P1完成前端框架重构分析
---
## 三、会议总结
**核心议题:** Gemini多模态能力应用、会议纪要Skill优化、数字人视频生成、Agent架构组织
**关键决策:**
1. **采用Gemini 1.5 Pro进行会议视频转写:** 多模态能力最强,转写准确率高,所有成员必须使用
2. **会议转写改为全量读取方式:** 不再使用索引搜索,避免信息遗漏
3. **转写文本需先进行Clean处理:** 去除重复冗余后再提供给主上下文
4. **会议纪要进展情况以会议转写为优先:** 周报为补充
5. **P0/P1/P2优先级判断采用人机协作:** AI给出建议人工确认
6. **Sub-agent调用必须使用绝对路径:** 相对路径调用不稳定
7. **推荐Agent调用Agent的方式:** 而非Skill调用Agent组织更清晰
8. **数字人视频时长改为支持20-30分钟:** 这是主要需求场景
9. **招投标Skill架构设计提升为P0任务:** 涉及30万合同需本周完成
10. **前端开发用Gemini代码逻辑用Claude Code测试用GPT Codex:** 不同任务使用不同模型
**下周工作重点:**
1. 🔴 会议纪要Skill优化生成三版对比腾讯转写版、Gemini转写版、Gemini直接生成版
2. 🔴 招投标文件Skill架构设计本周完成
3. 🔴 数字人PPT视频样本生成本周周末前真人训练
4. 🔴 Gemini 3.0分镜头脚本+VEO 3.1视频生成测试
5. 🔴 前端重构方案完善Code Review + 方案对比)
6. 需求澄清Skill专家交叉评审效果可视化
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-08
**下次会议:** 2025-12-15