Files
AIEC_Skills/会议转写测试/会议纪要生成效果对比/腾讯会议清洗后/工程类会议纪要_2025-12-02_第6次周会.md

226 lines
13 KiB
Markdown
Raw Normal View History

# 工程类会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
| --- | --- | --- | --- |
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成索引搜索改为全量读取的架构优化完成字段映射逻辑图设计负责人改为原负责人、截止时间改为原截止时间已进行新旧版本对比测试。存在问题文字转写准确性问题仍是最大挑战P0/P1/P2优先级判断难以精准。**解决方案:** 1先对转写文本做清洗处理2尝试主窗口全量处理替代分块并行3优先级判断让AI先给建议后人工确认 |
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成专家博弈流程基本测试实现独立评审→交叉评价→交叉回应→决策整合的完整流程。存在问题专家博弈prompt可能没写好评估水平需验证。**解决方案:** 把评估意见和响应打成问答文档判断质量每个领域专家prompt需专门调优 |
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成第一阶段需求文档整理五个核心需求完成数字人生成平台调研和费用对比。存在问题视频时长需求不准确原3-5分钟应为20-30分钟手势动作第一阶段也需考虑。**解决方案:** 1时长改为20-30分钟2加入手势动作要求3本周用真人训练数字人样本百度曦灵+黑镜4测试gemini分镜脚本+图片生成视频的工作流 |
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | Gartner报告解读转写系统需求文档已完成已发闫旭隆。合作方富友需求有变化时间点不确定。**解决方案:** 先做好准备,多做几个版本让合作方选择,自己找市面上好的案例做参考 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 已完成前端重构方案设计明确保留现有基础功能只重构展示部分和代码结构已确认API接口规范文档。存在问题功能清单对比尚未完成需考虑下一版本交互逻辑修改。**解决方案:** 1用大模型做后端代码审查2用research生成前端重构方案与当前方案对比3提前考虑下一版本功能需求 |
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 需求文档已完成确认,本周需设计架构 |
### 2. 重点项目问题及解决方案
#### 问题1: 会议纪要相关问题
**问题描述:**
1. 会议转写文本中存在大量语音识别错误,说话者标记不准确,上下文约束能力不足
2. AI难以准确判断任务的P0/P1/P2优先级缺少成员年龄、级别、工作时间等隐性上下文
3. 并行Agent处理会造成信息丢失和逻辑割裂
**解决方案:**
1. 使用Gemini多模态能力进行视频转写直接上传视频并根据会议模板生成纪要
2. 对转写文本进行清洗加工,去除脏数据和重复内容,保证信息全面同时内容紧凑
3. 在会议上直接确认P0/P1/P2优先级让AI先给建议后人再确认
4. 尝试主窗口全量处理一次性生成把skill写到主窗口里
5. 保留确认过程材料作为后续微调素材
**责任人:** 闫旭隆、郝倩玉
**截止时间:** 2025-12-09
#### 问题2: 数字人PPT需求相关问题
**问题描述:**
1. 需求文档中时长要求定义不准确3-5分钟 vs 20-30分钟
2. 数字人生成存在真实性问题(老外说流利中文让人质疑真假)
3. 使用界面/工作流方案尚未明确
**解决方案:**
1. 将视频时长需求改为20-30分钟作为主要需求
2. 使用真人录制训练数字人,用自己真实人物的语音和形象
3. 测试百度曦灵和黑镜平台的定制数字人效果
4. 研究端到端工作流API调用或网站操作或剪映自动化
5. 测试Gemini 3.0生成分镜脚本+图片再用Veo3.1生成视频的路径
**责任人:** 江争达
**截止时间:** 2025-12-09
#### 问题3: 需求方需求不明确问题
**问题描述:**
关于合作方(富友)数字分身需求一直不能明确,杜主任最新信息显示合作方时间点是否使用不确定。
**解决方案:**
1. 先自己做好数字分身方案,不以合作方需求为核心
2. 多做几个版本让合作方选择
3. 自己调研市面上比较好的方案,分别出方案后与相关人员对接
**责任人:** 郝倩玉、江争达
**截止时间:** 2025-12-09
#### 问题4: Subagent调用机制不稳定问题
**问题描述:**
在项目目录下调用全局agent时不指定绝对路径的情况下调用不稳定有时会读取sub的提示词但不执行表现不一致。
**解决方案:**
1. 使用绝对路径调用subagent测试表现稳定
2. 改用agent调agent的方式而不是skill调用subagent
3. 在子项目下定义一个主agent通过主agent调用其他agent
4. 调试阶段用skill主窗口加载方式调通后再移植到agent
**责任人:** 江争达、闫旭隆
**截止时间:** 2025-12-09
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
| --- | --- | --- | --- | --- |
| 🔴 会议纪要Skill测试对比 | 闫旭隆 | 使用当前版本生成会议纪要再用腾讯会议转写生成一版同时测试gemini直接喂视频生成纪要的效果 | P0 | 2025-12-09 |
| 🔴 会议转写文本清洗优化 | 闫旭隆 | 把会议转写文本中脏的、重复的内容做一遍加工清洗,保证信息全面同时内容紧凑 | P0 | 2025-12-09 |
| 🔴 需求Skill专家博弈流程优化 | 闫旭隆 | 查看二阶段专家交叉回应的字段映射,整理可视化效果,梳理整体流程图 | P0 | 2025-12-09 |
| 🔴 数字人视频样本训练 | 江争达 | 使用真实人物训练数字人语音和视频,在百度曦灵和黑镜平台各生成一个样本 | P0 | 2025-12-08 |
| 🔴 数字人PPT需求文档修改 | 江争达 | 时长改为20-30分钟添加手势动作要求完善第一阶段和第二阶段需求 | P0 | 2025-12-09 |
| 🔴 数字人工作流研究 | 江争达 | 研究数字人生成工作流方案API调用、剪映自动化测试Gemini 3.0生成分镜脚本+图片后用Veo3.1生成视频 | P0 | 2025-12-09 |
| 🔴 问答系统前端重构 | 江争达 | 完成前端重构方案,考虑下一版本交互逻辑修改,使用大模型审查方案并对比优化 | P0 | 2025-12-09 |
| 🔴 招投标Skill架构设计 | 郝倩玉 | 完成招投标文件Skill的架构设计先确认需求是否需要讨论明确 | P0 | 2025-12-09 |
| 🔴 Gartner报告转写Skill架构设计 | 郝倩玉 | 设计Gartner报告转写的Skill架构涉及年末签合同和30万收入 | P0 | 2025-12-09 |
| 🔴 数字分身市场调研 | 郝倩玉 | 调研市面上较好的数字分身方案版本,分别出方案后与钱林对接 | P0 | 2025-12-09 |
| 协助会议纪要Skill优化 | 郝倩玉 | 协助闫旭隆优化会议纪要Skill | P1 | 2025-12-09 |
| 后端代码审查 | 江争达 | 使用Claude 4.5或GPT做后端code review记录问题作为后续优化需求 | P1 | 2025-12-09 |
| 天眼查自动更新需求确认 | 江争达 | 与小彤确认天眼查客户数据库自动更新需求是否还需要 | P1 | 2025-12-09 |
| Cloud Skill转框架研究 | 郝倩玉 | 研究如何将Claude Skill迁移到LangGraph等低代码架构作为技术储备 | P1 | 待定 |
| 日报驱动项目管理系统开发 | 丁康 | 负责基于会议纪要的日报驱动项目管理系统Skill开发包括与MCP对接 | P1 | 待定 |
### 4. 组内成员工作进展
#### 闫旭隆
**上周完成:**
- ✅ 需求澄清-需求文档skill优化、测试、视频录制
- ✅ 会议纪要Skill开发改为全量读取架构整理流程图
**进行中:**
- 🔄 会议纪要Skill测试对比
**收到的反馈/学习建议:**
- **表扬:** 总的来说比上一版有进步,整个逻辑可以先固化下来使用;该有的要点都有,比较接近了
- **表扬:** 能把动作识别出来不容易,就算其他人明白也挺牛的
- **建议:** 映射逻辑图很重要AI目前最缺的是逻辑一致和前后连贯
- **建议:** 转写文本需先做清洗加工,去除重复和脏数据后再处理
- **建议:** 尝试主窗口全量处理一次性生成减少并行Agent带来的信息丢失
- **建议:** 整个文字转写换成gemini来做生成全量版而非逐字转写
**下周任务:**
- [ ] 🔴 P0会议纪要Skill测试对比腾讯会议+gemini视频两个版本
- [ ] 🔴 P0会议转写文本清洗优化
- [ ] 🔴 P0需求Skill专家博弈流程优化
- [ ] P1招投标文件Skill架构设计和调试
#### 江争达
**上周完成:**
- ✅ 数字人PPT需求文档
**进行中:**
- 🔄 问答系统v1.1前端重构方案
- 🔄 数字人视频样本训练
**收到的反馈/学习建议:**
- **批评:** 背景说明不清楚,核心诉求和问题点没有交代清楚,需求文档分析存在问题,不站在其他人角度思考
- **批评:** 只看树木不看森林,关于数字人老外说中文的问题理解不到位
- **建议:** 数字人PPT时长要求改为20-30分钟而非3-5分钟
- **建议:** 数字人视频需要有手势动作,开场和结尾不能呆呆站着
- **建议:** 前端重构要考虑下一版本交互逻辑修改
- **建议:** 后端代码需用大模型做code review审查
- **建议:** 提供示例代码给大模型是有用的
**下周任务:**
- [ ] 🔴 P0数字人视频样本训练本周末完成
- [ ] 🔴 P0数字人PPT需求文档修改
- [ ] 🔴 P0数字人工作流研究+Gemini分镜测试
- [ ] 🔴 P0问答系统前端重构
- [ ] P1后端代码审查
- [ ] P1天眼查自动更新需求确认
#### 郝倩玉
**上周完成:**
- ✅ 会议纪要Skill架构优化协助
- ✅ Gartner报告解读转写系统需求文档已发闫旭隆
**进行中:**
- 🔄 数字分身需求对接
- 🔄 招投标文件Skill架构设计
**收到的反馈/学习建议:**
- **建议:** 数字分身需求由于合作方时间不确定,先自己做好准备,做几个版本备选
- **建议:** Gartner报告转写因涉及年末签合同提升到P0先设计架构
- **建议:** 如果想学习Skill到LangGraph架构转换需要先把skill底层知识全部学一遍
**下周任务:**
- [ ] 🔴 P0招投标Skill架构设计
- [ ] 🔴 P0Gartner报告转写Skill架构设计
- [ ] 🔴 P0数字分身市场调研
- [ ] P1协助会议纪要Skill优化
- [ ] P1Cloud Skill转框架研究
#### 陶西平
**上周完成:**
- ✅ 数字人PPT需求文档协助提供调研文档
- ✅ 数字人与PPT结合视频生成测试
**进行中:**
- 🔄 前端框架调研
- 🔄 数字人调研报告
**收到的反馈/学习建议:**
- **认可:** 提供的数字人调研文档被江争达采用,作为需求文档重要参考
**下周任务:**
- [ ] 🔴 P0配合江老师前端框架重构相关工作
- [ ] P1完成数字人调研报告
- [ ] P1完成PPT与数字人结合调研
---
## 三、会议总结
**核心议题:** 会议纪要Skill架构优化、数字人PPT需求完善、问答系统前端重构、Subagent调用机制研究
**关键决策:**
1. **会议纪要转写采用Gemini多模态视频处理路径**:多模态能力最强,上下文最长,视觉能力超强
2. **模型工具组合确定**前端用Gemini中间逻辑用Claude Code整体项目修复/测试用GPT Codex
3. **会议纪要Skill改为全量读取方式**:放弃索引搜索,转写文本需先做清洗再处理
4. **P0优先级判断采用AI建议+人工确认模式**:不能完全依赖自动判断
5. **数字人视频时长改为20-30分钟**:技术上没有难度,只是花销问题
6. **数字分身选型聚焦百度曦灵和黑镜两个平台**:本周需用真人训练样本
7. **前端重构只改展示和代码结构**:保留现有功能流程不动,但要考虑下一版本交互逻辑
8. **SubAgent调用必须使用绝对路径**测试表现稳定推荐Agent调Agent方式
9. **Gartner报告转写提升为P0**涉及年末签合同和30万收入
10. **日报驱动项目管理系统由丁康负责**包括基于会议纪要生成日报、与MCP对接
**下周工作重点:**
1. 🔴 会议纪要Skill测试对比腾讯会议转写 vs gemini视频直接生成
2. 🔴 数字人视频样本训练(百度曦灵+黑镜,本周末完成)
3. 🔴 数字人工作流研究Gemini分镜脚本+图片→Veo3.1视频)
4. 🔴 问答系统前端重构方案完善
5. 🔴 招投标Skill和Gartner报告转写Skill架构设计
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-08
**下次会议:** 2025-12-09