# 工程类会议纪要 (2025-12-02)

## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平

---

## 二、工作内容

### 1. 重点项目进展情况汇总

| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
| --- | --- | --- | --- |
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成索引搜索改为全量读取的架构优化，完成字段映射逻辑图设计（负责人改为原负责人、截止时间改为原截止时间），已进行新旧版本对比测试。存在问题：文字转写准确性问题仍是最大挑战，P0/P1/P2优先级判断难以精准。**解决方案：** 1）先对转写文本做清洗处理；2）尝试主窗口全量处理替代分块并行；3）优先级判断让AI先给建议后人工确认 |
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成专家博弈流程基本测试，实现独立评审→交叉评价→交叉回应→决策整合的完整流程。存在问题：专家博弈prompt可能没写好，评估水平需验证。**解决方案：** 把评估意见和响应打成问答文档判断质量，每个领域专家prompt需专门调优 |
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成第一阶段需求文档整理（五个核心需求），完成数字人生成平台调研和费用对比。存在问题：视频时长需求不准确（原3-5分钟应为20-30分钟），手势动作第一阶段也需考虑。**解决方案：** 1）时长改为20-30分钟；2）加入手势动作要求；3）本周用真人训练数字人样本（百度曦灵+黑镜）；4）测试gemini分镜脚本+图片生成视频的工作流 |
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | Gartner报告解读转写系统需求文档已完成，已发闫旭隆。合作方（富友）需求有变化，时间点不确定。**解决方案：** 先做好准备，多做几个版本让合作方选择，自己找市面上好的案例做参考 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 已完成前端重构方案设计，明确保留现有基础功能只重构展示部分和代码结构，已确认API接口规范文档。存在问题：功能清单对比尚未完成，需考虑下一版本交互逻辑修改。**解决方案：** 1）用大模型做后端代码审查；2）用research生成前端重构方案与当前方案对比；3）提前考虑下一版本功能需求 |
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 需求文档已完成确认，本周需设计架构 |

### 2. 重点项目问题及解决方案

#### 问题1: 会议纪要相关问题

**问题描述:**
1. 会议转写文本中存在大量语音识别错误，说话者标记不准确，上下文约束能力不足
2. AI难以准确判断任务的P0/P1/P2优先级，缺少成员年龄、级别、工作时间等隐性上下文
3. 并行Agent处理会造成信息丢失和逻辑割裂

**解决方案:**
1. 使用Gemini多模态能力进行视频转写，直接上传视频并根据会议模板生成纪要
2. 对转写文本进行清洗加工，去除脏数据和重复内容，保证信息全面同时内容紧凑
3. 在会议上直接确认P0/P1/P2优先级，让AI先给建议后人再确认
4. 尝试主窗口全量处理一次性生成，把skill写到主窗口里
5. 保留确认过程材料作为后续微调素材

**责任人:** 闫旭隆、郝倩玉
**截止时间:** 2025-12-09

#### 问题2: 数字人PPT需求相关问题

**问题描述:**
1. 需求文档中时长要求定义不准确（3-5分钟 vs 20-30分钟）
2. 数字人生成存在真实性问题（老外说流利中文让人质疑真假）
3. 使用界面/工作流方案尚未明确

**解决方案:**
1. 将视频时长需求改为20-30分钟作为主要需求
2. 使用真人录制训练数字人，用自己真实人物的语音和形象
3. 测试百度曦灵和黑镜平台的定制数字人效果
4. 研究端到端工作流（API调用或网站操作或剪映自动化）
5. 测试Gemini 3.0生成分镜脚本+图片再用Veo3.1生成视频的路径

**责任人:** 江争达
**截止时间:** 2025-12-09

#### 问题3: 需求方需求不明确问题

**问题描述:**
关于合作方(富友)数字分身需求一直不能明确，杜主任最新信息显示合作方时间点是否使用不确定。

**解决方案:**
1. 先自己做好数字分身方案，不以合作方需求为核心
2. 多做几个版本让合作方选择
3. 自己调研市面上比较好的方案，分别出方案后与相关人员对接

**责任人:** 郝倩玉、江争达
**截止时间:** 2025-12-09

#### 问题4: Subagent调用机制不稳定问题

**问题描述:**
在项目目录下调用全局agent时，不指定绝对路径的情况下调用不稳定，有时会读取sub的提示词但不执行，表现不一致。

**解决方案:**
1. 使用绝对路径调用subagent，测试表现稳定
2. 改用agent调agent的方式，而不是skill调用subagent
3. 在子项目下定义一个主agent，通过主agent调用其他agent
4. 调试阶段用skill主窗口加载方式，调通后再移植到agent

**责任人:** 江争达、闫旭隆
**截止时间:** 2025-12-09

### 3. 下周工作安排

| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
| --- | --- | --- | --- | --- |
| 🔴 会议纪要Skill测试对比 | 闫旭隆 | 使用当前版本生成会议纪要，再用腾讯会议转写生成一版，同时测试gemini直接喂视频生成纪要的效果 | P0 | 2025-12-09 |
| 🔴 会议转写文本清洗优化 | 闫旭隆 | 把会议转写文本中脏的、重复的内容做一遍加工清洗，保证信息全面同时内容紧凑 | P0 | 2025-12-09 |
| 🔴 需求Skill专家博弈流程优化 | 闫旭隆 | 查看二阶段专家交叉回应的字段映射，整理可视化效果，梳理整体流程图 | P0 | 2025-12-09 |
| 🔴 数字人视频样本训练 | 江争达 | 使用真实人物训练数字人语音和视频，在百度曦灵和黑镜平台各生成一个样本 | P0 | 2025-12-08 |
| 🔴 数字人PPT需求文档修改 | 江争达 | 时长改为20-30分钟，添加手势动作要求，完善第一阶段和第二阶段需求 | P0 | 2025-12-09 |
| 🔴 数字人工作流研究 | 江争达 | 研究数字人生成工作流方案（API调用、剪映自动化）；测试Gemini 3.0生成分镜脚本+图片后用Veo3.1生成视频 | P0 | 2025-12-09 |
| 🔴 问答系统前端重构 | 江争达 | 完成前端重构方案，考虑下一版本交互逻辑修改，使用大模型审查方案并对比优化 | P0 | 2025-12-09 |
| 🔴 招投标Skill架构设计 | 郝倩玉 | 完成招投标文件Skill的架构设计，先确认需求是否需要讨论明确 | P0 | 2025-12-09 |
| 🔴 Gartner报告转写Skill架构设计 | 郝倩玉 | 设计Gartner报告转写的Skill架构（涉及年末签合同和30万收入） | P0 | 2025-12-09 |
| 🔴 数字分身市场调研 | 郝倩玉 | 调研市面上较好的数字分身方案版本，分别出方案后与钱林对接 | P0 | 2025-12-09 |
| 协助会议纪要Skill优化 | 郝倩玉 | 协助闫旭隆优化会议纪要Skill | P1 | 2025-12-09 |
| 后端代码审查 | 江争达 | 使用Claude 4.5或GPT做后端code review，记录问题作为后续优化需求 | P1 | 2025-12-09 |
| 天眼查自动更新需求确认 | 江争达 | 与小彤确认天眼查客户数据库自动更新需求是否还需要 | P1 | 2025-12-09 |
| Cloud Skill转框架研究 | 郝倩玉 | 研究如何将Claude Skill迁移到LangGraph等低代码架构，作为技术储备 | P1 | 待定 |
| 日报驱动项目管理系统开发 | 丁康 | 负责基于会议纪要的日报驱动项目管理系统Skill开发，包括与MCP对接 | P1 | 待定 |

### 4. 组内成员工作进展

#### 闫旭隆

**上周完成:**
- ✅ 需求澄清-需求文档skill优化、测试、视频录制
- ✅ 会议纪要Skill开发（改为全量读取架构，整理流程图）

**进行中:**
- 🔄 会议纪要Skill测试对比

**收到的反馈/学习建议:**
- **表扬:** 总的来说比上一版有进步，整个逻辑可以先固化下来使用；该有的要点都有，比较接近了
- **表扬:** 能把动作识别出来不容易，就算其他人明白也挺牛的
- **建议:** 映射逻辑图很重要，AI目前最缺的是逻辑一致和前后连贯
- **建议:** 转写文本需先做清洗加工，去除重复和脏数据后再处理
- **建议:** 尝试主窗口全量处理一次性生成，减少并行Agent带来的信息丢失
- **建议:** 整个文字转写换成gemini来做，生成全量版而非逐字转写

**下周任务:**
- [ ] 🔴 P0｜会议纪要Skill测试对比（腾讯会议+gemini视频两个版本）
- [ ] 🔴 P0｜会议转写文本清洗优化
- [ ] 🔴 P0｜需求Skill专家博弈流程优化
- [ ] P1｜招投标文件Skill架构设计和调试

#### 江争达

**上周完成:**
- ✅ 数字人PPT需求文档

**进行中:**
- 🔄 问答系统v1.1前端重构方案
- 🔄 数字人视频样本训练

**收到的反馈/学习建议:**
- **批评:** 背景说明不清楚，核心诉求和问题点没有交代清楚，需求文档分析存在问题，不站在其他人角度思考
- **批评:** 只看树木不看森林，关于数字人老外说中文的问题理解不到位
- **建议:** 数字人PPT时长要求改为20-30分钟，而非3-5分钟
- **建议:** 数字人视频需要有手势动作，开场和结尾不能呆呆站着
- **建议:** 前端重构要考虑下一版本交互逻辑修改
- **建议:** 后端代码需用大模型做code review审查
- **建议:** 提供示例代码给大模型是有用的

**下周任务:**
- [ ] 🔴 P0｜数字人视频样本训练（本周末完成）
- [ ] 🔴 P0｜数字人PPT需求文档修改
- [ ] 🔴 P0｜数字人工作流研究+Gemini分镜测试
- [ ] 🔴 P0｜问答系统前端重构
- [ ] P1｜后端代码审查
- [ ] P1｜天眼查自动更新需求确认

#### 郝倩玉

**上周完成:**
- ✅ 会议纪要Skill架构优化协助
- ✅ Gartner报告解读转写系统需求文档（已发闫旭隆）

**进行中:**
- 🔄 数字分身需求对接
- 🔄 招投标文件Skill架构设计

**收到的反馈/学习建议:**
- **建议:** 数字分身需求由于合作方时间不确定，先自己做好准备，做几个版本备选
- **建议:** Gartner报告转写因涉及年末签合同提升到P0，先设计架构
- **建议:** 如果想学习Skill到LangGraph架构转换，需要先把skill底层知识全部学一遍

**下周任务:**
- [ ] 🔴 P0｜招投标Skill架构设计
- [ ] 🔴 P0｜Gartner报告转写Skill架构设计
- [ ] 🔴 P0｜数字分身市场调研
- [ ] P1｜协助会议纪要Skill优化
- [ ] P1｜Cloud Skill转框架研究

#### 陶西平

**上周完成:**
- ✅ 数字人PPT需求文档协助（提供调研文档）
- ✅ 数字人与PPT结合视频生成测试

**进行中:**
- 🔄 前端框架调研
- 🔄 数字人调研报告

**收到的反馈/学习建议:**
- **认可:** 提供的数字人调研文档被江争达采用，作为需求文档重要参考

**下周任务:**
- [ ] 🔴 P0｜配合江老师前端框架重构相关工作
- [ ] P1｜完成数字人调研报告
- [ ] P1｜完成PPT与数字人结合调研

---

## 三、会议总结

**核心议题:** 会议纪要Skill架构优化、数字人PPT需求完善、问答系统前端重构、Subagent调用机制研究

**关键决策:**
1. **会议纪要转写采用Gemini多模态视频处理路径**：多模态能力最强，上下文最长，视觉能力超强
2. **模型工具组合确定**：前端用Gemini，中间逻辑用Claude Code，整体项目修复/测试用GPT Codex
3. **会议纪要Skill改为全量读取方式**：放弃索引搜索，转写文本需先做清洗再处理
4. **P0优先级判断采用AI建议+人工确认模式**：不能完全依赖自动判断
5. **数字人视频时长改为20-30分钟**：技术上没有难度，只是花销问题
6. **数字分身选型聚焦百度曦灵和黑镜两个平台**：本周需用真人训练样本
7. **前端重构只改展示和代码结构**：保留现有功能流程不动，但要考虑下一版本交互逻辑
8. **SubAgent调用必须使用绝对路径**：测试表现稳定，推荐Agent调Agent方式
9. **Gartner报告转写提升为P0**：涉及年末签合同和30万收入
10. **日报驱动项目管理系统由丁康负责**：包括基于会议纪要生成日报、与MCP对接

**下周工作重点:**
1. 🔴 会议纪要Skill测试对比（腾讯会议转写 vs gemini视频直接生成）
2. 🔴 数字人视频样本训练（百度曦灵+黑镜，本周末完成）
3. 🔴 数字人工作流研究（Gemini分镜脚本+图片→Veo3.1视频）
4. 🔴 问答系统前端重构方案完善
5. 🔴 招投标Skill和Gartner报告转写Skill架构设计

---

**纪要整理人:** Claude
**纪要时间:** 2025-12-08
**下次会议:** 2025-12-09