226 lines
13 KiB
Markdown
226 lines
13 KiB
Markdown
# 工程类会议纪要 (2025-12-02)
|
||
|
||
## 一、会议信息
|
||
- **会议时间:** 2025-12-02
|
||
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
|
||
|
||
---
|
||
|
||
## 二、工作内容
|
||
|
||
### 1. 重点项目进展情况汇总
|
||
|
||
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|
||
| --- | --- | --- | --- |
|
||
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成索引搜索改为全量读取的架构优化,完成字段映射逻辑图设计(负责人改为原负责人、截止时间改为原截止时间),已进行新旧版本对比测试。存在问题:文字转写准确性问题仍是最大挑战,P0/P1/P2优先级判断难以精准。**解决方案:** 1)先对转写文本做清洗处理;2)尝试主窗口全量处理替代分块并行;3)优先级判断让AI先给建议后人工确认 |
|
||
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成专家博弈流程基本测试,实现独立评审→交叉评价→交叉回应→决策整合的完整流程。存在问题:专家博弈prompt可能没写好,评估水平需验证。**解决方案:** 把评估意见和响应打成问答文档判断质量,每个领域专家prompt需专门调优 |
|
||
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成第一阶段需求文档整理(五个核心需求),完成数字人生成平台调研和费用对比。存在问题:视频时长需求不准确(原3-5分钟应为20-30分钟),手势动作第一阶段也需考虑。**解决方案:** 1)时长改为20-30分钟;2)加入手势动作要求;3)本周用真人训练数字人样本(百度曦灵+黑镜);4)测试gemini分镜脚本+图片生成视频的工作流 |
|
||
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | Gartner报告解读转写系统需求文档已完成,已发闫旭隆。合作方(富友)需求有变化,时间点不确定。**解决方案:** 先做好准备,多做几个版本让合作方选择,自己找市面上好的案例做参考 |
|
||
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 已完成前端重构方案设计,明确保留现有基础功能只重构展示部分和代码结构,已确认API接口规范文档。存在问题:功能清单对比尚未完成,需考虑下一版本交互逻辑修改。**解决方案:** 1)用大模型做后端代码审查;2)用research生成前端重构方案与当前方案对比;3)提前考虑下一版本功能需求 |
|
||
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 需求文档已完成确认,本周需设计架构 |
|
||
|
||
### 2. 重点项目问题及解决方案
|
||
|
||
#### 问题1: 会议纪要相关问题
|
||
|
||
**问题描述:**
|
||
1. 会议转写文本中存在大量语音识别错误,说话者标记不准确,上下文约束能力不足
|
||
2. AI难以准确判断任务的P0/P1/P2优先级,缺少成员年龄、级别、工作时间等隐性上下文
|
||
3. 并行Agent处理会造成信息丢失和逻辑割裂
|
||
|
||
**解决方案:**
|
||
1. 使用Gemini多模态能力进行视频转写,直接上传视频并根据会议模板生成纪要
|
||
2. 对转写文本进行清洗加工,去除脏数据和重复内容,保证信息全面同时内容紧凑
|
||
3. 在会议上直接确认P0/P1/P2优先级,让AI先给建议后人再确认
|
||
4. 尝试主窗口全量处理一次性生成,把skill写到主窗口里
|
||
5. 保留确认过程材料作为后续微调素材
|
||
|
||
**责任人:** 闫旭隆、郝倩玉
|
||
**截止时间:** 2025-12-09
|
||
|
||
#### 问题2: 数字人PPT需求相关问题
|
||
|
||
**问题描述:**
|
||
1. 需求文档中时长要求定义不准确(3-5分钟 vs 20-30分钟)
|
||
2. 数字人生成存在真实性问题(老外说流利中文让人质疑真假)
|
||
3. 使用界面/工作流方案尚未明确
|
||
|
||
**解决方案:**
|
||
1. 将视频时长需求改为20-30分钟作为主要需求
|
||
2. 使用真人录制训练数字人,用自己真实人物的语音和形象
|
||
3. 测试百度曦灵和黑镜平台的定制数字人效果
|
||
4. 研究端到端工作流(API调用或网站操作或剪映自动化)
|
||
5. 测试Gemini 3.0生成分镜脚本+图片再用Veo3.1生成视频的路径
|
||
|
||
**责任人:** 江争达
|
||
**截止时间:** 2025-12-09
|
||
|
||
#### 问题3: 需求方需求不明确问题
|
||
|
||
**问题描述:**
|
||
关于合作方(富友)数字分身需求一直不能明确,杜主任最新信息显示合作方时间点是否使用不确定。
|
||
|
||
**解决方案:**
|
||
1. 先自己做好数字分身方案,不以合作方需求为核心
|
||
2. 多做几个版本让合作方选择
|
||
3. 自己调研市面上比较好的方案,分别出方案后与相关人员对接
|
||
|
||
**责任人:** 郝倩玉、江争达
|
||
**截止时间:** 2025-12-09
|
||
|
||
#### 问题4: Subagent调用机制不稳定问题
|
||
|
||
**问题描述:**
|
||
在项目目录下调用全局agent时,不指定绝对路径的情况下调用不稳定,有时会读取sub的提示词但不执行,表现不一致。
|
||
|
||
**解决方案:**
|
||
1. 使用绝对路径调用subagent,测试表现稳定
|
||
2. 改用agent调agent的方式,而不是skill调用subagent
|
||
3. 在子项目下定义一个主agent,通过主agent调用其他agent
|
||
4. 调试阶段用skill主窗口加载方式,调通后再移植到agent
|
||
|
||
**责任人:** 江争达、闫旭隆
|
||
**截止时间:** 2025-12-09
|
||
|
||
### 3. 下周工作安排
|
||
|
||
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|
||
| --- | --- | --- | --- | --- |
|
||
| 🔴 会议纪要Skill测试对比 | 闫旭隆 | 使用当前版本生成会议纪要,再用腾讯会议转写生成一版,同时测试gemini直接喂视频生成纪要的效果 | P0 | 2025-12-09 |
|
||
| 🔴 会议转写文本清洗优化 | 闫旭隆 | 把会议转写文本中脏的、重复的内容做一遍加工清洗,保证信息全面同时内容紧凑 | P0 | 2025-12-09 |
|
||
| 🔴 需求Skill专家博弈流程优化 | 闫旭隆 | 查看二阶段专家交叉回应的字段映射,整理可视化效果,梳理整体流程图 | P0 | 2025-12-09 |
|
||
| 🔴 数字人视频样本训练 | 江争达 | 使用真实人物训练数字人语音和视频,在百度曦灵和黑镜平台各生成一个样本 | P0 | 2025-12-08 |
|
||
| 🔴 数字人PPT需求文档修改 | 江争达 | 时长改为20-30分钟,添加手势动作要求,完善第一阶段和第二阶段需求 | P0 | 2025-12-09 |
|
||
| 🔴 数字人工作流研究 | 江争达 | 研究数字人生成工作流方案(API调用、剪映自动化);测试Gemini 3.0生成分镜脚本+图片后用Veo3.1生成视频 | P0 | 2025-12-09 |
|
||
| 🔴 问答系统前端重构 | 江争达 | 完成前端重构方案,考虑下一版本交互逻辑修改,使用大模型审查方案并对比优化 | P0 | 2025-12-09 |
|
||
| 🔴 招投标Skill架构设计 | 郝倩玉 | 完成招投标文件Skill的架构设计,先确认需求是否需要讨论明确 | P0 | 2025-12-09 |
|
||
| 🔴 Gartner报告转写Skill架构设计 | 郝倩玉 | 设计Gartner报告转写的Skill架构(涉及年末签合同和30万收入) | P0 | 2025-12-09 |
|
||
| 🔴 数字分身市场调研 | 郝倩玉 | 调研市面上较好的数字分身方案版本,分别出方案后与钱林对接 | P0 | 2025-12-09 |
|
||
| 协助会议纪要Skill优化 | 郝倩玉 | 协助闫旭隆优化会议纪要Skill | P1 | 2025-12-09 |
|
||
| 后端代码审查 | 江争达 | 使用Claude 4.5或GPT做后端code review,记录问题作为后续优化需求 | P1 | 2025-12-09 |
|
||
| 天眼查自动更新需求确认 | 江争达 | 与小彤确认天眼查客户数据库自动更新需求是否还需要 | P1 | 2025-12-09 |
|
||
| Cloud Skill转框架研究 | 郝倩玉 | 研究如何将Claude Skill迁移到LangGraph等低代码架构,作为技术储备 | P1 | 待定 |
|
||
| 日报驱动项目管理系统开发 | 丁康 | 负责基于会议纪要的日报驱动项目管理系统Skill开发,包括与MCP对接 | P1 | 待定 |
|
||
|
||
### 4. 组内成员工作进展
|
||
|
||
#### 闫旭隆
|
||
|
||
**上周完成:**
|
||
- ✅ 需求澄清-需求文档skill优化、测试、视频录制
|
||
- ✅ 会议纪要Skill开发(改为全量读取架构,整理流程图)
|
||
|
||
**进行中:**
|
||
- 🔄 会议纪要Skill测试对比
|
||
|
||
**收到的反馈/学习建议:**
|
||
- **表扬:** 总的来说比上一版有进步,整个逻辑可以先固化下来使用;该有的要点都有,比较接近了
|
||
- **表扬:** 能把动作识别出来不容易,就算其他人明白也挺牛的
|
||
- **建议:** 映射逻辑图很重要,AI目前最缺的是逻辑一致和前后连贯
|
||
- **建议:** 转写文本需先做清洗加工,去除重复和脏数据后再处理
|
||
- **建议:** 尝试主窗口全量处理一次性生成,减少并行Agent带来的信息丢失
|
||
- **建议:** 整个文字转写换成gemini来做,生成全量版而非逐字转写
|
||
|
||
**下周任务:**
|
||
- [ ] 🔴 P0|会议纪要Skill测试对比(腾讯会议+gemini视频两个版本)
|
||
- [ ] 🔴 P0|会议转写文本清洗优化
|
||
- [ ] 🔴 P0|需求Skill专家博弈流程优化
|
||
- [ ] P1|招投标文件Skill架构设计和调试
|
||
|
||
#### 江争达
|
||
|
||
**上周完成:**
|
||
- ✅ 数字人PPT需求文档
|
||
|
||
**进行中:**
|
||
- 🔄 问答系统v1.1前端重构方案
|
||
- 🔄 数字人视频样本训练
|
||
|
||
**收到的反馈/学习建议:**
|
||
- **批评:** 背景说明不清楚,核心诉求和问题点没有交代清楚,需求文档分析存在问题,不站在其他人角度思考
|
||
- **批评:** 只看树木不看森林,关于数字人老外说中文的问题理解不到位
|
||
- **建议:** 数字人PPT时长要求改为20-30分钟,而非3-5分钟
|
||
- **建议:** 数字人视频需要有手势动作,开场和结尾不能呆呆站着
|
||
- **建议:** 前端重构要考虑下一版本交互逻辑修改
|
||
- **建议:** 后端代码需用大模型做code review审查
|
||
- **建议:** 提供示例代码给大模型是有用的
|
||
|
||
**下周任务:**
|
||
- [ ] 🔴 P0|数字人视频样本训练(本周末完成)
|
||
- [ ] 🔴 P0|数字人PPT需求文档修改
|
||
- [ ] 🔴 P0|数字人工作流研究+Gemini分镜测试
|
||
- [ ] 🔴 P0|问答系统前端重构
|
||
- [ ] P1|后端代码审查
|
||
- [ ] P1|天眼查自动更新需求确认
|
||
|
||
#### 郝倩玉
|
||
|
||
**上周完成:**
|
||
- ✅ 会议纪要Skill架构优化协助
|
||
- ✅ Gartner报告解读转写系统需求文档(已发闫旭隆)
|
||
|
||
**进行中:**
|
||
- 🔄 数字分身需求对接
|
||
- 🔄 招投标文件Skill架构设计
|
||
|
||
**收到的反馈/学习建议:**
|
||
- **建议:** 数字分身需求由于合作方时间不确定,先自己做好准备,做几个版本备选
|
||
- **建议:** Gartner报告转写因涉及年末签合同提升到P0,先设计架构
|
||
- **建议:** 如果想学习Skill到LangGraph架构转换,需要先把skill底层知识全部学一遍
|
||
|
||
**下周任务:**
|
||
- [ ] 🔴 P0|招投标Skill架构设计
|
||
- [ ] 🔴 P0|Gartner报告转写Skill架构设计
|
||
- [ ] 🔴 P0|数字分身市场调研
|
||
- [ ] P1|协助会议纪要Skill优化
|
||
- [ ] P1|Cloud Skill转框架研究
|
||
|
||
#### 陶西平
|
||
|
||
**上周完成:**
|
||
- ✅ 数字人PPT需求文档协助(提供调研文档)
|
||
- ✅ 数字人与PPT结合视频生成测试
|
||
|
||
**进行中:**
|
||
- 🔄 前端框架调研
|
||
- 🔄 数字人调研报告
|
||
|
||
**收到的反馈/学习建议:**
|
||
- **认可:** 提供的数字人调研文档被江争达采用,作为需求文档重要参考
|
||
|
||
**下周任务:**
|
||
- [ ] 🔴 P0|配合江老师前端框架重构相关工作
|
||
- [ ] P1|完成数字人调研报告
|
||
- [ ] P1|完成PPT与数字人结合调研
|
||
|
||
---
|
||
|
||
## 三、会议总结
|
||
|
||
**核心议题:** 会议纪要Skill架构优化、数字人PPT需求完善、问答系统前端重构、Subagent调用机制研究
|
||
|
||
**关键决策:**
|
||
1. **会议纪要转写采用Gemini多模态视频处理路径**:多模态能力最强,上下文最长,视觉能力超强
|
||
2. **模型工具组合确定**:前端用Gemini,中间逻辑用Claude Code,整体项目修复/测试用GPT Codex
|
||
3. **会议纪要Skill改为全量读取方式**:放弃索引搜索,转写文本需先做清洗再处理
|
||
4. **P0优先级判断采用AI建议+人工确认模式**:不能完全依赖自动判断
|
||
5. **数字人视频时长改为20-30分钟**:技术上没有难度,只是花销问题
|
||
6. **数字分身选型聚焦百度曦灵和黑镜两个平台**:本周需用真人训练样本
|
||
7. **前端重构只改展示和代码结构**:保留现有功能流程不动,但要考虑下一版本交互逻辑
|
||
8. **SubAgent调用必须使用绝对路径**:测试表现稳定,推荐Agent调Agent方式
|
||
9. **Gartner报告转写提升为P0**:涉及年末签合同和30万收入
|
||
10. **日报驱动项目管理系统由丁康负责**:包括基于会议纪要生成日报、与MCP对接
|
||
|
||
**下周工作重点:**
|
||
1. 🔴 会议纪要Skill测试对比(腾讯会议转写 vs gemini视频直接生成)
|
||
2. 🔴 数字人视频样本训练(百度曦灵+黑镜,本周末完成)
|
||
3. 🔴 数字人工作流研究(Gemini分镜脚本+图片→Veo3.1视频)
|
||
4. 🔴 问答系统前端重构方案完善
|
||
5. 🔴 招投标Skill和Gartner报告转写Skill架构设计
|
||
|
||
---
|
||
|
||
**纪要整理人:** Claude
|
||
**纪要时间:** 2025-12-08
|
||
**下次会议:** 2025-12-09
|