# 工程类会议纪要 (2025-12-02) ## 一、会议信息 - **会议时间:** 2025-12-02 - **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平 --- ## 二、工作内容 ### 1. 重点项目进展情况汇总 | 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 | | --- | --- | --- | --- | | 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成索引搜索改为全量读取的架构优化,完成字段映射逻辑图设计(负责人改为原负责人、截止时间改为原截止时间),已进行新旧版本对比测试。存在问题:文字转写准确性问题仍是最大挑战,P0/P1/P2优先级判断难以精准。**解决方案:** 1)先对转写文本做清洗处理;2)尝试主窗口全量处理替代分块并行;3)优先级判断让AI先给建议后人工确认 | | 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成专家博弈流程基本测试,实现独立评审→交叉评价→交叉回应→决策整合的完整流程。存在问题:专家博弈prompt可能没写好,评估水平需验证。**解决方案:** 把评估意见和响应打成问答文档判断质量,每个领域专家prompt需专门调优 | | 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成第一阶段需求文档整理(五个核心需求),完成数字人生成平台调研和费用对比。存在问题:视频时长需求不准确(原3-5分钟应为20-30分钟),手势动作第一阶段也需考虑。**解决方案:** 1)时长改为20-30分钟;2)加入手势动作要求;3)本周用真人训练数字人样本(百度曦灵+黑镜);4)测试gemini分镜脚本+图片生成视频的工作流 | | 数字分身需求文档 | 郝倩玉 | 2025-12-02 | Gartner报告解读转写系统需求文档已完成,已发闫旭隆。合作方(富友)需求有变化,时间点不确定。**解决方案:** 先做好准备,多做几个版本让合作方选择,自己找市面上好的案例做参考 | | 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 已完成前端重构方案设计,明确保留现有基础功能只重构展示部分和代码结构,已确认API接口规范文档。存在问题:功能清单对比尚未完成,需考虑下一版本交互逻辑修改。**解决方案:** 1)用大模型做后端代码审查;2)用research生成前端重构方案与当前方案对比;3)提前考虑下一版本功能需求 | | 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 需求文档已完成确认,本周需设计架构 | ### 2. 重点项目问题及解决方案 #### 问题1: 会议纪要相关问题 **问题描述:** 1. 会议转写文本中存在大量语音识别错误,说话者标记不准确,上下文约束能力不足 2. AI难以准确判断任务的P0/P1/P2优先级,缺少成员年龄、级别、工作时间等隐性上下文 3. 并行Agent处理会造成信息丢失和逻辑割裂 **解决方案:** 1. 使用Gemini多模态能力进行视频转写,直接上传视频并根据会议模板生成纪要 2. 对转写文本进行清洗加工,去除脏数据和重复内容,保证信息全面同时内容紧凑 3. 在会议上直接确认P0/P1/P2优先级,让AI先给建议后人再确认 4. 尝试主窗口全量处理一次性生成,把skill写到主窗口里 5. 保留确认过程材料作为后续微调素材 **责任人:** 闫旭隆、郝倩玉 **截止时间:** 2025-12-09 #### 问题2: 数字人PPT需求相关问题 **问题描述:** 1. 需求文档中时长要求定义不准确(3-5分钟 vs 20-30分钟) 2. 数字人生成存在真实性问题(老外说流利中文让人质疑真假) 3. 使用界面/工作流方案尚未明确 **解决方案:** 1. 将视频时长需求改为20-30分钟作为主要需求 2. 使用真人录制训练数字人,用自己真实人物的语音和形象 3. 测试百度曦灵和黑镜平台的定制数字人效果 4. 研究端到端工作流(API调用或网站操作或剪映自动化) 5. 测试Gemini 3.0生成分镜脚本+图片再用Veo3.1生成视频的路径 **责任人:** 江争达 **截止时间:** 2025-12-09 #### 问题3: 需求方需求不明确问题 **问题描述:** 关于合作方(富友)数字分身需求一直不能明确,杜主任最新信息显示合作方时间点是否使用不确定。 **解决方案:** 1. 先自己做好数字分身方案,不以合作方需求为核心 2. 多做几个版本让合作方选择 3. 自己调研市面上比较好的方案,分别出方案后与相关人员对接 **责任人:** 郝倩玉、江争达 **截止时间:** 2025-12-09 #### 问题4: Subagent调用机制不稳定问题 **问题描述:** 在项目目录下调用全局agent时,不指定绝对路径的情况下调用不稳定,有时会读取sub的提示词但不执行,表现不一致。 **解决方案:** 1. 使用绝对路径调用subagent,测试表现稳定 2. 改用agent调agent的方式,而不是skill调用subagent 3. 在子项目下定义一个主agent,通过主agent调用其他agent 4. 调试阶段用skill主窗口加载方式,调通后再移植到agent **责任人:** 江争达、闫旭隆 **截止时间:** 2025-12-09 ### 3. 下周工作安排 | 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 | | --- | --- | --- | --- | --- | | 🔴 会议纪要Skill测试对比 | 闫旭隆 | 使用当前版本生成会议纪要,再用腾讯会议转写生成一版,同时测试gemini直接喂视频生成纪要的效果 | P0 | 2025-12-09 | | 🔴 会议转写文本清洗优化 | 闫旭隆 | 把会议转写文本中脏的、重复的内容做一遍加工清洗,保证信息全面同时内容紧凑 | P0 | 2025-12-09 | | 🔴 需求Skill专家博弈流程优化 | 闫旭隆 | 查看二阶段专家交叉回应的字段映射,整理可视化效果,梳理整体流程图 | P0 | 2025-12-09 | | 🔴 数字人视频样本训练 | 江争达 | 使用真实人物训练数字人语音和视频,在百度曦灵和黑镜平台各生成一个样本 | P0 | 2025-12-08 | | 🔴 数字人PPT需求文档修改 | 江争达 | 时长改为20-30分钟,添加手势动作要求,完善第一阶段和第二阶段需求 | P0 | 2025-12-09 | | 🔴 数字人工作流研究 | 江争达 | 研究数字人生成工作流方案(API调用、剪映自动化);测试Gemini 3.0生成分镜脚本+图片后用Veo3.1生成视频 | P0 | 2025-12-09 | | 🔴 问答系统前端重构 | 江争达 | 完成前端重构方案,考虑下一版本交互逻辑修改,使用大模型审查方案并对比优化 | P0 | 2025-12-09 | | 🔴 招投标Skill架构设计 | 郝倩玉 | 完成招投标文件Skill的架构设计,先确认需求是否需要讨论明确 | P0 | 2025-12-09 | | 🔴 Gartner报告转写Skill架构设计 | 郝倩玉 | 设计Gartner报告转写的Skill架构(涉及年末签合同和30万收入) | P0 | 2025-12-09 | | 🔴 数字分身市场调研 | 郝倩玉 | 调研市面上较好的数字分身方案版本,分别出方案后与钱林对接 | P0 | 2025-12-09 | | 协助会议纪要Skill优化 | 郝倩玉 | 协助闫旭隆优化会议纪要Skill | P1 | 2025-12-09 | | 后端代码审查 | 江争达 | 使用Claude 4.5或GPT做后端code review,记录问题作为后续优化需求 | P1 | 2025-12-09 | | 天眼查自动更新需求确认 | 江争达 | 与小彤确认天眼查客户数据库自动更新需求是否还需要 | P1 | 2025-12-09 | | Cloud Skill转框架研究 | 郝倩玉 | 研究如何将Claude Skill迁移到LangGraph等低代码架构,作为技术储备 | P1 | 待定 | | 日报驱动项目管理系统开发 | 丁康 | 负责基于会议纪要的日报驱动项目管理系统Skill开发,包括与MCP对接 | P1 | 待定 | ### 4. 组内成员工作进展 #### 闫旭隆 **上周完成:** - ✅ 需求澄清-需求文档skill优化、测试、视频录制 - ✅ 会议纪要Skill开发(改为全量读取架构,整理流程图) **进行中:** - 🔄 会议纪要Skill测试对比 **收到的反馈/学习建议:** - **表扬:** 总的来说比上一版有进步,整个逻辑可以先固化下来使用;该有的要点都有,比较接近了 - **表扬:** 能把动作识别出来不容易,就算其他人明白也挺牛的 - **建议:** 映射逻辑图很重要,AI目前最缺的是逻辑一致和前后连贯 - **建议:** 转写文本需先做清洗加工,去除重复和脏数据后再处理 - **建议:** 尝试主窗口全量处理一次性生成,减少并行Agent带来的信息丢失 - **建议:** 整个文字转写换成gemini来做,生成全量版而非逐字转写 **下周任务:** - [ ] 🔴 P0|会议纪要Skill测试对比(腾讯会议+gemini视频两个版本) - [ ] 🔴 P0|会议转写文本清洗优化 - [ ] 🔴 P0|需求Skill专家博弈流程优化 - [ ] P1|招投标文件Skill架构设计和调试 #### 江争达 **上周完成:** - ✅ 数字人PPT需求文档 **进行中:** - 🔄 问答系统v1.1前端重构方案 - 🔄 数字人视频样本训练 **收到的反馈/学习建议:** - **批评:** 背景说明不清楚,核心诉求和问题点没有交代清楚,需求文档分析存在问题,不站在其他人角度思考 - **批评:** 只看树木不看森林,关于数字人老外说中文的问题理解不到位 - **建议:** 数字人PPT时长要求改为20-30分钟,而非3-5分钟 - **建议:** 数字人视频需要有手势动作,开场和结尾不能呆呆站着 - **建议:** 前端重构要考虑下一版本交互逻辑修改 - **建议:** 后端代码需用大模型做code review审查 - **建议:** 提供示例代码给大模型是有用的 **下周任务:** - [ ] 🔴 P0|数字人视频样本训练(本周末完成) - [ ] 🔴 P0|数字人PPT需求文档修改 - [ ] 🔴 P0|数字人工作流研究+Gemini分镜测试 - [ ] 🔴 P0|问答系统前端重构 - [ ] P1|后端代码审查 - [ ] P1|天眼查自动更新需求确认 #### 郝倩玉 **上周完成:** - ✅ 会议纪要Skill架构优化协助 - ✅ Gartner报告解读转写系统需求文档(已发闫旭隆) **进行中:** - 🔄 数字分身需求对接 - 🔄 招投标文件Skill架构设计 **收到的反馈/学习建议:** - **建议:** 数字分身需求由于合作方时间不确定,先自己做好准备,做几个版本备选 - **建议:** Gartner报告转写因涉及年末签合同提升到P0,先设计架构 - **建议:** 如果想学习Skill到LangGraph架构转换,需要先把skill底层知识全部学一遍 **下周任务:** - [ ] 🔴 P0|招投标Skill架构设计 - [ ] 🔴 P0|Gartner报告转写Skill架构设计 - [ ] 🔴 P0|数字分身市场调研 - [ ] P1|协助会议纪要Skill优化 - [ ] P1|Cloud Skill转框架研究 #### 陶西平 **上周完成:** - ✅ 数字人PPT需求文档协助(提供调研文档) - ✅ 数字人与PPT结合视频生成测试 **进行中:** - 🔄 前端框架调研 - 🔄 数字人调研报告 **收到的反馈/学习建议:** - **认可:** 提供的数字人调研文档被江争达采用,作为需求文档重要参考 **下周任务:** - [ ] 🔴 P0|配合江老师前端框架重构相关工作 - [ ] P1|完成数字人调研报告 - [ ] P1|完成PPT与数字人结合调研 --- ## 三、会议总结 **核心议题:** 会议纪要Skill架构优化、数字人PPT需求完善、问答系统前端重构、Subagent调用机制研究 **关键决策:** 1. **会议纪要转写采用Gemini多模态视频处理路径**:多模态能力最强,上下文最长,视觉能力超强 2. **模型工具组合确定**:前端用Gemini,中间逻辑用Claude Code,整体项目修复/测试用GPT Codex 3. **会议纪要Skill改为全量读取方式**:放弃索引搜索,转写文本需先做清洗再处理 4. **P0优先级判断采用AI建议+人工确认模式**:不能完全依赖自动判断 5. **数字人视频时长改为20-30分钟**:技术上没有难度,只是花销问题 6. **数字分身选型聚焦百度曦灵和黑镜两个平台**:本周需用真人训练样本 7. **前端重构只改展示和代码结构**:保留现有功能流程不动,但要考虑下一版本交互逻辑 8. **SubAgent调用必须使用绝对路径**:测试表现稳定,推荐Agent调Agent方式 9. **Gartner报告转写提升为P0**:涉及年末签合同和30万收入 10. **日报驱动项目管理系统由丁康负责**:包括基于会议纪要生成日报、与MCP对接 **下周工作重点:** 1. 🔴 会议纪要Skill测试对比(腾讯会议转写 vs gemini视频直接生成) 2. 🔴 数字人视频样本训练(百度曦灵+黑镜,本周末完成) 3. 🔴 数字人工作流研究(Gemini分镜脚本+图片→Veo3.1视频) 4. 🔴 问答系统前端重构方案完善 5. 🔴 招投标Skill和Gartner报告转写Skill架构设计 --- **纪要整理人:** Claude **纪要时间:** 2025-12-08 **下次会议:** 2025-12-09