# 工程类会议纪要 (2025-12-02) ## 一、会议信息 - **会议时间:** 2025-12-02 - **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉、丁康 - **记录整理:** Claude --- ## 二、工作内容 ### 1. 重点项目进展情况汇总 | 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 | | ------------------------ | -------------- | ---------- | ------------------------------------------------------------ | | 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成架构优化,改为全量读取会议转写文本(不采用索引搜索),整理了字段映射逻辑图,整个流程已固化。领导评价:比上一版有进步,整体逻辑可以先固化使用。存在问题:文字转写准确性和上下文约束能力是核心瓶颈;P0/P1/P2优先级判断难以自动化 | | 需求澄清Skill测试与推广 | 闫旭隆 | 2025-12-02 | 已完成优化,加入多轮专家博弈机制(独立评审→交叉评价→交叉回应→最终整合),并录制了演示视频。领导建议:验证专家博弈环节的实际效果,将评估意见和响应打成一篇文档进行对照分析 | | 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成需求文档整理,包含五个第一阶段核心需求。下周行动计划:1)时长从3-5分钟改为20-30分钟;2)必须加入手势动作要求;3)不能使用老外形象说流利中文;4)本周尽快用真人训练数字人样本 | | 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 相关领导处的需求尚未明确。下一步建议:自己调研市面上做得好的几个版本,分别出方案让需求方选择 | | 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 进行中,已完成接口规范文档确认,功能模块清单正在对照核实中。领导建议:后端代码不要动,先用Claude 4.5或Codex做代码审查;重构时必须考虑下一版本功能需求 | ### 2. 重点项目问题及解决方案 #### 问题1: 会议纪要文字转写准确性问题 **问题描述:** 会议纪要Skill的最大问题是文字转写的准确性和上下文约束能力不足。语音识别不清晰,加上没有很好的上下文约束,导致在已经非常清晰的上下文背景下开会时,AI无法准确理解和提取信息。 **解决方案:** 1. 考虑使用Gemini进行多模态转写(视频+音频+文字),利用其100万token的超长上下文能力 2. 将转写文本先进行清洗加工,保证信息全面的同时内容紧凑,去除重复内容,在主窗口+子Agent中加载清洗后的会议转写文本 3. 调用Gemini API在Claude中处理转写后的文本 4. 尝试使用Gemini进行一次性生成会议纪要 **责任人:** 闫旭隆 **截止时间:** 2025-12-09 #### 问题2: 会议纪要P0/P1/P2优先级判断困难 **问题描述:** AI难以准确判断任务的优先级(P0/P1/P2),因为缺少关键的潜在上下文信息,如成员的年龄、级别、工作时间长短等,这些都是分配工作时的潜意识上下文。 **解决方案:** 1. 在会议上直接确认P0/P1/P2优先级,给AI一个明确的信号 2. 让AI先给出优先级建议,人再给反馈确认 3. 每个人生成一份个人相关的优先级列表后确认 4. 保留确认过程的所有材料作为后续调优或微调的素材 5. 将潜在上下文(成员背景信息)显性化后提供给AI **责任人:** 闫旭隆 **截止时间:** 2025-12-09 #### 问题3: Sub Agent在项目目录下调用的路径问题 **问题描述:** 测试发现Sub Agent在项目子目录下调用时存在问题:不使用绝对路径时,Agent会读取prompt但不执行;使用绝对路径指定时才能正常调用。系统似乎默认优先查找全局Agent目录,找不到就忽略。 **解决方案:** 1. 在Skill中调用Sub Agent时使用绝对路径指定Agent位置 2. 改用Agent调Agent的方式,而非Skill调Agent 3. 定义一个主Agent来调用其他Agent,保持逻辑清晰 4. 调试时使用Skill方式(便于观察上下文),调通后再迁移到Agent调Agent的架构 **责任人:** 江争达 **截止时间:** 2025-12-09 #### 问题4: 问答系统前端重构方案需完善 **问题描述:** 前端重构工作尚未完成,只做了一半。需要确保重构时考虑下一个版本的交互逻辑更改,避免架构调整后又需要重新修改或增加组件。 **解决方案:** 1. 用Opus 4.5或Codex对后端代码进行审查,找出问题后记录下来 2. 找一个Code Review的Agent或Skill对代码进行审查 3. 让大模型生成一版前端重构方案,与现有方案对比差异 4. 把下一个版本的功能需求结合这次重构一起考虑 5. 提供示例代码(特别是与后端交互的逻辑代码)给大模型参考 **责任人:** 江争达 **截止时间:** 2025-12-09 #### 问题5: 数字人PPT讲解视频手势动作缺失 **问题描述:** 数字人PPT讲解视频中,开场和结尾没有手势动作,人物呆呆站着讲解,效果不真实。 **解决方案:** 1. 在验收标准中加入手势动作要求 2. 修改数字人在PPT讲解视频中展现形式 3. 测试Veo 3.1的动作生成能力 **责任人:** 陶西平 **截止时间:** 2025-12-09 #### 问题6: 需求表达和背景说明不清晰 **问题描述:** 团队成员在汇报和文档中,需求表达和背景说明不够清晰,不交代核心诉求和问题点,导致其他人或大模型无法理解要解决什么问题。 **解决方案:** 1. 汇报时必须交代核心诉求和问题点 2. 给人可以口头补充,给大模型必须写下来 3. 站在其他人的角度思考,确保表达能被理解 4. 背景说明要特别详细 **责任人:** 全体成员 **截止时间:** 2025-12-09 ### 3. 下周工作安排 | 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 | | ----------------------------------------- | -------------- | ------------------------------------------------------------ | ------ | ---------- | | 🔴 会议纪要Skill全量处理优化 | 闫旭隆、郝倩玉 | 用现版本、Gemini视频生成转写文本+主窗口清洗后加载、Gemini视频直接生成三种方式各生成一版会议纪要进行对比测试 | P0 | 2025-12-09 | | 🔴 数字人PPT视频样本生成 | 江争达、陶西平 | 用百度曦灵和heygen平台训练自己真人的语音和视频,生成数字人PPT讲解视频样本,需包含手势动作,视频时长支持20-30分钟 | P0 | 2025-12-08 | | 🔴 Gemini分镜脚本生成测试 | 江争达、陶西平 | 使用Gemini 3.0 Pro生成视频分镜脚本和分镜图片,再用VEO 3.1或其他模型生成视频,测试端到端数字人视频生成工作流 | P0 | 2025-12-09 | | 🔴 问答系统V1.1前端重构 | 江争达、陶西平 | 重构前端展示和代码结构,保留基础功能和后端不变,需结合下一版本交互逻辑变更一起考虑,先用大模型对后端代码进行code review | P0 | 2025-12-09 | | 🔴 需求澄清Skill专家博弈优化 | 闫旭隆 | 查看专家交叉回应的字段映射,整理可视化效果,评估专家博弈环节对需求文档质量的提升效果 | P0 | 2025-12-09 | | 🔴 投标商务应答自动生成系统Skill架构设计 | 郝倩玉、闫旭隆 | 设计投标商务应答自动生成系统Skill的架构方案 | P0 | 2025-12-09 | | 🔴 Gartner报告解读转写Skill架构设计 | 郝倩玉、闫旭隆 | 设计Gartner报告转写Skill的架构,涉及后续合同签约需求(要求最晚12月中旬必须交付) | P0 | 2025-12-09 | | 🔴 数字分身方案调研及方案撰写 | 郝倩玉 | 先调研市面上做得好的版本,分别出几个方案让需求方选择 | P0 | 2025-12-09 | | 日报驱动项目管理系统Skill开发 | 丁康 | 开发基于会议纪要的日报生成系统Skill | P1 | 待定 | | 完成问答系统前端重构需求文档 | 陶西平 | 完成问答系统前端重构需求文档 | P1 | 2025-12-09 | | 服务器采购 | 江争达 | 尽快采购,先确认好需要部署哪些软件 | P1 | 2025-12-09 | | Skill Plugin管理系统搭建 | 江争达 | 学习并搭建内部Skill Marketplace,管理团队开发的所有Skill | P2 | 待定 | | Claude Skill转Langchain/Langgraph架构研究 | 闫旭隆 | 研究如何将Claude Code Skill转移到Langchain/Langgraph的低代码架构,做一个小功能进行学习验证 | P2 | 待定 | ### 4. 组内成员工作进展 #### 江争达 **上周完成:** - ✅ 数字人PPT需求文档 **进行中:** - 🔄 完成问答系统v1.1前端重构方案 - 🔄 PDF Skill技术调研(待开始) - 🔄 Skill Plugin管理系统搭建(待开始) - 🔄 服务器采购(待开始) - 🔄 招投标文件Skill架构调试(待开始) - 🔄 日报驱动系统需求研究(待开始) **收到的反馈/学习建议:** - **批评:** 需求文档分析存在很大问题,不站在其他人的角度去思考,其他人听不懂你讲什么。核心诉求点没有说清楚,背景不交代清楚导致没人看得懂文档 - **批评:** 表达能力需要提升,没有表达能力就没法跟大模型打交道 - **建议:** 问答系统前端重构方案需要把下个版本可能修改的逻辑先考虑进去 - **建议:** 后端代码先不要动,先用Opus 4.5或Codex做一遍代码审查 - **建议:** 前端重构方案需要用大模型重新生成一版,与现有方案对比差异 - **建议:** 提供示例代码,特别是与后端交互的逻辑代码应该提供给大模型参考 - **建议:** Claude 4.5幻觉还是很高的,日常问答以GPT o1为主可能会比较好 **下周任务:** - [ ] 🔴 P0|问答系统V1.1前端重构 - [ ] 🔴 P0|数字人PPT视频样本生成 - [ ] 🔴 P0|Gemini分镜脚本生成测试 - [ ] P1|PDF Skill技术调研 - [ ] P1|服务器采购 - [ ] P2|Skill Plugin管理系统搭建 #### 闫旭隆 **上周完成:** - ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制,录制视频 - ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文,录制视频 **进行中:** - 🔄 招投标文件Skill架构设计 **收到的反馈/学习建议:** - **表扬:** 会议纪要Skill架构改进获得认可,改用全量读取替代索引搜索的方案是正确的,字段映射逻辑图也得到肯定 - **表扬:** 会议纪要Skill的测试结果与人工订正版本相比"比上面是有进步了","该有的要点是有" - **建议:** 尝试使用主窗口全量处理替代分块agent搜索,可能效果更好;同时建议用Gemini做会议转写测试 - **建议:** 招投标Skill架构设计作为P0任务需要本周完成,同时Gartner报告转写也需要先设计架构 - **建议:** 会议纪要的下周工作安排提取是最核心的功能,需要重点优化P0/P1优先级判断的准确性 **下周任务:** - [ ] 🔴 P0|会议纪要Skill全量处理优化及gemini方案对比测试 - [ ] 🔴 P0|需求澄清多专家博弈阶段效果可视化展示 - [ ] 🔴 P0|招投标Skill架构设计 - [ ] 🔴 P0|Gartner报告转写Skill架构设计 #### 郝倩玉 **上周完成:** - ✅ 会议纪要Skill架构优化(协助旭隆优化学习类+Q&A类会议纪要Skill逻辑) - ✅ Gartner 报告解读转写系统需求对接及文档撰写,确定版需求文档已发旭隆。 - ✅ 问答系统V1.0测试推动(多次与媛媛沟通) - ✅数字分身需求对接 **进行中:** - 🔄 招投标文件Skill架构设计(投标商务响应文件自动生成系统需求文档已完成) **收到的反馈/学习建议:** - **建议:** 招投标Skill架构设计后续需要针对需求部分再次讨论确认,因为有些需求不一定合理 - **建议:** Gartner报告转写系统架构设计需要尽快完成,因为涉及年末签合同,可能有30万的业务机会,优先级提升为P0 - **建议:** 数字分身需求方面,由于合作方需求不明确,需要自己先调研市面上比较好的版本,做出多个方案供选择 **下周任务:** - [ ] 🔴 P0|参与优化会议纪要Skill - [ ] 🔴 P0|参与设计招投标Skill架构 - [ ] 🔴 P0|参与设计Gartner报告转写Skill架构 - [ ] 🔴 P0|数字分身方案调研 #### 陶西平 **上周完成:** - ✅ 数字人PPT需求文档(协助江老师修改需求文档) - ✅ 学习使用Claude Code的document skill,使用pdf skill的表单填写功能 - ✅ 调研数字人平台的公共数字人能力,收集总结相关目标数字人平台价格信息 **进行中:** - 🔄 数字人与ppt结合(生成一个基于指定PPT的数字人视频) - 🔄 前端框架重构(对问答系统前端功能进行分析) **收到的反馈/学习建议:** - **肯定:** 陶西平提供的数字人调研文档被团队成员引用,作为数字人平台费用对比的基础参考资料 **下周任务:** - [ ] 🔴 P0|数字人PPT视频样本生成 - [ ] 🔴 P0|Gemini分镜脚本生成测试 - [ ] P1|完成问答系统前端重构需求文档 --- ## 三、会议总结 **核心议题:** 会议纪要Skill优化、数字人PPT视频生成、问答系统前端重构、招投标/Gartner报告Skill架构设计 **关键决策:** 1. **会议纪要转写采用Gemini多模态视频处理方案:** 领导测试发现Gemini 3.0 Pro可以直接上传会议视频生成转写文本,多模态能力最强,上下文最长,效果优于纯语音转写 2. . **进展情况以会议转写为优先,周报作为补充:** 会议中发现转写文本更能反映实际进展情况 3. **P0/P1/P2优先级判断需要人工确认:** AI缺乏隐性上下文(如成员资历、工作时长等),建议先让AI给出优先级建议,然后由人工确认 4. **数字人PPT视频主需求调整为支持20-30分钟时长:** 实际使用场景(如PPT宣讲、会议发言)需要20-30分钟 5. **数字人形象必须使用中国人,不能用老外说流利中文:** 确保形象和语言匹配,追求真实性 6. **数字人视频第一阶段必须包含手势动作:** 开场和结尾的手势动作是必须的,不能呆板站立讲解 7. **本周完成数字人真人训练视频样本:** 要求本周末前用自己真人训练出语音和视频样本 8. **使用Gemini 3.0生成分镜头脚本和图片,再用其他平台生成视频:** 这是目前最有效的动画视频制作路径 9. **前端重构只改展示部分,后端不动但需做代码审查:** 用Codex或大模型做一遍代码审查,找出问题记录下来 10. **Sub Agent调用必须使用绝对路径指定:** 项目下的sub agent不指定绝对路径时调用不稳定 11. **推荐使用Agent调用Agent的方式,而非Skill调用Sub Agent:** 这样调用更清晰,上下文共享更好 12. **招投标Skill架构设计提升为P0任务:** 因为涉及年末演示和签合同,可能有30万收入 13. **Gartner报告转写Skill提升为P0任务:** 同样因为紧急需求 **下周工作重点:** 1. 🔴 会议纪要Skill全量处理优化,对比Gemini转写与腾讯会议转写效果 2. 🔴 数字人PPT视频样本生成,本周末前完成真人训练 3. 🔴 招投标Skill和Gartner报告转写Skill架构设计 4. 🔴 问答系统V1.1前端重构,需先做代码审查 5. 🔴 需求澄清Skill专家博弈效果验证和流程图梳理 6. 🔴 数字分身方案调研,主动出多个版本供选择 --- **纪要整理人:** Claude **纪要时间:** 2025-12-02 **下次会议:** 2025-12-09