16 KiB
工程类会议纪要 (2025-12-02)
一、会议信息
- 会议时间: 2025-12-02
- 参会人员: 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉、丁康
- 记录整理: Claude
二、工作内容
1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|---|---|---|---|
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成架构优化,改为全量读取会议转写文本(不采用索引搜索),整理了字段映射逻辑图,整个流程已固化。领导评价:比上一版有进步,整体逻辑可以先固化使用。存在问题:文字转写准确性和上下文约束能力是核心瓶颈;P0/P1/P2优先级判断难以自动化 |
| 需求澄清Skill测试与推广 | 闫旭隆 | 2025-12-02 | 已完成优化,加入多轮专家博弈机制(独立评审→交叉评价→交叉回应→最终整合),并录制了演示视频。领导建议:验证专家博弈环节的实际效果,将评估意见和响应打成一篇文档进行对照分析 |
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成需求文档整理,包含五个第一阶段核心需求。下周行动计划:1)时长从3-5分钟改为20-30分钟;2)必须加入手势动作要求;3)不能使用老外形象说流利中文;4)本周尽快用真人训练数字人样本 |
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 相关领导处的需求尚未明确。下一步建议:自己调研市面上做得好的几个版本,分别出方案让需求方选择 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 进行中,已完成接口规范文档确认,功能模块清单正在对照核实中。领导建议:后端代码不要动,先用Claude 4.5或Codex做代码审查;重构时必须考虑下一版本功能需求 |
2. 重点项目问题及解决方案
问题1: 会议纪要文字转写准确性问题
问题描述: 会议纪要Skill的最大问题是文字转写的准确性和上下文约束能力不足。语音识别不清晰,加上没有很好的上下文约束,导致在已经非常清晰的上下文背景下开会时,AI无法准确理解和提取信息。
解决方案:
- 考虑使用Gemini进行多模态转写(视频+音频+文字),利用其100万token的超长上下文能力
- 将转写文本先进行清洗加工,保证信息全面的同时内容紧凑,去除重复内容,在主窗口+子Agent中加载清洗后的会议转写文本
- 调用Gemini API在Claude中处理转写后的文本
- 尝试使用Gemini进行一次性生成会议纪要
责任人: 闫旭隆 截止时间: 2025-12-09
问题2: 会议纪要P0/P1/P2优先级判断困难
问题描述: AI难以准确判断任务的优先级(P0/P1/P2),因为缺少关键的潜在上下文信息,如成员的年龄、级别、工作时间长短等,这些都是分配工作时的潜意识上下文。
解决方案:
- 在会议上直接确认P0/P1/P2优先级,给AI一个明确的信号
- 让AI先给出优先级建议,人再给反馈确认
- 每个人生成一份个人相关的优先级列表后确认
- 保留确认过程的所有材料作为后续调优或微调的素材
- 将潜在上下文(成员背景信息)显性化后提供给AI
责任人: 闫旭隆 截止时间: 2025-12-09
问题3: Sub Agent在项目目录下调用的路径问题
问题描述: 测试发现Sub Agent在项目子目录下调用时存在问题:不使用绝对路径时,Agent会读取prompt但不执行;使用绝对路径指定时才能正常调用。系统似乎默认优先查找全局Agent目录,找不到就忽略。
解决方案:
- 在Skill中调用Sub Agent时使用绝对路径指定Agent位置
- 改用Agent调Agent的方式,而非Skill调Agent
- 定义一个主Agent来调用其他Agent,保持逻辑清晰
- 调试时使用Skill方式(便于观察上下文),调通后再迁移到Agent调Agent的架构
责任人: 江争达 截止时间: 2025-12-09
问题4: 问答系统前端重构方案需完善
问题描述: 前端重构工作尚未完成,只做了一半。需要确保重构时考虑下一个版本的交互逻辑更改,避免架构调整后又需要重新修改或增加组件。
解决方案:
- 用Opus 4.5或Codex对后端代码进行审查,找出问题后记录下来
- 找一个Code Review的Agent或Skill对代码进行审查
- 让大模型生成一版前端重构方案,与现有方案对比差异
- 把下一个版本的功能需求结合这次重构一起考虑
- 提供示例代码(特别是与后端交互的逻辑代码)给大模型参考
责任人: 江争达 截止时间: 2025-12-09
问题5: 数字人PPT讲解视频手势动作缺失
问题描述: 数字人PPT讲解视频中,开场和结尾没有手势动作,人物呆呆站着讲解,效果不真实。
解决方案:
- 在验收标准中加入手势动作要求
- 修改数字人在PPT讲解视频中展现形式
- 测试Veo 3.1的动作生成能力
责任人: 陶西平 截止时间: 2025-12-09
问题6: 需求表达和背景说明不清晰
问题描述: 团队成员在汇报和文档中,需求表达和背景说明不够清晰,不交代核心诉求和问题点,导致其他人或大模型无法理解要解决什么问题。
解决方案:
- 汇报时必须交代核心诉求和问题点
- 给人可以口头补充,给大模型必须写下来
- 站在其他人的角度思考,确保表达能被理解
- 背景说明要特别详细
责任人: 全体成员 截止时间: 2025-12-09
3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|---|---|---|---|---|
| 🔴 会议纪要Skill全量处理优化 | 闫旭隆、郝倩玉 | 用现版本、Gemini视频生成转写文本+主窗口清洗后加载、Gemini视频直接生成三种方式各生成一版会议纪要进行对比测试 | P0 | 2025-12-09 |
| 🔴 数字人PPT视频样本生成 | 江争达、陶西平 | 用百度曦灵和heygen平台训练自己真人的语音和视频,生成数字人PPT讲解视频样本,需包含手势动作,视频时长支持20-30分钟 | P0 | 2025-12-08 |
| 🔴 Gemini分镜脚本生成测试 | 江争达、陶西平 | 使用Gemini 3.0 Pro生成视频分镜脚本和分镜图片,再用VEO 3.1或其他模型生成视频,测试端到端数字人视频生成工作流 | P0 | 2025-12-09 |
| 🔴 问答系统V1.1前端重构 | 江争达、陶西平 | 重构前端展示和代码结构,保留基础功能和后端不变,需结合下一版本交互逻辑变更一起考虑,先用大模型对后端代码进行code review | P0 | 2025-12-09 |
| 🔴 需求澄清Skill专家博弈优化 | 闫旭隆 | 查看专家交叉回应的字段映射,整理可视化效果,评估专家博弈环节对需求文档质量的提升效果 | P0 | 2025-12-09 |
| 🔴 投标商务应答自动生成系统Skill架构设计 | 郝倩玉、闫旭隆 | 设计投标商务应答自动生成系统Skill的架构方案 | P0 | 2025-12-09 |
| 🔴 Gartner报告解读转写Skill架构设计 | 郝倩玉、闫旭隆 | 设计Gartner报告转写Skill的架构,涉及后续合同签约需求(要求最晚12月中旬必须交付) | P0 | 2025-12-09 |
| 🔴 数字分身方案调研及方案撰写 | 郝倩玉 | 先调研市面上做得好的版本,分别出几个方案让需求方选择 | P0 | 2025-12-09 |
| 日报驱动项目管理系统Skill开发 | 丁康 | 开发基于会议纪要的日报生成系统Skill | P1 | 待定 |
| 完成问答系统前端重构需求文档 | 陶西平 | 完成问答系统前端重构需求文档 | P1 | 2025-12-09 |
| 服务器采购 | 江争达 | 尽快采购,先确认好需要部署哪些软件 | P1 | 2025-12-09 |
| Skill Plugin管理系统搭建 | 江争达 | 学习并搭建内部Skill Marketplace,管理团队开发的所有Skill | P2 | 待定 |
| Claude Skill转Langchain/Langgraph架构研究 | 闫旭隆 | 研究如何将Claude Code Skill转移到Langchain/Langgraph的低代码架构,做一个小功能进行学习验证 | P2 | 待定 |
4. 组内成员工作进展
江争达
上周完成:
- ✅ 数字人PPT需求文档
进行中:
- 🔄 完成问答系统v1.1前端重构方案
- 🔄 PDF Skill技术调研(待开始)
- 🔄 Skill Plugin管理系统搭建(待开始)
- 🔄 服务器采购(待开始)
- 🔄 招投标文件Skill架构调试(待开始)
- 🔄 日报驱动系统需求研究(待开始)
收到的反馈/学习建议:
- 批评: 需求文档分析存在很大问题,不站在其他人的角度去思考,其他人听不懂你讲什么。核心诉求点没有说清楚,背景不交代清楚导致没人看得懂文档
- 批评: 表达能力需要提升,没有表达能力就没法跟大模型打交道
- 建议: 问答系统前端重构方案需要把下个版本可能修改的逻辑先考虑进去
- 建议: 后端代码先不要动,先用Opus 4.5或Codex做一遍代码审查
- 建议: 前端重构方案需要用大模型重新生成一版,与现有方案对比差异
- 建议: 提供示例代码,特别是与后端交互的逻辑代码应该提供给大模型参考
- 建议: Claude 4.5幻觉还是很高的,日常问答以GPT o1为主可能会比较好
下周任务:
- 🔴 P0|问答系统V1.1前端重构
- 🔴 P0|数字人PPT视频样本生成
- 🔴 P0|Gemini分镜脚本生成测试
- P1|PDF Skill技术调研
- P1|服务器采购
- P2|Skill Plugin管理系统搭建
闫旭隆
上周完成:
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制,录制视频
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文,录制视频
进行中:
- 🔄 招投标文件Skill架构设计
收到的反馈/学习建议:
- 表扬: 会议纪要Skill架构改进获得认可,改用全量读取替代索引搜索的方案是正确的,字段映射逻辑图也得到肯定
- 表扬: 会议纪要Skill的测试结果与人工订正版本相比"比上面是有进步了","该有的要点是有"
- 建议: 尝试使用主窗口全量处理替代分块agent搜索,可能效果更好;同时建议用Gemini做会议转写测试
- 建议: 招投标Skill架构设计作为P0任务需要本周完成,同时Gartner报告转写也需要先设计架构
- 建议: 会议纪要的下周工作安排提取是最核心的功能,需要重点优化P0/P1优先级判断的准确性
下周任务:
- 🔴 P0|会议纪要Skill全量处理优化及gemini方案对比测试
- 🔴 P0|需求澄清多专家博弈阶段效果可视化展示
- 🔴 P0|招投标Skill架构设计
- 🔴 P0|Gartner报告转写Skill架构设计
郝倩玉
上周完成:
- ✅ 会议纪要Skill架构优化(协助旭隆优化学习类+Q&A类会议纪要Skill逻辑)
- ✅ Gartner 报告解读转写系统需求对接及文档撰写,确定版需求文档已发旭隆。
- ✅ 问答系统V1.0测试推动(多次与媛媛沟通)
- ✅数字分身需求对接
进行中:
- 🔄 招投标文件Skill架构设计(投标商务响应文件自动生成系统需求文档已完成)
收到的反馈/学习建议:
- 建议: 招投标Skill架构设计后续需要针对需求部分再次讨论确认,因为有些需求不一定合理
- 建议: Gartner报告转写系统架构设计需要尽快完成,因为涉及年末签合同,可能有30万的业务机会,优先级提升为P0
- 建议: 数字分身需求方面,由于合作方需求不明确,需要自己先调研市面上比较好的版本,做出多个方案供选择
下周任务:
- 🔴 P0|参与优化会议纪要Skill
- 🔴 P0|参与设计招投标Skill架构
- 🔴 P0|参与设计Gartner报告转写Skill架构
- 🔴 P0|数字分身方案调研
陶西平
上周完成:
- ✅ 数字人PPT需求文档(协助江老师修改需求文档)
- ✅ 学习使用Claude Code的document skill,使用pdf skill的表单填写功能
- ✅ 调研数字人平台的公共数字人能力,收集总结相关目标数字人平台价格信息
进行中:
- 🔄 数字人与ppt结合(生成一个基于指定PPT的数字人视频)
- 🔄 前端框架重构(对问答系统前端功能进行分析)
收到的反馈/学习建议:
- 肯定: 陶西平提供的数字人调研文档被团队成员引用,作为数字人平台费用对比的基础参考资料
下周任务:
- 🔴 P0|数字人PPT视频样本生成
- 🔴 P0|Gemini分镜脚本生成测试
- P1|完成问答系统前端重构需求文档
三、会议总结
核心议题: 会议纪要Skill优化、数字人PPT视频生成、问答系统前端重构、招投标/Gartner报告Skill架构设计
关键决策:
- 会议纪要转写采用Gemini多模态视频处理方案: 领导测试发现Gemini 3.0 Pro可以直接上传会议视频生成转写文本,多模态能力最强,上下文最长,效果优于纯语音转写
- . 进展情况以会议转写为优先,周报作为补充: 会议中发现转写文本更能反映实际进展情况
- P0/P1/P2优先级判断需要人工确认: AI缺乏隐性上下文(如成员资历、工作时长等),建议先让AI给出优先级建议,然后由人工确认
- 数字人PPT视频主需求调整为支持20-30分钟时长: 实际使用场景(如PPT宣讲、会议发言)需要20-30分钟
- 数字人形象必须使用中国人,不能用老外说流利中文: 确保形象和语言匹配,追求真实性
- 数字人视频第一阶段必须包含手势动作: 开场和结尾的手势动作是必须的,不能呆板站立讲解
- 本周完成数字人真人训练视频样本: 要求本周末前用自己真人训练出语音和视频样本
- 使用Gemini 3.0生成分镜头脚本和图片,再用其他平台生成视频: 这是目前最有效的动画视频制作路径
- 前端重构只改展示部分,后端不动但需做代码审查: 用Codex或大模型做一遍代码审查,找出问题记录下来
- Sub Agent调用必须使用绝对路径指定: 项目下的sub agent不指定绝对路径时调用不稳定
- 推荐使用Agent调用Agent的方式,而非Skill调用Sub Agent: 这样调用更清晰,上下文共享更好
- 招投标Skill架构设计提升为P0任务: 因为涉及年末演示和签合同,可能有30万收入
- Gartner报告转写Skill提升为P0任务: 同样因为紧急需求
下周工作重点:
- 🔴 会议纪要Skill全量处理优化,对比Gemini转写与腾讯会议转写效果
- 🔴 数字人PPT视频样本生成,本周末前完成真人训练
- 🔴 招投标Skill和Gartner报告转写Skill架构设计
- 🔴 问答系统V1.1前端重构,需先做代码审查
- 🔴 需求澄清Skill专家博弈效果验证和流程图梳理
- 🔴 数字分身方案调研,主动出多个版本供选择
纪要整理人: Claude 纪要时间: 2025-12-02 下次会议: 2025-12-09