9.8 KiB
9.8 KiB
工程类会议纪要-2025-12-02-第X次周会
一、会议信息
- 会议时间: 2025-12-02
- 参会人员: 连云波(主持)、江争达、郝倩玉、陶西平、闫旭隆
- 记录整理人: Gemini
二、工作内容
1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|---|---|---|---|
| 会议纪要Skill架构优化 | 闫旭隆 | 12月02日 | 基本完成但需进一步测试(周报:已完成)。 会议演示了全量读取转写文本的方案,但发现Sub-agent调用存在路径和上下文隔离问题,建议后续尝试Agent调用Agent架构;计划引入Gemini视频转写作为输入源。 |
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 12月02日 | 完成。 已增加专家博弈机制(多轮交叉评价),并录制了演示视频。 |
| 数字人PPT需求文档 | 江争达 | 12月02日 | 需重写(周报:已完成)。 会议评审未通过:需求提炼过于简单(仅3-5分钟),未体现20-30分钟长视频的技术难点,且对“真实感”理解有误(如流利中文的老外),缺乏手势动作等核心需求。 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 12月02日 | 进行中。 已出初版文档,会议建议暂停直接开发,先利用Opus审查后端代码,并用大模型生成前端重构方案进行对比。 |
| 数字分身需求文档 | 郝倩玉 | 12月02日 | 暂停/放缓。 核所需求放缓,暂不以其需求为核心,转为自行调研市面优秀案例。 |
2. 重点项目问题及解决方案
项目: 会议纪要Skill开发
问题1:Skill调用Sub-agent存在上下文和路径问题
- 问题描述: 在测试中发现,Skill调用Sub-agent时,如果是相对路径几乎无法成功,绝对路径偶尔成功;且Sub-agent的上下文隔离效果不理想,逻辑控制存在问题。
- 解决方案:
- 短期方案: 暂时将Skill逻辑直接提取到主窗口上下文执行,利用主窗口的强大理解能力。
- 长期架构: 放弃“Skill调Sub-agent”模式,转向“Agent调用Agent”架构,在主Agent下定义子Agent,逻辑更清晰。
- 输入源优化: 采用Gemini处理会议视频(多模态能力),生成精准文字稿后再喂给Skill。
- 责任人: 闫旭隆
- 截止时间: 2025-12-09
项目: 数字人PPT生成
问题2:需求文档缺乏深度与核心难点
- 问题描述: 提交的需求文档仅列出了基础功能(如PPT同步、画面不遮挡),忽视了长视频(20-30分钟)生成的成本与技术难点,且对数字人“真实感”的定义存在偏差(如不仅是语音流利,更要有肢体动作)。
- 解决方案:
- 修改需求: 增加时长至20-30分钟的要求,增加手势动作需求。
- 技术路径: 利用Gemini 3.0生成分镜脚本和分镜图片,结合VEO 3.1或Nano Banana生成视频片段,再进行拼接。
- 样本制作: 本周内必须用真人素材训练出一个语音和视频样本,验证可行性。
- 责任人: 江争达
- 截止时间: 2025-12-09
项目: 前端重构
问题3:重构方案缺乏大模型辅助验证
- 问题描述: 目前的重构方案主要基于人工思考,未充分利用大模型能力进行代码审查和方案对比;且Claude 4.5在文字回答上存在幻觉风险。
- 解决方案:
- 后端审查: 使用Opus 4.5或Codex对现有后端代码进行Code Review。
- 方案对比: 让GPT-5.1或Gemini基于现有架构生成一版前端重构方案,与人工方案进行对比,查漏补缺。
- 责任人: 江争达、陶西平
- 截止时间: 2025-12-09
3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|---|---|---|---|---|
| 🔴 会议纪要Skill优化与测试 | 闫旭隆 | 生成双版本对比纪要:1.基于当前Skill+腾讯会议文本;2.基于Gemini视频转写+Skill | P0 | 12月09日 |
| 🔴 需求澄清Skill二阶段可视化 | 闫旭隆 | 整理二阶段专家交叉回应的可视化效果,并梳理完整流程图 | P0 | 12月09日 |
| 🔴 数字人PPT视频样本及需求修正 | 江争达 | 1.产出真人训练视频样本;2.使用Gemini 3.0测试分镜脚本;3.修正需求文档 | P0 | 12月09日 |
| 🔴 招投标文件Skill架构设计 | 闫旭隆、郝倩玉 | 完成架构设计(需求紧急,优先级提升) | P0 | 12月09日 |
| 问答系统V1.1前端重构 | 江争达、陶西平 | 使用大模型(Opus/GPT)生成对比方案并审查后端代码 | P1 | 12月09日 |
| Gartner报告解读转写系统 | 郝倩玉、闫旭隆 | 完成架构设计 | P1 | 12月09日 |
| PDF Skill技术调研 | 江争达 | 调研Claude Code PDF能力 | P1 | 12月09日 |
| 架构迁移研究 | 闫旭隆 | 研究从Cloud Code Skill架构转为LangChain/Deep Agent架构的可行性 | P1 | 待定 |
| 日报驱动系统需求研究 | 江争达(丁康执行) | 指导丁康完成Asana架构学习及日报驱动需求研究 | P2 | 待定 |
| Skill Plugin管理系统搭建 | 江争达 | 学习并搭建内部Skill Marketplace | P2 | 待定 |
4. 组内成员工作进展
闫旭隆
上周完成:
- ✅ 需求澄清-需求文档skill优化(增加多轮博弈机制)
- ✅ 会议纪要Skill优化(全量读取模式)
进行中:
- 🔄 招投标文件Skill架构设计
收到的反馈/学习建议:
- 建议: Skill调用Sub-agent路径问题难以解决,建议转向Agent调用Agent架构。
- 建议: 提示词编写要有明确的正确/错误示例,才能保证Agent执行质量。
- 表扬: 演示的PPT生成Skill(结合Gemini规划+Playwright执行)效果非常好,完全自动化。
下周任务:
- 🔴 P0|会议纪要Skill优化与测试(Gemini视频源对比)
- 🔴 P0|需求澄清Skill二阶段可视化
- 🔴 P0|招投标文件Skill架构设计
- P1|架构迁移研究(Skill to Deep Agent)
江争达
上周完成:
- ✅ 数字人PPT需求文档(会议评审认为需重写)
- ✅ 问答系统v1.1前端重构方案(初版)
进行中:
- 🔄 数字人PPT需求文档修正
- 🔄 前端重构方案优化
收到的反馈/学习建议:
- 批评: 数字人需求文档“只看树木不看森林”,对“真实感”理解有误(如流利中文老外问题)。
- 批评: 需求文档过于简单,未挖掘20-30分钟长视频生成的真正技术难点。
- 建议: 不要急着写代码,先用Opus审查后端,用GPT/Gemini生成前端方案做对比。
- 建议: 尽快测试Gemini 3.0的分镜脚本生成能力。
下周任务:
- 🔴 P0|数字人PPT视频样本及需求修正
- P1|问答系统V1.1前端重构(模型辅助方案)
- P1|PDF Skill技术调研
- P2|日报驱动系统需求研究(指导丁康)
- P2|Skill Plugin管理系统搭建
郝倩玉
上周完成:
- ✅ Gartner报告解读转写系统需求文档
- ✅ 投标商务应答文件自动生成系统需求文档
进行中:
- 🔄 数字分身需求对接(放缓)
收到的反馈/学习建议:
- 确认: 招投标文件Skill需求紧急,提升为P0优先级。
下周任务:
- 🔴 P0|招投标文件Skill架构设计(协助)
- P1|Gartner报告解读转写系统架构设计
陶西平
上周完成:
- ✅ 协助江老师修改数字人需求文档
- ✅ 前端框架重构分析
进行中:
- 🔄 前端功能分析
收到的反馈/学习建议:
- 任务调整: 配合江争达进行前端重构的大模型方案生成与对比。
下周任务:
- P1|问答系统V1.1前端重构(协助)
三、会议总结
核心议题: 会议纪要Skill架构复盘、数字人PPT需求深度评审、前端重构方法论纠偏
关键决策:
- 会议纪要输入源升级: 决定引入Gemini处理会议视频,利用其多模态能力生成高质量文字稿作为Skill输入。
- Agent架构调整: 鉴于Skill调用Sub-agent的路径和上下文问题,未来开发倾向于“Agent调用Agent”或主窗口全量加载模式。
- 数字人需求变更: 明确数字人PPT视频需满足20-30分钟时长,必须包含手势动作,并利用Gemini 3.0生成分镜脚本。
- 优先级调整: 招投标文件Skill开发提升为P0级任务。
- 重构方法论: 前端重构禁止直接编码,必须先通过大模型(Opus/GPT)进行后端审查和前端方案生成对比。
下周工作重点:
- 完成会议纪要Skill的双版本效果对比(腾讯会议文本 vs Gemini视频转写)。
- 产出数字人真人的训练视频样本及修正后的需求文档。
- 完成招投标文件Skill的架构设计。
- 落实前端重构的大模型辅助验证方案。