需求文档skill回溯专家博弈之前

This commit is contained in:
闫旭隆
2025-12-11 14:19:36 +08:00
parent 5f329d7b4c
commit f4314c3ede
117 changed files with 28969 additions and 3325 deletions

View File

@ -0,0 +1,196 @@
# Q&A资源库类会议纪要 (2025-12-08)
## 一、会议信息
- **会议时间:** 2025-12-08
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
- **纪要整理人:** Claude
---
## 二、工作问题 Q&A
### 1. 会议纪要Skill相关问题
**Q1: 会议纪要Skill信息提取准确率低怎么解决**
**问题背景:** 会议转写文本存在语音识别错误、语义跳脱等问题导致Skill提取信息时准确率不高且分块索引搜索容易遗漏信息。
**解决方案:**
1. **文字转写换成Gemini多模态:** 上传会议视频让Gemini转写准确率远高于传统语音识别几乎无字错误
2. **Clean预处理:** 对转写文本进行去重、去错处理,压缩到紧凑版本后再使用
3. **全量读取替代索引搜索:** 将Clean后的完整文本加载到主上下文通过语义理解提取而非关键词匹配
4. **主窗口全量处理:** 尝试将所有映射逻辑写入主窗口Skill一次性处理避免Sub-Agent分块造成逻辑割裂
---
**Q2: P0/P1/P2优先级如何准确判断**
**问题背景:** AI难以准确判断任务优先级因为不了解团队成员的年龄、级别、工作时长等潜在上下文。
**解决方案:**
1. **AI先给建议:** 让系统给出优先级排序建议,而非直接生成
2. **人工确认反馈:** 会议中或会后立即向每个人确认优先级
3. **保留学习材料:** 将确认过程的所有材料保留,作为后续强化学习或微调的数据
---
### 2. Sub-Agent调用相关问题
**Q3: Skill调用项目级Sub-Agent为什么不稳定**
**问题背景:** 测试发现使用相对路径调用项目级Sub-Agent几乎全部失败但使用绝对路径可以稳定成功。
**解决方案:**
1. **必须使用绝对路径:** 调用项目级Sub-Agent时指定完整的绝对路径
2. **原因分析:** Claude默认优先搜索全局Agent目录找不到会忽略而非查找项目目录
3. **架构建议:** 优先使用Agent调用Agent的方式而非Skill调用Agent
---
**Q4: Skill嵌套还是Sub-Agent分离哪个更好**
**问题背景:** 复杂任务需要多个步骤协作存在Skill嵌套Skill和Skill调Sub-Agent两种架构选择。
**解决方案:**
1. **推荐Skill嵌套Skill:** 上下文共享,逻辑控制精确,调用关系清晰
2. **不推荐Sub-Agent:** 上下文剥离后会丢失大量信息,逻辑控制容易出问题
3. **最佳实践:** Agent调Agent > Skill嵌套Skill > Skill调Agent
---
### 3. 数字人需求相关问题
**Q5: 数字人视频时长应该定义为多少?**
**问题背景:** 需求文档中定义的3-5分钟时长不符合实际业务场景需求。
**解决方案:**
1. **主要需求改为20-30分钟:** 这是PPT宣讲的真实时长需求
2. **3-5分钟作为测试:** 初期可用短时长验证技术可行性
3. **技术上无本质差异:** 主要是成本问题,不是技术瓶颈
---
**Q6: 数字人平台如何选型?**
**问题背景:** 市场上数字人平台众多,需要评估性价比和效果。
**调研结果:**
| 平台 | 特点 | 建议 |
|-----|-----|-----|
| 百度希壤 | 价格较低40元/10分钟API便宜 | 重点测试,本周出样本 |
| 黑镜 | 会员免费,只收定制费,后续生成免费 | 重点测试,本周出样本 |
| HeyGen | 效果好但价格高 | 作为参考 |
| 可灵/即梦 | 价格很贵 | 不优先考虑 |
| VEO 3.1 | 新升级,能力提升 | 测试首尾帧生成视频效果 |
---
### 4. 前端重构相关问题
**Q7: 前端重构如何保证质量?**
**问题背景:** 需要在保留现有功能的基础上重构前端,同时避免引入问题。
**解决方案:**
1. **后端先审查不改:** 用Opus 4.5或Codex对后端代码做Code Review记录问题不急改
2. **方案交叉验证:** 用GPT Research生成方案与现有方案对比
3. **考虑下一版本:** 重构时把下一版本功能需求一起考虑进去
4. **提供示例代码:** 特别是后端交互的逻辑代码
---
### 5. 需求表达相关问题
**Q8: 为什么与大模型交互总是得不到好答案?**
**问题背景:** 技术调研文档和需求表达不够清晰,导致他人难以理解,与大模型交互效果也差。
**解决方案:**
1. **详细说明背景:** 包含为什么做、要解决什么问题、核心诉求是什么
2. **站在读者角度:** 考虑没有上下文的人能否理解
3. **先写后说:** 对于复杂背景,先写下来整理清楚再交流
4. **正反示例:** 在Prompt中同时给出正确和错误示例
---
## 三、重点工作方法
### 方法 1Gemini多模态视频转写方法
- **描述:** 使用Gemini的多模态能力进行会议视频转写可同时识别画面内容和语音内容。先将会议视频上传给Gemini让其原文转写所有内容再用Clean后的文本作为后续处理的输入。
- **适用场景:** 会议纪要生成、视频内容分析、培训视频转文档
- **关键要点:**
- 支持最长1小时的视频
- 可以通过prompt调整提取内容
- 能识别画面变化(屏幕切换、操作演示)
- 转写准确度极高,几乎无字错误
### 方法 2全量上下文处理优于分块搜索
- **描述:** 在处理长文本时使用全量读取加载到主上下文通过语义理解提取信息而非RAG关键词搜索。人的口语存在大量跳脱和不清晰表达直接搜索会漏掉信息。
- **适用场景:** 会议转写处理、文档信息提取、口语化内容分析
- **关键要点:**
- 先做Clean预处理去除冗余
- 通过Attention机制理解上下文语义
- 可接受较长上下文换取准确性
- RAG对口语化内容效果很差
### 方法 3Skill嵌套Skill架构方法
- **描述:** 使用Skill嵌套Skill的方式进行复杂任务编排直接在主窗口Skill.md中调用其他Skill而不是通过Sub-Agent。上下文共享逻辑控制精确。
- **适用场景:** 复杂工作流编排、多步骤任务自动化
- **关键要点:**
- 上下文共享,信息不丢失
- 调用关系清晰,易于调试
- 避免Sub-Agent的上下文隔离问题
- 接受较长上下文的代价
### 方法 4Agent调Agent架构组织
- **描述:** 在子项目下定义主Agent由主Agent调配各Sub-Agent而非Skill调Agent。这样架构组织更清晰避免来回嵌套。
- **适用场景:** 多Agent协作系统、复杂项目架构
- **关键要点:**
- 主Agent负责调度和协调
- Sub-Agent专注单一功能
- 架构层次分明,易于维护
- 调用语法更规范
### 方法 5提示词正反示例编写技巧
- **描述:** 在编写Skill或Agent的Prompt时必须同时提供正确示例和错误示例。格式"错误的是什么,正确的是什么"。Agent有自己的想法通过正反对比可以强化行为规范。
- **适用场景:** 高精度任务的Prompt编写、规范化操作流程
- **关键要点:**
- 正确示例:期望的输出格式和内容
- 错误示例:常见的错误模式
- 双向约束,减少偏离
- 适用于精密操作任务
### 方法 6Playwright+MCP浏览器自动化
- **描述:** 使用Playwright ExtensionChrome插件结合MCP进行浏览器自动化操作可实现网页操作的完全自动化。对于脱离浏览器的操作如文件保存对话框使用OS Scripts配合处理。
- **适用场景:** 网页自动化操作、Gemini/Canva等平台自动操作
- **关键要点:**
- 自动打开网页、输入文本、点击按钮
- 自动上传和下载文件
- OS Scripts处理浏览器外的操作
- 控制精准,完全自动化
### 方法 7Gemini分镜头脚本视频生成工作流
- **描述:** 使用Gemini 3.0 Pro生成视频分镜头脚本和图片再通过VEO等模型生成视频。流程需求描述 → 分镜脚本 → 分镜图片 → 视频生成 → 合成。
- **适用场景:** 动画视频制作、数字人视频生成、宣传片制作
- **关键要点:**
- Gemini分镜脚本生成能力最强
- 首尾帧+文字稿生成视频已成熟
- 分镜图片质量决定最终效果
- 可生成30秒-2分钟的视频段落
### 方法 8工具组合使用策略
- **描述:** 不同大模型在不同场景下的最佳组合使用策略,发挥各自优势。
- **适用场景:** 日常开发、AI辅助编程
- **关键要点:**
- **前端开发:** Gemini效果极好
- **代码逻辑/架构:** Claude Code工具调用能力最强
- **Bug修复/测试:** GPT Codex
- **文字问答:** GPT 5.1Claude幻觉较高
- **多模态/视觉:** Gemini 3.0 Pro
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-08
**下次会议:** 2025-12-15

View File

@ -0,0 +1,107 @@
# 云大所需求相关进度会议纪要 (2025-12-08)
## 一、会议信息
- **会议时间:** 2025-12-08
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
- **纪要整理人:** Claude
---
## 二、需求项目进展
| 项目名称 | 负责人 | 本周进展 | 存在问题 | 下周计划 | 优先级 |
|---------|-------|---------|---------|---------|-------|
| 投标商务应答自动生成系统 | 闫旭隆、郝倩玉、江争达 | 需求文档已完成并发给闫旭隆本周提升为P0任务 | 涉及30万合同需尽快完成架构设计 | 完成Skill架构设计 | P0 |
| 数字人项目 | 陶西平、江争达、郝倩玉 | 完成第一阶段需求文档、平台选型调研(百度希壤、黑镜等) | 时长需求定义不准应为20-30分钟、缺少手势动作、缺少结尾画面 | 1完成百度希壤和黑镜真人训练样本2测试VEO 3.13测试Gemini分镜头工作流 | P0 |
| Gartner 报告解读转写系统 | 闫旭隆、郝倩玉 | 需求文档已完成,已发给闫旭隆 | 涉及年末收入,媛媛催促较急 | 先完成架构设计 | P1 |
| 运营商信息精准爬取系统 | 郝倩玉 | 持续与需求方沟通中 | 需求方具体需求一直不能明确 | 持续跟进需求明确情况 | P1 |
**备注:** 以下市场部需求项目本次会议未涉及:
- 客户风险推送自动化系统
- 邮件自动处理转发系统
- 证书信息提取系统
- 云大阁新报告自动推送
---
## 三、问题与风险
### 项目1: 投标商务应答自动生成系统
**问题描述:**
- 涉及30万合同需尽快完成架构设计和功能实现
**解决方案:**
1. 本周提升为P0优先级
2. 闫旭隆负责Skill架构设计
3. 先有个样子出来,后续持续优化
**责任人:** 闫旭隆
**截止时间:** 2025-12-15
---
### 项目2: 数字人项目
**问题描述:**
1. 时长需求定义不准确文档写3-5分钟实际主要需求是20-30分钟
2. 数字人缺少手势动作,前十秒站着不动会显得不真实
3. 缺少结尾画面,数字人应有告别动作
4. 数字分身需求放缓(核所需求时间有变)
**解决方案:**
1. 将主要时长需求改为20-30分钟
2. 第一阶段必须加入手势动作
3. 增加结尾画面设计
4. 本周完成百度希壤和黑镜的真人训练样本
5. 测试VEO 3.1和Gemini 3.0分镜头工作流
6. 数字分身如核所不做则自主设计多个版本
**责任人:** 陶西平、郝倩玉
**截止时间:** 2025-12-13视频样本2025-12-15工作流测试
---
### 项目3: Gartner 报告解读转写系统
**问题描述:**
- 媛媛催促较急,涉及年末收入
**解决方案:**
1. 设为P1优先级
2. 先完成架构设计
3. 后续根据架构进行实现
**责任人:** 闫旭隆
**截止时间:** 2025-12-15
---
### 项目4: 运营商信息精准爬取系统
**问题描述:**
- 需求方(富有、琳贤)具体需求一直不能明确
**解决方案:**
1. 持续跟进沟通
2. 提供可行性方案给对方做参考
3. 等待需求明确后再推进
**责任人:** 郝倩玉
**截止时间:** 待需求明确
---
## 四、下周重点
1. 🔴 **投标商务应答自动生成系统:** 完成Skill架构设计P0
2. 🔴 **数字人项目:** 完成百度希壤和黑镜真人训练样本测试VEO 3.1和Gemini分镜头工作流P0
3. **Gartner报告解读转写系统:** 完成架构设计P1
4. **运营商信息精准爬取系统:** 持续跟进需求明确P1
5. **数字分身:** 如核所不做则自主设计多个版本P1
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-08
**下次会议:** 2025-12-15

View File

@ -0,0 +1,247 @@
# 工程类会议纪要 (2025-12-08)
## 一、会议信息
- **会议时间:** 2025-12-08
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
- **纪要整理人:** Claude
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|---------|---------|-----------|-------------|
| 会议纪要Skill架构优化 | 闫旭隆 | 2025-12-02 | 已完成架构重构从索引搜索改为全量读取会议转写绘制了字段映射逻辑流程图和Phase2并行执行流程图。存在问题全量读取资源消耗大、子Agent并行处理可能造成逻辑割裂、语义识别准确性不足。**解决方案:** 1使用Gemini进行视频转写2先对转写文本进行Clean处理3尝试主窗口全量处理方案 |
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成多轮博弈机制开发加入多角色专家评审和交叉回应功能。存在问题专家prompt编写难度大、评审过程无法直观查看、主Agent可能读取不完整。**解决方案:** 1将评审过程整合为一问一答文档2评估博弈效果效果不佳则优化或去除 |
| 数字人PPT需求文档 | 江争达数字人PPT、郝倩玉数字分身 | 2025-12-02 | 已完成第一阶段需求文档包含5个核心需求、质量标准、平台选型调研。存在问题时长需求定义不准应为20-30分钟而非3-5分钟、缺少手势动作、缺少结尾画面。**解决方案:** 1将主要时长改为20-30分钟2增加手势动作要求3本周完成百度希壤和黑镜真人训练样本 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 已完成部分需求文档系统架构图、API接口规范、功能清单。存在问题未完成功能对照、未考虑下一版本需求、后端代码未审查。**解决方案:** 1用Codex/Opus做后端Code Review2用GPT Research生成方案对比3考虑下一版本功能需求 |
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 会议中提升为P0任务涉及30万合同需本周完成架构设计 |
| 问答系统V1.0测试推动 | 江争达、郝倩玉 | 2025-12-02 | 进行中,多次与媛媛沟通,相关领导参与测试时间尚未确定 |
| Gartner报告解读转写系统 | 郝倩玉 | 2025-12-02 | 需求文档已完成并发给闫旭隆设为P1任务先做架构设计 |
### 2. 重点项目问题及解决方案
#### 问题1: 会议纪要Skill信息提取准确性问题
**问题描述:**
会议纪要Skill在提取信息时存在准确性问题
- 转写文本准确性不足,存在错误和语义识别问题
- 上下文约束能力弱,缺少会议背景信息
- 分块索引方式导致信息遗漏,全量读取方案资源消耗大
- Sub-agent并行提取后主窗口整合存在逻辑割裂问题
**解决方案:**
1. 文字转写采用Gemini多模态能力利用其视频识别能力提升转写准确性
2. 对转写文本进行Clean处理去除重复和冗余信息后再作为输入
3. 将全量Clean后的转写文本直接加载到主上下文让主窗口一次性处理
4. 尝试调用Gemini API在Claude内部处理会议纪要生成
5. 测试主上下文全量处理与Sub-agent并行提取两种方案的效果对比
**责任人:** 闫旭隆
**截止时间:** 2025-12-15
#### 问题2: Sub-agent调用路径问题全局vs项目级
**问题描述:**
Skill调用自定义Sub-agent时存在全局路径和项目级路径调用差异问题
- 使用相对路径时Claude优先查找全局Agent找不到会读取项目级Agent的Prompt但不执行
- 使用绝对路径可以成功调用项目级Sub-agent
- 未使用Task规范调用也能成功但机制不清晰
**解决方案:**
1. 调用项目级Sub-agent时必须使用绝对路径
2. 建议采用Agent调用Agent的方式而非Skill调用Agent
3. 在子项目下定义主Agent由主Agent调配各Sub-agent
4. 使用标准的Task调用规范避免语言描述产生歧义
5. 调试阶段可用Skill加载方式调通后迁移到Agent架构
**责任人:** 江争达
**截止时间:** 2025-12-15
#### 问题3: 数字人需求文档表达清晰度问题
**问题描述:**
数字人PPT需求文档存在表达不够清晰和具体的问题
- 时长需求定义为3-5分钟但实际主要需求应为20-30分钟
- 缺少结尾画面设计
- 非功能性需求中缺少使用界面说明
- 数字人手势动作需求缺失
**解决方案:**
1. 将时长需求调整为20-30分钟作为主要需求3-5分钟作为初期测试
2. 增加结尾画面设计,数字人独立告别画面
3. 补充使用界面需求明确工作流、API调用或平台操作方式
4. 在核心质量指标中增加手势动作要求,至少前后十秒要有手势
5. 与GPT/Gemini进行需求方案交叉验证
**责任人:** 陶西平
**截止时间:** 2025-12-15
#### 问题4: 需求文档背景说明不清晰问题
**问题描述:**
技术调研文档和需求文档的背景说明不够清晰:
- 核心诉求和问题点没有交代清楚
- 不站在读者角度思考,导致他人难以理解
- 与大模型交互时无法得到好的答案
**解决方案:**
1. 撰写技术文档时必须站在读者角度思考
2. 把背景、核心诉求、要解决的问题清晰表达出来
3. 对于说不出来的复杂背景说明,先写下来再给大模型
4. 确保文档准备充分后别人才能看得懂
**责任人:** 江争达
**截止时间:** 2025-12-15
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|---------|-------|-------------|-------|---------|
| 🔴 会议纪要Skill优化-Gemini转写对比 | 闫旭隆 | 生成三版会议纪要对比腾讯会议转写版、Gemini转写版、Gemini直接生成版 | P0 | 2025-12-15 |
| 🔴 需求澄清Skill专家交叉评审可视化 | 闫旭隆 | 整理专家交叉回应效果的可视化展示,呈现专家间的问题、建议、响应过程 | P0 | 2025-12-15 |
| 🔴 招投标文件Skill架构设计 | 闫旭隆 | 完成招投标文件生成Skill的整体架构设计 | P0 | 2025-12-15 |
| 🔴 数字人PPT视频样本生成 | 陶西平 | 使用百度希壤和黑镜平台训练真人数字人,生成包含手势动作的视频样本 | P0 | 2025-12-13 |
| 🔴 数字人视频工作流研究 | 陶西平 | 研究数字人视频生成工作流API调用/剪映自动化/平台操作),确定技术方案 | P0 | 2025-12-15 |
| 🔴 Gemini 3.0分镜头脚本+视频生成测试 | 陶西平 | 使用Gemini 3.0生成分镜头脚本和图片通过VEO 3.1生成30秒-2分钟视频 | P0 | 2025-12-15 |
| 🔴 前端重构方案完善 | 江争达 | 用Codex审查后端代码、用GPT Research对比方案、考虑下一版本功能需求 | P0 | 2025-12-15 |
| Gartner报告转写系统架构设计 | 闫旭隆 | 设计Gartner报告转写系统的整体架构 | P1 | 2025-12-15 |
| Claude Code Skill转LangChain研究 | 闫旭隆 | 研究如何将Skill迁移到LangChain/LangGraph的DeepAgent架构 | P1 | 待定 |
| 日报驱动项目管理系统开发 | 丁康 | 学习Asana架构和模块设计基于会议纪要生成日报并对接Asana MCP的系统 | P1 | 待定 |
| 数字分身需求对接 | 郝倩玉 | 继续与娴霖沟通,如核所需求不明确则自主设计多个版本 | P1 | 2025-12-15 |
| 运营商信息精准爬取系统需求跟进 | 郝倩玉 | 持续跟进需求方需求明确情况 | P1 | 2025-12-15 |
### 4. 组内成员工作进展
#### 闫旭隆
**上周完成:**
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文
- ✅ 录制演示视频
**进行中:**
- 🔄 会议纪要Skill持续优化
**收到的反馈/学习建议:**
- **建议:** 流程图绘制和字段映射逻辑需要写入Skill中确保Claude逻辑清晰避免瞎改
- **建议:** 会议转写换成Gemini来做做一个clean版本作为输入基础
- **建议:** 尝试主上下文窗口全量处理方案与当前并行子Agent方案对比效果
- **建议:** P0优先级判断让系统给出建议后人工确认保留确认材料用于后续优化
- **表扬:** 会议纪要Skill新版本相比上一版有明显进步主要要点已经提取到位
**下周任务:**
- [ ] 🔴 P0会议纪要Skill优化-Gemini转写对比测试
- [ ] 🔴 P0需求澄清Skill专家交叉评审可视化
- [ ] 🔴 P0招投标文件Skill架构设计
- [ ] P1Gartner报告转写系统架构设计
- [ ] P1Claude Code Skill转LangChain研究
#### 江争达
**上周完成:**
- ✅ 数字人PPT需求文档
- ✅ Sub-agent调用研究文档
**进行中:**
- 🔄 问答系统v1.1前端重构方案
- 🔄 PDF Skill技术调研
- 🔄 服务器采购
- 🔄 招投标文件Skill架构调试
**收到的反馈/学习建议:**
- **批评:** Sub-agent调研文档背景说明不够清晰核心诉求和问题点没有交代清楚90%的重点都说丢了
- **批评:** 表达能力和提问题能力不足,导致与大模型交互时无法得到好的答案
- **建议:** 需要提升需求表达能力,站在读者角度思考,把背景、核心诉求清晰表达出来
- **建议:** 对于说不出来的复杂背景说明,建议先写下来再给大模型
- **建议:** 前端重构方案需要用大模型审查后端代码,找出问题后再决定是否修改
**下周任务:**
- [ ] 🔴 P0前端重构方案完善Code Review + 方案对比)
- [ ] P1问答系统V1.0测试推动
- [ ] P1PDF Skill技术调研
- [ ] P1服务器采购
- [ ] P1招投标文件Skill架构调试
#### 郝倩玉
**上周完成:**
- ✅ 会议纪要Skill架构优化协助闫旭隆优化学习类+Q&A类逻辑
- ✅ Gartner报告解读转写系统需求文档
- ✅ 多次与媛媛沟通问答系统测试事宜
**进行中:**
- 🔄 数字分身需求对接(核所需求放缓)
- 🔄 招投标文件Skill架构设计
- 🔄 问答系统V1.0测试推动
- 🔄 运营商信息精准爬取系统需求跟进
**收到的反馈/学习建议:**
- **任务调整:** 数字分身需求因核所需求放缓而面临不确定性,如核所不做则自己做需求,多做几个版本供选择
- **任务安排:** 招投标文件Skill架构设计提升为P0任务涉及年末收入
- **指导:** 可以尝试学习Skill开发先试一个小的功能
**下周任务:**
- [ ] 🔴 P0推动招投标文件Skill架构设计
- [ ] P1数字分身需求对接持续跟进或自主设计
- [ ] P1运营商信息精准爬取系统需求跟进
- [ ] P1问答系统V1.0测试推动
- [ ] P2学习Skill开发
#### 陶西平
**上周完成:**
- ✅ 数字人PPT需求文档协助江老师修改
- ✅ 数字人平台选型调研HeyGen、百度希壤、黑镜等
**进行中:**
- 🔄 数字人与PPT结合视频生成
- 🔄 前端框架重构分析
**收到的反馈/学习建议:**
- **建议:** 视频时长需求应为20-30分钟主要需求而非3-5分钟
- **建议:** 数字人必须要有手势动作,至少前后十秒要有手的动作
- **建议:** 增加结尾画面,数字人独立告别
- **建议:** 测试VEO 3.1的能力使用Gemini 3.0生成分镜头脚本+图片
- **建议:** 研究可以微调和训练的数字人平台
- **建议:** 前端重构时要考虑下一版本交互逻辑用Codex审查后端代码
**下周任务:**
- [ ] 🔴 P0数字人PPT视频样本生成真人训练本周周末前
- [ ] 🔴 P0数字人视频工作流研究
- [ ] 🔴 P0Gemini 3.0分镜头脚本+VEO 3.1视频生成测试
- [ ] P1完成前端框架重构分析
---
## 三、会议总结
**核心议题:** Gemini多模态能力应用、会议纪要Skill优化、数字人视频生成、Agent架构组织
**关键决策:**
1. **采用Gemini 1.5 Pro进行会议视频转写:** 多模态能力最强,转写准确率高,所有成员必须使用
2. **会议转写改为全量读取方式:** 不再使用索引搜索,避免信息遗漏
3. **转写文本需先进行Clean处理:** 去除重复冗余后再提供给主上下文
4. **会议纪要进展情况以会议转写为优先:** 周报为补充
5. **P0/P1/P2优先级判断采用人机协作:** AI给出建议人工确认
6. **Sub-agent调用必须使用绝对路径:** 相对路径调用不稳定
7. **推荐Agent调用Agent的方式:** 而非Skill调用Agent组织更清晰
8. **数字人视频时长改为支持20-30分钟:** 这是主要需求场景
9. **招投标Skill架构设计提升为P0任务:** 涉及30万合同需本周完成
10. **前端开发用Gemini代码逻辑用Claude Code测试用GPT Codex:** 不同任务使用不同模型
**下周工作重点:**
1. 🔴 会议纪要Skill优化生成三版对比腾讯转写版、Gemini转写版、Gemini直接生成版
2. 🔴 招投标文件Skill架构设计本周完成
3. 🔴 数字人PPT视频样本生成本周周末前真人训练
4. 🔴 Gemini 3.0分镜头脚本+VEO 3.1视频生成测试
5. 🔴 前端重构方案完善Code Review + 方案对比)
6. 需求澄清Skill专家交叉评审效果可视化
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-08
**下次会议:** 2025-12-15

View File

@ -0,0 +1,186 @@
# 工程类会议纪要-2025-12-02-第X次周会
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、江争达、郝倩玉、陶西平、闫旭隆
- **记录整理人:** Gemini
------
## 二、工作内容
### 1. 重点项目进展情况汇总
| **项目名称** | **原负责人** | **原截止时间** | **项目进展情况** |
| ------------------------ | -------------- | -------------- | ------------------------------------------------------------ |
| 会议纪要Skill架构优化 | 闫旭隆 | 12月02日 | **基本完成但需进一步测试**(周报:已完成)。 会议演示了全量读取转写文本的方案但发现Sub-agent调用存在路径和上下文隔离问题建议后续尝试Agent调用Agent架构计划引入Gemini视频转写作为输入源。 |
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 12月02日 | **完成**。 已增加专家博弈机制(多轮交叉评价),并录制了演示视频。 |
| 数字人PPT需求文档 | 江争达 | 12月02日 | **需重写**(周报:已完成)。 会议评审未通过需求提炼过于简单仅3-5分钟未体现20-30分钟长视频的技术难点且对“真实感”理解有误如流利中文的老外缺乏手势动作等核心需求。 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 12月02日 | **进行中**。 已出初版文档会议建议暂停直接开发先利用Opus审查后端代码并用大模型生成前端重构方案进行对比。 |
| 数字分身需求文档 | 郝倩玉 | 12月02日 | **暂停/放缓**。 核所需求放缓,暂不以其需求为核心,转为自行调研市面优秀案例。 |
### 2. 重点项目问题及解决方案
#### 项目: 会议纪要Skill开发
**问题1Skill调用Sub-agent存在上下文和路径问题**
- **问题描述:** 在测试中发现Skill调用Sub-agent时如果是相对路径几乎无法成功绝对路径偶尔成功且Sub-agent的上下文隔离效果不理想逻辑控制存在问题。
- **解决方案:**
1. **短期方案:** 暂时将Skill逻辑直接提取到主窗口上下文执行利用主窗口的强大理解能力。
2. **长期架构:** 放弃“Skill调Sub-agent”模式转向“Agent调用Agent”架构在主Agent下定义子Agent逻辑更清晰。
3. **输入源优化:** 采用Gemini处理会议视频多模态能力生成精准文字稿后再喂给Skill。
- **责任人:** 闫旭隆
- **截止时间:** 2025-12-09
#### 项目: 数字人PPT生成
**问题2需求文档缺乏深度与核心难点**
- **问题描述:** 提交的需求文档仅列出了基础功能如PPT同步、画面不遮挡忽视了长视频20-30分钟生成的成本与技术难点且对数字人“真实感”的定义存在偏差如不仅是语音流利更要有肢体动作
- **解决方案:**
1. **修改需求:** 增加时长至20-30分钟的要求增加手势动作需求。
2. **技术路径:** 利用Gemini 3.0生成分镜脚本和分镜图片结合VEO 3.1或Nano Banana生成视频片段再进行拼接。
3. **样本制作:** 本周内必须用真人素材训练出一个语音和视频样本,验证可行性。
- **责任人:** 江争达
- **截止时间:** 2025-12-09
#### 项目: 前端重构
**问题3重构方案缺乏大模型辅助验证**
- **问题描述:** 目前的重构方案主要基于人工思考未充分利用大模型能力进行代码审查和方案对比且Claude 4.5在文字回答上存在幻觉风险。
- **解决方案:**
1. **后端审查:** 使用Opus 4.5或Codex对现有后端代码进行Code Review。
2. **方案对比:** 让GPT-5.1或Gemini基于现有架构生成一版前端重构方案与人工方案进行对比查漏补缺。
- **责任人:** 江争达、陶西平
- **截止时间:** 2025-12-09
### 3. 下周工作安排
| **项目名称** | **负责人** | **下周会前目标** | **优先级** | **截止时间** |
| ----------------------------- | ------------------ | ------------------------------------------------------------ | ---------- | ------------ |
| 🔴 会议纪要Skill优化与测试 | 闫旭隆 | 生成双版本对比纪要1.基于当前Skill+腾讯会议文本2.基于Gemini视频转写+Skill | P0 | 12月09日 |
| 🔴 需求澄清Skill二阶段可视化 | 闫旭隆 | 整理二阶段专家交叉回应的可视化效果,并梳理完整流程图 | P0 | 12月09日 |
| 🔴 数字人PPT视频样本及需求修正 | 江争达 | 1.产出真人训练视频样本2.使用Gemini 3.0测试分镜脚本3.修正需求文档 | P0 | 12月09日 |
| 🔴 招投标文件Skill架构设计 | 闫旭隆、郝倩玉 | 完成架构设计(需求紧急,优先级提升) | P0 | 12月09日 |
| 问答系统V1.1前端重构 | 江争达、陶西平 | 使用大模型Opus/GPT生成对比方案并审查后端代码 | P1 | 12月09日 |
| Gartner报告解读转写系统 | 郝倩玉、闫旭隆 | 完成架构设计 | P1 | 12月09日 |
| PDF Skill技术调研 | 江争达 | 调研Claude Code PDF能力 | P1 | 12月09日 |
| 架构迁移研究 | 闫旭隆 | 研究从Cloud Code Skill架构转为LangChain/Deep Agent架构的可行性 | P1 | 待定 |
| 日报驱动系统需求研究 | 江争达(丁康执行) | 指导丁康完成Asana架构学习及日报驱动需求研究 | P2 | 待定 |
| Skill Plugin管理系统搭建 | 江争达 | 学习并搭建内部Skill Marketplace | P2 | 待定 |
### 4. 组内成员工作进展
#### 闫旭隆
**上周完成:**
- ✅ 需求澄清-需求文档skill优化增加多轮博弈机制
- ✅ 会议纪要Skill优化全量读取模式
**进行中:**
- 🔄 招投标文件Skill架构设计
**收到的反馈/学习建议:**
- **建议:** Skill调用Sub-agent路径问题难以解决建议转向Agent调用Agent架构。
- **建议:** 提示词编写要有明确的正确/错误示例才能保证Agent执行质量。
- **表扬:** 演示的PPT生成Skill结合Gemini规划+Playwright执行效果非常好完全自动化。
**下周任务:**
- [ ] 🔴 P0会议纪要Skill优化与测试Gemini视频源对比
- [ ] 🔴 P0需求澄清Skill二阶段可视化
- [ ] 🔴 P0招投标文件Skill架构设计
- [ ] P1架构迁移研究Skill to Deep Agent
#### 江争达
**上周完成:**
- ✅ 数字人PPT需求文档会议评审认为需重写
- ✅ 问答系统v1.1前端重构方案(初版)
**进行中:**
- 🔄 数字人PPT需求文档修正
- 🔄 前端重构方案优化
**收到的反馈/学习建议:**
- **批评:** 数字人需求文档“只看树木不看森林”,对“真实感”理解有误(如流利中文老外问题)。
- **批评:** 需求文档过于简单未挖掘20-30分钟长视频生成的真正技术难点。
- **建议:** 不要急着写代码先用Opus审查后端用GPT/Gemini生成前端方案做对比。
- **建议:** 尽快测试Gemini 3.0的分镜脚本生成能力。
**下周任务:**
- [ ] 🔴 P0数字人PPT视频样本及需求修正
- [ ] P1问答系统V1.1前端重构(模型辅助方案)
- [ ] P1PDF Skill技术调研
- [ ] P2日报驱动系统需求研究指导丁康
- [ ] P2Skill Plugin管理系统搭建
#### 郝倩玉
**上周完成:**
- ✅ Gartner报告解读转写系统需求文档
- ✅ 投标商务应答文件自动生成系统需求文档
**进行中:**
- 🔄 数字分身需求对接(放缓)
**收到的反馈/学习建议:**
- **确认:** 招投标文件Skill需求紧急提升为P0优先级。
**下周任务:**
- [ ] 🔴 P0招投标文件Skill架构设计协助
- [ ] P1Gartner报告解读转写系统架构设计
#### 陶西平
**上周完成:**
- ✅ 协助江老师修改数字人需求文档
- ✅ 前端框架重构分析
**进行中:**
- 🔄 前端功能分析
**收到的反馈/学习建议:**
- **任务调整:** 配合江争达进行前端重构的大模型方案生成与对比。
**下周任务:**
- [ ] P1问答系统V1.1前端重构(协助)
------
## 三、会议总结
**核心议题:** 会议纪要Skill架构复盘、数字人PPT需求深度评审、前端重构方法论纠偏
**关键决策:**
1. **会议纪要输入源升级:** 决定引入Gemini处理会议视频利用其多模态能力生成高质量文字稿作为Skill输入。
2. **Agent架构调整** 鉴于Skill调用Sub-agent的路径和上下文问题未来开发倾向于“Agent调用Agent”或主窗口全量加载模式。
3. **数字人需求变更:** 明确数字人PPT视频需满足20-30分钟时长必须包含手势动作并利用Gemini 3.0生成分镜脚本。
4. **优先级调整:** 招投标文件Skill开发提升为P0级任务。
5. **重构方法论:** 前端重构禁止直接编码必须先通过大模型Opus/GPT进行后端审查和前端方案生成对比。
**下周工作重点:**
1. 完成会议纪要Skill的双版本效果对比腾讯会议文本 vs Gemini视频转写
2. 产出数字人真人的训练视频样本及修正后的需求文档。
3. 完成招投标文件Skill的架构设计。
4. 落实前端重构的大模型辅助验证方案。

View File

@ -0,0 +1,260 @@
# Q&A资源库类会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
- **纪要整理人:** Claude
---
## 二、工作问题 Q&A
### 1. 会议纪要Skill相关问题
**Q1: 会议纪要Skill信息提取准确性不足怎么办**
**问题详情:** 文字转写准确性不够语义识别困难缺乏上下文约束能力分块搜索导致信息遗漏P0/P1/P2优先级判断不准确。
**A1:**
1. 将文字转写工具从腾讯会议换成Gemini多模态转写利用其视觉识别能力提高准确性
2. 对转写文本进行Clean预处理去除脏数据和重复内容
3. 采用全量主上下文窗口处理,不用分块搜索
4. P0/P1/P2优先级在会议上实时确认不完全依赖AI判断
---
**Q2: 子Agent分割处理会导致什么问题**
**问题详情:** 使用多个子Agent并行提取信息后在主窗口整合时发现信息丢失和逻辑割裂。
**A2:**
1. 子Agent提取后主窗口无法建立各部分之间的关联性
2. 建议把Clean后的转写文本直接加载给主上下文全量处理
3. 将子Agent提取的结果作为增强Prompt传给主上下文减少信息损失
4. 非长连续工作场景,主上下文能处理好的就全放主上下文
---
### 2. Sub-agent架构相关问题
**Q3: Sub-agent调用不稳定怎么解决**
**问题详情:** Sub-agent在项目下使用相对路径调用时几乎无法成功执行会读取prompt但不执行。
**A3:**
1. **必须使用绝对路径调用Sub-agent**,相对路径调用不稳定
2. 采用Agent调Agent的架构而非Skill调Agent
3. 定义主Agent后直接选定激活其他Agent自动成为Sub-agent
4. 调试阶段可用Skill调通后将Skill.md移植到Agent中
---
**Q4: Skill和Agent应该如何组织架构**
**问题详情:** Skill调Agent、Agent调Skill来回嵌套导致逻辑混乱。
**A4:**
1. **用Agent调Agent不用Skill调Agent**
2. 可以用Skill嵌套Skill虽然上下文长但逻辑控制精确
3. Sub-agent因不带上下文会导致控制问题主上下文共享更好
4. 子项目下用主Agent组织其他Agent更清晰
---
### 3. 数字人PPT相关问题
**Q5: 数字人选型需要注意什么?**
**问题详情:** 老外数字人说流利中文会让人质疑真实性,与追求真实感的目标矛盾。
**A5:**
1. **不要只看树木不看森林**,老外说流利中文会让人质疑真假
2. 追求真实性就要用真实可信的形象,用真人录制训练
3. 数字人必须有手势动作,前十秒不能呆站
4. 视频结尾加独立告别画面,有始有终
---
**Q6: 数字人平台如何选型?**
**问题详情:** 多个平台费用和能力不同,如何选择。
**A6:**
1. **优先百度希壤和HeyGen黑镜**
2. 可灵即梦按秒收费太贵
3. 百度希壤按分钟包价格合理40块钱10分钟
4. 黑镜会员免费生成,只收定制费
5. 可尝试Gemini VEO 3.13.0 Pro后视频能力升级明显
---
### 4. 前端重构相关问题
**Q7: 前端重构应该如何规划?**
**问题详情:** 只重构展示部分可能不够,担心后续架构又要重改。
**A7:**
1. **重构时必须考虑下一版本的交互逻辑修改**
2. 后端先不动用Opus 4.5或Codex做一次Code Review
3. 将审查发现的问题记录作为重构需求文档
4. 先审查再动手,避免盲目重构
---
### 5. 需求Skill相关问题
**Q8: 多专家博弈评审机制如何验证效果?**
**问题详情:** 只看到专家提问,看不到响应,无法判断评审水平是否足够。
**A8:**
1. 将专家评估意见和响应整合成可视化的一问一答文档
2. 评估提问和响应的水平是否匹配
3. 水平不匹配则不需要这个环节
4. 各领域专家的prompt需要专人编写
---
### 6. AI能力边界相关问题
**Q9: AI优先级判断不准怎么办**
**问题详情:** AI对P0/P1/P2任务优先级判断困难缺乏人员背景等隐性上下文。
**A9:**
1. **在会议上实时确认优先级**不完全依赖AI
2. 让AI先给出建议排序人再确认反馈
3. 将确认过程材料保留,用于后续强化学习
4. 尝试将潜在上下文逐步显性化
---
## 三、重点工作方法
### 方法1: 多模态视频转写优先法
- **描述:** 使用Gemini多模态能力处理会议视频转写相比纯语音识别效率更高。Gemini能识别画面内容、文字和说话人动作可通过prompt调整提取内容甚至直接给会议模版让其一步生成会议纪要。
- **适用场景:** 会议记录、视频内容提取、多信息源整合
- **关键要点:**
- 多模态处理比纯语音识别效率高,能识别背景画面信息
- Gemini上下文最长(100万token),视觉能力最强
- 可用Gem自定义功能预置会议纪要模版后上传视频自动生成
### 方法2: AI工具组合使用策略
- **描述:** 不同AI工具各有专长应根据任务特点组合使用前端用Gemini多模态强中间逻辑用Claude工具调用强项目修复测试用GPT Codex。
- **适用场景:** 复杂项目开发、多任务并行处理
- **关键要点:**
- Gemini最全面多模态尤其视觉能力超强适合做PPT和视频
- Claude工具调用和工具理解能力无人能及做Agent首选
- 选择工具要看任务特点而非盲目追求最聪明的模型
### 方法3: 转写文本预清洗法
- **描述:** 在处理会议转写前先用AI对原始转写进行Clean去除脏数据和重复内容保证信息全面的同时内容紧凑。
- **适用场景:** 会议转写处理、长文本预处理、数据清洗
- **关键要点:**
- 原始转写存在逻辑中断、错误,直接处理效果差
- Clean后内容紧凑从3万字可精简到2万字左右
- 避免给AI喂垃圾数据先精加工再处理
### 方法4: 主上下文全量处理法
- **描述:** 对于信息损失敏感的任务优先在主上下文窗口全量处理而非分割给多个子Agent。
- **适用场景:** 信息整合、关联分析、会议纪要生成
- **关键要点:**
- 子Agent处理会造成逻辑割裂和信息丢失
- 主上下文直接生成比提示词生成再整合信息量更大
- 非长连续工作场景,主上下文能处理好的就全放主上下文
### 方法5: 人机协作关键节点介入法
- **描述:** 识别AI难以自主判断的关键节点如优先级判断在这些节点让人介入给予关键帮助。
- **适用场景:** 复杂决策、优先级判断、隐性知识应用
- **关键要点:**
- AI缺乏潜上下文人员级别、工作年限等某些判断靠人更有效
- 先让AI给建议再人工确认保留确认记录用于后续训练
- 把潜在上下文逐步显性化给AI
### 方法6: 会议实时确认法
- **描述:** 在会议进行中或刚结束时实时整理会议纪要并当场确认不等会后让AI自行判断。
- **适用场景:** 周会、项目会议、决策会议
- **关键要点:**
- 会议中前半部分已可开始整理
- 会上直接确认P0/P1等关键信息
- 当场确认效率最高、准确度最高
### 方法7: Sub-Agent绝对路径调用法
- **描述:** 在项目下调用Sub-Agent时必须使用绝对路径相对路径调用几乎不成功。
- **适用场景:** Skill开发、Agent架构设计
- **关键要点:**
- 相对路径调用Sub-Agent几乎不成功
- 绝对路径调用测试七八次基本稳定
- 不指定目录时AI会优先找全局Agent
### 方法8: Agent调用Agent架构
- **描述:** 不要在Skill里调用Sub-Agent而应该用Agent调用Agent。定义主Agent后选定它再调用的其他Agent就是Sub-Agent。
- **适用场景:** 复杂Agent系统设计、多Agent协作
- **关键要点:**
- Skill调用Sub-Agent组织会乱
- Agent调Agent最容易实现
- 避免Skill和Agent互相嵌套调用
### 方法9: Skill嵌套Skill替代Sub-Agent
- **描述:** 直接用Skill嵌套Skill来组织复杂流程放弃Sub-Agent。虽然上下文较长但逻辑控制精确。
- **适用场景:** 复杂流程自动化、多步骤任务
- **关键要点:**
- Skill套Skill比Sub-Agent清晰得多
- 上下文共享使逻辑控制精确
- Sub-Agent不带上下文会导致控制问题
### 方法10: 上下文越全越好原则
- **描述:** 不要过度限定AI做什么而是给它尽量完整的上下文让它自己理解并制定方案。
- **适用场景:** 创意生成、方案设计、内容生成
- **关键要点:**
- Claude生成的提示词不如Gemini直接读文档效果好
- 不要规定AI做什么给全上下文让它自己决定
- 启发:上下文管理思路的转变
### 方法11: Playwright+OS Scripts自动化工作流
- **描述:** 用Playwright MCP控制浏览器操作当操作超出浏览器范围时用OS Scripts接管实现完全自动化。
- **适用场景:** 网页自动化、图片生成、PPT制作
- **关键要点:**
- Playwright控制浏览器内操作
- OS Scripts处理系统对话框等浏览器外操作
- Python脚本组装最终产出
### 方法12: AI分镜头脚本生成法
- **描述:** 用Gemini 3生成分镜头脚本分段生成图片再通过首尾帧生成连贯视频最后合成完整视频。
- **适用场景:** 视频制作、数字人视频、宣传片
- **关键要点:**
- Gemini 3对镜头理解和分镜脚本生成优于其他模型
- 先生成分段图片,再用首尾帧生成视频
- 分段生成后合并成完整视频
### 方法13: 代码审查驱动重构法
- **描述:** 重构前先用AI对现有代码做完整审查记录问题作为需求文档再逐步重构。
- **适用场景:** 代码重构、技术债务清理、架构升级
- **关键要点:**
- 先审查再动手,审查结果就是重构需求文档
- 用Opus 4.5或Codex做Code Review
- 重构时同时考虑下一版本功能需求
### 方法14: AI模拟专家访谈法
- **描述:** 在需求文档第一版生成时用AI模拟领域专家来回答访谈问题实现需求采集流程自动化。
- **适用场景:** 需求采集、专家访谈、方案设计
- **关键要点:**
- 用AI模拟比我们经验丰富的专家
- 专家Agent回答可能更全面
- 适用于需求文档初版生成
### 方法15: 字段映射逻辑图驱动开发
- **描述:** 开发复杂Skill时先绘制每个输出字段的来源映射逻辑图明确来源和优先级。
- **适用场景:** Skill开发、数据处理流程设计
- **关键要点:**
- 每个字段明确来源和优先级
- 用可视化逻辑图而非纯文字描述
- 解决AI逻辑不连贯问题
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-02
**下次会议:** 2025-12-09

View File

@ -0,0 +1,86 @@
# 云大所需求相关进度会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
- **纪要整理人:** Claude
---
## 二、需求项目进展
| 项目名称 | 负责人 | 本周进展 | 存在问题 | 下周计划 | 优先级 |
|----------|--------|----------|----------|----------|--------|
| 投标商务应答自动生成系统 | 郝倩玉、闫旭隆、江争达 | 需求文档已完成,已发闫旭隆确认 | 架构设计待启动 | 从P1提升到P0完成招投标Skill架构设计 | P0 |
| 运营商信息精准爬取系统 | 郝倩玉 | 持续跟进需求方反馈 | 需求方具体需求一直不能明确 | 持续跟进需求方反馈 | P1 |
| 数字人项目 | 江争达、陶西平 | 需求文档已完成删减优化,整合平台选型调研结果 | 1第二阶段功能规划缺失2时长需求不准确当前3-5分钟实际应20-30分钟3数字人缺少手势动作4老外说流利中文的真实性问题 | 用真人训练生成PPT样本研究数字人工作流测试Gemini分镜头视频生成 | P0 |
| Gartner 报告解读转写系统 | 郝倩玉 | 需求文档已完成,已发闫旭隆 | 无 | 等待技术方案确认 | P1 |
| 客户风险推送自动化系统 | - | 本次会议未讨论 | - | - | - |
| 邮件自动处理转发系统 | - | 本次会议未讨论 | - | - | - |
| 证书信息提取系统 | - | 本次会议未讨论 | - | - | - |
| 云大阁新报告自动推送 | - | 本次会议未讨论 | - | - | - |
---
## 三、问题与风险
### 1. 投标商务应答自动生成系统
**问题描述:** 需求文档已完成,但架构设计尚未启动
**解决方案:**
- 从P1提升到P0优先级加快推进
- 闫旭隆负责确认需求文档并设计Skill架构
- 江争达负责后期调试
**责任人:** 郝倩玉、闫旭隆、江争达
**截止时间:** 2025-12-09
---
### 2. 运营商信息精准爬取系统
**问题描述:** 需求方(富有、琳贤)的具体需求一直不能明确
**解决方案:**
- 持续跟进,反复沟通
- 提供可行性方案给对方做参考
**责任人:** 郝倩玉
**截止时间:** 待定(等待需求方明确)
---
### 3. 数字人项目
**问题描述:**
1. 需求文档第二阶段功能缺失
2. 时长需求不准确3-5分钟 vs 实际20-30分钟
3. 数字人形象和动作要求不完整
4. 真实性考虑不足
**解决方案:**
1. 补充第二阶段功能详细说明
2. 时长需求扩展到支持20-30分钟PPT宣讲
3. 增加手势动作要求,避免呆板
4. 使用真人录制训练的语音和形象
5. 视频结尾增加独立告别画面
**责任人:** 江争达、陶西平
**截止时间:** 2025-12-09
---
## 四、下周重点
1. 🔴 **投标商务应答自动生成系统** - 完成Skill架构设计P0
2. 🔴 **数字人项目** - 用真人训练生成PPT样本研究数字人工作流测试Gemini分镜头视频生成P0
3. **运营商信息精准爬取系统** - 持续跟进需求方反馈P1
4. **Gartner报告解读转写系统** - 等待技术方案确认P1
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-02
**下次会议:** 2025-12-09

View File

@ -0,0 +1,309 @@
# 工程类会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
- **纪要整理人:** Claude
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|----------|----------|------------|--------------|
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成整体架构改进:从索引搜索改为全量读取方式;完成字段来源映射逻辑图设计;修改负责人字段为"原负责人",截止时间改为"原截止时间"。存在问题1文字语义识别仍是最大问题2存在信息遗漏日报驱动系统未提取3逻辑判断存在矛盾。**解决方案:** 1转写工具换成Gemini多模态2生成Clean后的全量文字稿作为输入3全量主上下文窗口处理4将Subagent逻辑整合成单一Skill文件 |
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 正在进行多专家博弈评审机制验证已生成专家评审JSON文件。存在问题1多专家博弈的prompt可能没写好2需验证评审水平是否达标。**解决方案:** 1把专家评估意见整合成可视化文档一问一答形式2各领域专家Prompt需专人编写3尝试用AI模拟专家回答访谈问题 |
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成需求文档删减和优化保留有用需求删除默认功能分阶段规划保持不变已整合数字人平台选型调研结果。存在问题1第二阶段功能规划缺失2时长需求定义不准确当前3-5分钟实际应为20-30分钟3数字人缺少手势动作4老外说流利中文的真实性问题。**解决方案:** 1补充第二阶段说明2时长调整为20-30分钟3加入手势要求4用真实人容貌训练 |
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 未在会议中讨论,需求方尚未明确反馈 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 正在规划前端展示部分和代码结构重构保留现有基础功能。存在问题1需考虑下一版本交互逻辑更改2后端代码质量未知。**解决方案:** 1重构时考虑下一版本功能需求2用Opus 4.5或Codex对后端做Code Review3后端先不动审查后再规划 |
| 问答系统V1.0测试推动 | 江争达、郝倩玉 | 2025-12-02 | 未在会议中详细讨论,多次与媛媛沟通,相关领导参与测试时间尚未确定 |
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 从P1提升到P0比较紧急。投标商务响应文件自动生成系统需求文档已完成 |
| Gartner报告解读转写系统需求文档 | 郝倩玉 | 2025-12-02 | 已完成,已发闫旭隆 |
### 2. 重点项目问题及解决方案
#### 问题1: 会议纪要Skill信息提取准确性问题
**问题描述:**
会议纪要Skill在信息提取时存在以下问题
- 文字转写的准确性不够,语义识别困难
- 缺乏上下文约束能力,无法理解会议背景信息
- 分块搜索导致信息遗漏,如日报驱动系统未被提取
- 逻辑判断存在矛盾,如周报显示完成但会议中反映未完成
- P0/P1/P2优先级判断不准确
**解决方案:**
1. 将文字转写工具从腾讯会议换成Gemini多模态转写利用其视觉识别能力提高准确性
2. 对转写文本进行Clean预处理去除脏数据和重复内容保证信息紧凑
3. 采用全量主上下文窗口处理将Clean后的转写文本直接加载给主窗口
4. 将子Agent提取的结果作为增强Prompt传给主上下文减少信息损失
5. 尝试用Agent调Agent的架构替代Skill调Agent使组织逻辑更清晰
**责任人:** 闫旭隆
**截止时间:** 2025-12-09
#### 问题2: Sub-agent调用不稳定问题
**问题描述:**
Sub-agent在项目下使用相对路径调用时几乎无法成功执行
- 全局下调用Sub-agent能正常执行
- 项目下使用相对路径调用时会读取Sub-agent的prompt但不执行
- 项目下使用绝对路径调用时才能稳定成功
**解决方案:**
1. Sub-agent调用时必须使用绝对路径
2. 采用Agent调Agent的架构而非Skill调Agent
3. 定义主Agent后直接选定激活其他Agent自动成为Sub-agent
4. 调试阶段可用Skill调通后将Skill.md移植到Agent中
5. 非必要情况下用Agent组织Agent不用Skill组织Agent
**责任人:** 闫旭隆
**截止时间:** 2025-12-09
#### 问题3: 数字人PPT需求文档产出问题
**问题描述:**
数字人PPT需求文档存在以下问题
- 时长需求不准确只写了3-5分钟但实际PPT宣讲需要20-30分钟
- 第二阶段功能需求未写入文档
- 数字人动作要求不完整,缺少手势动作要求
- 真实性考虑不足,老外说流利中文会让人质疑真假(本末倒置)
**解决方案:**
1. 时长需求扩展到支持20-30分钟的PPT宣讲
2. 将第一阶段和第二阶段功能需求都完整写入文档
3. 增加数字人手势动作要求,避免前十秒后十秒呆板无动作
4. 数字人形象选型需考虑真实性,使用真人录制训练的语音和形象
5. 视频结尾增加数字人独立告别画面,有始有终
**责任人:** 江争达、陶西平
**截止时间:** 2025-12-09
#### 问题4: 前端重构方案考虑不全面
**问题描述:**
问答系统v1.1前端重构需要考虑更多因素:
- 只重构前端展示和代码结构可能不够
- 需要考虑下一版本的交互逻辑变更
- 后端代码质量未经审查
**解决方案:**
1. 重构时需考虑下一版本可能的功能需求和交互逻辑变更
2. 用Opus 4.5或Codex对后端代码进行一次Code Review审查
3. 将审查发现的问题记录下来作为后续重构的需求文档
4. 后端暂不动,先审查再规划
**责任人:** 江争达、陶西平
**截止时间:** 2025-12-09
#### 问题5: 需求Skill多专家评审效果不明确
**问题描述:**
需求Skill的多专家博弈评审机制效果无法确认
- 只看到专家提问,看不到响应
- 无法判断专家评估水平是否足够
- 各领域专家的prompt可能没写好
**解决方案:**
1. 将专家评估意见和最后响应整合成可视化的一问一答文档
2. 评估专家提问和响应的水平是否匹配,判断是否有必要保留该环节
3. 各领域专家由专人负责编写专业的prompt
4. 第一版需求文档生成时可尝试用AI模拟专家回答访谈问题
**责任人:** 闫旭隆
**截止时间:** 2025-12-09
#### 问题6: AI优先级判断依赖人工介入
**问题描述:**
AI对P0/P1/P2任务优先级的判断非常困难因为缺乏潜在上下文
- 不知道团队成员的年龄、级别、工作时间长短
- 无法理解不同人员分配任务的差异
- 这些潜在上下文很难完全显性化给AI
**解决方案:**
1. 在会议上实时确认P0/P1/P2任务优先级
2. 让AI先给出建议排序人再确认反馈
3. 将确认过程的材料保留,用于后续强化学习或微调
4. 尝试将潜在上下文逐步显性化
**责任人:** 连云波、闫旭隆
**截止时间:** 2025-12-09
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|----------|--------|--------------|--------|----------|
| 🔴 会议纪要Skill优化-全量主窗口处理 | 闫旭隆 | 先用现有版本生成会议纪要然后在主窗口加载会议转写上下文做全量处理将Subagent逻辑整合成单一Skill文件 | P0 | 2025-12-09 |
| 🔴 会议转写文本双版本对比 | 闫旭隆 | 分别用腾讯会议版本和Gemini视频转写版本生成转写文本进行对比分析 | P0 | 2025-12-09 |
| 🔴 Gemini转写文本测试 | 闫旭隆 | 用Gemini转写文本套到现有Skill生成会议纪要 + 直接用Gemini喂视频一步生成会议纪要 | P0 | 2025-12-09 |
| 🔴 需求Skill专家交叉回应可视化 | 闫旭隆 | 整理二阶段专家交叉回应模块的可视化效果,把评估意见和响应整合成一问一答文档 | P0 | 2025-12-09 |
| 🔴 需求Skill流程图优化 | 闫旭隆 | 走一遍需求Skill流程图查看未来流程需要怎么修改完善 | P0 | 2025-12-09 |
| 🔴 招投标Skill架构设计 | 闫旭隆、郝倩玉 | 从P1提升到P0完成招投标Skill的架构设计 | P0 | 2025-12-09 |
| 🔴 数字人PPT样本生成 | 江争达、陶西平 | 用自己真实人容貌训练出来的语音和视频生成PPT讲解样本 | P0 | 2025-12-09 |
| 🔴 数字人工作流研究 | 江争达、陶西平 | 研究数字人生成工作流包括API调用、网站操作或剪映自动化工具等 | P0 | 2025-12-09 |
| 🔴 Gemini分镜头视频生成测试 | 江争达、陶西平 | 通过Gemini 3.0生成分镜头脚本和图片,再找平台试生成视频效果 | P0 | 2025-12-09 |
| 🔴 前端重构-后端代码审查 | 江争达 | 用Codex或Opus 4.5对现有后端代码做Code Review记录问题作为重构需求 | P0 | 2025-12-09 |
| 🔴 前端重构方案优化 | 江争达、陶西平 | 用大模型重新生成前端重构方案,对比现有方案差异;考虑下个版本交互逻辑 | P0 | 2025-12-09 |
| 数字分身需求对接 | 郝倩玉 | 持续跟进需求方反馈,推动需求明确 | P1 | 2025-12-09 |
| 问答系统V1.0测试推动 | 郝倩玉 | 继续与张媛媛沟通,推动相关领导参与测试 | P1 | 2025-12-09 |
| 运营商信息精准爬取系统需求跟进 | 郝倩玉 | 持续跟进需求方反馈 | P1 | 2025-12-09 |
| 天眼查自动更新需求确认 | 闫旭隆 | 确认小童是否还需要天眼查客户数据库自动更新功能 | P1 | 2025-12-09 |
| 日报驱动项目管理系统开发 | 丁康 | 学习Asana架构和模块设计日报驱动项目管理系统 | P1 | 待定 |
| Skill到LangChain架构迁移研究 | 待定 | 研究如何将Claude Code Skill转移到LangChain/LangGraph架构 | P2 | 待定 |
### 4. 组内成员工作进展
#### 闫旭隆
**上周完成:**
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文
- ✅ 录制演示视频
**进行中:**
- 🔄 会议纪要Skill架构优化全量主窗口处理
- 🔄 需求Skill专家博弈机制验证
**收到的反馈/学习建议:**
- **表扬:** 会议纪要Skill的逻辑映射图做得很重要有助于保持逻辑一致性和前后连贯性
- **表扬:** 生成的会议纪要比手动版本更具体详细,主要要点都有提取出来
- **批评:** 日报驱动系统没有总结出来,逻辑不全,存在信息遗漏问题
- **建议:** 整个文字转写换成Gemini因为Gemini多模态能力最强
- **建议:** 把转写文本Clean一次去除脏的、重复的内容直接加载给主上下文
- **建议:** 尝试用全量主上下文窗口处理把Skill全部写到主Agent里
- **建议:** P0/P1/P2优先级判断让AI先给建议人再确认反馈
- **建议:** 调试时可以用Skill调用Sub-agent方式流程调通后把Skill.md移植到Agent中
**下周任务:**
- [ ] 🔴 P0会议纪要Skill优化-全量主窗口处理
- [ ] 🔴 P0会议转写文本双版本对比
- [ ] 🔴 P0Gemini转写文本测试
- [ ] 🔴 P0需求Skill专家交叉回应可视化
- [ ] 🔴 P0需求Skill流程图优化
- [ ] 🔴 P0招投标Skill架构设计
- [ ] P1天眼查自动更新需求确认
#### 江争达
**上周完成:**
- ✅ 数字人PPT需求文档
**进行中:**
- 🔄 问答系统v1.1前端重构方案
- 🔄 PDF Skill技术调研
- 🔄 Skill Plugin管理系统搭建
- 🔄 服务器采购
- 🔄 招投标文件Skill架构调试
**收到的反馈/学习建议:**
- **批评:** 数字人选型存在"只看树木不看森林"的问题——老外生成流利中文会让人质疑真实性,追求真实却选择最假的表现是本末倒置
- **建议:** 数字人PPT需求文档中分阶段规划部分第二阶段内容缺失建议都写上完整
- **建议:** 视频时长需求提得不够准确应该考虑20-30分钟的PPT宣讲场景
- **建议:** 数字人标准中要把手势动作加进去,前十秒后十秒不能呆板无动作
- **建议:** 视频结尾可以增加数字人独立的告别画面,有始有终
- **建议:** 前端重构时要考虑下一版本的交互逻辑更改
- **建议:** 后端先不动用Opus 4.5或Codex对后端代码做一次审查
- **建议:** 通过Gemini 3.0生成分镜头脚本,利用其视觉理解能力生成图片
**下周任务:**
- [ ] 🔴 P0数字人PPT样本生成真人训练
- [ ] 🔴 P0数字人工作流研究
- [ ] 🔴 P0Gemini分镜头视频生成测试
- [ ] 🔴 P0前端重构-后端代码审查
- [ ] 🔴 P0前端重构方案优化
- [ ] P1问答系统V1.0测试推动
- [ ] P1PDF Skill技术调研
- [ ] P1服务器采购
#### 郝倩玉
**上周完成:**
- ✅ 会议纪要Skill架构优化协助旭隆优化学习类+Q&A类会议纪要Skill逻辑
- ✅ Gartner报告解读转写系统需求文档已发闫旭隆
- ✅ 问答系统V1.0测试推动沟通
**进行中:**
- 🔄 数字分身需求对接(需求方尚未明确)
- 🔄 招投标文件Skill架构设计
- 🔄 运营商信息精准爬取系统需求跟进
**收到的反馈/学习建议:**
- 无(本次会议未针对郝倩玉工作进行专门讨论)
**下周任务:**
- [ ] 🔴 P0招投标Skill架构设计配合闫旭隆
- [ ] P1数字分身需求对接
- [ ] P1推动问答系统V1.0测试
- [ ] P1运营商信息精准爬取系统需求跟进
#### 陶西平
**上周完成:**
- ✅ 数字人PPT需求文档协助江老师修改
- ✅ 学习使用claudecode的document skill
- ✅ 调研数字人平台公共数字人能力
- ✅ 根据指定PPT生成数字人结合视频
**进行中:**
- 🔄 数字人与PPT结合优化
- 🔄 前端框架重构
**收到的反馈/学习建议:**
- **建议:** 需求文档分阶段规划中,第一阶段和第二阶段功能都应该写清楚
- **建议:** 数字人视频时长需求应该考虑20-30分钟的PPT宣讲场景
- **建议:** 数字人需要添加手势动作,前十秒呆站着讲是有问题的
- **批评:** 老外数字人说流利中文的问题是"只看树木不看森林",会让人质疑真实性
- **建议:** 视频结尾可以加数字人独立的告别画面,有始有终
- **建议:** 尝试用Gemini VEO 3.1测试视频生成效果
- **建议:** 可以通过Gemini 3生成分镜头脚本分段生成图片再合成视频
- **建议:** 前端重构时要考虑下一版本的交互逻辑更改
- **建议:** 后端先不动用Opus 4.5或Codex对后端代码做审查
**下周任务:**
- [ ] 🔴 P0配合江老师数字人PPT样本生成
- [ ] 🔴 P0数字人工作流研究
- [ ] 🔴 P0Gemini分镜头视频生成测试
- [ ] 🔴 P0前端重构方案优化
- [ ] P1完成问答系统前端重构需求文档
---
## 三、会议总结
**核心议题:** 会议纪要Skill架构优化、数字人PPT需求完善、前端重构方案、AI工具选型
**关键决策:**
1. **AI工具选型方案确定:** 前端用Gemini处理多模态任务中间逻辑用Claude Code测试和问题修复用GPT Codex
2. **会议纪要Skill转写工具改用Gemini多模态:** 纯语音识别效率低Gemini能识别画面内容且错误率低
3. **会议转写文本必须先Clean处理:** 去除脏数据和重复内容,保证信息紧凑后再输入
4. **尝试全量主上下文窗口处理:** 子Agent方式会导致信息丢失和逻辑割裂全量处理信息损失最小
5. **P0/P1/P2优先级判断需人工确认:** AI缺少隐性上下文优先级判断需人工在会上辅助
6. **Agent调Agent优于Skill调Agent:** 定义主Agent后其他都是Sub-agent组织逻辑更清晰
7. **Sub-agent调用必须使用绝对路径:** 相对路径调用不稳定
8. **Skill嵌套Skill比Sub-agent更清晰可控:** 虽然上下文长,但逻辑控制精确
9. **数字人视频时长需求扩展到20-30分钟:** 这是PPT宣讲的主要需求
10. **数字人必须包含手势动作:** 前十秒不能呆站,真实性要求
11. **数字人平台选型优先百度希壤和HeyGen:** 价格合理,可定制
12. **前端重构前先做后端Code Review:** 用Opus 4.5或Codex审查后端先不动
13. **前端重构必须考虑下一版本交互逻辑:** 避免架构调整后又要重改
14. **日报驱动项目管理系统由丁康负责:** 基于会议纪要生成日报对接Asana
15. **Skill迁移到LangChain/LangGraph作为P1-P2研究项目:** 当前Skill用多了后需转化到正式Agent框架
**下周工作重点:**
1. 🔴 会议纪要Skill优化改用Gemini转写 + 全量主窗口处理
2. 🔴 需求Skill专家交叉回应可视化整理
3. 🔴 招投标Skill架构设计P1提升为P0
4. 🔴 数字人PPT样本生成真人训练+ 工作流研究
5. 🔴 前端重构-后端代码审查 + 方案优化
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-02
**下次会议:** 2025-12-09

View File

@ -0,0 +1,132 @@
# 会议纪要生成效果对比报告
## 核心结论
| 排名 | 版本 | 得分 | 说明 |
|------|------|------|------|
| 1 | **Gemini清洗后** | **88.10分** | 最佳方案,但是时间成本高 |
| 2 | 腾讯清洗后 | 86.65分 | |
| 3 | Gemini清洗前 | 82.05分 | 时间成本高 |
| 4 | 腾讯清洗前 | 79.35分 | |
### 关键发现
| 结论 | 数据支撑 |
|------|---------|
| **Gemini优于腾讯会议** | 清洗后领先1.45分清洗前领先2.7分 |
| **Gemini画面提取是关键优势** | 可识别屏幕文字如HeyGen腾讯无此能力 |
| **Gemini分段识别更准确** | 按发言人分段,上下文更清晰;腾讯一大段混在一起,"P0"与"PE"混淆 |
| **85%差异源于执行波动** | 转写有正确内容但LLM未正确提取 |
| **15%差异源于转写质量** | 专有名词错误、优先级误判等 |
---
## 转写来源对比
| 转写来源 | 特点 | 版本 |
|---------|------|------|
| **Gemini** | 多模态(视频+音频),含画面内容提取 | 清洗前、清洗后(窗口交互对话) |
| **腾讯会议** | 纯语音转写 | 清洗前、清洗后Skill基础清洗+话题识别+发言人识别) |
| **手工修订版** | 人工校验基准 | - |
### 关键差异:画面内容提取
| 指标 | Gemini清洗前 | Gemini清洗后 | 腾讯会议 |
|------|-------------|-------------|---------|
| 画面内容标注数量 | 189处 | 70处 | **0处** |
| 能否识别屏幕上的文字 | ✅ 是 | ✅ 是 | ❌ 否 |
---
## 一、转写质量直接影响的差异(📝)
这些差异**直接由转写文本质量导致**Skill无法弥补
### 1.1 专有名词识别
| 正确写法 | Gemini转写 | 腾讯转写 | 影响 |
|----------|-----------|---------|------|
| 百度**曦灵** | 希壤 | 西林 | 产品名称错误 |
| **HeyGen** | 黑镜但画面提取到HeyGen | 黑镜 | Gemini清洗后正确其他错误 |
**结论**:
- Gemini画面内容提取可补充语音识别错误HeyGen案例
- 专有名词错误需后期词典校正
### 1.2 优先级记录差异
| 任务 | 正确优先级 | Gemini转写记录 | 腾讯转写记录 | 影响 |
|------|-----------|---------------|-------------|------|
| Gartner报告Skill | **P0** | ⚠️ P1 | ⚠️ P1 | 均误判为P1 |
**结论**: Gemini转写记录为"可以做P1",腾讯转写为"PE"误识别由于是后续说的“提升为P0”导致未识别理解到两者均导致会议纪要输出P1。这是转写质量+执行波动共同影响的案例。
### 1.3 内容覆盖差异
| 内容 | Gemini清洗前 | Gemini清洗后 | 腾讯清洗前 | 腾讯清洗后 |
|------|-------------|-------------|-----------|-----------|
| 服务器采购 | ✅ 有记录 | ❌ 无 | ❌ 无 | ❌ 无 |
**结论**: 部分内容仅在特定转写版本中存在。
---
## 二、转写来源对会议纪要各维度的影响
### 2.1 下周工作安排权重25%,最核心)
#### P0任务优先级准确性
| 任务 | 手工版 | Gemini清洗前 | 腾讯清洗前 | 腾讯清洗后 | Gemini清洗后 | 差异来源 |
|------|-------|-------------|-----------|-----------|-------------|----------|
| 招投标Skill架构设计 | P0 | ✅ P0 | ⚠️ **P1** | ✅ P0 | ✅ P0 | 🎲 执行波动 |
| Gartner报告Skill | **P0** | ⚠️ **P1** | ⚠️ **P1** | ⚠️ **P1** | ❌ 未列 | 📝 Gemini/腾讯转写均记录为P1 |
| 数字分身方案调研 | P0 | ⚠️ **P1** | ⚠️ **P1** | ✅ P0 | ⚠️ **P1** | 🎲 执行波动 |
#### 负责人识别准确性
| 任务 | 手工版 | Gemini清洗前 | 腾讯清洗前 | 腾讯清洗后 | Gemini清洗后 |
|------|-------|-------------|-----------|-----------|-------------|
| 会议纪要Skill优化 | 闫旭隆、郝倩玉 | 闫旭隆 | 闫旭隆 | 闫旭隆 | 闫旭隆 |
| 数字人PPT样本 | 江争达、陶西平 | 陶西平 | 江争达 | 江争达 | 江争达、陶西平 |
| 招投标Skill架构 | 郝倩玉、闫旭隆 | 闫旭隆 | 郝倩玉 | 郝倩玉 | 闫旭隆、郝倩玉 |
**结论**: Gemini清洗后负责人识别最完整其他版本普遍简化为单人。
### 2.2 问题拆分粒度
| 问题 | 手工版 | Gemini清洗前 | 腾讯清洗前 | 腾讯清洗后 | Gemini清洗后 |
|------|-------|-------------|-----------|-----------|-------------|
| P0/P1/P2优先级判断困难 | ✅ 独立 | ❌ 未列 | ❌ 未列 | ⚠️ 合并 | ✅ 独立 |
| 前端重构方案需完善 | ✅ 独立 | ❌ 合并 | ✅ 独立 | ❌ 未列 | ✅ 独立 |
**结论**: Gemini清洗后问题拆分最细致。
---
## 三、综合评分对比
### 3.1 各维度得分
| 评估维度 | 权重 | 手工版 | Gemini清洗前 | 腾讯清洗前 | 腾讯清洗后 | Gemini清洗后 |
|----------|------|-------|-------------|-----------|-----------|-------------|
| 会议信息 | 5% | 100 | 80 | 80 | 85 | 90 |
| 项目进展汇总 | 15% | 100 | 90 | 85 | 90 | 92 |
| 问题及解决方案 | 20% | 100 | 75 | 70 | 82 | 88 |
| **下周工作安排** | **25%** | 100 | 80 | 82 | 88 | 85 |
| 成员工作进展 | 15% | 100 | 85 | 80 | 85 | 88 |
| 会议总结 | 20% | 100 | 78 | 82 | 88 | 90 |
| **加权总分** | 100% | **100** | **82.05** | **79.35** | **86.65** | **88.10** |
### 3.2 转写来源效果对比
| 转写来源 | 清洗前 | 清洗后 | 清洗提升 |
|---------|--------|--------|----------|
| **Gemini** | 82.05分 | **88.10分** | +6.05分 |
| **腾讯会议** | 79.35分 | 86.65分 | +7.30分 |
| **来源差距** | Gemini领先2.7分 | Gemini领先1.45分 | - |
---
**报告生成时间:** 2025-12-09

View File

@ -0,0 +1,281 @@
# 工程类会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉、丁康
- **记录整理:** Claude
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
| ------------------------ | -------------- | ---------- | ------------------------------------------------------------ |
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成架构优化改为全量读取会议转写文本不采用索引搜索整理了字段映射逻辑图整个流程已固化。领导评价比上一版有进步整体逻辑可以先固化使用。存在问题文字转写准确性和上下文约束能力是核心瓶颈P0/P1/P2优先级判断难以自动化 |
| 需求澄清Skill测试与推广 | 闫旭隆 | 2025-12-02 | 已完成优化,加入多轮专家博弈机制(独立评审→交叉评价→交叉回应→最终整合),并录制了演示视频。领导建议:验证专家博弈环节的实际效果,将评估意见和响应打成一篇文档进行对照分析 |
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成需求文档整理包含五个第一阶段核心需求。下周行动计划1)时长从3-5分钟改为20-30分钟2)必须加入手势动作要求3)不能使用老外形象说流利中文4)本周尽快用真人训练数字人样本 |
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 相关领导处的需求尚未明确。下一步建议:自己调研市面上做得好的几个版本,分别出方案让需求方选择 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 进行中已完成接口规范文档确认功能模块清单正在对照核实中。领导建议后端代码不要动先用Claude 4.5或Codex做代码审查重构时必须考虑下一版本功能需求 |
### 2. 重点项目问题及解决方案
#### 问题1: 会议纪要文字转写准确性问题
**问题描述:**
会议纪要Skill的最大问题是文字转写的准确性和上下文约束能力不足。语音识别不清晰加上没有很好的上下文约束导致在已经非常清晰的上下文背景下开会时AI无法准确理解和提取信息。
**解决方案:**
1. 考虑使用Gemini进行多模态转写视频+音频+文字利用其100万token的超长上下文能力
2. 将转写文本先进行清洗加工,保证信息全面的同时内容紧凑,去除重复内容,在主窗口+子Agent中加载清洗后的会议转写文本
3. 调用Gemini API在Claude中处理转写后的文本
4. 尝试使用Gemini进行一次性生成会议纪要
**责任人:** 闫旭隆
**截止时间:** 2025-12-09
#### 问题2: 会议纪要P0/P1/P2优先级判断困难
**问题描述:**
AI难以准确判断任务的优先级P0/P1/P2因为缺少关键的潜在上下文信息如成员的年龄、级别、工作时间长短等这些都是分配工作时的潜意识上下文。
**解决方案:**
1. 在会议上直接确认P0/P1/P2优先级给AI一个明确的信号
2. 让AI先给出优先级建议人再给反馈确认
3. 每个人生成一份个人相关的优先级列表后确认
4. 保留确认过程的所有材料作为后续调优或微调的素材
5. 将潜在上下文成员背景信息显性化后提供给AI
**责任人:** 闫旭隆
**截止时间:** 2025-12-09
#### 问题3: Sub Agent在项目目录下调用的路径问题
**问题描述:**
测试发现Sub Agent在项目子目录下调用时存在问题不使用绝对路径时Agent会读取prompt但不执行使用绝对路径指定时才能正常调用。系统似乎默认优先查找全局Agent目录找不到就忽略。
**解决方案:**
1. 在Skill中调用Sub Agent时使用绝对路径指定Agent位置
2. 改用Agent调Agent的方式而非Skill调Agent
3. 定义一个主Agent来调用其他Agent保持逻辑清晰
4. 调试时使用Skill方式便于观察上下文调通后再迁移到Agent调Agent的架构
**责任人:** 江争达
**截止时间:** 2025-12-09
#### 问题4: 问答系统前端重构方案需完善
**问题描述:**
前端重构工作尚未完成,只做了一半。需要确保重构时考虑下一个版本的交互逻辑更改,避免架构调整后又需要重新修改或增加组件。
**解决方案:**
1. 用Opus 4.5或Codex对后端代码进行审查找出问题后记录下来
2. 找一个Code Review的Agent或Skill对代码进行审查
3. 让大模型生成一版前端重构方案,与现有方案对比差异
4. 把下一个版本的功能需求结合这次重构一起考虑
5. 提供示例代码(特别是与后端交互的逻辑代码)给大模型参考
**责任人:** 江争达
**截止时间:** 2025-12-09
#### 问题5: 数字人PPT讲解视频手势动作缺失
**问题描述:**
数字人PPT讲解视频中开场和结尾没有手势动作人物呆呆站着讲解效果不真实。
**解决方案:**
1. 在验收标准中加入手势动作要求
2. 修改数字人在PPT讲解视频中展现形式
3. 测试Veo 3.1的动作生成能力
**责任人:** 陶西平
**截止时间:** 2025-12-09
#### 问题6: 需求表达和背景说明不清晰
**问题描述:**
团队成员在汇报和文档中,需求表达和背景说明不够清晰,不交代核心诉求和问题点,导致其他人或大模型无法理解要解决什么问题。
**解决方案:**
1. 汇报时必须交代核心诉求和问题点
2. 给人可以口头补充,给大模型必须写下来
3. 站在其他人的角度思考,确保表达能被理解
4. 背景说明要特别详细
**责任人:** 全体成员
**截止时间:** 2025-12-09
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
| ----------------------------------------- | -------------- | ------------------------------------------------------------ | ------ | ---------- |
| 🔴 会议纪要Skill全量处理优化 | 闫旭隆、郝倩玉 | 用现版本、Gemini视频生成转写文本+主窗口清洗后加载、Gemini视频直接生成三种方式各生成一版会议纪要进行对比测试 | P0 | 2025-12-09 |
| 🔴 数字人PPT视频样本生成 | 江争达、陶西平 | 用百度曦灵和heygen平台训练自己真人的语音和视频生成数字人PPT讲解视频样本需包含手势动作视频时长支持20-30分钟 | P0 | 2025-12-08 |
| 🔴 Gemini分镜脚本生成测试 | 江争达、陶西平 | 使用Gemini 3.0 Pro生成视频分镜脚本和分镜图片再用VEO 3.1或其他模型生成视频,测试端到端数字人视频生成工作流 | P0 | 2025-12-09 |
| 🔴 问答系统V1.1前端重构 | 江争达、陶西平 | 重构前端展示和代码结构保留基础功能和后端不变需结合下一版本交互逻辑变更一起考虑先用大模型对后端代码进行code review | P0 | 2025-12-09 |
| 🔴 需求澄清Skill专家博弈优化 | 闫旭隆 | 查看专家交叉回应的字段映射,整理可视化效果,评估专家博弈环节对需求文档质量的提升效果 | P0 | 2025-12-09 |
| 🔴 投标商务应答自动生成系统Skill架构设计 | 郝倩玉、闫旭隆 | 设计投标商务应答自动生成系统Skill的架构方案 | P0 | 2025-12-09 |
| 🔴 Gartner报告解读转写Skill架构设计 | 郝倩玉、闫旭隆 | 设计Gartner报告转写Skill的架构涉及后续合同签约需求要求最晚12月中旬必须交付 | P0 | 2025-12-09 |
| 🔴 数字分身方案调研及方案撰写 | 郝倩玉 | 先调研市面上做得好的版本,分别出几个方案让需求方选择 | P0 | 2025-12-09 |
| 日报驱动项目管理系统Skill开发 | 丁康 | 开发基于会议纪要的日报生成系统Skill | P1 | 待定 |
| 完成问答系统前端重构需求文档 | 陶西平 | 完成问答系统前端重构需求文档 | P1 | 2025-12-09 |
| 服务器采购 | 江争达 | 尽快采购,先确认好需要部署哪些软件 | P1 | 2025-12-09 |
| Skill Plugin管理系统搭建 | 江争达 | 学习并搭建内部Skill Marketplace管理团队开发的所有Skill | P2 | 待定 |
| Claude Skill转Langchain/Langgraph架构研究 | 闫旭隆 | 研究如何将Claude Code Skill转移到Langchain/Langgraph的低代码架构做一个小功能进行学习验证 | P2 | 待定 |
### 4. 组内成员工作进展
#### 江争达
**上周完成:**
- ✅ 数字人PPT需求文档
**进行中:**
- 🔄 完成问答系统v1.1前端重构方案
- 🔄 PDF Skill技术调研待开始
- 🔄 Skill Plugin管理系统搭建待开始
- 🔄 服务器采购(待开始)
- 🔄 招投标文件Skill架构调试待开始
- 🔄 日报驱动系统需求研究(待开始)
**收到的反馈/学习建议:**
- **批评:** 需求文档分析存在很大问题,不站在其他人的角度去思考,其他人听不懂你讲什么。核心诉求点没有说清楚,背景不交代清楚导致没人看得懂文档
- **批评:** 表达能力需要提升,没有表达能力就没法跟大模型打交道
- **建议:** 问答系统前端重构方案需要把下个版本可能修改的逻辑先考虑进去
- **建议:** 后端代码先不要动先用Opus 4.5或Codex做一遍代码审查
- **建议:** 前端重构方案需要用大模型重新生成一版,与现有方案对比差异
- **建议:** 提供示例代码,特别是与后端交互的逻辑代码应该提供给大模型参考
- **建议:** Claude 4.5幻觉还是很高的日常问答以GPT o1为主可能会比较好
**下周任务:**
- [ ] 🔴 P0问答系统V1.1前端重构
- [ ] 🔴 P0数字人PPT视频样本生成
- [ ] 🔴 P0Gemini分镜脚本生成测试
- [ ] P1PDF Skill技术调研
- [ ] P1服务器采购
- [ ] P2Skill Plugin管理系统搭建
#### 闫旭隆
**上周完成:**
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制,录制视频
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文录制视频
**进行中:**
- 🔄 招投标文件Skill架构设计
**收到的反馈/学习建议:**
- **表扬:** 会议纪要Skill架构改进获得认可改用全量读取替代索引搜索的方案是正确的字段映射逻辑图也得到肯定
- **表扬:** 会议纪要Skill的测试结果与人工订正版本相比"比上面是有进步了""该有的要点是有"
- **建议:** 尝试使用主窗口全量处理替代分块agent搜索可能效果更好同时建议用Gemini做会议转写测试
- **建议:** 招投标Skill架构设计作为P0任务需要本周完成同时Gartner报告转写也需要先设计架构
- **建议:** 会议纪要的下周工作安排提取是最核心的功能需要重点优化P0/P1优先级判断的准确性
**下周任务:**
- [ ] 🔴 P0会议纪要Skill全量处理优化及gemini方案对比测试
- [ ] 🔴 P0需求澄清多专家博弈阶段效果可视化展示
- [ ] 🔴 P0招投标Skill架构设计
- [ ] 🔴 P0Gartner报告转写Skill架构设计
#### 郝倩玉
**上周完成:**
- ✅ 会议纪要Skill架构优化协助旭隆优化学习类+Q&A类会议纪要Skill逻辑
- ✅ Gartner 报告解读转写系统需求对接及文档撰写,确定版需求文档已发旭隆。
- ✅ 问答系统V1.0测试推动(多次与媛媛沟通)
- ✅数字分身需求对接
**进行中:**
- 🔄 招投标文件Skill架构设计投标商务响应文件自动生成系统需求文档已完成
**收到的反馈/学习建议:**
- **建议:** 招投标Skill架构设计后续需要针对需求部分再次讨论确认因为有些需求不一定合理
- **建议:** Gartner报告转写系统架构设计需要尽快完成因为涉及年末签合同可能有30万的业务机会优先级提升为P0
- **建议:** 数字分身需求方面,由于合作方需求不明确,需要自己先调研市面上比较好的版本,做出多个方案供选择
**下周任务:**
- [ ] 🔴 P0参与优化会议纪要Skill
- [ ] 🔴 P0参与设计招投标Skill架构
- [ ] 🔴 P0参与设计Gartner报告转写Skill架构
- [ ] 🔴 P0数字分身方案调研
#### 陶西平
**上周完成:**
- ✅ 数字人PPT需求文档协助江老师修改需求文档
- ✅ 学习使用Claude Code的document skill使用pdf skill的表单填写功能
- ✅ 调研数字人平台的公共数字人能力,收集总结相关目标数字人平台价格信息
**进行中:**
- 🔄 数字人与ppt结合生成一个基于指定PPT的数字人视频
- 🔄 前端框架重构(对问答系统前端功能进行分析)
**收到的反馈/学习建议:**
- **肯定:** 陶西平提供的数字人调研文档被团队成员引用,作为数字人平台费用对比的基础参考资料
**下周任务:**
- [ ] 🔴 P0数字人PPT视频样本生成
- [ ] 🔴 P0Gemini分镜脚本生成测试
- [ ] P1完成问答系统前端重构需求文档
---
## 三、会议总结
**核心议题:** 会议纪要Skill优化、数字人PPT视频生成、问答系统前端重构、招投标/Gartner报告Skill架构设计
**关键决策:**
1. **会议纪要转写采用Gemini多模态视频处理方案:** 领导测试发现Gemini 3.0 Pro可以直接上传会议视频生成转写文本多模态能力最强上下文最长效果优于纯语音转写
2. . **进展情况以会议转写为优先,周报作为补充:** 会议中发现转写文本更能反映实际进展情况
3. **P0/P1/P2优先级判断需要人工确认:** AI缺乏隐性上下文如成员资历、工作时长等建议先让AI给出优先级建议然后由人工确认
4. **数字人PPT视频主需求调整为支持20-30分钟时长:** 实际使用场景如PPT宣讲、会议发言需要20-30分钟
5. **数字人形象必须使用中国人,不能用老外说流利中文:** 确保形象和语言匹配,追求真实性
6. **数字人视频第一阶段必须包含手势动作:** 开场和结尾的手势动作是必须的,不能呆板站立讲解
7. **本周完成数字人真人训练视频样本:** 要求本周末前用自己真人训练出语音和视频样本
8. **使用Gemini 3.0生成分镜头脚本和图片,再用其他平台生成视频:** 这是目前最有效的动画视频制作路径
9. **前端重构只改展示部分,后端不动但需做代码审查:** 用Codex或大模型做一遍代码审查找出问题记录下来
10. **Sub Agent调用必须使用绝对路径指定:** 项目下的sub agent不指定绝对路径时调用不稳定
11. **推荐使用Agent调用Agent的方式而非Skill调用Sub Agent:** 这样调用更清晰,上下文共享更好
12. **招投标Skill架构设计提升为P0任务:** 因为涉及年末演示和签合同可能有30万收入
13. **Gartner报告转写Skill提升为P0任务:** 同样因为紧急需求
**下周工作重点:**
1. 🔴 会议纪要Skill全量处理优化对比Gemini转写与腾讯会议转写效果
2. 🔴 数字人PPT视频样本生成本周末前完成真人训练
3. 🔴 招投标Skill和Gartner报告转写Skill架构设计
4. 🔴 问答系统V1.1前端重构,需先做代码审查
5. 🔴 需求澄清Skill专家博弈效果验证和流程图梳理
6. 🔴 数字分身方案调研,主动出多个版本供选择
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-02
**下次会议:** 2025-12-09

View File

@ -0,0 +1,156 @@
# Q&A资源库类会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉
---
## 二、工作问题 Q&A
### 1. 会议纪要Skill相关问题
**Q1: 会议纪要语音转写准确性不足怎么解决?**
**问题描述:** 语音识别效率低,文字转写的准确性不足,上下文约束能力差。转写文本有大量重复、错误和逻辑中断。
**解决方案:**
- 使用Gemini多模态能力处理视频转写直接上传视频给Gemini生成会议纪要
- 先清洗转写文本去除重复、脏数据再进行处理生成紧凑的clean版本
- 改为全量读取上下文方式,不用索引搜索,让模型通过语义理解提取信息
- 考虑调用Gemini API在Claude里面处理转写实现自动化
**Q2: 会议纪要P0/P1/P2优先级判断不准确怎么办**
**问题描述:** 模型很难准确判断任务的优先级,因为缺少成员的年龄、级别、工作时间等潜在上下文信息。
**解决方案:**
- 让模型先给出优先级建议,人再进行确认反馈
- 在会上直接确认P0/P1/P2给模型明确的文字信息
- 逐步把潜在上下文显性化,作为输入提供给模型
- 保留确认过程的所有材料,作为后续微调训练数据
### 2. Agent架构相关问题
**Q3: Sub Agent调用时相对路径不可靠怎么办**
**问题描述:** 在项目目录下调用全局Agent时使用相对路径调用不可靠。不指定绝对路径时Sub Agent会读取提示词但不会按照预期执行。
**解决方案:**
- 使用绝对路径调用Sub Agent确保路径指向正确位置
- 建议用Agent调Agent而非Skill调Agent逻辑更清晰
- Skill调Skill在主窗口上下文共享控制更精确
- 调试时用Skill形式调通后再移植到Agent中
**Q4: Skill调Agent和Agent调Agent哪个更好**
**问题描述:** 在编排复杂流程时,需要选择合适的调用方式。
**解决方案:**
- **Agent调Agent更推荐:** 逻辑更清晰,更智能
- **Skill调Skill的优势:** 主窗口上下文共享,控制更精确
- **调试建议:** 调试时用Skill形式上下文可见调通后再移植到Agent
- **架构建议:** 非必要情况下不要在Skill里面调用Sub Agent会导致逻辑割裂
### 3. 需求文档相关问题
**Q5: 需求文档如何区分默认需求和核心需求?**
**问题描述:** 数字人PPT需求文档时间要求不准确3-5分钟应为20-30分钟说明需求理解存在偏差。
**解决方案:**
- 先明确目标用户的真实使用场景如PPT宣讲一般需要20-30分钟
- 区分"不提也会做"的默认需求和"必须明确"的核心需求
- 需求文档要站在其他人角度思考,让非技术人员也能看懂
**Q6: 如何提升需求表达能力?**
**问题描述:** 需求文档分析问题大,不站在其他人角度思考,核心诉求没说清楚。
**解决方案:**
- 给大模型的提示词必须写详细完整,口头表达时可以简略
- 先交代背景和核心诉求,再说具体内容
- 用deep research或GPT做方案校验
- 把方案给大模型审查,看有什么值得借鉴或存在的问题
### 4. 前端重构相关问题
**Q7: 前端重构如何避免二次返工?**
**问题描述:** 前端重构方案只完成了一半,未考虑下一版本的交互逻辑更改。
**解决方案:**
- 在重构时就考虑下一版本的功能需求
- 后端先用代码审查工具审查一遍,记录问题
- 用deep research或GPT生成前端重构方案对比
- 对照流程图验证方案的准确性
---
## 三、重点工作方法
### 方法1: Gemini多模态视频转写方法
**方法描述:** 使用Gemini的多模态能力直接处理会议视频生成会议纪要。
**适用场景:** 会议纪要生成、视频内容提取
**关键要点:**
- 直接上传视频给Gemini配合会议纪要模板
- 多模态能力可以同时处理视频、音频、文字
- 比纯文字转写后再处理效果更好
- API调用成本可接受半小时约6000字2万多token
### 方法2: PPT自动化生成方法
**方法描述:** 使用Gemini 3.0生成分镜脚本和图片,再通过视频生成平台合成视频。
**适用场景:** PPT自动生成、视频内容创作
**关键要点:**
- 先用Gemini生成分镜头脚本
- 让Gemini生成每个分镜的图片
- 使用首尾帧+文字通过VEO 3.1等平台生成视频
- 使用Playwright MCP实现浏览器自动化操作
### 方法3: Agent架构调试方法
**方法描述:** 先用Skill形式调试调通后再移植到Agent中。
**适用场景:** 复杂Agent流程开发
**关键要点:**
- 调试时用Skill形式上下文可见便于定位问题
- 调通后移植到Agent实现上下文隔离
- 使用绝对路径调用Sub Agent
- 建议用Agent调Agent而非Skill调Agent
### 方法4: 需求文档审查方法
**方法描述:** 使用大模型对需求文档进行多角度审查。
**适用场景:** 需求文档质量提升
**关键要点:**
- 先用deep research或GPT生成参考方案
- 把自己的方案给大模型审查
- 对比两个方案的差异
- 关注核心需求而非默认功能
### 方法5: 代码审查方法
**方法描述:** 使用Claude 4.5或GPT codex对代码进行审查。
**适用场景:** 代码重构前的问题发现
**关键要点:**
- 先审查再重构,避免带病开发
- 审查出来的问题记录下来作为需求文档
- 使用专业的code review工具或Agent
- 下一次会议讨论是否需要修改
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-02
**下次会议:** 2025-12-09

View File

@ -0,0 +1,79 @@
# 云大所需求相关进度会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉
---
## 二、需求项目进展
| 项目名称 | 负责人 | 本周进展 | 存在问题 | 下周计划 | 优先级 |
|----------|--------|----------|----------|----------|--------|
| 投标商务应答自动生成系统 | 郝倩玉、闫旭隆、江争达 | 需求文档已完成并已发给闫旭隆确认 | 架构设计尚未开始 | 需求文档确认+Skill架构设计 | P0 |
| 数字人项目 | 江争达、陶西平、郝倩玉 | 江争达展示修改后的需求文档;陶西平完成数字人平台调研 | 时间要求理解错误应为20-30分钟缺少手势动作要求数字分身需求不明确 | 完成真人训练视频样本(百度曦灵/黑镜修改需求文档Gemini分镜脚本测试 | P0 |
| Gartner 报告解读转写系统 | 郝倩玉 | 需求文档已完成 | 架构设计尚未开始 | 架构设计(需求紧急,涉及年末签约) | P0 |
| 运营商信息精准爬取系统 | 郝倩玉 | 进行中,持续跟进 | 需求方需求不明确 | 继续跟进沟通 | P1 |
| 客户风险推送自动化系统 | - | 未讨论 | - | - | - |
| 邮件自动处理转发系统 | - | 未讨论 | - | - | - |
| 证书信息提取系统 | - | 未讨论 | - | - | - |
| 云大阁新报告自动推送 | - | 未讨论 | - | - | - |
---
## 三、问题与风险
### 投标商务应答自动生成系统
**问题描述:** 需求文档已完成,但架构设计尚未开始
**解决方案:**
1. 闫旭隆确认需求文档并设计Skill架构
2. 江争达负责后期调试
**责任人:** 郝倩玉、闫旭隆、江争达
**截止时间:** 2025-12-09
### 数字人项目
**问题1: 需求文档时间要求不准确**
- 问题需求文档写3-5分钟实际需求应为20-30分钟
- 解决方案:修改视频时长要求
**问题2: 缺少手势动作要求**
- 问题:开场和结束时数字人不能呆呆站着
- 解决方案:在验收标准中增加手势动作要求
**问题3: 数字分身需求不明确**
- 问题:合作方需求一直不能明确
- 解决方案:自己调研市面上的方案,做几个版本供选择
**责任人:** 江争达、郝倩玉
**截止时间:** 2025-12-09
### Gartner 报告解读转写系统
**问题描述:** 需求紧急涉及年末签约可能有30万合同
**解决方案:**
1. 本周完成架构设计
2. 优化可以后续迭代,先有个基本架构
**责任人:** 郝倩玉
**截止时间:** 2025-12-09
---
## 四、下周重点
1. 🔴 **投标商务应答自动生成系统** - 需求文档确认 + Skill架构设计
2. 🔴 **数字人项目** - 完成真人训练视频样本(百度曦灵/黑镜)
3. 🔴 **数字人项目** - Gemini 3.0生成分镜脚本测试
4. 🔴 **数字人项目** - 修改需求文档(时长+手势动作)
5. 🔴 **Gartner 报告解读转写系统** - 架构设计
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-02
**下次会议:** 2025-12-09

View File

@ -0,0 +1,246 @@
# 工程类会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|----------|----------|------------|--------------|
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成改进版本,改为全量加载方式(不用索引搜索),绘制了映射逻辑图。领导评价:整体有进步,基本逻辑可以固化下来先用;建议尝试用主窗口全量处理 |
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成二阶段专家博弈机制开发,新增专家交叉评价和交叉回应功能。领导评价:效果不错,专家博弈机制有价值;建议把评估意见和响应打成文档对比验证 |
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已展示修改后的需求文档但需求理解存在偏差。领导反馈时间要求应为20-30分钟而非3-5分钟缺少手势动作要求需要本周完成用真人训练数字人视频样本 |
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 进行中,合作方需求不明确。领导建议:自己调研市面上的方案,做几个版本供选择 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 前端重构方案只完成了一半。领导建议:后端先用代码审查工具审查一遍;前端重构要考虑下一版本的交互逻辑 |
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 需求文档已完成并已发给闫旭隆被提升为P0任务。领导要求需要尽快设计架构 |
### 2. 重点项目问题及解决方案
#### 问题1: 会议纪要语音转写准确性问题
**问题描述:**
语音识别效率低,文字转写的准确性不足,上下文约束能力差。会议中很多语言不清晰,直接搜索提取不出来。转写文本有大量重复、错误和逻辑中断,导致难以阅读和处理。
**解决方案:**
1. 使用Gemini多模态能力处理视频转写直接上传视频给Gemini生成会议纪要
2. 先清洗转写文本去除重复、脏数据再进行处理生成紧凑的clean版本
3. 改为全量读取上下文方式,不用索引搜索,让模型自己通过语义理解提取信息
4. 考虑调用Gemini API在Claude里面处理转写实现自动化
**责任人:** 闫旭隆
**截止时间:** 2025-12-09
#### 问题2: Sub Agent调用机制问题
**问题描述:**
在项目目录下调用全局Agent时使用相对路径调用不可靠。测试发现不指定绝对路径时Sub Agent会读取提示词但不会按照预期执行只有使用绝对路径调用时才能正常工作。
**解决方案:**
1. 使用绝对路径调用Sub Agent确保路径指向正确位置
2. 建议用Agent调Agent而非Skill调Agent逻辑更清晰
3. Skill调Skill在主窗口上下文共享控制更精确
4. 调试时用Skill形式调通后再移植到Agent中
**责任人:** 江争达、闫旭隆
**截止时间:** 2025-12-09
#### 问题3: 数字人PPT需求文档相关问题
**问题描述:**
- 时间要求不准确需求文档中写的3-5分钟视频时长不准确实际需求应该是20-30分钟的PPT宣讲视频
- 缺少手势动作要求:第一阶段需求中没有包含手势动作要求,但开场和结束时数字人不能呆呆站着讲
**解决方案:**
1. 将视频时长要求修改为20-30分钟3-5分钟作为基础能力
2. 在验收标准中增加开场和结束的手势动作要求
3. 前十秒和后十秒必须有手势动作,可以没有躯体动作但手势必须有
**责任人:** 江争达
**截止时间:** 2025-12-09
#### 问题4: 问答系统前端重构方案未完成
**问题描述:**
前端重构方案只完成了一半,只重构了前端展示部分和代码结构,但未考虑下一版本的交互逻辑更改,可能导致架构调整通不过或需要大量修改。
**解决方案:**
1. 用代码审查工具如Claude Code或Opus 4.5)先审查后端代码,找出问题记录下来
2. 在重构时考虑下一版本的功能需求,避免二次返工
3. 用deep research或GPT的research功能生成前端重构方案对比
4. 对照流程图验证方案的准确性
**责任人:** 江争达
**截止时间:** 2025-12-09
#### 问题5: 数字分身需求不明确
**问题描述:**
合作方(通过市场部对接)的需求一直不能明确,杜主任反馈合作方可能用不用还不确定,导致需求对接工作难以推进。
**解决方案:**
1. 自己做几个版本的数字分身方案,让市场部/合作方选择
2. 调研市面上做得好的数字分身案例,分别出方案
3. 持续与相关人员(琳贤等)沟通跟进
**责任人:** 郝倩玉
**截止时间:** 2025-12-09
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|----------|--------|--------------|--------|----------|
| 🔴 会议纪要Skill腾讯会议版本生成 | 闫旭隆 | 用腾讯会议转写文本生成一版会议纪要与Gemini转写版本对比效果 | P0 | 2025-12-09 |
| 🔴 会议纪要Skill Gemini版本生成 | 闫旭隆 | 使用Gemini视频转写功能直接生成会议纪要测试多模态转写效果 | P0 | 2025-12-09 |
| 🔴 需求Skill二阶段专家博弈字段映射 | 闫旭隆 | 整理二阶段专家交叉评价、交叉回应的字段映射逻辑,做可视化效果展示 | P0 | 2025-12-09 |
| 🔴 数字人PPT真人训练视频样本 | 江争达 | 本周完成用真人训练的数字人视频样本,测试百度西林和黑镜两个平台 | P0 | 2025-12-09 |
| 🔴 Gemini 3.0生成分镜脚本测试 | 江争达 | 使用Gemini 3.0生成分镜头脚本和分镜图片再通过VEO 3.1等平台生成视频 | P0 | 2025-12-09 |
| 🔴 数字人PPT需求文档修改 | 江争达 | 根据会议反馈修改需求文档将视频时长从3-5分钟改为20-30分钟增加手势动作要求 | P0 | 2025-12-09 |
| 🔴 问答系统前端重构方案完善 | 江争达 | 继续完善前端重构方案,考虑下一版本交互逻辑的修改,结合大模型审查方案 | P0 | 2025-12-09 |
| 🔴 问答系统后端代码审查 | 江争达 | 使用Claude 4.5或GPT codex等代码审查工具对后端代码进行一遍审查记录问题 | P0 | 2025-12-09 |
| 🔴 招投标文件Skill需求文档确认 | 郝倩玉 | 确认投标商务响应文件自动生成系统的需求文档,确保需求合理明确 | P0 | 2025-12-09 |
| 🔴 Gartner报告解读转写系统架构设计 | 郝倩玉 | 设计Gartner报告解读转写系统的架构需求紧急涉及年末签约 | P0 | 2025-12-09 |
| 🔴 协助会议纪要Skill优化 | 郝倩玉 | 协助闫旭隆优化会议纪要Skill包括学习类和Q&A类会议纪要逻辑 | P0 | 2025-12-09 |
| 🔴 配合前端框架重构 | 陶西平 | 配合江老师完成问答系统前端框架重构相关工作 | P0 | 2025-12-09 |
| 招投标文件Skill架构设计 | 闫旭隆 | 设计招投标文件自动生成系统的Skill架构 | P1 | 2025-12-09 |
| 招投标文件Skill架构调试 | 江争达 | 协助调试招投标文件Skill架构 | P1 | 2025-12-09 |
| 数字分身需求调研与方案 | 郝倩玉 | 调研市面上较好的数字分身版本,制定多个方案供选择 | P1 | 2025-12-09 |
| 日报驱动项目管理系统Skill开发 | 丁康 | 开发日报驱动的项目管理系统Skill包括基于会议纪要生成日报、与MCP对接等功能 | P2 | 待定 |
| Claude Code Skill转LangGraph架构研究 | 郝倩玉 | 研究如何将Claude Code Skill转移到LangGraph低代码架构作为探索性项目 | P2 | 待定 |
### 4. 组内成员工作进展
#### 闫旭隆
**上周完成:**
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文
**进行中:**
- 🔄 会议纪要Skill架构持续优化
**收到的反馈/学习建议:**
- **表扬:** 会议纪要Skill整体有进步基本逻辑可以固化下来先用
- **建议:** 尝试用主窗口全量处理一次可能效果更好不要过于依赖子Agent分块处理
- **建议:** 先清洗转写文本(去除重复、脏数据),再做处理,保证信息全面同时内容紧凑
- **表扬:** 需求Skill的专家博弈机制效果不错
- **建议:** 把专家评估意见和最后响应打成一篇文档对比验证效果
- **建议:** 映射逻辑图很重要要把逻辑写进skill里保持一致性
- **建议:** 会议纪要最核心目的是下周工作安排,所有逻辑都应围绕这个目标展开
**下周任务:**
- [ ] 🔴 P0会议纪要Skill腾讯会议版本生成
- [ ] 🔴 P0会议纪要Skill Gemini版本生成
- [ ] 🔴 P0需求Skill二阶段专家博弈字段映射
- [ ] P1招投标文件Skill架构设计
#### 江争达
**上周完成:**
- ✅ 数字人PPT需求文档初版
**进行中:**
- 🔄 完成问答系统v1.1前端重构方案
- 🔄 Sub Agent调用机制调研测试
**收到的反馈/学习建议:**
- **批评:** 数字人PPT需求文档时间要求不准确3-5分钟应为20-30分钟
- **批评:** 数字人需求缺少手势动作要求,开场和结束不能没有动作
- **建议:** 前端重构要考虑下一版本的交互逻辑
- **建议:** 后端先用代码审查工具如codex审查一遍
- **批评:** Sub Agent调用测试的背景说明不清楚核心诉求没说清楚
- **批评:** 表达能力/提问题表达能力需要提升,不站在其他人角度思考
- **建议:** 给大模型的提示词必须写详细完整,口头表达时可以简略,但给大模型时必须写清楚
- **建议:** 前端重构方案要用deep research或GPT做校验
**下周任务:**
- [ ] 🔴 P0数字人PPT真人训练视频样本
- [ ] 🔴 P0Gemini 3.0生成分镜脚本测试
- [ ] 🔴 P0数字人PPT需求文档修改
- [ ] 🔴 P0问答系统前端重构方案完善
- [ ] 🔴 P0问答系统后端代码审查
- [ ] P1招投标文件Skill架构调试
#### 郝倩玉
**上周完成:**
- ✅ 会议纪要Skill架构优化协助闫旭隆
- ✅ Gartner报告解读转写系统需求对接及文档撰写
**进行中:**
- 🔄 招投标文件Skill架构设计
- 🔄 数字分身需求文档
- 🔄 问答系统V1.0测试推动
**收到的反馈/学习建议:**
- **任务分配:** 招投标文件Skill需求已确认提升为P0
- **任务分配:** Gartner报告解读转写系统需要先设计架构提升为P0
- **建议:** 数字分身需求继续跟进,自己调研市面上的方案,做几个版本供选择
- **建议:** Gartner报告转写系统虽然不难但优化比较难先做出一个基本架构
**下周任务:**
- [ ] 🔴 P0招投标文件Skill需求文档确认
- [ ] 🔴 P0Gartner报告解读转写系统架构设计
- [ ] 🔴 P0协助会议纪要Skill优化
- [ ] P1数字分身需求调研与方案
- [ ] P2Claude Code Skill转LangGraph架构研究
#### 陶西平
**上周完成:**
- ✅ 数字人PPT需求文档协助江老师
- ✅ 学习使用claudecode的document skill使用pdf skill的表单填写功能
- ✅ 调研数字人平台的公共数字人能力
**进行中:**
- 🔄 数字人与ppt结合生成指定PPT的数字人视频
- 🔄 前端框架重构(对问答系统前端功能进行分析)
**收到的反馈/学习建议:**
- **建议:** 数字人PPT需求文档中视频时长需求不准确应该将20-30分钟作为主要需求
- **建议:** 需求文档应考虑数字人手势动作至少前10秒和后10秒要有手势动作
- **建议:** 使用Gemini 3.0生成分镜头脚本和图片再用VEO 3.1等生成视频
**下周任务:**
- [ ] 🔴 P0配合江老师前端框架重构相关工作
- [ ] P1完成数字人调研报告
- [ ] P1完成PPT与数字人结合调研
---
## 三、会议总结
**核心议题:** 会议纪要Skill优化、数字人PPT需求文档、问答系统前端重构、招投标文件Skill架构设计
**关键决策:**
1. **会议纪要Skill方案确定:** 先用当前版本固化流程,后续尝试主窗口全量处理
2. **会议转写方案:** 使用Gemini多模态能力处理视频转写可能是最有效的路径
3. **数字人平台选型:** 重点测试百度曦灵和黑镜两个平台,本周完成真人训练样本
4. **Agent架构决策:** 建议用Agent调Agent而非Skill调Skill更清晰
5. **招投标Skill优先级提升:** 提升为P0因为涉及潜在合同30万
6. **Gartner报告系统优先级提升:** 提升为P0市场部需要年末演示
7. **日报驱动系统负责人确定:** 由丁康负责作为P2任务
8. **PPT自动化方案:** 使用Gemini 3.0生成分镜脚本+图片,再生成视频
9. **数字人PPT讲解时长需求调整:** 从3-5分钟改为支持20-30分钟
10. **前端重构需考虑下一版本交互逻辑**
11. **后端代码先进行审查再重构**
**下周工作重点:**
1. 🔴 会议纪要Skill优化腾讯会议版本 + Gemini版本对比测试
2. 🔴 数字人PPT完成真人训练视频样本百度曦灵/黑镜)
3. 🔴 数字人PPTGemini 3.0生成分镜脚本测试
4. 🔴 问答系统:前端重构方案完善 + 后端代码审查
5. 🔴 招投标文件Skill需求确认 + 架构设计
6. 🔴 Gartner报告解读转写系统架构设计
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-02
**下次会议:** 2025-12-09

View File

@ -0,0 +1,171 @@
# Q&A资源库类会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
---
## 二、工作问题 Q&A
### 1. 会议纪要Skill相关问题
**Q1: 会议转写文本语音识别错误多,说话者标记不准确怎么办?**
**A:**
1. 使用Gemini多模态能力进行视频转写直接上传视频而非仅依赖语音
2. 对转写文本进行预清洗,去除重复和脏数据
3. 多模态转写能提供画面切换、屏幕操作等额外上下文信息
**Q2: AI难以准确判断P0/P1/P2任务优先级怎么办**
**A:**
1. 让AI先给出优先级建议人再确认反馈
2. 在会上直接语音确认优先级给AI明确输入
3. 保留确认过程的所有材料作为后续微调素材
4. 原因AI缺少成员年龄、级别、工作时长等潜意识上下文
**Q3: 并行Agent处理会造成信息丢失和逻辑割裂怎么办**
**A:**
1. 采用全量加载让主窗口一次性处理,而非分块搜索
2. 人的语言有大量不清晰表达,直接搜索难以匹配
3. AI通过上下文语义理解能更准确提取信息
4. 把skill写到主窗口里一次性处理效果不比分块差
### 2. 数字人PPT相关问题
**Q4: 数字人PPT视频时长需求如何定义**
**A:**
1. 应定义为20-30分钟而非3-5分钟
2. 实际场景包括PPT宣讲20-30分钟、创始人讲解、领导发言等
3. 技术上没有难度,主要是花销问题
4. 3-5分钟作为最小实现但20-30分钟是主要需求
**Q5: 如何避免数字人看起来很假(如老外说流利中文)?**
**A:**
1. 使用真人录制训练数字人语音和形象
2. 在百度曦灵和黑镜平台测试定制数字人效果
3. 避免使用看起来不真实的数字人形象
4. 数字人的手势动作也要有,开场和结尾不能呆呆站着
### 3. Skill调用机制问题
**Q6: 项目级调用全局Agent不稳定怎么办**
**A:**
1. 使用绝对路径调用SubAgent测试表现稳定
2. 不指定路径时系统默认搜索全局目录,找不到就忽略
3. 改用Agent调Agent方式而非Skill调Agent
4. 在子项目下定义主Agent通过主Agent调用其他Agent
**Q7: Skill嵌套调用的最佳方式是什么**
**A:**
1. 精确逻辑控制场景Skill嵌套Skill优于SubAgent
2. Skill共享主窗口上下文逻辑控制精确
3. SubAgent不带上下文容易出现逻辑割裂
4. 调试阶段用Skill主窗口加载方式调通后再移植
### 4. 前端重构相关问题
**Q8: 前端重构前需要做什么准备?**
**A:**
1. 用大模型对后端代码做Code Review审查
2. 找专门的code review agent或skill
3. 记录发现的问题作为需求文档
4. 重构时考虑下一版本的交互逻辑变更
5. 提供示例代码给大模型,保持代码风格一致
---
## 三、重点工作方法
### 方法 1多模态视频转写会议纪要
- **方法描述:** 使用Gemini的多模态能力直接上传会议视频进行转写而非仅依赖纯语音识别。视频包含文字、图像、音频等多种信息能提供更丰富的上下文如画面切换、屏幕操作等转写准确性更高。可以直接给视频配合会议纪要模板一步生成结构化会议纪要。
- **适用场景:** 会议纪要生成、视频内容提取
- **关键要点:**
- 多模态信息比纯音频更准确
- 可直接配合模板一步生成
- 画面信息提供额外上下文
### 方法 2模型工具组合策略
- **方法描述:** 前端开发用Gemini一句话就能生成完整前端中间逻辑代码构造用Claude Code工具调用和理解能力最强整体项目修复和测试用GPT的Codex。如果只能选一个主力还是Claude Code因为做Agent时工具理解能力最重要。
- **适用场景:** AI辅助开发、工具选型
- **关键要点:**
- 前端→Gemini
- 逻辑代码→Claude Code
- 修复测试→GPT Codex
### 方法 3全量上下文处理优于分块搜索
- **方法描述:** 会议纪要信息提取应采用全量加载转写文本让AI自行提取而非分块搜索。因为人的语言有大量不清晰表达直接搜索难以匹配AI通过上下文语义理解能更准确提取信息。
- **适用场景:** 会议纪要生成、文本信息提取
- **关键要点:**
- 分块搜索容易丢失信息
- AI语义理解比关键词匹配更准确
- 全文一次性处理效果最好
### 方法 4文字转写预清洗
- **方法描述:** 在进行会议纪要生成前,先对原始转写文本进行一次清洗加工:去除重复内容、脏数据,保证信息全面的同时内容紧凑。清洗后的文本再作为主窗口的上下文输入。
- **适用场景:** 会议纪要处理、长文本处理
- **关键要点:**
- 去除重复和脏数据
- 保持信息完整性
- 减少每个Agent的处理负担
### 方法 5优先级判断人机协作
- **方法描述:** P0/P1/P2任务优先级判断是AI最难的部分因为AI缺乏成员年龄、级别、工作时长等潜意识上下文。解决方案让AI先给出优先级建议人再确认反馈或在会上直接语音确认优先级。
- **适用场景:** 任务优先级评估、工作安排
- **关键要点:**
- AI给建议、人做确认
- 保留确认材料用于后续优化
- 尝试将隐性上下文显性化
### 方法 6Agent调Agent优于Skill调Agent
- **方法描述:** 在Claude Code中组织多Agent时建议用Agent调用Agent而非Skill调用Agent。在子项目下定义一个主Agent激活后用它调用其他子Agent。这样组织更清晰不会出现Skill嵌套Skill的逻辑混乱。
- **适用场景:** 多Agent编排、复杂Skill开发
- **关键要点:**
- 定义主Agent负责调度
- 避免Skill嵌套的逻辑混乱
- SubAgent必须用绝对路径调用
### 方法 7试错式行为规范定义
- **方法描述:** 定义Agent行为规范时不要预先规定太多动作会限制能力而是先让它犯错然后针对性地告诉它'必须做什么'(漏了的)、'不要做什么'(错了的)。用正确示例和错误示例对比来规范行为。
- **适用场景:** Skill开发、Agent行为规范
- **关键要点:**
- 预先规定太多会限制AI能力
- 先测试再针对性规范
- 正确/错误示例对比最有效
### 方法 8代码审查先于重构
- **方法描述:** 重构代码前先用大模型如Claude 4.5、GPT Codex对现有代码进行审查Code Review找专门的code review agent或skill。记录发现的问题作为需求文档评估后再决定是否修改避免盲目重构。
- **适用场景:** 代码重构、质量改进
- **关键要点:**
- 审查先行,避免盲目重构
- 问题记录作为需求文档
- 下次会议评估是否修改
### 方法 9提问表达能力决定AI输出质量
- **方法描述:** 与AI交互时必须清晰交代背景、核心诉求和问题点。站在对方角度思考如果不补充这些上下文对方能否理解你要干什么表达不清会导致AI给出糟糕的答案。
- **适用场景:** AI交互、需求沟通
- **关键要点:**
- 清晰交代背景和核心诉求
- 站在对方角度检查表达
- 表达能力直接影响AI输出质量
### 方法 10Playwright+Claude实现办公自动化
- **方法描述:** 使用Playwright MCP扩展控制浏览器配合Claude Code的Skill编排实现办公自动化流程。例如自动打开Gemini网页、上传文件、输入提示词、下载生成结果、组装PPT。对于浏览器外的操作如保存对话框用Python脚本通过scripts调用。
- **适用场景:** 办公自动化、批量文档处理
- **关键要点:**
- Playwright控制浏览器操作
- Python脚本处理浏览器外操作
- Skill编排整体流程
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-08
**下次会议:** 2025-12-09

View File

@ -0,0 +1,73 @@
# 云大所需求相关进度会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
---
## 二、需求项目进展
| 项目名称 | 负责人 | 本周进展 | 存在问题 | 下周计划 | 优先级 |
| --- | --- | --- | --- | --- | --- |
| 投标商务应答自动生成系统 | 郝倩玉、闫旭隆、江争达 | 需求文档已完成确认 | 需要先设计Skill架构 | 完成招投标Skill架构设计 | P0 |
| 运营商信息精准爬取系统 | 郝倩玉 | 多轮沟通中,需求方需求尚未明确 | 需求方的具体需求一直不能明确 | 持续跟进需求 | P1 |
| 数字人项目 | 江争达、郝倩玉、陶西平 | 已完成第一阶段需求文档整理和平台调研(百度曦灵、黑镜、可灵),已完成费用对比 | 1视频时长需求定义不准确原3-5分钟应为20-30分钟2需要加入手势动作要求3合作方需求时间点不确定 | 1用真人训练数字人样本2研究端到端工作流3测试Gemini分镜脚本+视频生成路径 | P0 |
| Gartner报告解读转写系统 | 郝倩玉 | 需求文档已完成,人员确认完毕,已发闫旭隆 | 无 | 设计Skill架构涉及年末签合同和30万收入 | P0 |
> **说明:** 本次会议未涉及以下市场部需求项目:客户风险推送自动化系统、邮件自动处理转发系统、证书信息提取系统、云大阁新报告自动推送
---
## 三、问题与风险
### 投标商务应答自动生成系统
**问题:** 需要设计Skill架构
**解决方案:** 本周由郝倩玉完成架构设计,如需求需要讨论则先明确
**责任人:** 郝倩玉
**截止时间:** 2025-12-09
### 数字人项目
**问题1:** 视频时长需求定义不准确
- 原需求3-5分钟
- 实际需求20-30分钟PPT宣讲、领导发言等场景
**解决方案:** 时长改为20-30分钟作为主要需求技术上没有难度主要是花销问题
**问题2:** 合作方(富友)需求时间点不确定
**解决方案:**
1. 先自己做好数字分身方案,不以合作方需求为核心
2. 多做几个版本让合作方选择
3. 调研市面上比较好的方案,分别出方案
**责任人:** 江争达、郝倩玉
**截止时间:** 2025-12-09
### 运营商信息精准爬取系统
**问题:** 需求方的具体需求一直不能明确
**解决方案:** 持续跟进,反复沟通,提供可行性方案给对方做参考
**责任人:** 郝倩玉
**截止时间:** 待定
---
## 四、下周重点
1. 🔴 **数字人视频样本训练** - 本周末完成,使用真实人物在百度曦灵和黑镜平台各生成样本
2. 🔴 **数字人工作流研究** - 测试Gemini 3.0生成分镜脚本+图片后用Veo3.1生成视频
3. 🔴 **招投标Skill架构设计** - 完成投标商务应答自动生成系统的Skill架构
4. 🔴 **Gartner报告转写Skill架构设计** - 涉及年末签合同和30万收入优先级提升
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-08
**下次会议:** 2025-12-09

View File

@ -0,0 +1,225 @@
# 工程类会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
| --- | --- | --- | --- |
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成索引搜索改为全量读取的架构优化完成字段映射逻辑图设计负责人改为原负责人、截止时间改为原截止时间已进行新旧版本对比测试。存在问题文字转写准确性问题仍是最大挑战P0/P1/P2优先级判断难以精准。**解决方案:** 1先对转写文本做清洗处理2尝试主窗口全量处理替代分块并行3优先级判断让AI先给建议后人工确认 |
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成专家博弈流程基本测试实现独立评审→交叉评价→交叉回应→决策整合的完整流程。存在问题专家博弈prompt可能没写好评估水平需验证。**解决方案:** 把评估意见和响应打成问答文档判断质量每个领域专家prompt需专门调优 |
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成第一阶段需求文档整理五个核心需求完成数字人生成平台调研和费用对比。存在问题视频时长需求不准确原3-5分钟应为20-30分钟手势动作第一阶段也需考虑。**解决方案:** 1时长改为20-30分钟2加入手势动作要求3本周用真人训练数字人样本百度曦灵+黑镜4测试gemini分镜脚本+图片生成视频的工作流 |
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | Gartner报告解读转写系统需求文档已完成已发闫旭隆。合作方富友需求有变化时间点不确定。**解决方案:** 先做好准备,多做几个版本让合作方选择,自己找市面上好的案例做参考 |
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 已完成前端重构方案设计明确保留现有基础功能只重构展示部分和代码结构已确认API接口规范文档。存在问题功能清单对比尚未完成需考虑下一版本交互逻辑修改。**解决方案:** 1用大模型做后端代码审查2用research生成前端重构方案与当前方案对比3提前考虑下一版本功能需求 |
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 需求文档已完成确认,本周需设计架构 |
### 2. 重点项目问题及解决方案
#### 问题1: 会议纪要相关问题
**问题描述:**
1. 会议转写文本中存在大量语音识别错误,说话者标记不准确,上下文约束能力不足
2. AI难以准确判断任务的P0/P1/P2优先级缺少成员年龄、级别、工作时间等隐性上下文
3. 并行Agent处理会造成信息丢失和逻辑割裂
**解决方案:**
1. 使用Gemini多模态能力进行视频转写直接上传视频并根据会议模板生成纪要
2. 对转写文本进行清洗加工,去除脏数据和重复内容,保证信息全面同时内容紧凑
3. 在会议上直接确认P0/P1/P2优先级让AI先给建议后人再确认
4. 尝试主窗口全量处理一次性生成把skill写到主窗口里
5. 保留确认过程材料作为后续微调素材
**责任人:** 闫旭隆、郝倩玉
**截止时间:** 2025-12-09
#### 问题2: 数字人PPT需求相关问题
**问题描述:**
1. 需求文档中时长要求定义不准确3-5分钟 vs 20-30分钟
2. 数字人生成存在真实性问题(老外说流利中文让人质疑真假)
3. 使用界面/工作流方案尚未明确
**解决方案:**
1. 将视频时长需求改为20-30分钟作为主要需求
2. 使用真人录制训练数字人,用自己真实人物的语音和形象
3. 测试百度曦灵和黑镜平台的定制数字人效果
4. 研究端到端工作流API调用或网站操作或剪映自动化
5. 测试Gemini 3.0生成分镜脚本+图片再用Veo3.1生成视频的路径
**责任人:** 江争达
**截止时间:** 2025-12-09
#### 问题3: 需求方需求不明确问题
**问题描述:**
关于合作方(富友)数字分身需求一直不能明确,杜主任最新信息显示合作方时间点是否使用不确定。
**解决方案:**
1. 先自己做好数字分身方案,不以合作方需求为核心
2. 多做几个版本让合作方选择
3. 自己调研市面上比较好的方案,分别出方案后与相关人员对接
**责任人:** 郝倩玉、江争达
**截止时间:** 2025-12-09
#### 问题4: Subagent调用机制不稳定问题
**问题描述:**
在项目目录下调用全局agent时不指定绝对路径的情况下调用不稳定有时会读取sub的提示词但不执行表现不一致。
**解决方案:**
1. 使用绝对路径调用subagent测试表现稳定
2. 改用agent调agent的方式而不是skill调用subagent
3. 在子项目下定义一个主agent通过主agent调用其他agent
4. 调试阶段用skill主窗口加载方式调通后再移植到agent
**责任人:** 江争达、闫旭隆
**截止时间:** 2025-12-09
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
| --- | --- | --- | --- | --- |
| 🔴 会议纪要Skill测试对比 | 闫旭隆 | 使用当前版本生成会议纪要再用腾讯会议转写生成一版同时测试gemini直接喂视频生成纪要的效果 | P0 | 2025-12-09 |
| 🔴 会议转写文本清洗优化 | 闫旭隆 | 把会议转写文本中脏的、重复的内容做一遍加工清洗,保证信息全面同时内容紧凑 | P0 | 2025-12-09 |
| 🔴 需求Skill专家博弈流程优化 | 闫旭隆 | 查看二阶段专家交叉回应的字段映射,整理可视化效果,梳理整体流程图 | P0 | 2025-12-09 |
| 🔴 数字人视频样本训练 | 江争达 | 使用真实人物训练数字人语音和视频,在百度曦灵和黑镜平台各生成一个样本 | P0 | 2025-12-08 |
| 🔴 数字人PPT需求文档修改 | 江争达 | 时长改为20-30分钟添加手势动作要求完善第一阶段和第二阶段需求 | P0 | 2025-12-09 |
| 🔴 数字人工作流研究 | 江争达 | 研究数字人生成工作流方案API调用、剪映自动化测试Gemini 3.0生成分镜脚本+图片后用Veo3.1生成视频 | P0 | 2025-12-09 |
| 🔴 问答系统前端重构 | 江争达 | 完成前端重构方案,考虑下一版本交互逻辑修改,使用大模型审查方案并对比优化 | P0 | 2025-12-09 |
| 🔴 招投标Skill架构设计 | 郝倩玉 | 完成招投标文件Skill的架构设计先确认需求是否需要讨论明确 | P0 | 2025-12-09 |
| 🔴 Gartner报告转写Skill架构设计 | 郝倩玉 | 设计Gartner报告转写的Skill架构涉及年末签合同和30万收入 | P0 | 2025-12-09 |
| 🔴 数字分身市场调研 | 郝倩玉 | 调研市面上较好的数字分身方案版本,分别出方案后与钱林对接 | P0 | 2025-12-09 |
| 协助会议纪要Skill优化 | 郝倩玉 | 协助闫旭隆优化会议纪要Skill | P1 | 2025-12-09 |
| 后端代码审查 | 江争达 | 使用Claude 4.5或GPT做后端code review记录问题作为后续优化需求 | P1 | 2025-12-09 |
| 天眼查自动更新需求确认 | 江争达 | 与小彤确认天眼查客户数据库自动更新需求是否还需要 | P1 | 2025-12-09 |
| Cloud Skill转框架研究 | 郝倩玉 | 研究如何将Claude Skill迁移到LangGraph等低代码架构作为技术储备 | P1 | 待定 |
| 日报驱动项目管理系统开发 | 丁康 | 负责基于会议纪要的日报驱动项目管理系统Skill开发包括与MCP对接 | P1 | 待定 |
### 4. 组内成员工作进展
#### 闫旭隆
**上周完成:**
- ✅ 需求澄清-需求文档skill优化、测试、视频录制
- ✅ 会议纪要Skill开发改为全量读取架构整理流程图
**进行中:**
- 🔄 会议纪要Skill测试对比
**收到的反馈/学习建议:**
- **表扬:** 总的来说比上一版有进步,整个逻辑可以先固化下来使用;该有的要点都有,比较接近了
- **表扬:** 能把动作识别出来不容易,就算其他人明白也挺牛的
- **建议:** 映射逻辑图很重要AI目前最缺的是逻辑一致和前后连贯
- **建议:** 转写文本需先做清洗加工,去除重复和脏数据后再处理
- **建议:** 尝试主窗口全量处理一次性生成减少并行Agent带来的信息丢失
- **建议:** 整个文字转写换成gemini来做生成全量版而非逐字转写
**下周任务:**
- [ ] 🔴 P0会议纪要Skill测试对比腾讯会议+gemini视频两个版本
- [ ] 🔴 P0会议转写文本清洗优化
- [ ] 🔴 P0需求Skill专家博弈流程优化
- [ ] P1招投标文件Skill架构设计和调试
#### 江争达
**上周完成:**
- ✅ 数字人PPT需求文档
**进行中:**
- 🔄 问答系统v1.1前端重构方案
- 🔄 数字人视频样本训练
**收到的反馈/学习建议:**
- **批评:** 背景说明不清楚,核心诉求和问题点没有交代清楚,需求文档分析存在问题,不站在其他人角度思考
- **批评:** 只看树木不看森林,关于数字人老外说中文的问题理解不到位
- **建议:** 数字人PPT时长要求改为20-30分钟而非3-5分钟
- **建议:** 数字人视频需要有手势动作,开场和结尾不能呆呆站着
- **建议:** 前端重构要考虑下一版本交互逻辑修改
- **建议:** 后端代码需用大模型做code review审查
- **建议:** 提供示例代码给大模型是有用的
**下周任务:**
- [ ] 🔴 P0数字人视频样本训练本周末完成
- [ ] 🔴 P0数字人PPT需求文档修改
- [ ] 🔴 P0数字人工作流研究+Gemini分镜测试
- [ ] 🔴 P0问答系统前端重构
- [ ] P1后端代码审查
- [ ] P1天眼查自动更新需求确认
#### 郝倩玉
**上周完成:**
- ✅ 会议纪要Skill架构优化协助
- ✅ Gartner报告解读转写系统需求文档已发闫旭隆
**进行中:**
- 🔄 数字分身需求对接
- 🔄 招投标文件Skill架构设计
**收到的反馈/学习建议:**
- **建议:** 数字分身需求由于合作方时间不确定,先自己做好准备,做几个版本备选
- **建议:** Gartner报告转写因涉及年末签合同提升到P0先设计架构
- **建议:** 如果想学习Skill到LangGraph架构转换需要先把skill底层知识全部学一遍
**下周任务:**
- [ ] 🔴 P0招投标Skill架构设计
- [ ] 🔴 P0Gartner报告转写Skill架构设计
- [ ] 🔴 P0数字分身市场调研
- [ ] P1协助会议纪要Skill优化
- [ ] P1Cloud Skill转框架研究
#### 陶西平
**上周完成:**
- ✅ 数字人PPT需求文档协助提供调研文档
- ✅ 数字人与PPT结合视频生成测试
**进行中:**
- 🔄 前端框架调研
- 🔄 数字人调研报告
**收到的反馈/学习建议:**
- **认可:** 提供的数字人调研文档被江争达采用,作为需求文档重要参考
**下周任务:**
- [ ] 🔴 P0配合江老师前端框架重构相关工作
- [ ] P1完成数字人调研报告
- [ ] P1完成PPT与数字人结合调研
---
## 三、会议总结
**核心议题:** 会议纪要Skill架构优化、数字人PPT需求完善、问答系统前端重构、Subagent调用机制研究
**关键决策:**
1. **会议纪要转写采用Gemini多模态视频处理路径**:多模态能力最强,上下文最长,视觉能力超强
2. **模型工具组合确定**前端用Gemini中间逻辑用Claude Code整体项目修复/测试用GPT Codex
3. **会议纪要Skill改为全量读取方式**:放弃索引搜索,转写文本需先做清洗再处理
4. **P0优先级判断采用AI建议+人工确认模式**:不能完全依赖自动判断
5. **数字人视频时长改为20-30分钟**:技术上没有难度,只是花销问题
6. **数字分身选型聚焦百度曦灵和黑镜两个平台**:本周需用真人训练样本
7. **前端重构只改展示和代码结构**:保留现有功能流程不动,但要考虑下一版本交互逻辑
8. **SubAgent调用必须使用绝对路径**测试表现稳定推荐Agent调Agent方式
9. **Gartner报告转写提升为P0**涉及年末签合同和30万收入
10. **日报驱动项目管理系统由丁康负责**包括基于会议纪要生成日报、与MCP对接
**下周工作重点:**
1. 🔴 会议纪要Skill测试对比腾讯会议转写 vs gemini视频直接生成
2. 🔴 数字人视频样本训练(百度曦灵+黑镜,本周末完成)
3. 🔴 数字人工作流研究Gemini分镜脚本+图片→Veo3.1视频)
4. 🔴 问答系统前端重构方案完善
5. 🔴 招投标Skill和Gartner报告转写Skill架构设计
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-08
**下次会议:** 2025-12-09