需求文档skill回溯专家博弈之前
This commit is contained in:
196
会议转写测试/会议纪要生成效果对比/gemini清洗前/Q&A资源库类会议纪要_2025-12-08_第6次周会.md
Normal file
196
会议转写测试/会议纪要生成效果对比/gemini清洗前/Q&A资源库类会议纪要_2025-12-08_第6次周会.md
Normal file
@ -0,0 +1,196 @@
|
||||
# Q&A资源库类会议纪要 (2025-12-08)
|
||||
|
||||
## 一、会议信息
|
||||
- **会议时间:** 2025-12-08
|
||||
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
|
||||
- **纪要整理人:** Claude
|
||||
|
||||
---
|
||||
|
||||
## 二、工作问题 Q&A
|
||||
|
||||
### 1. 会议纪要Skill相关问题
|
||||
|
||||
**Q1: 会议纪要Skill信息提取准确率低怎么解决?**
|
||||
|
||||
**问题背景:** 会议转写文本存在语音识别错误、语义跳脱等问题,导致Skill提取信息时准确率不高,且分块索引搜索容易遗漏信息。
|
||||
|
||||
**解决方案:**
|
||||
1. **文字转写换成Gemini多模态:** 上传会议视频让Gemini转写,准确率远高于传统语音识别,几乎无字错误
|
||||
2. **Clean预处理:** 对转写文本进行去重、去错处理,压缩到紧凑版本后再使用
|
||||
3. **全量读取替代索引搜索:** 将Clean后的完整文本加载到主上下文,通过语义理解提取而非关键词匹配
|
||||
4. **主窗口全量处理:** 尝试将所有映射逻辑写入主窗口Skill,一次性处理,避免Sub-Agent分块造成逻辑割裂
|
||||
|
||||
---
|
||||
|
||||
**Q2: P0/P1/P2优先级如何准确判断?**
|
||||
|
||||
**问题背景:** AI难以准确判断任务优先级,因为不了解团队成员的年龄、级别、工作时长等潜在上下文。
|
||||
|
||||
**解决方案:**
|
||||
1. **AI先给建议:** 让系统给出优先级排序建议,而非直接生成
|
||||
2. **人工确认反馈:** 会议中或会后立即向每个人确认优先级
|
||||
3. **保留学习材料:** 将确认过程的所有材料保留,作为后续强化学习或微调的数据
|
||||
|
||||
---
|
||||
|
||||
### 2. Sub-Agent调用相关问题
|
||||
|
||||
**Q3: Skill调用项目级Sub-Agent为什么不稳定?**
|
||||
|
||||
**问题背景:** 测试发现使用相对路径调用项目级Sub-Agent几乎全部失败,但使用绝对路径可以稳定成功。
|
||||
|
||||
**解决方案:**
|
||||
1. **必须使用绝对路径:** 调用项目级Sub-Agent时指定完整的绝对路径
|
||||
2. **原因分析:** Claude默认优先搜索全局Agent目录,找不到会忽略而非查找项目目录
|
||||
3. **架构建议:** 优先使用Agent调用Agent的方式,而非Skill调用Agent
|
||||
|
||||
---
|
||||
|
||||
**Q4: Skill嵌套还是Sub-Agent分离,哪个更好?**
|
||||
|
||||
**问题背景:** 复杂任务需要多个步骤协作,存在Skill嵌套Skill和Skill调Sub-Agent两种架构选择。
|
||||
|
||||
**解决方案:**
|
||||
1. **推荐Skill嵌套Skill:** 上下文共享,逻辑控制精确,调用关系清晰
|
||||
2. **不推荐Sub-Agent:** 上下文剥离后会丢失大量信息,逻辑控制容易出问题
|
||||
3. **最佳实践:** Agent调Agent > Skill嵌套Skill > Skill调Agent
|
||||
|
||||
---
|
||||
|
||||
### 3. 数字人需求相关问题
|
||||
|
||||
**Q5: 数字人视频时长应该定义为多少?**
|
||||
|
||||
**问题背景:** 需求文档中定义的3-5分钟时长不符合实际业务场景需求。
|
||||
|
||||
**解决方案:**
|
||||
1. **主要需求改为20-30分钟:** 这是PPT宣讲的真实时长需求
|
||||
2. **3-5分钟作为测试:** 初期可用短时长验证技术可行性
|
||||
3. **技术上无本质差异:** 主要是成本问题,不是技术瓶颈
|
||||
|
||||
---
|
||||
|
||||
**Q6: 数字人平台如何选型?**
|
||||
|
||||
**问题背景:** 市场上数字人平台众多,需要评估性价比和效果。
|
||||
|
||||
**调研结果:**
|
||||
| 平台 | 特点 | 建议 |
|
||||
|-----|-----|-----|
|
||||
| 百度希壤 | 价格较低(40元/10分钟),API便宜 | 重点测试,本周出样本 |
|
||||
| 黑镜 | 会员免费,只收定制费,后续生成免费 | 重点测试,本周出样本 |
|
||||
| HeyGen | 效果好但价格高 | 作为参考 |
|
||||
| 可灵/即梦 | 价格很贵 | 不优先考虑 |
|
||||
| VEO 3.1 | 新升级,能力提升 | 测试首尾帧生成视频效果 |
|
||||
|
||||
---
|
||||
|
||||
### 4. 前端重构相关问题
|
||||
|
||||
**Q7: 前端重构如何保证质量?**
|
||||
|
||||
**问题背景:** 需要在保留现有功能的基础上重构前端,同时避免引入问题。
|
||||
|
||||
**解决方案:**
|
||||
1. **后端先审查不改:** 用Opus 4.5或Codex对后端代码做Code Review,记录问题不急改
|
||||
2. **方案交叉验证:** 用GPT Research生成方案与现有方案对比
|
||||
3. **考虑下一版本:** 重构时把下一版本功能需求一起考虑进去
|
||||
4. **提供示例代码:** 特别是后端交互的逻辑代码
|
||||
|
||||
---
|
||||
|
||||
### 5. 需求表达相关问题
|
||||
|
||||
**Q8: 为什么与大模型交互总是得不到好答案?**
|
||||
|
||||
**问题背景:** 技术调研文档和需求表达不够清晰,导致他人难以理解,与大模型交互效果也差。
|
||||
|
||||
**解决方案:**
|
||||
1. **详细说明背景:** 包含为什么做、要解决什么问题、核心诉求是什么
|
||||
2. **站在读者角度:** 考虑没有上下文的人能否理解
|
||||
3. **先写后说:** 对于复杂背景,先写下来整理清楚再交流
|
||||
4. **正反示例:** 在Prompt中同时给出正确和错误示例
|
||||
|
||||
---
|
||||
|
||||
## 三、重点工作方法
|
||||
|
||||
### 方法 1:Gemini多模态视频转写方法
|
||||
- **描述:** 使用Gemini的多模态能力进行会议视频转写,可同时识别画面内容和语音内容。先将会议视频上传给Gemini,让其原文转写所有内容,再用Clean后的文本作为后续处理的输入。
|
||||
- **适用场景:** 会议纪要生成、视频内容分析、培训视频转文档
|
||||
- **关键要点:**
|
||||
- 支持最长1小时的视频
|
||||
- 可以通过prompt调整提取内容
|
||||
- 能识别画面变化(屏幕切换、操作演示)
|
||||
- 转写准确度极高,几乎无字错误
|
||||
|
||||
### 方法 2:全量上下文处理优于分块搜索
|
||||
- **描述:** 在处理长文本时,使用全量读取加载到主上下文,通过语义理解提取信息,而非RAG关键词搜索。人的口语存在大量跳脱和不清晰表达,直接搜索会漏掉信息。
|
||||
- **适用场景:** 会议转写处理、文档信息提取、口语化内容分析
|
||||
- **关键要点:**
|
||||
- 先做Clean预处理,去除冗余
|
||||
- 通过Attention机制理解上下文语义
|
||||
- 可接受较长上下文换取准确性
|
||||
- RAG对口语化内容效果很差
|
||||
|
||||
### 方法 3:Skill嵌套Skill架构方法
|
||||
- **描述:** 使用Skill嵌套Skill的方式进行复杂任务编排,直接在主窗口Skill.md中调用其他Skill,而不是通过Sub-Agent。上下文共享,逻辑控制精确。
|
||||
- **适用场景:** 复杂工作流编排、多步骤任务自动化
|
||||
- **关键要点:**
|
||||
- 上下文共享,信息不丢失
|
||||
- 调用关系清晰,易于调试
|
||||
- 避免Sub-Agent的上下文隔离问题
|
||||
- 接受较长上下文的代价
|
||||
|
||||
### 方法 4:Agent调Agent架构组织
|
||||
- **描述:** 在子项目下定义主Agent,由主Agent调配各Sub-Agent,而非Skill调Agent。这样架构组织更清晰,避免来回嵌套。
|
||||
- **适用场景:** 多Agent协作系统、复杂项目架构
|
||||
- **关键要点:**
|
||||
- 主Agent负责调度和协调
|
||||
- Sub-Agent专注单一功能
|
||||
- 架构层次分明,易于维护
|
||||
- 调用语法更规范
|
||||
|
||||
### 方法 5:提示词正反示例编写技巧
|
||||
- **描述:** 在编写Skill或Agent的Prompt时,必须同时提供正确示例和错误示例。格式:"错误的是什么,正确的是什么"。Agent有自己的想法,通过正反对比可以强化行为规范。
|
||||
- **适用场景:** 高精度任务的Prompt编写、规范化操作流程
|
||||
- **关键要点:**
|
||||
- 正确示例:期望的输出格式和内容
|
||||
- 错误示例:常见的错误模式
|
||||
- 双向约束,减少偏离
|
||||
- 适用于精密操作任务
|
||||
|
||||
### 方法 6:Playwright+MCP浏览器自动化
|
||||
- **描述:** 使用Playwright Extension(Chrome插件)结合MCP进行浏览器自动化操作,可实现网页操作的完全自动化。对于脱离浏览器的操作(如文件保存对话框),使用OS Scripts配合处理。
|
||||
- **适用场景:** 网页自动化操作、Gemini/Canva等平台自动操作
|
||||
- **关键要点:**
|
||||
- 自动打开网页、输入文本、点击按钮
|
||||
- 自动上传和下载文件
|
||||
- OS Scripts处理浏览器外的操作
|
||||
- 控制精准,完全自动化
|
||||
|
||||
### 方法 7:Gemini分镜头脚本视频生成工作流
|
||||
- **描述:** 使用Gemini 3.0 Pro生成视频分镜头脚本和图片,再通过VEO等模型生成视频。流程:需求描述 → 分镜脚本 → 分镜图片 → 视频生成 → 合成。
|
||||
- **适用场景:** 动画视频制作、数字人视频生成、宣传片制作
|
||||
- **关键要点:**
|
||||
- Gemini分镜脚本生成能力最强
|
||||
- 首尾帧+文字稿生成视频已成熟
|
||||
- 分镜图片质量决定最终效果
|
||||
- 可生成30秒-2分钟的视频段落
|
||||
|
||||
### 方法 8:工具组合使用策略
|
||||
- **描述:** 不同大模型在不同场景下的最佳组合使用策略,发挥各自优势。
|
||||
- **适用场景:** 日常开发、AI辅助编程
|
||||
- **关键要点:**
|
||||
- **前端开发:** Gemini(效果极好)
|
||||
- **代码逻辑/架构:** Claude Code(工具调用能力最强)
|
||||
- **Bug修复/测试:** GPT Codex
|
||||
- **文字问答:** GPT 5.1(Claude幻觉较高)
|
||||
- **多模态/视觉:** Gemini 3.0 Pro
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-08
|
||||
**下次会议:** 2025-12-15
|
||||
107
会议转写测试/会议纪要生成效果对比/gemini清洗前/云大所需求相关进度会议纪要_2025-12-08_第6次周会.md
Normal file
107
会议转写测试/会议纪要生成效果对比/gemini清洗前/云大所需求相关进度会议纪要_2025-12-08_第6次周会.md
Normal file
@ -0,0 +1,107 @@
|
||||
# 云大所需求相关进度会议纪要 (2025-12-08)
|
||||
|
||||
## 一、会议信息
|
||||
- **会议时间:** 2025-12-08
|
||||
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
|
||||
- **纪要整理人:** Claude
|
||||
|
||||
---
|
||||
|
||||
## 二、需求项目进展
|
||||
|
||||
| 项目名称 | 负责人 | 本周进展 | 存在问题 | 下周计划 | 优先级 |
|
||||
|---------|-------|---------|---------|---------|-------|
|
||||
| 投标商务应答自动生成系统 | 闫旭隆、郝倩玉、江争达 | 需求文档已完成并发给闫旭隆,本周提升为P0任务 | 涉及30万合同,需尽快完成架构设计 | 完成Skill架构设计 | P0 |
|
||||
| 数字人项目 | 陶西平、江争达、郝倩玉 | 完成第一阶段需求文档、平台选型调研(百度希壤、黑镜等) | 时长需求定义不准(应为20-30分钟)、缺少手势动作、缺少结尾画面 | 1)完成百度希壤和黑镜真人训练样本;2)测试VEO 3.1;3)测试Gemini分镜头工作流 | P0 |
|
||||
| Gartner 报告解读转写系统 | 闫旭隆、郝倩玉 | 需求文档已完成,已发给闫旭隆 | 涉及年末收入,媛媛催促较急 | 先完成架构设计 | P1 |
|
||||
| 运营商信息精准爬取系统 | 郝倩玉 | 持续与需求方沟通中 | 需求方具体需求一直不能明确 | 持续跟进需求明确情况 | P1 |
|
||||
|
||||
**备注:** 以下市场部需求项目本次会议未涉及:
|
||||
- 客户风险推送自动化系统
|
||||
- 邮件自动处理转发系统
|
||||
- 证书信息提取系统
|
||||
- 云大阁新报告自动推送
|
||||
|
||||
---
|
||||
|
||||
## 三、问题与风险
|
||||
|
||||
### 项目1: 投标商务应答自动生成系统
|
||||
|
||||
**问题描述:**
|
||||
- 涉及30万合同,需尽快完成架构设计和功能实现
|
||||
|
||||
**解决方案:**
|
||||
1. 本周提升为P0优先级
|
||||
2. 闫旭隆负责Skill架构设计
|
||||
3. 先有个样子出来,后续持续优化
|
||||
|
||||
**责任人:** 闫旭隆
|
||||
**截止时间:** 2025-12-15
|
||||
|
||||
---
|
||||
|
||||
### 项目2: 数字人项目
|
||||
|
||||
**问题描述:**
|
||||
1. 时长需求定义不准确(文档写3-5分钟,实际主要需求是20-30分钟)
|
||||
2. 数字人缺少手势动作,前十秒站着不动会显得不真实
|
||||
3. 缺少结尾画面,数字人应有告别动作
|
||||
4. 数字分身需求放缓(核所需求时间有变)
|
||||
|
||||
**解决方案:**
|
||||
1. 将主要时长需求改为20-30分钟
|
||||
2. 第一阶段必须加入手势动作
|
||||
3. 增加结尾画面设计
|
||||
4. 本周完成百度希壤和黑镜的真人训练样本
|
||||
5. 测试VEO 3.1和Gemini 3.0分镜头工作流
|
||||
6. 数字分身如核所不做则自主设计多个版本
|
||||
|
||||
**责任人:** 陶西平、郝倩玉
|
||||
**截止时间:** 2025-12-13(视频样本),2025-12-15(工作流测试)
|
||||
|
||||
---
|
||||
|
||||
### 项目3: Gartner 报告解读转写系统
|
||||
|
||||
**问题描述:**
|
||||
- 媛媛催促较急,涉及年末收入
|
||||
|
||||
**解决方案:**
|
||||
1. 设为P1优先级
|
||||
2. 先完成架构设计
|
||||
3. 后续根据架构进行实现
|
||||
|
||||
**责任人:** 闫旭隆
|
||||
**截止时间:** 2025-12-15
|
||||
|
||||
---
|
||||
|
||||
### 项目4: 运营商信息精准爬取系统
|
||||
|
||||
**问题描述:**
|
||||
- 需求方(富有、琳贤)具体需求一直不能明确
|
||||
|
||||
**解决方案:**
|
||||
1. 持续跟进沟通
|
||||
2. 提供可行性方案给对方做参考
|
||||
3. 等待需求明确后再推进
|
||||
|
||||
**责任人:** 郝倩玉
|
||||
**截止时间:** 待需求明确
|
||||
|
||||
---
|
||||
|
||||
## 四、下周重点
|
||||
|
||||
1. 🔴 **投标商务应答自动生成系统:** 完成Skill架构设计(P0)
|
||||
2. 🔴 **数字人项目:** 完成百度希壤和黑镜真人训练样本,测试VEO 3.1和Gemini分镜头工作流(P0)
|
||||
3. **Gartner报告解读转写系统:** 完成架构设计(P1)
|
||||
4. **运营商信息精准爬取系统:** 持续跟进需求明确(P1)
|
||||
5. **数字分身:** 如核所不做则自主设计多个版本(P1)
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-08
|
||||
**下次会议:** 2025-12-15
|
||||
247
会议转写测试/会议纪要生成效果对比/gemini清洗前/工程类会议纪要_2025-12-08_第6次周会.md
Normal file
247
会议转写测试/会议纪要生成效果对比/gemini清洗前/工程类会议纪要_2025-12-08_第6次周会.md
Normal file
@ -0,0 +1,247 @@
|
||||
# 工程类会议纪要 (2025-12-08)
|
||||
|
||||
## 一、会议信息
|
||||
- **会议时间:** 2025-12-08
|
||||
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
|
||||
- **纪要整理人:** Claude
|
||||
|
||||
---
|
||||
|
||||
## 二、工作内容
|
||||
|
||||
### 1. 重点项目进展情况汇总
|
||||
|
||||
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|
||||
|---------|---------|-----------|-------------|
|
||||
| 会议纪要Skill架构优化 | 闫旭隆 | 2025-12-02 | 已完成架构重构:从索引搜索改为全量读取会议转写,绘制了字段映射逻辑流程图和Phase2并行执行流程图。存在问题:全量读取资源消耗大、子Agent并行处理可能造成逻辑割裂、语义识别准确性不足。**解决方案:** 1)使用Gemini进行视频转写;2)先对转写文本进行Clean处理;3)尝试主窗口全量处理方案 |
|
||||
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成多轮博弈机制开发:加入多角色专家评审和交叉回应功能。存在问题:专家prompt编写难度大、评审过程无法直观查看、主Agent可能读取不完整。**解决方案:** 1)将评审过程整合为一问一答文档;2)评估博弈效果,效果不佳则优化或去除 |
|
||||
| 数字人PPT需求文档 | 江争达(数字人PPT)、郝倩玉(数字分身) | 2025-12-02 | 已完成第一阶段需求文档,包含5个核心需求、质量标准、平台选型调研。存在问题:时长需求定义不准(应为20-30分钟而非3-5分钟)、缺少手势动作、缺少结尾画面。**解决方案:** 1)将主要时长改为20-30分钟;2)增加手势动作要求;3)本周完成百度希壤和黑镜真人训练样本 |
|
||||
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 已完成部分需求文档:系统架构图、API接口规范、功能清单。存在问题:未完成功能对照、未考虑下一版本需求、后端代码未审查。**解决方案:** 1)用Codex/Opus做后端Code Review;2)用GPT Research生成方案对比;3)考虑下一版本功能需求 |
|
||||
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 会议中提升为P0任务(涉及30万合同),需本周完成架构设计 |
|
||||
| 问答系统V1.0测试推动 | 江争达、郝倩玉 | 2025-12-02 | 进行中,多次与媛媛沟通,相关领导参与测试时间尚未确定 |
|
||||
| Gartner报告解读转写系统 | 郝倩玉 | 2025-12-02 | 需求文档已完成并发给闫旭隆,设为P1任务先做架构设计 |
|
||||
|
||||
### 2. 重点项目问题及解决方案
|
||||
|
||||
#### 问题1: 会议纪要Skill信息提取准确性问题
|
||||
|
||||
**问题描述:**
|
||||
会议纪要Skill在提取信息时存在准确性问题:
|
||||
- 转写文本准确性不足,存在错误和语义识别问题
|
||||
- 上下文约束能力弱,缺少会议背景信息
|
||||
- 分块索引方式导致信息遗漏,全量读取方案资源消耗大
|
||||
- Sub-agent并行提取后主窗口整合存在逻辑割裂问题
|
||||
|
||||
**解决方案:**
|
||||
1. 文字转写采用Gemini多模态能力,利用其视频识别能力提升转写准确性
|
||||
2. 对转写文本进行Clean处理,去除重复和冗余信息后再作为输入
|
||||
3. 将全量Clean后的转写文本直接加载到主上下文,让主窗口一次性处理
|
||||
4. 尝试调用Gemini API在Claude内部处理会议纪要生成
|
||||
5. 测试主上下文全量处理与Sub-agent并行提取两种方案的效果对比
|
||||
|
||||
**责任人:** 闫旭隆
|
||||
**截止时间:** 2025-12-15
|
||||
|
||||
#### 问题2: Sub-agent调用路径问题(全局vs项目级)
|
||||
|
||||
**问题描述:**
|
||||
Skill调用自定义Sub-agent时,存在全局路径和项目级路径调用差异问题:
|
||||
- 使用相对路径时,Claude优先查找全局Agent,找不到会读取项目级Agent的Prompt但不执行
|
||||
- 使用绝对路径可以成功调用项目级Sub-agent
|
||||
- 未使用Task规范调用也能成功,但机制不清晰
|
||||
|
||||
**解决方案:**
|
||||
1. 调用项目级Sub-agent时必须使用绝对路径
|
||||
2. 建议采用Agent调用Agent的方式,而非Skill调用Agent
|
||||
3. 在子项目下定义主Agent,由主Agent调配各Sub-agent
|
||||
4. 使用标准的Task调用规范,避免语言描述产生歧义
|
||||
5. 调试阶段可用Skill加载方式,调通后迁移到Agent架构
|
||||
|
||||
**责任人:** 江争达
|
||||
**截止时间:** 2025-12-15
|
||||
|
||||
#### 问题3: 数字人需求文档表达清晰度问题
|
||||
|
||||
**问题描述:**
|
||||
数字人PPT需求文档存在表达不够清晰和具体的问题:
|
||||
- 时长需求定义为3-5分钟,但实际主要需求应为20-30分钟
|
||||
- 缺少结尾画面设计
|
||||
- 非功能性需求中缺少使用界面说明
|
||||
- 数字人手势动作需求缺失
|
||||
|
||||
**解决方案:**
|
||||
1. 将时长需求调整为20-30分钟作为主要需求,3-5分钟作为初期测试
|
||||
2. 增加结尾画面设计,数字人独立告别画面
|
||||
3. 补充使用界面需求,明确工作流、API调用或平台操作方式
|
||||
4. 在核心质量指标中增加手势动作要求,至少前后十秒要有手势
|
||||
5. 与GPT/Gemini进行需求方案交叉验证
|
||||
|
||||
**责任人:** 陶西平
|
||||
**截止时间:** 2025-12-15
|
||||
|
||||
#### 问题4: 需求文档背景说明不清晰问题
|
||||
|
||||
**问题描述:**
|
||||
技术调研文档和需求文档的背景说明不够清晰:
|
||||
- 核心诉求和问题点没有交代清楚
|
||||
- 不站在读者角度思考,导致他人难以理解
|
||||
- 与大模型交互时无法得到好的答案
|
||||
|
||||
**解决方案:**
|
||||
1. 撰写技术文档时必须站在读者角度思考
|
||||
2. 把背景、核心诉求、要解决的问题清晰表达出来
|
||||
3. 对于说不出来的复杂背景说明,先写下来再给大模型
|
||||
4. 确保文档准备充分后别人才能看得懂
|
||||
|
||||
**责任人:** 江争达
|
||||
**截止时间:** 2025-12-15
|
||||
|
||||
### 3. 下周工作安排
|
||||
|
||||
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|
||||
|---------|-------|-------------|-------|---------|
|
||||
| 🔴 会议纪要Skill优化-Gemini转写对比 | 闫旭隆 | 生成三版会议纪要对比:腾讯会议转写版、Gemini转写版、Gemini直接生成版 | P0 | 2025-12-15 |
|
||||
| 🔴 需求澄清Skill专家交叉评审可视化 | 闫旭隆 | 整理专家交叉回应效果的可视化展示,呈现专家间的问题、建议、响应过程 | P0 | 2025-12-15 |
|
||||
| 🔴 招投标文件Skill架构设计 | 闫旭隆 | 完成招投标文件生成Skill的整体架构设计 | P0 | 2025-12-15 |
|
||||
| 🔴 数字人PPT视频样本生成 | 陶西平 | 使用百度希壤和黑镜平台训练真人数字人,生成包含手势动作的视频样本 | P0 | 2025-12-13 |
|
||||
| 🔴 数字人视频工作流研究 | 陶西平 | 研究数字人视频生成工作流(API调用/剪映自动化/平台操作),确定技术方案 | P0 | 2025-12-15 |
|
||||
| 🔴 Gemini 3.0分镜头脚本+视频生成测试 | 陶西平 | 使用Gemini 3.0生成分镜头脚本和图片,通过VEO 3.1生成30秒-2分钟视频 | P0 | 2025-12-15 |
|
||||
| 🔴 前端重构方案完善 | 江争达 | 用Codex审查后端代码、用GPT Research对比方案、考虑下一版本功能需求 | P0 | 2025-12-15 |
|
||||
| Gartner报告转写系统架构设计 | 闫旭隆 | 设计Gartner报告转写系统的整体架构 | P1 | 2025-12-15 |
|
||||
| Claude Code Skill转LangChain研究 | 闫旭隆 | 研究如何将Skill迁移到LangChain/LangGraph的DeepAgent架构 | P1 | 待定 |
|
||||
| 日报驱动项目管理系统开发 | 丁康 | 学习Asana架构和模块,设计基于会议纪要生成日报并对接Asana MCP的系统 | P1 | 待定 |
|
||||
| 数字分身需求对接 | 郝倩玉 | 继续与娴霖沟通,如核所需求不明确则自主设计多个版本 | P1 | 2025-12-15 |
|
||||
| 运营商信息精准爬取系统需求跟进 | 郝倩玉 | 持续跟进需求方需求明确情况 | P1 | 2025-12-15 |
|
||||
|
||||
### 4. 组内成员工作进展
|
||||
|
||||
#### 闫旭隆
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制
|
||||
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文
|
||||
- ✅ 录制演示视频
|
||||
|
||||
**进行中:**
|
||||
- 🔄 会议纪要Skill持续优化
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **建议:** 流程图绘制和字段映射逻辑需要写入Skill中,确保Claude逻辑清晰,避免瞎改
|
||||
- **建议:** 会议转写换成Gemini来做,做一个clean版本作为输入基础
|
||||
- **建议:** 尝试主上下文窗口全量处理方案,与当前并行子Agent方案对比效果
|
||||
- **建议:** P0优先级判断让系统给出建议后人工确认,保留确认材料用于后续优化
|
||||
- **表扬:** 会议纪要Skill新版本相比上一版有明显进步,主要要点已经提取到位
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|会议纪要Skill优化-Gemini转写对比测试
|
||||
- [ ] 🔴 P0|需求澄清Skill专家交叉评审可视化
|
||||
- [ ] 🔴 P0|招投标文件Skill架构设计
|
||||
- [ ] P1|Gartner报告转写系统架构设计
|
||||
- [ ] P1|Claude Code Skill转LangChain研究
|
||||
|
||||
#### 江争达
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 数字人PPT需求文档
|
||||
- ✅ Sub-agent调用研究文档
|
||||
|
||||
**进行中:**
|
||||
- 🔄 问答系统v1.1前端重构方案
|
||||
- 🔄 PDF Skill技术调研
|
||||
- 🔄 服务器采购
|
||||
- 🔄 招投标文件Skill架构调试
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **批评:** Sub-agent调研文档背景说明不够清晰,核心诉求和问题点没有交代清楚,90%的重点都说丢了
|
||||
- **批评:** 表达能力和提问题能力不足,导致与大模型交互时无法得到好的答案
|
||||
- **建议:** 需要提升需求表达能力,站在读者角度思考,把背景、核心诉求清晰表达出来
|
||||
- **建议:** 对于说不出来的复杂背景说明,建议先写下来再给大模型
|
||||
- **建议:** 前端重构方案需要用大模型审查后端代码,找出问题后再决定是否修改
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|前端重构方案完善(Code Review + 方案对比)
|
||||
- [ ] P1|问答系统V1.0测试推动
|
||||
- [ ] P1|PDF Skill技术调研
|
||||
- [ ] P1|服务器采购
|
||||
- [ ] P1|招投标文件Skill架构调试
|
||||
|
||||
#### 郝倩玉
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 会议纪要Skill架构优化(协助闫旭隆优化学习类+Q&A类逻辑)
|
||||
- ✅ Gartner报告解读转写系统需求文档
|
||||
- ✅ 多次与媛媛沟通问答系统测试事宜
|
||||
|
||||
**进行中:**
|
||||
- 🔄 数字分身需求对接(核所需求放缓)
|
||||
- 🔄 招投标文件Skill架构设计
|
||||
- 🔄 问答系统V1.0测试推动
|
||||
- 🔄 运营商信息精准爬取系统需求跟进
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **任务调整:** 数字分身需求因核所需求放缓而面临不确定性,如核所不做则自己做需求,多做几个版本供选择
|
||||
- **任务安排:** 招投标文件Skill架构设计提升为P0任务,涉及年末收入
|
||||
- **指导:** 可以尝试学习Skill开发,先试一个小的功能
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|推动招投标文件Skill架构设计
|
||||
- [ ] P1|数字分身需求对接(持续跟进或自主设计)
|
||||
- [ ] P1|运营商信息精准爬取系统需求跟进
|
||||
- [ ] P1|问答系统V1.0测试推动
|
||||
- [ ] P2|学习Skill开发
|
||||
|
||||
#### 陶西平
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 数字人PPT需求文档(协助江老师修改)
|
||||
- ✅ 数字人平台选型调研(HeyGen、百度希壤、黑镜等)
|
||||
|
||||
**进行中:**
|
||||
- 🔄 数字人与PPT结合视频生成
|
||||
- 🔄 前端框架重构分析
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **建议:** 视频时长需求应为20-30分钟(主要需求),而非3-5分钟
|
||||
- **建议:** 数字人必须要有手势动作,至少前后十秒要有手的动作
|
||||
- **建议:** 增加结尾画面,数字人独立告别
|
||||
- **建议:** 测试VEO 3.1的能力,使用Gemini 3.0生成分镜头脚本+图片
|
||||
- **建议:** 研究可以微调和训练的数字人平台
|
||||
- **建议:** 前端重构时要考虑下一版本交互逻辑,用Codex审查后端代码
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|数字人PPT视频样本生成(真人训练,本周周末前)
|
||||
- [ ] 🔴 P0|数字人视频工作流研究
|
||||
- [ ] 🔴 P0|Gemini 3.0分镜头脚本+VEO 3.1视频生成测试
|
||||
- [ ] P1|完成前端框架重构分析
|
||||
|
||||
---
|
||||
|
||||
## 三、会议总结
|
||||
|
||||
**核心议题:** Gemini多模态能力应用、会议纪要Skill优化、数字人视频生成、Agent架构组织
|
||||
|
||||
**关键决策:**
|
||||
1. **采用Gemini 1.5 Pro进行会议视频转写:** 多模态能力最强,转写准确率高,所有成员必须使用
|
||||
2. **会议转写改为全量读取方式:** 不再使用索引搜索,避免信息遗漏
|
||||
3. **转写文本需先进行Clean处理:** 去除重复冗余后再提供给主上下文
|
||||
4. **会议纪要进展情况以会议转写为优先:** 周报为补充
|
||||
5. **P0/P1/P2优先级判断采用人机协作:** AI给出建议,人工确认
|
||||
6. **Sub-agent调用必须使用绝对路径:** 相对路径调用不稳定
|
||||
7. **推荐Agent调用Agent的方式:** 而非Skill调用Agent,组织更清晰
|
||||
8. **数字人视频时长改为支持20-30分钟:** 这是主要需求场景
|
||||
9. **招投标Skill架构设计提升为P0任务:** 涉及30万合同,需本周完成
|
||||
10. **前端开发用Gemini,代码逻辑用Claude Code,测试用GPT Codex:** 不同任务使用不同模型
|
||||
|
||||
**下周工作重点:**
|
||||
1. 🔴 会议纪要Skill优化:生成三版对比(腾讯转写版、Gemini转写版、Gemini直接生成版)
|
||||
2. 🔴 招投标文件Skill架构设计(本周完成)
|
||||
3. 🔴 数字人PPT视频样本生成(本周周末前,真人训练)
|
||||
4. 🔴 Gemini 3.0分镜头脚本+VEO 3.1视频生成测试
|
||||
5. 🔴 前端重构方案完善(Code Review + 方案对比)
|
||||
6. 需求澄清Skill专家交叉评审效果可视化
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-08
|
||||
**下次会议:** 2025-12-15
|
||||
186
会议转写测试/会议纪要生成效果对比/gemini清洗前平台一次性生成/gemini工程类会议纪要.md
Normal file
186
会议转写测试/会议纪要生成效果对比/gemini清洗前平台一次性生成/gemini工程类会议纪要.md
Normal file
@ -0,0 +1,186 @@
|
||||
# 工程类会议纪要-2025-12-02-第X次周会
|
||||
|
||||
## 一、会议信息
|
||||
|
||||
- **会议时间:** 2025-12-02
|
||||
- **参会人员:** 连云波(主持)、江争达、郝倩玉、陶西平、闫旭隆
|
||||
- **记录整理人:** Gemini
|
||||
|
||||
------
|
||||
|
||||
## 二、工作内容
|
||||
|
||||
### 1. 重点项目进展情况汇总
|
||||
|
||||
| **项目名称** | **原负责人** | **原截止时间** | **项目进展情况** |
|
||||
| ------------------------ | -------------- | -------------- | ------------------------------------------------------------ |
|
||||
| 会议纪要Skill架构优化 | 闫旭隆 | 12月02日 | **基本完成但需进一步测试**(周报:已完成)。 会议演示了全量读取转写文本的方案,但发现Sub-agent调用存在路径和上下文隔离问题,建议后续尝试Agent调用Agent架构;计划引入Gemini视频转写作为输入源。 |
|
||||
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 12月02日 | **完成**。 已增加专家博弈机制(多轮交叉评价),并录制了演示视频。 |
|
||||
| 数字人PPT需求文档 | 江争达 | 12月02日 | **需重写**(周报:已完成)。 会议评审未通过:需求提炼过于简单(仅3-5分钟),未体现20-30分钟长视频的技术难点,且对“真实感”理解有误(如流利中文的老外),缺乏手势动作等核心需求。 |
|
||||
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 12月02日 | **进行中**。 已出初版文档,会议建议暂停直接开发,先利用Opus审查后端代码,并用大模型生成前端重构方案进行对比。 |
|
||||
| 数字分身需求文档 | 郝倩玉 | 12月02日 | **暂停/放缓**。 核所需求放缓,暂不以其需求为核心,转为自行调研市面优秀案例。 |
|
||||
|
||||
### 2. 重点项目问题及解决方案
|
||||
|
||||
#### 项目: 会议纪要Skill开发
|
||||
|
||||
**问题1:Skill调用Sub-agent存在上下文和路径问题**
|
||||
|
||||
- **问题描述:** 在测试中发现,Skill调用Sub-agent时,如果是相对路径几乎无法成功,绝对路径偶尔成功;且Sub-agent的上下文隔离效果不理想,逻辑控制存在问题。
|
||||
- **解决方案:**
|
||||
1. **短期方案:** 暂时将Skill逻辑直接提取到主窗口上下文执行,利用主窗口的强大理解能力。
|
||||
2. **长期架构:** 放弃“Skill调Sub-agent”模式,转向“Agent调用Agent”架构,在主Agent下定义子Agent,逻辑更清晰。
|
||||
3. **输入源优化:** 采用Gemini处理会议视频(多模态能力),生成精准文字稿后再喂给Skill。
|
||||
- **责任人:** 闫旭隆
|
||||
- **截止时间:** 2025-12-09
|
||||
|
||||
#### 项目: 数字人PPT生成
|
||||
|
||||
**问题2:需求文档缺乏深度与核心难点**
|
||||
|
||||
- **问题描述:** 提交的需求文档仅列出了基础功能(如PPT同步、画面不遮挡),忽视了长视频(20-30分钟)生成的成本与技术难点,且对数字人“真实感”的定义存在偏差(如不仅是语音流利,更要有肢体动作)。
|
||||
- **解决方案:**
|
||||
1. **修改需求:** 增加时长至20-30分钟的要求,增加手势动作需求。
|
||||
2. **技术路径:** 利用Gemini 3.0生成分镜脚本和分镜图片,结合VEO 3.1或Nano Banana生成视频片段,再进行拼接。
|
||||
3. **样本制作:** 本周内必须用真人素材训练出一个语音和视频样本,验证可行性。
|
||||
- **责任人:** 江争达
|
||||
- **截止时间:** 2025-12-09
|
||||
|
||||
#### 项目: 前端重构
|
||||
|
||||
**问题3:重构方案缺乏大模型辅助验证**
|
||||
|
||||
- **问题描述:** 目前的重构方案主要基于人工思考,未充分利用大模型能力进行代码审查和方案对比;且Claude 4.5在文字回答上存在幻觉风险。
|
||||
- **解决方案:**
|
||||
1. **后端审查:** 使用Opus 4.5或Codex对现有后端代码进行Code Review。
|
||||
2. **方案对比:** 让GPT-5.1或Gemini基于现有架构生成一版前端重构方案,与人工方案进行对比,查漏补缺。
|
||||
- **责任人:** 江争达、陶西平
|
||||
- **截止时间:** 2025-12-09
|
||||
|
||||
### 3. 下周工作安排
|
||||
|
||||
| **项目名称** | **负责人** | **下周会前目标** | **优先级** | **截止时间** |
|
||||
| ----------------------------- | ------------------ | ------------------------------------------------------------ | ---------- | ------------ |
|
||||
| 🔴 会议纪要Skill优化与测试 | 闫旭隆 | 生成双版本对比纪要:1.基于当前Skill+腾讯会议文本;2.基于Gemini视频转写+Skill | P0 | 12月09日 |
|
||||
| 🔴 需求澄清Skill二阶段可视化 | 闫旭隆 | 整理二阶段专家交叉回应的可视化效果,并梳理完整流程图 | P0 | 12月09日 |
|
||||
| 🔴 数字人PPT视频样本及需求修正 | 江争达 | 1.产出真人训练视频样本;2.使用Gemini 3.0测试分镜脚本;3.修正需求文档 | P0 | 12月09日 |
|
||||
| 🔴 招投标文件Skill架构设计 | 闫旭隆、郝倩玉 | 完成架构设计(需求紧急,优先级提升) | P0 | 12月09日 |
|
||||
| 问答系统V1.1前端重构 | 江争达、陶西平 | 使用大模型(Opus/GPT)生成对比方案并审查后端代码 | P1 | 12月09日 |
|
||||
| Gartner报告解读转写系统 | 郝倩玉、闫旭隆 | 完成架构设计 | P1 | 12月09日 |
|
||||
| PDF Skill技术调研 | 江争达 | 调研Claude Code PDF能力 | P1 | 12月09日 |
|
||||
| 架构迁移研究 | 闫旭隆 | 研究从Cloud Code Skill架构转为LangChain/Deep Agent架构的可行性 | P1 | 待定 |
|
||||
| 日报驱动系统需求研究 | 江争达(丁康执行) | 指导丁康完成Asana架构学习及日报驱动需求研究 | P2 | 待定 |
|
||||
| Skill Plugin管理系统搭建 | 江争达 | 学习并搭建内部Skill Marketplace | P2 | 待定 |
|
||||
|
||||
### 4. 组内成员工作进展
|
||||
|
||||
#### 闫旭隆
|
||||
|
||||
**上周完成:**
|
||||
|
||||
- ✅ 需求澄清-需求文档skill优化(增加多轮博弈机制)
|
||||
- ✅ 会议纪要Skill优化(全量读取模式)
|
||||
|
||||
**进行中:**
|
||||
|
||||
- 🔄 招投标文件Skill架构设计
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
|
||||
- **建议:** Skill调用Sub-agent路径问题难以解决,建议转向Agent调用Agent架构。
|
||||
- **建议:** 提示词编写要有明确的正确/错误示例,才能保证Agent执行质量。
|
||||
- **表扬:** 演示的PPT生成Skill(结合Gemini规划+Playwright执行)效果非常好,完全自动化。
|
||||
|
||||
**下周任务:**
|
||||
|
||||
- [ ] 🔴 P0|会议纪要Skill优化与测试(Gemini视频源对比)
|
||||
- [ ] 🔴 P0|需求澄清Skill二阶段可视化
|
||||
- [ ] 🔴 P0|招投标文件Skill架构设计
|
||||
- [ ] P1|架构迁移研究(Skill to Deep Agent)
|
||||
|
||||
#### 江争达
|
||||
|
||||
**上周完成:**
|
||||
|
||||
- ✅ 数字人PPT需求文档(会议评审认为需重写)
|
||||
- ✅ 问答系统v1.1前端重构方案(初版)
|
||||
|
||||
**进行中:**
|
||||
|
||||
- 🔄 数字人PPT需求文档修正
|
||||
- 🔄 前端重构方案优化
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
|
||||
- **批评:** 数字人需求文档“只看树木不看森林”,对“真实感”理解有误(如流利中文老外问题)。
|
||||
- **批评:** 需求文档过于简单,未挖掘20-30分钟长视频生成的真正技术难点。
|
||||
- **建议:** 不要急着写代码,先用Opus审查后端,用GPT/Gemini生成前端方案做对比。
|
||||
- **建议:** 尽快测试Gemini 3.0的分镜脚本生成能力。
|
||||
|
||||
**下周任务:**
|
||||
|
||||
- [ ] 🔴 P0|数字人PPT视频样本及需求修正
|
||||
- [ ] P1|问答系统V1.1前端重构(模型辅助方案)
|
||||
- [ ] P1|PDF Skill技术调研
|
||||
- [ ] P2|日报驱动系统需求研究(指导丁康)
|
||||
- [ ] P2|Skill Plugin管理系统搭建
|
||||
|
||||
#### 郝倩玉
|
||||
|
||||
**上周完成:**
|
||||
|
||||
- ✅ Gartner报告解读转写系统需求文档
|
||||
- ✅ 投标商务应答文件自动生成系统需求文档
|
||||
|
||||
**进行中:**
|
||||
|
||||
- 🔄 数字分身需求对接(放缓)
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
|
||||
- **确认:** 招投标文件Skill需求紧急,提升为P0优先级。
|
||||
|
||||
**下周任务:**
|
||||
|
||||
- [ ] 🔴 P0|招投标文件Skill架构设计(协助)
|
||||
- [ ] P1|Gartner报告解读转写系统架构设计
|
||||
|
||||
#### 陶西平
|
||||
|
||||
**上周完成:**
|
||||
|
||||
- ✅ 协助江老师修改数字人需求文档
|
||||
- ✅ 前端框架重构分析
|
||||
|
||||
**进行中:**
|
||||
|
||||
- 🔄 前端功能分析
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
|
||||
- **任务调整:** 配合江争达进行前端重构的大模型方案生成与对比。
|
||||
|
||||
**下周任务:**
|
||||
|
||||
- [ ] P1|问答系统V1.1前端重构(协助)
|
||||
|
||||
------
|
||||
|
||||
## 三、会议总结
|
||||
|
||||
**核心议题:** 会议纪要Skill架构复盘、数字人PPT需求深度评审、前端重构方法论纠偏
|
||||
|
||||
**关键决策:**
|
||||
|
||||
1. **会议纪要输入源升级:** 决定引入Gemini处理会议视频,利用其多模态能力生成高质量文字稿作为Skill输入。
|
||||
2. **Agent架构调整:** 鉴于Skill调用Sub-agent的路径和上下文问题,未来开发倾向于“Agent调用Agent”或主窗口全量加载模式。
|
||||
3. **数字人需求变更:** 明确数字人PPT视频需满足20-30分钟时长,必须包含手势动作,并利用Gemini 3.0生成分镜脚本。
|
||||
4. **优先级调整:** 招投标文件Skill开发提升为P0级任务。
|
||||
5. **重构方法论:** 前端重构禁止直接编码,必须先通过大模型(Opus/GPT)进行后端审查和前端方案生成对比。
|
||||
|
||||
**下周工作重点:**
|
||||
|
||||
1. 完成会议纪要Skill的双版本效果对比(腾讯会议文本 vs Gemini视频转写)。
|
||||
2. 产出数字人真人的训练视频样本及修正后的需求文档。
|
||||
3. 完成招投标文件Skill的架构设计。
|
||||
4. 落实前端重构的大模型辅助验证方案。
|
||||
260
会议转写测试/会议纪要生成效果对比/gemini清洗后/Q&A资源库类会议纪要_2025-12-02_第6次周会.md
Normal file
260
会议转写测试/会议纪要生成效果对比/gemini清洗后/Q&A资源库类会议纪要_2025-12-02_第6次周会.md
Normal file
@ -0,0 +1,260 @@
|
||||
# Q&A资源库类会议纪要 (2025-12-02)
|
||||
|
||||
## 一、会议信息
|
||||
|
||||
- **会议时间:** 2025-12-02
|
||||
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
|
||||
- **纪要整理人:** Claude
|
||||
|
||||
---
|
||||
|
||||
## 二、工作问题 Q&A
|
||||
|
||||
### 1. 会议纪要Skill相关问题
|
||||
|
||||
**Q1: 会议纪要Skill信息提取准确性不足怎么办?**
|
||||
|
||||
**问题详情:** 文字转写准确性不够,语义识别困难;缺乏上下文约束能力;分块搜索导致信息遗漏;P0/P1/P2优先级判断不准确。
|
||||
|
||||
**A1:**
|
||||
1. 将文字转写工具从腾讯会议换成Gemini多模态转写,利用其视觉识别能力提高准确性
|
||||
2. 对转写文本进行Clean预处理,去除脏数据和重复内容
|
||||
3. 采用全量主上下文窗口处理,不用分块搜索
|
||||
4. P0/P1/P2优先级在会议上实时确认,不完全依赖AI判断
|
||||
|
||||
---
|
||||
|
||||
**Q2: 子Agent分割处理会导致什么问题?**
|
||||
|
||||
**问题详情:** 使用多个子Agent并行提取信息后,在主窗口整合时发现信息丢失和逻辑割裂。
|
||||
|
||||
**A2:**
|
||||
1. 子Agent提取后主窗口无法建立各部分之间的关联性
|
||||
2. 建议把Clean后的转写文本直接加载给主上下文全量处理
|
||||
3. 将子Agent提取的结果作为增强Prompt传给主上下文,减少信息损失
|
||||
4. 非长连续工作场景,主上下文能处理好的就全放主上下文
|
||||
|
||||
---
|
||||
|
||||
### 2. Sub-agent架构相关问题
|
||||
|
||||
**Q3: Sub-agent调用不稳定怎么解决?**
|
||||
|
||||
**问题详情:** Sub-agent在项目下使用相对路径调用时几乎无法成功执行,会读取prompt但不执行。
|
||||
|
||||
**A3:**
|
||||
1. **必须使用绝对路径调用Sub-agent**,相对路径调用不稳定
|
||||
2. 采用Agent调Agent的架构,而非Skill调Agent
|
||||
3. 定义主Agent后直接选定激活,其他Agent自动成为Sub-agent
|
||||
4. 调试阶段可用Skill,调通后将Skill.md移植到Agent中
|
||||
|
||||
---
|
||||
|
||||
**Q4: Skill和Agent应该如何组织架构?**
|
||||
|
||||
**问题详情:** Skill调Agent、Agent调Skill来回嵌套导致逻辑混乱。
|
||||
|
||||
**A4:**
|
||||
1. **用Agent调Agent,不用Skill调Agent**
|
||||
2. 可以用Skill嵌套Skill,虽然上下文长但逻辑控制精确
|
||||
3. Sub-agent因不带上下文会导致控制问题,主上下文共享更好
|
||||
4. 子项目下用主Agent组织其他Agent更清晰
|
||||
|
||||
---
|
||||
|
||||
### 3. 数字人PPT相关问题
|
||||
|
||||
**Q5: 数字人选型需要注意什么?**
|
||||
|
||||
**问题详情:** 老外数字人说流利中文会让人质疑真实性,与追求真实感的目标矛盾。
|
||||
|
||||
**A5:**
|
||||
1. **不要只看树木不看森林**,老外说流利中文会让人质疑真假
|
||||
2. 追求真实性就要用真实可信的形象,用真人录制训练
|
||||
3. 数字人必须有手势动作,前十秒不能呆站
|
||||
4. 视频结尾加独立告别画面,有始有终
|
||||
|
||||
---
|
||||
|
||||
**Q6: 数字人平台如何选型?**
|
||||
|
||||
**问题详情:** 多个平台费用和能力不同,如何选择。
|
||||
|
||||
**A6:**
|
||||
1. **优先百度希壤和HeyGen(黑镜)**
|
||||
2. 可灵即梦按秒收费太贵
|
||||
3. 百度希壤按分钟包价格合理(40块钱10分钟)
|
||||
4. 黑镜会员免费生成,只收定制费
|
||||
5. 可尝试Gemini VEO 3.1,3.0 Pro后视频能力升级明显
|
||||
|
||||
---
|
||||
|
||||
### 4. 前端重构相关问题
|
||||
|
||||
**Q7: 前端重构应该如何规划?**
|
||||
|
||||
**问题详情:** 只重构展示部分可能不够,担心后续架构又要重改。
|
||||
|
||||
**A7:**
|
||||
1. **重构时必须考虑下一版本的交互逻辑修改**
|
||||
2. 后端先不动,用Opus 4.5或Codex做一次Code Review
|
||||
3. 将审查发现的问题记录作为重构需求文档
|
||||
4. 先审查再动手,避免盲目重构
|
||||
|
||||
---
|
||||
|
||||
### 5. 需求Skill相关问题
|
||||
|
||||
**Q8: 多专家博弈评审机制如何验证效果?**
|
||||
|
||||
**问题详情:** 只看到专家提问,看不到响应,无法判断评审水平是否足够。
|
||||
|
||||
**A8:**
|
||||
1. 将专家评估意见和响应整合成可视化的一问一答文档
|
||||
2. 评估提问和响应的水平是否匹配
|
||||
3. 水平不匹配则不需要这个环节
|
||||
4. 各领域专家的prompt需要专人编写
|
||||
|
||||
---
|
||||
|
||||
### 6. AI能力边界相关问题
|
||||
|
||||
**Q9: AI优先级判断不准怎么办?**
|
||||
|
||||
**问题详情:** AI对P0/P1/P2任务优先级判断困难,缺乏人员背景等隐性上下文。
|
||||
|
||||
**A9:**
|
||||
1. **在会议上实时确认优先级**,不完全依赖AI
|
||||
2. 让AI先给出建议排序,人再确认反馈
|
||||
3. 将确认过程材料保留,用于后续强化学习
|
||||
4. 尝试将潜在上下文逐步显性化
|
||||
|
||||
---
|
||||
|
||||
## 三、重点工作方法
|
||||
|
||||
### 方法1: 多模态视频转写优先法
|
||||
- **描述:** 使用Gemini多模态能力处理会议视频转写,相比纯语音识别效率更高。Gemini能识别画面内容、文字和说话人动作,可通过prompt调整提取内容,甚至直接给会议模版让其一步生成会议纪要。
|
||||
- **适用场景:** 会议记录、视频内容提取、多信息源整合
|
||||
- **关键要点:**
|
||||
- 多模态处理比纯语音识别效率高,能识别背景画面信息
|
||||
- Gemini上下文最长(100万token),视觉能力最强
|
||||
- 可用Gem自定义功能,预置会议纪要模版后上传视频自动生成
|
||||
|
||||
### 方法2: AI工具组合使用策略
|
||||
- **描述:** 不同AI工具各有专长,应根据任务特点组合使用:前端用Gemini(多模态强),中间逻辑用Claude(工具调用强),项目修复测试用GPT Codex。
|
||||
- **适用场景:** 复杂项目开发、多任务并行处理
|
||||
- **关键要点:**
|
||||
- Gemini最全面,多模态尤其视觉能力超强,适合做PPT和视频
|
||||
- Claude工具调用和工具理解能力无人能及,做Agent首选
|
||||
- 选择工具要看任务特点而非盲目追求最聪明的模型
|
||||
|
||||
### 方法3: 转写文本预清洗法
|
||||
- **描述:** 在处理会议转写前,先用AI对原始转写进行Clean,去除脏数据和重复内容,保证信息全面的同时内容紧凑。
|
||||
- **适用场景:** 会议转写处理、长文本预处理、数据清洗
|
||||
- **关键要点:**
|
||||
- 原始转写存在逻辑中断、错误,直接处理效果差
|
||||
- Clean后内容紧凑,从3万字可精简到2万字左右
|
||||
- 避免给AI喂垃圾数据,先精加工再处理
|
||||
|
||||
### 方法4: 主上下文全量处理法
|
||||
- **描述:** 对于信息损失敏感的任务,优先在主上下文窗口全量处理,而非分割给多个子Agent。
|
||||
- **适用场景:** 信息整合、关联分析、会议纪要生成
|
||||
- **关键要点:**
|
||||
- 子Agent处理会造成逻辑割裂和信息丢失
|
||||
- 主上下文直接生成比提示词生成再整合信息量更大
|
||||
- 非长连续工作场景,主上下文能处理好的就全放主上下文
|
||||
|
||||
### 方法5: 人机协作关键节点介入法
|
||||
- **描述:** 识别AI难以自主判断的关键节点(如优先级判断),在这些节点让人介入给予关键帮助。
|
||||
- **适用场景:** 复杂决策、优先级判断、隐性知识应用
|
||||
- **关键要点:**
|
||||
- AI缺乏潜上下文(人员级别、工作年限等),某些判断靠人更有效
|
||||
- 先让AI给建议再人工确认,保留确认记录用于后续训练
|
||||
- 把潜在上下文逐步显性化给AI
|
||||
|
||||
### 方法6: 会议实时确认法
|
||||
- **描述:** 在会议进行中或刚结束时,实时整理会议纪要并当场确认,不等会后让AI自行判断。
|
||||
- **适用场景:** 周会、项目会议、决策会议
|
||||
- **关键要点:**
|
||||
- 会议中前半部分已可开始整理
|
||||
- 会上直接确认P0/P1等关键信息
|
||||
- 当场确认效率最高、准确度最高
|
||||
|
||||
### 方法7: Sub-Agent绝对路径调用法
|
||||
- **描述:** 在项目下调用Sub-Agent时必须使用绝对路径,相对路径调用几乎不成功。
|
||||
- **适用场景:** Skill开发、Agent架构设计
|
||||
- **关键要点:**
|
||||
- 相对路径调用Sub-Agent几乎不成功
|
||||
- 绝对路径调用测试七八次基本稳定
|
||||
- 不指定目录时AI会优先找全局Agent
|
||||
|
||||
### 方法8: Agent调用Agent架构
|
||||
- **描述:** 不要在Skill里调用Sub-Agent,而应该用Agent调用Agent。定义主Agent后选定它,再调用的其他Agent就是Sub-Agent。
|
||||
- **适用场景:** 复杂Agent系统设计、多Agent协作
|
||||
- **关键要点:**
|
||||
- Skill调用Sub-Agent组织会乱
|
||||
- Agent调Agent最容易实现
|
||||
- 避免Skill和Agent互相嵌套调用
|
||||
|
||||
### 方法9: Skill嵌套Skill替代Sub-Agent
|
||||
- **描述:** 直接用Skill嵌套Skill来组织复杂流程,放弃Sub-Agent。虽然上下文较长,但逻辑控制精确。
|
||||
- **适用场景:** 复杂流程自动化、多步骤任务
|
||||
- **关键要点:**
|
||||
- Skill套Skill比Sub-Agent清晰得多
|
||||
- 上下文共享使逻辑控制精确
|
||||
- Sub-Agent不带上下文会导致控制问题
|
||||
|
||||
### 方法10: 上下文越全越好原则
|
||||
- **描述:** 不要过度限定AI做什么,而是给它尽量完整的上下文,让它自己理解并制定方案。
|
||||
- **适用场景:** 创意生成、方案设计、内容生成
|
||||
- **关键要点:**
|
||||
- Claude生成的提示词不如Gemini直接读文档效果好
|
||||
- 不要规定AI做什么,给全上下文让它自己决定
|
||||
- 启发:上下文管理思路的转变
|
||||
|
||||
### 方法11: Playwright+OS Scripts自动化工作流
|
||||
- **描述:** 用Playwright MCP控制浏览器操作,当操作超出浏览器范围时用OS Scripts接管,实现完全自动化。
|
||||
- **适用场景:** 网页自动化、图片生成、PPT制作
|
||||
- **关键要点:**
|
||||
- Playwright控制浏览器内操作
|
||||
- OS Scripts处理系统对话框等浏览器外操作
|
||||
- Python脚本组装最终产出
|
||||
|
||||
### 方法12: AI分镜头脚本生成法
|
||||
- **描述:** 用Gemini 3生成分镜头脚本,分段生成图片,再通过首尾帧生成连贯视频,最后合成完整视频。
|
||||
- **适用场景:** 视频制作、数字人视频、宣传片
|
||||
- **关键要点:**
|
||||
- Gemini 3对镜头理解和分镜脚本生成优于其他模型
|
||||
- 先生成分段图片,再用首尾帧生成视频
|
||||
- 分段生成后合并成完整视频
|
||||
|
||||
### 方法13: 代码审查驱动重构法
|
||||
- **描述:** 重构前先用AI对现有代码做完整审查,记录问题作为需求文档,再逐步重构。
|
||||
- **适用场景:** 代码重构、技术债务清理、架构升级
|
||||
- **关键要点:**
|
||||
- 先审查再动手,审查结果就是重构需求文档
|
||||
- 用Opus 4.5或Codex做Code Review
|
||||
- 重构时同时考虑下一版本功能需求
|
||||
|
||||
### 方法14: AI模拟专家访谈法
|
||||
- **描述:** 在需求文档第一版生成时,用AI模拟领域专家来回答访谈问题,实现需求采集流程自动化。
|
||||
- **适用场景:** 需求采集、专家访谈、方案设计
|
||||
- **关键要点:**
|
||||
- 用AI模拟比我们经验丰富的专家
|
||||
- 专家Agent回答可能更全面
|
||||
- 适用于需求文档初版生成
|
||||
|
||||
### 方法15: 字段映射逻辑图驱动开发
|
||||
- **描述:** 开发复杂Skill时,先绘制每个输出字段的来源映射逻辑图,明确来源和优先级。
|
||||
- **适用场景:** Skill开发、数据处理流程设计
|
||||
- **关键要点:**
|
||||
- 每个字段明确来源和优先级
|
||||
- 用可视化逻辑图而非纯文字描述
|
||||
- 解决AI逻辑不连贯问题
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-02
|
||||
**下次会议:** 2025-12-09
|
||||
@ -0,0 +1,86 @@
|
||||
# 云大所需求相关进度会议纪要 (2025-12-02)
|
||||
|
||||
## 一、会议信息
|
||||
|
||||
- **会议时间:** 2025-12-02
|
||||
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
|
||||
- **纪要整理人:** Claude
|
||||
|
||||
---
|
||||
|
||||
## 二、需求项目进展
|
||||
|
||||
| 项目名称 | 负责人 | 本周进展 | 存在问题 | 下周计划 | 优先级 |
|
||||
|----------|--------|----------|----------|----------|--------|
|
||||
| 投标商务应答自动生成系统 | 郝倩玉、闫旭隆、江争达 | 需求文档已完成,已发闫旭隆确认 | 架构设计待启动 | 从P1提升到P0,完成招投标Skill架构设计 | P0 |
|
||||
| 运营商信息精准爬取系统 | 郝倩玉 | 持续跟进需求方反馈 | 需求方具体需求一直不能明确 | 持续跟进需求方反馈 | P1 |
|
||||
| 数字人项目 | 江争达、陶西平 | 需求文档已完成删减优化,整合平台选型调研结果 | 1)第二阶段功能规划缺失;2)时长需求不准确(当前3-5分钟,实际应20-30分钟);3)数字人缺少手势动作;4)老外说流利中文的真实性问题 | 用真人训练生成PPT样本;研究数字人工作流;测试Gemini分镜头视频生成 | P0 |
|
||||
| Gartner 报告解读转写系统 | 郝倩玉 | 需求文档已完成,已发闫旭隆 | 无 | 等待技术方案确认 | P1 |
|
||||
| 客户风险推送自动化系统 | - | 本次会议未讨论 | - | - | - |
|
||||
| 邮件自动处理转发系统 | - | 本次会议未讨论 | - | - | - |
|
||||
| 证书信息提取系统 | - | 本次会议未讨论 | - | - | - |
|
||||
| 云大阁新报告自动推送 | - | 本次会议未讨论 | - | - | - |
|
||||
|
||||
---
|
||||
|
||||
## 三、问题与风险
|
||||
|
||||
### 1. 投标商务应答自动生成系统
|
||||
|
||||
**问题描述:** 需求文档已完成,但架构设计尚未启动
|
||||
|
||||
**解决方案:**
|
||||
- 从P1提升到P0优先级,加快推进
|
||||
- 闫旭隆负责确认需求文档并设计Skill架构
|
||||
- 江争达负责后期调试
|
||||
|
||||
**责任人:** 郝倩玉、闫旭隆、江争达
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
---
|
||||
|
||||
### 2. 运营商信息精准爬取系统
|
||||
|
||||
**问题描述:** 需求方(富有、琳贤)的具体需求一直不能明确
|
||||
|
||||
**解决方案:**
|
||||
- 持续跟进,反复沟通
|
||||
- 提供可行性方案给对方做参考
|
||||
|
||||
**责任人:** 郝倩玉
|
||||
**截止时间:** 待定(等待需求方明确)
|
||||
|
||||
---
|
||||
|
||||
### 3. 数字人项目
|
||||
|
||||
**问题描述:**
|
||||
1. 需求文档第二阶段功能缺失
|
||||
2. 时长需求不准确(3-5分钟 vs 实际20-30分钟)
|
||||
3. 数字人形象和动作要求不完整
|
||||
4. 真实性考虑不足
|
||||
|
||||
**解决方案:**
|
||||
1. 补充第二阶段功能详细说明
|
||||
2. 时长需求扩展到支持20-30分钟PPT宣讲
|
||||
3. 增加手势动作要求,避免呆板
|
||||
4. 使用真人录制训练的语音和形象
|
||||
5. 视频结尾增加独立告别画面
|
||||
|
||||
**责任人:** 江争达、陶西平
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
---
|
||||
|
||||
## 四、下周重点
|
||||
|
||||
1. 🔴 **投标商务应答自动生成系统** - 完成Skill架构设计(P0)
|
||||
2. 🔴 **数字人项目** - 用真人训练生成PPT样本;研究数字人工作流;测试Gemini分镜头视频生成(P0)
|
||||
3. **运营商信息精准爬取系统** - 持续跟进需求方反馈(P1)
|
||||
4. **Gartner报告解读转写系统** - 等待技术方案确认(P1)
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-02
|
||||
**下次会议:** 2025-12-09
|
||||
309
会议转写测试/会议纪要生成效果对比/gemini清洗后/工程类会议纪要_2025-12-02_第6次周会.md
Normal file
309
会议转写测试/会议纪要生成效果对比/gemini清洗后/工程类会议纪要_2025-12-02_第6次周会.md
Normal file
@ -0,0 +1,309 @@
|
||||
# 工程类会议纪要 (2025-12-02)
|
||||
|
||||
## 一、会议信息
|
||||
|
||||
- **会议时间:** 2025-12-02
|
||||
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
|
||||
- **纪要整理人:** Claude
|
||||
|
||||
---
|
||||
|
||||
## 二、工作内容
|
||||
|
||||
### 1. 重点项目进展情况汇总
|
||||
|
||||
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|
||||
|----------|----------|------------|--------------|
|
||||
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成整体架构改进:从索引搜索改为全量读取方式;完成字段来源映射逻辑图设计;修改负责人字段为"原负责人",截止时间改为"原截止时间"。存在问题:1)文字语义识别仍是最大问题;2)存在信息遗漏(日报驱动系统未提取);3)逻辑判断存在矛盾。**解决方案:** 1)转写工具换成Gemini多模态;2)生成Clean后的全量文字稿作为输入;3)全量主上下文窗口处理;4)将Subagent逻辑整合成单一Skill文件 |
|
||||
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 正在进行多专家博弈评审机制验证,已生成专家评审JSON文件。存在问题:1)多专家博弈的prompt可能没写好;2)需验证评审水平是否达标。**解决方案:** 1)把专家评估意见整合成可视化文档(一问一答形式);2)各领域专家Prompt需专人编写;3)尝试用AI模拟专家回答访谈问题 |
|
||||
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成需求文档删减和优化,保留有用需求,删除默认功能;分阶段规划保持不变;已整合数字人平台选型调研结果。存在问题:1)第二阶段功能规划缺失;2)时长需求定义不准确(当前3-5分钟,实际应为20-30分钟);3)数字人缺少手势动作;4)老外说流利中文的真实性问题。**解决方案:** 1)补充第二阶段说明;2)时长调整为20-30分钟;3)加入手势要求;4)用真实人容貌训练 |
|
||||
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 未在会议中讨论,需求方尚未明确反馈 |
|
||||
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 正在规划前端展示部分和代码结构重构,保留现有基础功能。存在问题:1)需考虑下一版本交互逻辑更改;2)后端代码质量未知。**解决方案:** 1)重构时考虑下一版本功能需求;2)用Opus 4.5或Codex对后端做Code Review;3)后端先不动,审查后再规划 |
|
||||
| 问答系统V1.0测试推动 | 江争达、郝倩玉 | 2025-12-02 | 未在会议中详细讨论,多次与媛媛沟通,相关领导参与测试时间尚未确定 |
|
||||
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 从P1提升到P0,比较紧急。投标商务响应文件自动生成系统需求文档已完成 |
|
||||
| Gartner报告解读转写系统需求文档 | 郝倩玉 | 2025-12-02 | 已完成,已发闫旭隆 |
|
||||
|
||||
### 2. 重点项目问题及解决方案
|
||||
|
||||
#### 问题1: 会议纪要Skill信息提取准确性问题
|
||||
|
||||
**问题描述:**
|
||||
会议纪要Skill在信息提取时存在以下问题:
|
||||
- 文字转写的准确性不够,语义识别困难
|
||||
- 缺乏上下文约束能力,无法理解会议背景信息
|
||||
- 分块搜索导致信息遗漏,如日报驱动系统未被提取
|
||||
- 逻辑判断存在矛盾,如周报显示完成但会议中反映未完成
|
||||
- P0/P1/P2优先级判断不准确
|
||||
|
||||
**解决方案:**
|
||||
1. 将文字转写工具从腾讯会议换成Gemini多模态转写,利用其视觉识别能力提高准确性
|
||||
2. 对转写文本进行Clean预处理,去除脏数据和重复内容,保证信息紧凑
|
||||
3. 采用全量主上下文窗口处理,将Clean后的转写文本直接加载给主窗口
|
||||
4. 将子Agent提取的结果作为增强Prompt传给主上下文,减少信息损失
|
||||
5. 尝试用Agent调Agent的架构替代Skill调Agent,使组织逻辑更清晰
|
||||
|
||||
**责任人:** 闫旭隆
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题2: Sub-agent调用不稳定问题
|
||||
|
||||
**问题描述:**
|
||||
Sub-agent在项目下使用相对路径调用时几乎无法成功执行:
|
||||
- 全局下调用Sub-agent能正常执行
|
||||
- 项目下使用相对路径调用时,会读取Sub-agent的prompt但不执行
|
||||
- 项目下使用绝对路径调用时才能稳定成功
|
||||
|
||||
**解决方案:**
|
||||
1. Sub-agent调用时必须使用绝对路径
|
||||
2. 采用Agent调Agent的架构,而非Skill调Agent
|
||||
3. 定义主Agent后直接选定激活,其他Agent自动成为Sub-agent
|
||||
4. 调试阶段可用Skill,调通后将Skill.md移植到Agent中
|
||||
5. 非必要情况下用Agent组织Agent,不用Skill组织Agent
|
||||
|
||||
**责任人:** 闫旭隆
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题3: 数字人PPT需求文档产出问题
|
||||
|
||||
**问题描述:**
|
||||
数字人PPT需求文档存在以下问题:
|
||||
- 时长需求不准确,只写了3-5分钟,但实际PPT宣讲需要20-30分钟
|
||||
- 第二阶段功能需求未写入文档
|
||||
- 数字人动作要求不完整,缺少手势动作要求
|
||||
- 真实性考虑不足,老外说流利中文会让人质疑真假(本末倒置)
|
||||
|
||||
**解决方案:**
|
||||
1. 时长需求扩展到支持20-30分钟的PPT宣讲
|
||||
2. 将第一阶段和第二阶段功能需求都完整写入文档
|
||||
3. 增加数字人手势动作要求,避免前十秒后十秒呆板无动作
|
||||
4. 数字人形象选型需考虑真实性,使用真人录制训练的语音和形象
|
||||
5. 视频结尾增加数字人独立告别画面,有始有终
|
||||
|
||||
**责任人:** 江争达、陶西平
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题4: 前端重构方案考虑不全面
|
||||
|
||||
**问题描述:**
|
||||
问答系统v1.1前端重构需要考虑更多因素:
|
||||
- 只重构前端展示和代码结构可能不够
|
||||
- 需要考虑下一版本的交互逻辑变更
|
||||
- 后端代码质量未经审查
|
||||
|
||||
**解决方案:**
|
||||
1. 重构时需考虑下一版本可能的功能需求和交互逻辑变更
|
||||
2. 用Opus 4.5或Codex对后端代码进行一次Code Review审查
|
||||
3. 将审查发现的问题记录下来作为后续重构的需求文档
|
||||
4. 后端暂不动,先审查再规划
|
||||
|
||||
**责任人:** 江争达、陶西平
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题5: 需求Skill多专家评审效果不明确
|
||||
|
||||
**问题描述:**
|
||||
需求Skill的多专家博弈评审机制效果无法确认:
|
||||
- 只看到专家提问,看不到响应
|
||||
- 无法判断专家评估水平是否足够
|
||||
- 各领域专家的prompt可能没写好
|
||||
|
||||
**解决方案:**
|
||||
1. 将专家评估意见和最后响应整合成可视化的一问一答文档
|
||||
2. 评估专家提问和响应的水平是否匹配,判断是否有必要保留该环节
|
||||
3. 各领域专家由专人负责编写专业的prompt
|
||||
4. 第一版需求文档生成时可尝试用AI模拟专家回答访谈问题
|
||||
|
||||
**责任人:** 闫旭隆
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题6: AI优先级判断依赖人工介入
|
||||
|
||||
**问题描述:**
|
||||
AI对P0/P1/P2任务优先级的判断非常困难,因为缺乏潜在上下文:
|
||||
- 不知道团队成员的年龄、级别、工作时间长短
|
||||
- 无法理解不同人员分配任务的差异
|
||||
- 这些潜在上下文很难完全显性化给AI
|
||||
|
||||
**解决方案:**
|
||||
1. 在会议上实时确认P0/P1/P2任务优先级
|
||||
2. 让AI先给出建议排序,人再确认反馈
|
||||
3. 将确认过程的材料保留,用于后续强化学习或微调
|
||||
4. 尝试将潜在上下文逐步显性化
|
||||
|
||||
**责任人:** 连云波、闫旭隆
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
### 3. 下周工作安排
|
||||
|
||||
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|
||||
|----------|--------|--------------|--------|----------|
|
||||
| 🔴 会议纪要Skill优化-全量主窗口处理 | 闫旭隆 | 先用现有版本生成会议纪要,然后在主窗口加载会议转写上下文做全量处理;将Subagent逻辑整合成单一Skill文件 | P0 | 2025-12-09 |
|
||||
| 🔴 会议转写文本双版本对比 | 闫旭隆 | 分别用腾讯会议版本和Gemini视频转写版本生成转写文本,进行对比分析 | P0 | 2025-12-09 |
|
||||
| 🔴 Gemini转写文本测试 | 闫旭隆 | 用Gemini转写文本套到现有Skill生成会议纪要 + 直接用Gemini喂视频一步生成会议纪要 | P0 | 2025-12-09 |
|
||||
| 🔴 需求Skill专家交叉回应可视化 | 闫旭隆 | 整理二阶段专家交叉回应模块的可视化效果,把评估意见和响应整合成一问一答文档 | P0 | 2025-12-09 |
|
||||
| 🔴 需求Skill流程图优化 | 闫旭隆 | 走一遍需求Skill流程图,查看未来流程需要怎么修改完善 | P0 | 2025-12-09 |
|
||||
| 🔴 招投标Skill架构设计 | 闫旭隆、郝倩玉 | 从P1提升到P0,完成招投标Skill的架构设计 | P0 | 2025-12-09 |
|
||||
| 🔴 数字人PPT样本生成 | 江争达、陶西平 | 用自己真实人容貌训练出来的语音和视频,生成PPT讲解样本 | P0 | 2025-12-09 |
|
||||
| 🔴 数字人工作流研究 | 江争达、陶西平 | 研究数字人生成工作流,包括API调用、网站操作或剪映自动化工具等 | P0 | 2025-12-09 |
|
||||
| 🔴 Gemini分镜头视频生成测试 | 江争达、陶西平 | 通过Gemini 3.0生成分镜头脚本和图片,再找平台试生成视频效果 | P0 | 2025-12-09 |
|
||||
| 🔴 前端重构-后端代码审查 | 江争达 | 用Codex或Opus 4.5对现有后端代码做Code Review,记录问题作为重构需求 | P0 | 2025-12-09 |
|
||||
| 🔴 前端重构方案优化 | 江争达、陶西平 | 用大模型重新生成前端重构方案,对比现有方案差异;考虑下个版本交互逻辑 | P0 | 2025-12-09 |
|
||||
| 数字分身需求对接 | 郝倩玉 | 持续跟进需求方反馈,推动需求明确 | P1 | 2025-12-09 |
|
||||
| 问答系统V1.0测试推动 | 郝倩玉 | 继续与张媛媛沟通,推动相关领导参与测试 | P1 | 2025-12-09 |
|
||||
| 运营商信息精准爬取系统需求跟进 | 郝倩玉 | 持续跟进需求方反馈 | P1 | 2025-12-09 |
|
||||
| 天眼查自动更新需求确认 | 闫旭隆 | 确认小童是否还需要天眼查客户数据库自动更新功能 | P1 | 2025-12-09 |
|
||||
| 日报驱动项目管理系统开发 | 丁康 | 学习Asana架构和模块,设计日报驱动项目管理系统 | P1 | 待定 |
|
||||
| Skill到LangChain架构迁移研究 | 待定 | 研究如何将Claude Code Skill转移到LangChain/LangGraph架构 | P2 | 待定 |
|
||||
|
||||
### 4. 组内成员工作进展
|
||||
|
||||
#### 闫旭隆
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制
|
||||
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文
|
||||
- ✅ 录制演示视频
|
||||
|
||||
**进行中:**
|
||||
- 🔄 会议纪要Skill架构优化(全量主窗口处理)
|
||||
- 🔄 需求Skill专家博弈机制验证
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **表扬:** 会议纪要Skill的逻辑映射图做得很重要,有助于保持逻辑一致性和前后连贯性
|
||||
- **表扬:** 生成的会议纪要比手动版本更具体详细,主要要点都有提取出来
|
||||
- **批评:** 日报驱动系统没有总结出来,逻辑不全,存在信息遗漏问题
|
||||
- **建议:** 整个文字转写换成Gemini,因为Gemini多模态能力最强
|
||||
- **建议:** 把转写文本Clean一次,去除脏的、重复的内容,直接加载给主上下文
|
||||
- **建议:** 尝试用全量主上下文窗口处理,把Skill全部写到主Agent里
|
||||
- **建议:** P0/P1/P2优先级判断让AI先给建议,人再确认反馈
|
||||
- **建议:** 调试时可以用Skill调用Sub-agent方式,流程调通后把Skill.md移植到Agent中
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|会议纪要Skill优化-全量主窗口处理
|
||||
- [ ] 🔴 P0|会议转写文本双版本对比
|
||||
- [ ] 🔴 P0|Gemini转写文本测试
|
||||
- [ ] 🔴 P0|需求Skill专家交叉回应可视化
|
||||
- [ ] 🔴 P0|需求Skill流程图优化
|
||||
- [ ] 🔴 P0|招投标Skill架构设计
|
||||
- [ ] P1|天眼查自动更新需求确认
|
||||
|
||||
#### 江争达
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 数字人PPT需求文档
|
||||
|
||||
**进行中:**
|
||||
- 🔄 问答系统v1.1前端重构方案
|
||||
- 🔄 PDF Skill技术调研
|
||||
- 🔄 Skill Plugin管理系统搭建
|
||||
- 🔄 服务器采购
|
||||
- 🔄 招投标文件Skill架构调试
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **批评:** 数字人选型存在"只看树木不看森林"的问题——老外生成流利中文会让人质疑真实性,追求真实却选择最假的表现是本末倒置
|
||||
- **建议:** 数字人PPT需求文档中分阶段规划部分,第二阶段内容缺失,建议都写上完整
|
||||
- **建议:** 视频时长需求提得不够准确,应该考虑20-30分钟的PPT宣讲场景
|
||||
- **建议:** 数字人标准中要把手势动作加进去,前十秒后十秒不能呆板无动作
|
||||
- **建议:** 视频结尾可以增加数字人独立的告别画面,有始有终
|
||||
- **建议:** 前端重构时要考虑下一版本的交互逻辑更改
|
||||
- **建议:** 后端先不动,用Opus 4.5或Codex对后端代码做一次审查
|
||||
- **建议:** 通过Gemini 3.0生成分镜头脚本,利用其视觉理解能力生成图片
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|数字人PPT样本生成(真人训练)
|
||||
- [ ] 🔴 P0|数字人工作流研究
|
||||
- [ ] 🔴 P0|Gemini分镜头视频生成测试
|
||||
- [ ] 🔴 P0|前端重构-后端代码审查
|
||||
- [ ] 🔴 P0|前端重构方案优化
|
||||
- [ ] P1|问答系统V1.0测试推动
|
||||
- [ ] P1|PDF Skill技术调研
|
||||
- [ ] P1|服务器采购
|
||||
|
||||
#### 郝倩玉
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 会议纪要Skill架构优化(协助旭隆优化学习类+Q&A类会议纪要Skill逻辑)
|
||||
- ✅ Gartner报告解读转写系统需求文档(已发闫旭隆)
|
||||
- ✅ 问答系统V1.0测试推动沟通
|
||||
|
||||
**进行中:**
|
||||
- 🔄 数字分身需求对接(需求方尚未明确)
|
||||
- 🔄 招投标文件Skill架构设计
|
||||
- 🔄 运营商信息精准爬取系统需求跟进
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- 无(本次会议未针对郝倩玉工作进行专门讨论)
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|招投标Skill架构设计(配合闫旭隆)
|
||||
- [ ] P1|数字分身需求对接
|
||||
- [ ] P1|推动问答系统V1.0测试
|
||||
- [ ] P1|运营商信息精准爬取系统需求跟进
|
||||
|
||||
#### 陶西平
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 数字人PPT需求文档(协助江老师修改)
|
||||
- ✅ 学习使用claudecode的document skill
|
||||
- ✅ 调研数字人平台公共数字人能力
|
||||
- ✅ 根据指定PPT生成数字人结合视频
|
||||
|
||||
**进行中:**
|
||||
- 🔄 数字人与PPT结合优化
|
||||
- 🔄 前端框架重构
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **建议:** 需求文档分阶段规划中,第一阶段和第二阶段功能都应该写清楚
|
||||
- **建议:** 数字人视频时长需求应该考虑20-30分钟的PPT宣讲场景
|
||||
- **建议:** 数字人需要添加手势动作,前十秒呆站着讲是有问题的
|
||||
- **批评:** 老外数字人说流利中文的问题是"只看树木不看森林",会让人质疑真实性
|
||||
- **建议:** 视频结尾可以加数字人独立的告别画面,有始有终
|
||||
- **建议:** 尝试用Gemini VEO 3.1测试视频生成效果
|
||||
- **建议:** 可以通过Gemini 3生成分镜头脚本,分段生成图片再合成视频
|
||||
- **建议:** 前端重构时要考虑下一版本的交互逻辑更改
|
||||
- **建议:** 后端先不动,用Opus 4.5或Codex对后端代码做审查
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|配合江老师数字人PPT样本生成
|
||||
- [ ] 🔴 P0|数字人工作流研究
|
||||
- [ ] 🔴 P0|Gemini分镜头视频生成测试
|
||||
- [ ] 🔴 P0|前端重构方案优化
|
||||
- [ ] P1|完成问答系统前端重构需求文档
|
||||
|
||||
---
|
||||
|
||||
## 三、会议总结
|
||||
|
||||
**核心议题:** 会议纪要Skill架构优化、数字人PPT需求完善、前端重构方案、AI工具选型
|
||||
|
||||
**关键决策:**
|
||||
|
||||
1. **AI工具选型方案确定:** 前端用Gemini处理多模态任务,中间逻辑用Claude Code,测试和问题修复用GPT Codex
|
||||
2. **会议纪要Skill转写工具改用Gemini多模态:** 纯语音识别效率低,Gemini能识别画面内容且错误率低
|
||||
3. **会议转写文本必须先Clean处理:** 去除脏数据和重复内容,保证信息紧凑后再输入
|
||||
4. **尝试全量主上下文窗口处理:** 子Agent方式会导致信息丢失和逻辑割裂,全量处理信息损失最小
|
||||
5. **P0/P1/P2优先级判断需人工确认:** AI缺少隐性上下文,优先级判断需人工在会上辅助
|
||||
6. **Agent调Agent优于Skill调Agent:** 定义主Agent后其他都是Sub-agent,组织逻辑更清晰
|
||||
7. **Sub-agent调用必须使用绝对路径:** 相对路径调用不稳定
|
||||
8. **Skill嵌套Skill比Sub-agent更清晰可控:** 虽然上下文长,但逻辑控制精确
|
||||
9. **数字人视频时长需求扩展到20-30分钟:** 这是PPT宣讲的主要需求
|
||||
10. **数字人必须包含手势动作:** 前十秒不能呆站,真实性要求
|
||||
11. **数字人平台选型优先百度希壤和HeyGen:** 价格合理,可定制
|
||||
12. **前端重构前先做后端Code Review:** 用Opus 4.5或Codex审查,后端先不动
|
||||
13. **前端重构必须考虑下一版本交互逻辑:** 避免架构调整后又要重改
|
||||
14. **日报驱动项目管理系统由丁康负责:** 基于会议纪要生成日报,对接Asana
|
||||
15. **Skill迁移到LangChain/LangGraph作为P1-P2研究项目:** 当前Skill用多了后需转化到正式Agent框架
|
||||
|
||||
**下周工作重点:**
|
||||
|
||||
1. 🔴 会议纪要Skill优化,改用Gemini转写 + 全量主窗口处理
|
||||
2. 🔴 需求Skill专家交叉回应可视化整理
|
||||
3. 🔴 招投标Skill架构设计(P1提升为P0)
|
||||
4. 🔴 数字人PPT样本生成(真人训练)+ 工作流研究
|
||||
5. 🔴 前端重构-后端代码审查 + 方案优化
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-02
|
||||
**下次会议:** 2025-12-09
|
||||
132
会议转写测试/会议纪要生成效果对比/会议纪要生成效果对比报告.md
Normal file
132
会议转写测试/会议纪要生成效果对比/会议纪要生成效果对比报告.md
Normal file
@ -0,0 +1,132 @@
|
||||
# 会议纪要生成效果对比报告
|
||||
|
||||
## 核心结论
|
||||
|
||||
| 排名 | 版本 | 得分 | 说明 |
|
||||
|------|------|------|------|
|
||||
| 1 | **Gemini清洗后** | **88.10分** | 最佳方案,但是时间成本高 |
|
||||
| 2 | 腾讯清洗后 | 86.65分 | |
|
||||
| 3 | Gemini清洗前 | 82.05分 | 时间成本高 |
|
||||
| 4 | 腾讯清洗前 | 79.35分 | |
|
||||
|
||||
### 关键发现
|
||||
|
||||
| 结论 | 数据支撑 |
|
||||
|------|---------|
|
||||
| **Gemini优于腾讯会议** | 清洗后领先1.45分,清洗前领先2.7分 |
|
||||
| **Gemini画面提取是关键优势** | 可识别屏幕文字(如HeyGen),腾讯无此能力 |
|
||||
| **Gemini分段识别更准确** | 按发言人分段,上下文更清晰;腾讯一大段混在一起,"P0"与"PE"混淆 |
|
||||
| **85%差异源于执行波动** | 转写有正确内容但LLM未正确提取 |
|
||||
| **15%差异源于转写质量** | 专有名词错误、优先级误判等 |
|
||||
|
||||
---
|
||||
|
||||
## 转写来源对比
|
||||
|
||||
| 转写来源 | 特点 | 版本 |
|
||||
|---------|------|------|
|
||||
| **Gemini** | 多模态(视频+音频),含画面内容提取 | 清洗前、清洗后(窗口交互对话) |
|
||||
| **腾讯会议** | 纯语音转写 | 清洗前、清洗后(Skill基础清洗+话题识别+发言人识别) |
|
||||
| **手工修订版** | 人工校验基准 | - |
|
||||
|
||||
### 关键差异:画面内容提取
|
||||
|
||||
| 指标 | Gemini清洗前 | Gemini清洗后 | 腾讯会议 |
|
||||
|------|-------------|-------------|---------|
|
||||
| 画面内容标注数量 | 189处 | 70处 | **0处** |
|
||||
| 能否识别屏幕上的文字 | ✅ 是 | ✅ 是 | ❌ 否 |
|
||||
|
||||
---
|
||||
|
||||
## 一、转写质量直接影响的差异(📝)
|
||||
|
||||
这些差异**直接由转写文本质量导致**,Skill无法弥补:
|
||||
|
||||
### 1.1 专有名词识别
|
||||
|
||||
| 正确写法 | Gemini转写 | 腾讯转写 | 影响 |
|
||||
|----------|-----------|---------|------|
|
||||
| 百度**曦灵** | 希壤 | 西林 | 产品名称错误 |
|
||||
| **HeyGen** | 黑镜(但画面提取到HeyGen) | 黑镜 | Gemini清洗后正确,其他错误 |
|
||||
|
||||
**结论**:
|
||||
|
||||
- Gemini画面内容提取可补充语音识别错误(HeyGen案例)
|
||||
- 专有名词错误需后期词典校正
|
||||
|
||||
### 1.2 优先级记录差异
|
||||
|
||||
| 任务 | 正确优先级 | Gemini转写记录 | 腾讯转写记录 | 影响 |
|
||||
|------|-----------|---------------|-------------|------|
|
||||
| Gartner报告Skill | **P0** | ⚠️ P1 | ⚠️ P1 | 均误判为P1 |
|
||||
|
||||
**结论**: Gemini转写记录为"可以做P1",腾讯转写为"PE"(误识别),由于是后续说的“提升为P0”,导致未识别理解到,两者均导致会议纪要输出P1。这是转写质量+执行波动共同影响的案例。
|
||||
|
||||
### 1.3 内容覆盖差异
|
||||
|
||||
| 内容 | Gemini清洗前 | Gemini清洗后 | 腾讯清洗前 | 腾讯清洗后 |
|
||||
|------|-------------|-------------|-----------|-----------|
|
||||
| 服务器采购 | ✅ 有记录 | ❌ 无 | ❌ 无 | ❌ 无 |
|
||||
|
||||
**结论**: 部分内容仅在特定转写版本中存在。
|
||||
|
||||
---
|
||||
|
||||
## 二、转写来源对会议纪要各维度的影响
|
||||
|
||||
### 2.1 下周工作安排(权重25%,最核心)
|
||||
|
||||
#### P0任务优先级准确性
|
||||
|
||||
| 任务 | 手工版 | Gemini清洗前 | 腾讯清洗前 | 腾讯清洗后 | Gemini清洗后 | 差异来源 |
|
||||
|------|-------|-------------|-----------|-----------|-------------|----------|
|
||||
| 招投标Skill架构设计 | P0 | ✅ P0 | ⚠️ **P1** | ✅ P0 | ✅ P0 | 🎲 执行波动 |
|
||||
| Gartner报告Skill | **P0** | ⚠️ **P1** | ⚠️ **P1** | ⚠️ **P1** | ❌ 未列 | 📝 Gemini/腾讯转写均记录为P1 |
|
||||
| 数字分身方案调研 | P0 | ⚠️ **P1** | ⚠️ **P1** | ✅ P0 | ⚠️ **P1** | 🎲 执行波动 |
|
||||
|
||||
#### 负责人识别准确性
|
||||
|
||||
| 任务 | 手工版 | Gemini清洗前 | 腾讯清洗前 | 腾讯清洗后 | Gemini清洗后 |
|
||||
|------|-------|-------------|-----------|-----------|-------------|
|
||||
| 会议纪要Skill优化 | 闫旭隆、郝倩玉 | 闫旭隆 | 闫旭隆 | 闫旭隆 | 闫旭隆 |
|
||||
| 数字人PPT样本 | 江争达、陶西平 | 陶西平 | 江争达 | 江争达 | 江争达、陶西平 |
|
||||
| 招投标Skill架构 | 郝倩玉、闫旭隆 | 闫旭隆 | 郝倩玉 | 郝倩玉 | 闫旭隆、郝倩玉 |
|
||||
|
||||
**结论**: Gemini清洗后负责人识别最完整,其他版本普遍简化为单人。
|
||||
|
||||
### 2.2 问题拆分粒度
|
||||
|
||||
| 问题 | 手工版 | Gemini清洗前 | 腾讯清洗前 | 腾讯清洗后 | Gemini清洗后 |
|
||||
|------|-------|-------------|-----------|-----------|-------------|
|
||||
| P0/P1/P2优先级判断困难 | ✅ 独立 | ❌ 未列 | ❌ 未列 | ⚠️ 合并 | ✅ 独立 |
|
||||
| 前端重构方案需完善 | ✅ 独立 | ❌ 合并 | ✅ 独立 | ❌ 未列 | ✅ 独立 |
|
||||
|
||||
**结论**: Gemini清洗后问题拆分最细致。
|
||||
|
||||
---
|
||||
|
||||
## 三、综合评分对比
|
||||
|
||||
### 3.1 各维度得分
|
||||
|
||||
| 评估维度 | 权重 | 手工版 | Gemini清洗前 | 腾讯清洗前 | 腾讯清洗后 | Gemini清洗后 |
|
||||
|----------|------|-------|-------------|-----------|-----------|-------------|
|
||||
| 会议信息 | 5% | 100 | 80 | 80 | 85 | 90 |
|
||||
| 项目进展汇总 | 15% | 100 | 90 | 85 | 90 | 92 |
|
||||
| 问题及解决方案 | 20% | 100 | 75 | 70 | 82 | 88 |
|
||||
| **下周工作安排** | **25%** | 100 | 80 | 82 | 88 | 85 |
|
||||
| 成员工作进展 | 15% | 100 | 85 | 80 | 85 | 88 |
|
||||
| 会议总结 | 20% | 100 | 78 | 82 | 88 | 90 |
|
||||
| **加权总分** | 100% | **100** | **82.05** | **79.35** | **86.65** | **88.10** |
|
||||
|
||||
### 3.2 转写来源效果对比
|
||||
|
||||
| 转写来源 | 清洗前 | 清洗后 | 清洗提升 |
|
||||
|---------|--------|--------|----------|
|
||||
| **Gemini** | 82.05分 | **88.10分** | +6.05分 |
|
||||
| **腾讯会议** | 79.35分 | 86.65分 | +7.30分 |
|
||||
| **来源差距** | Gemini领先2.7分 | Gemini领先1.45分 | - |
|
||||
|
||||
---
|
||||
|
||||
**报告生成时间:** 2025-12-09
|
||||
281
会议转写测试/会议纪要生成效果对比/工程类会议纪要_2025-12-02-手工修订版.md
Normal file
281
会议转写测试/会议纪要生成效果对比/工程类会议纪要_2025-12-02-手工修订版.md
Normal file
@ -0,0 +1,281 @@
|
||||
# 工程类会议纪要 (2025-12-02)
|
||||
|
||||
## 一、会议信息
|
||||
|
||||
- **会议时间:** 2025-12-02
|
||||
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉、丁康
|
||||
- **记录整理:** Claude
|
||||
|
||||
---
|
||||
|
||||
## 二、工作内容
|
||||
|
||||
### 1. 重点项目进展情况汇总
|
||||
|
||||
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|
||||
| ------------------------ | -------------- | ---------- | ------------------------------------------------------------ |
|
||||
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成架构优化,改为全量读取会议转写文本(不采用索引搜索),整理了字段映射逻辑图,整个流程已固化。领导评价:比上一版有进步,整体逻辑可以先固化使用。存在问题:文字转写准确性和上下文约束能力是核心瓶颈;P0/P1/P2优先级判断难以自动化 |
|
||||
| 需求澄清Skill测试与推广 | 闫旭隆 | 2025-12-02 | 已完成优化,加入多轮专家博弈机制(独立评审→交叉评价→交叉回应→最终整合),并录制了演示视频。领导建议:验证专家博弈环节的实际效果,将评估意见和响应打成一篇文档进行对照分析 |
|
||||
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成需求文档整理,包含五个第一阶段核心需求。下周行动计划:1)时长从3-5分钟改为20-30分钟;2)必须加入手势动作要求;3)不能使用老外形象说流利中文;4)本周尽快用真人训练数字人样本 |
|
||||
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 相关领导处的需求尚未明确。下一步建议:自己调研市面上做得好的几个版本,分别出方案让需求方选择 |
|
||||
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 进行中,已完成接口规范文档确认,功能模块清单正在对照核实中。领导建议:后端代码不要动,先用Claude 4.5或Codex做代码审查;重构时必须考虑下一版本功能需求 |
|
||||
|
||||
### 2. 重点项目问题及解决方案
|
||||
|
||||
#### 问题1: 会议纪要文字转写准确性问题
|
||||
|
||||
**问题描述:**
|
||||
会议纪要Skill的最大问题是文字转写的准确性和上下文约束能力不足。语音识别不清晰,加上没有很好的上下文约束,导致在已经非常清晰的上下文背景下开会时,AI无法准确理解和提取信息。
|
||||
|
||||
**解决方案:**
|
||||
|
||||
1. 考虑使用Gemini进行多模态转写(视频+音频+文字),利用其100万token的超长上下文能力
|
||||
2. 将转写文本先进行清洗加工,保证信息全面的同时内容紧凑,去除重复内容,在主窗口+子Agent中加载清洗后的会议转写文本
|
||||
3. 调用Gemini API在Claude中处理转写后的文本
|
||||
4. 尝试使用Gemini进行一次性生成会议纪要
|
||||
|
||||
**责任人:** 闫旭隆
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题2: 会议纪要P0/P1/P2优先级判断困难
|
||||
|
||||
**问题描述:**
|
||||
AI难以准确判断任务的优先级(P0/P1/P2),因为缺少关键的潜在上下文信息,如成员的年龄、级别、工作时间长短等,这些都是分配工作时的潜意识上下文。
|
||||
|
||||
**解决方案:**
|
||||
|
||||
1. 在会议上直接确认P0/P1/P2优先级,给AI一个明确的信号
|
||||
2. 让AI先给出优先级建议,人再给反馈确认
|
||||
3. 每个人生成一份个人相关的优先级列表后确认
|
||||
4. 保留确认过程的所有材料作为后续调优或微调的素材
|
||||
5. 将潜在上下文(成员背景信息)显性化后提供给AI
|
||||
|
||||
**责任人:** 闫旭隆
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题3: Sub Agent在项目目录下调用的路径问题
|
||||
|
||||
**问题描述:**
|
||||
测试发现Sub Agent在项目子目录下调用时存在问题:不使用绝对路径时,Agent会读取prompt但不执行;使用绝对路径指定时才能正常调用。系统似乎默认优先查找全局Agent目录,找不到就忽略。
|
||||
|
||||
**解决方案:**
|
||||
|
||||
1. 在Skill中调用Sub Agent时使用绝对路径指定Agent位置
|
||||
2. 改用Agent调Agent的方式,而非Skill调Agent
|
||||
3. 定义一个主Agent来调用其他Agent,保持逻辑清晰
|
||||
4. 调试时使用Skill方式(便于观察上下文),调通后再迁移到Agent调Agent的架构
|
||||
|
||||
**责任人:** 江争达
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题4: 问答系统前端重构方案需完善
|
||||
|
||||
**问题描述:**
|
||||
前端重构工作尚未完成,只做了一半。需要确保重构时考虑下一个版本的交互逻辑更改,避免架构调整后又需要重新修改或增加组件。
|
||||
|
||||
**解决方案:**
|
||||
|
||||
1. 用Opus 4.5或Codex对后端代码进行审查,找出问题后记录下来
|
||||
2. 找一个Code Review的Agent或Skill对代码进行审查
|
||||
3. 让大模型生成一版前端重构方案,与现有方案对比差异
|
||||
4. 把下一个版本的功能需求结合这次重构一起考虑
|
||||
5. 提供示例代码(特别是与后端交互的逻辑代码)给大模型参考
|
||||
|
||||
**责任人:** 江争达
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题5: 数字人PPT讲解视频手势动作缺失
|
||||
|
||||
**问题描述:**
|
||||
数字人PPT讲解视频中,开场和结尾没有手势动作,人物呆呆站着讲解,效果不真实。
|
||||
|
||||
**解决方案:**
|
||||
|
||||
1. 在验收标准中加入手势动作要求
|
||||
2. 修改数字人在PPT讲解视频中展现形式
|
||||
3. 测试Veo 3.1的动作生成能力
|
||||
|
||||
|
||||
**责任人:** 陶西平
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题6: 需求表达和背景说明不清晰
|
||||
|
||||
**问题描述:**
|
||||
团队成员在汇报和文档中,需求表达和背景说明不够清晰,不交代核心诉求和问题点,导致其他人或大模型无法理解要解决什么问题。
|
||||
|
||||
**解决方案:**
|
||||
|
||||
1. 汇报时必须交代核心诉求和问题点
|
||||
2. 给人可以口头补充,给大模型必须写下来
|
||||
3. 站在其他人的角度思考,确保表达能被理解
|
||||
4. 背景说明要特别详细
|
||||
|
||||
**责任人:** 全体成员
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
### 3. 下周工作安排
|
||||
|
||||
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|
||||
| ----------------------------------------- | -------------- | ------------------------------------------------------------ | ------ | ---------- |
|
||||
| 🔴 会议纪要Skill全量处理优化 | 闫旭隆、郝倩玉 | 用现版本、Gemini视频生成转写文本+主窗口清洗后加载、Gemini视频直接生成三种方式各生成一版会议纪要进行对比测试 | P0 | 2025-12-09 |
|
||||
| 🔴 数字人PPT视频样本生成 | 江争达、陶西平 | 用百度曦灵和heygen平台训练自己真人的语音和视频,生成数字人PPT讲解视频样本,需包含手势动作,视频时长支持20-30分钟 | P0 | 2025-12-08 |
|
||||
| 🔴 Gemini分镜脚本生成测试 | 江争达、陶西平 | 使用Gemini 3.0 Pro生成视频分镜脚本和分镜图片,再用VEO 3.1或其他模型生成视频,测试端到端数字人视频生成工作流 | P0 | 2025-12-09 |
|
||||
| 🔴 问答系统V1.1前端重构 | 江争达、陶西平 | 重构前端展示和代码结构,保留基础功能和后端不变,需结合下一版本交互逻辑变更一起考虑,先用大模型对后端代码进行code review | P0 | 2025-12-09 |
|
||||
| 🔴 需求澄清Skill专家博弈优化 | 闫旭隆 | 查看专家交叉回应的字段映射,整理可视化效果,评估专家博弈环节对需求文档质量的提升效果 | P0 | 2025-12-09 |
|
||||
| 🔴 投标商务应答自动生成系统Skill架构设计 | 郝倩玉、闫旭隆 | 设计投标商务应答自动生成系统Skill的架构方案 | P0 | 2025-12-09 |
|
||||
| 🔴 Gartner报告解读转写Skill架构设计 | 郝倩玉、闫旭隆 | 设计Gartner报告转写Skill的架构,涉及后续合同签约需求(要求最晚12月中旬必须交付) | P0 | 2025-12-09 |
|
||||
| 🔴 数字分身方案调研及方案撰写 | 郝倩玉 | 先调研市面上做得好的版本,分别出几个方案让需求方选择 | P0 | 2025-12-09 |
|
||||
| 日报驱动项目管理系统Skill开发 | 丁康 | 开发基于会议纪要的日报生成系统Skill | P1 | 待定 |
|
||||
| 完成问答系统前端重构需求文档 | 陶西平 | 完成问答系统前端重构需求文档 | P1 | 2025-12-09 |
|
||||
| 服务器采购 | 江争达 | 尽快采购,先确认好需要部署哪些软件 | P1 | 2025-12-09 |
|
||||
| Skill Plugin管理系统搭建 | 江争达 | 学习并搭建内部Skill Marketplace,管理团队开发的所有Skill | P2 | 待定 |
|
||||
| Claude Skill转Langchain/Langgraph架构研究 | 闫旭隆 | 研究如何将Claude Code Skill转移到Langchain/Langgraph的低代码架构,做一个小功能进行学习验证 | P2 | 待定 |
|
||||
|
||||
### 4. 组内成员工作进展
|
||||
|
||||
#### 江争达
|
||||
|
||||
**上周完成:**
|
||||
|
||||
- ✅ 数字人PPT需求文档
|
||||
|
||||
**进行中:**
|
||||
|
||||
- 🔄 完成问答系统v1.1前端重构方案
|
||||
- 🔄 PDF Skill技术调研(待开始)
|
||||
- 🔄 Skill Plugin管理系统搭建(待开始)
|
||||
- 🔄 服务器采购(待开始)
|
||||
- 🔄 招投标文件Skill架构调试(待开始)
|
||||
- 🔄 日报驱动系统需求研究(待开始)
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
|
||||
- **批评:** 需求文档分析存在很大问题,不站在其他人的角度去思考,其他人听不懂你讲什么。核心诉求点没有说清楚,背景不交代清楚导致没人看得懂文档
|
||||
- **批评:** 表达能力需要提升,没有表达能力就没法跟大模型打交道
|
||||
- **建议:** 问答系统前端重构方案需要把下个版本可能修改的逻辑先考虑进去
|
||||
- **建议:** 后端代码先不要动,先用Opus 4.5或Codex做一遍代码审查
|
||||
- **建议:** 前端重构方案需要用大模型重新生成一版,与现有方案对比差异
|
||||
- **建议:** 提供示例代码,特别是与后端交互的逻辑代码应该提供给大模型参考
|
||||
- **建议:** Claude 4.5幻觉还是很高的,日常问答以GPT o1为主可能会比较好
|
||||
|
||||
**下周任务:**
|
||||
|
||||
- [ ] 🔴 P0|问答系统V1.1前端重构
|
||||
- [ ] 🔴 P0|数字人PPT视频样本生成
|
||||
- [ ] 🔴 P0|Gemini分镜脚本生成测试
|
||||
- [ ] P1|PDF Skill技术调研
|
||||
- [ ] P1|服务器采购
|
||||
- [ ] P2|Skill Plugin管理系统搭建
|
||||
|
||||
#### 闫旭隆
|
||||
|
||||
**上周完成:**
|
||||
|
||||
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制,录制视频
|
||||
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文,录制视频
|
||||
|
||||
**进行中:**
|
||||
|
||||
- 🔄 招投标文件Skill架构设计
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
|
||||
- **表扬:** 会议纪要Skill架构改进获得认可,改用全量读取替代索引搜索的方案是正确的,字段映射逻辑图也得到肯定
|
||||
- **表扬:** 会议纪要Skill的测试结果与人工订正版本相比"比上面是有进步了","该有的要点是有"
|
||||
- **建议:** 尝试使用主窗口全量处理替代分块agent搜索,可能效果更好;同时建议用Gemini做会议转写测试
|
||||
- **建议:** 招投标Skill架构设计作为P0任务需要本周完成,同时Gartner报告转写也需要先设计架构
|
||||
- **建议:** 会议纪要的下周工作安排提取是最核心的功能,需要重点优化P0/P1优先级判断的准确性
|
||||
|
||||
**下周任务:**
|
||||
|
||||
- [ ] 🔴 P0|会议纪要Skill全量处理优化及gemini方案对比测试
|
||||
- [ ] 🔴 P0|需求澄清多专家博弈阶段效果可视化展示
|
||||
- [ ] 🔴 P0|招投标Skill架构设计
|
||||
- [ ] 🔴 P0|Gartner报告转写Skill架构设计
|
||||
|
||||
#### 郝倩玉
|
||||
|
||||
**上周完成:**
|
||||
|
||||
- ✅ 会议纪要Skill架构优化(协助旭隆优化学习类+Q&A类会议纪要Skill逻辑)
|
||||
- ✅ Gartner 报告解读转写系统需求对接及文档撰写,确定版需求文档已发旭隆。
|
||||
- ✅ 问答系统V1.0测试推动(多次与媛媛沟通)
|
||||
- ✅数字分身需求对接
|
||||
|
||||
**进行中:**
|
||||
|
||||
- 🔄 招投标文件Skill架构设计(投标商务响应文件自动生成系统需求文档已完成)
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
|
||||
- **建议:** 招投标Skill架构设计后续需要针对需求部分再次讨论确认,因为有些需求不一定合理
|
||||
- **建议:** Gartner报告转写系统架构设计需要尽快完成,因为涉及年末签合同,可能有30万的业务机会,优先级提升为P0
|
||||
- **建议:** 数字分身需求方面,由于合作方需求不明确,需要自己先调研市面上比较好的版本,做出多个方案供选择
|
||||
|
||||
**下周任务:**
|
||||
|
||||
- [ ] 🔴 P0|参与优化会议纪要Skill
|
||||
- [ ] 🔴 P0|参与设计招投标Skill架构
|
||||
- [ ] 🔴 P0|参与设计Gartner报告转写Skill架构
|
||||
- [ ] 🔴 P0|数字分身方案调研
|
||||
|
||||
#### 陶西平
|
||||
|
||||
**上周完成:**
|
||||
|
||||
- ✅ 数字人PPT需求文档(协助江老师修改需求文档)
|
||||
- ✅ 学习使用Claude Code的document skill,使用pdf skill的表单填写功能
|
||||
- ✅ 调研数字人平台的公共数字人能力,收集总结相关目标数字人平台价格信息
|
||||
|
||||
**进行中:**
|
||||
|
||||
- 🔄 数字人与ppt结合(生成一个基于指定PPT的数字人视频)
|
||||
- 🔄 前端框架重构(对问答系统前端功能进行分析)
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
|
||||
- **肯定:** 陶西平提供的数字人调研文档被团队成员引用,作为数字人平台费用对比的基础参考资料
|
||||
|
||||
**下周任务:**
|
||||
|
||||
- [ ] 🔴 P0|数字人PPT视频样本生成
|
||||
- [ ] 🔴 P0|Gemini分镜脚本生成测试
|
||||
- [ ] P1|完成问答系统前端重构需求文档
|
||||
|
||||
---
|
||||
|
||||
## 三、会议总结
|
||||
|
||||
**核心议题:** 会议纪要Skill优化、数字人PPT视频生成、问答系统前端重构、招投标/Gartner报告Skill架构设计
|
||||
|
||||
**关键决策:**
|
||||
|
||||
1. **会议纪要转写采用Gemini多模态视频处理方案:** 领导测试发现Gemini 3.0 Pro可以直接上传会议视频生成转写文本,多模态能力最强,上下文最长,效果优于纯语音转写
|
||||
2. . **进展情况以会议转写为优先,周报作为补充:** 会议中发现转写文本更能反映实际进展情况
|
||||
3. **P0/P1/P2优先级判断需要人工确认:** AI缺乏隐性上下文(如成员资历、工作时长等),建议先让AI给出优先级建议,然后由人工确认
|
||||
4. **数字人PPT视频主需求调整为支持20-30分钟时长:** 实际使用场景(如PPT宣讲、会议发言)需要20-30分钟
|
||||
5. **数字人形象必须使用中国人,不能用老外说流利中文:** 确保形象和语言匹配,追求真实性
|
||||
6. **数字人视频第一阶段必须包含手势动作:** 开场和结尾的手势动作是必须的,不能呆板站立讲解
|
||||
7. **本周完成数字人真人训练视频样本:** 要求本周末前用自己真人训练出语音和视频样本
|
||||
8. **使用Gemini 3.0生成分镜头脚本和图片,再用其他平台生成视频:** 这是目前最有效的动画视频制作路径
|
||||
9. **前端重构只改展示部分,后端不动但需做代码审查:** 用Codex或大模型做一遍代码审查,找出问题记录下来
|
||||
10. **Sub Agent调用必须使用绝对路径指定:** 项目下的sub agent不指定绝对路径时调用不稳定
|
||||
11. **推荐使用Agent调用Agent的方式,而非Skill调用Sub Agent:** 这样调用更清晰,上下文共享更好
|
||||
12. **招投标Skill架构设计提升为P0任务:** 因为涉及年末演示和签合同,可能有30万收入
|
||||
13. **Gartner报告转写Skill提升为P0任务:** 同样因为紧急需求
|
||||
|
||||
**下周工作重点:**
|
||||
|
||||
1. 🔴 会议纪要Skill全量处理优化,对比Gemini转写与腾讯会议转写效果
|
||||
2. 🔴 数字人PPT视频样本生成,本周末前完成真人训练
|
||||
3. 🔴 招投标Skill和Gartner报告转写Skill架构设计
|
||||
4. 🔴 问答系统V1.1前端重构,需先做代码审查
|
||||
5. 🔴 需求澄清Skill专家博弈效果验证和流程图梳理
|
||||
6. 🔴 数字分身方案调研,主动出多个版本供选择
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-02
|
||||
**下次会议:** 2025-12-09
|
||||
156
会议转写测试/会议纪要生成效果对比/腾讯会议清洗前/Q&A资源库类会议纪要_2025-12-02_第6次周会.md
Normal file
156
会议转写测试/会议纪要生成效果对比/腾讯会议清洗前/Q&A资源库类会议纪要_2025-12-02_第6次周会.md
Normal file
@ -0,0 +1,156 @@
|
||||
# Q&A资源库类会议纪要 (2025-12-02)
|
||||
|
||||
## 一、会议信息
|
||||
- **会议时间:** 2025-12-02
|
||||
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉
|
||||
|
||||
---
|
||||
|
||||
## 二、工作问题 Q&A
|
||||
|
||||
### 1. 会议纪要Skill相关问题
|
||||
|
||||
**Q1: 会议纪要语音转写准确性不足怎么解决?**
|
||||
|
||||
**问题描述:** 语音识别效率低,文字转写的准确性不足,上下文约束能力差。转写文本有大量重复、错误和逻辑中断。
|
||||
|
||||
**解决方案:**
|
||||
- 使用Gemini多模态能力处理视频转写,直接上传视频给Gemini生成会议纪要
|
||||
- 先清洗转写文本(去除重复、脏数据)再进行处理,生成紧凑的clean版本
|
||||
- 改为全量读取上下文方式,不用索引搜索,让模型通过语义理解提取信息
|
||||
- 考虑调用Gemini API在Claude里面处理转写,实现自动化
|
||||
|
||||
**Q2: 会议纪要P0/P1/P2优先级判断不准确怎么办?**
|
||||
|
||||
**问题描述:** 模型很难准确判断任务的优先级,因为缺少成员的年龄、级别、工作时间等潜在上下文信息。
|
||||
|
||||
**解决方案:**
|
||||
- 让模型先给出优先级建议,人再进行确认反馈
|
||||
- 在会上直接确认P0/P1/P2,给模型明确的文字信息
|
||||
- 逐步把潜在上下文显性化,作为输入提供给模型
|
||||
- 保留确认过程的所有材料,作为后续微调训练数据
|
||||
|
||||
### 2. Agent架构相关问题
|
||||
|
||||
**Q3: Sub Agent调用时相对路径不可靠怎么办?**
|
||||
|
||||
**问题描述:** 在项目目录下调用全局Agent时,使用相对路径调用不可靠。不指定绝对路径时,Sub Agent会读取提示词但不会按照预期执行。
|
||||
|
||||
**解决方案:**
|
||||
- 使用绝对路径调用Sub Agent,确保路径指向正确位置
|
||||
- 建议用Agent调Agent而非Skill调Agent,逻辑更清晰
|
||||
- Skill调Skill在主窗口上下文共享,控制更精确
|
||||
- 调试时用Skill形式,调通后再移植到Agent中
|
||||
|
||||
**Q4: Skill调Agent和Agent调Agent哪个更好?**
|
||||
|
||||
**问题描述:** 在编排复杂流程时,需要选择合适的调用方式。
|
||||
|
||||
**解决方案:**
|
||||
- **Agent调Agent更推荐:** 逻辑更清晰,更智能
|
||||
- **Skill调Skill的优势:** 主窗口上下文共享,控制更精确
|
||||
- **调试建议:** 调试时用Skill形式(上下文可见),调通后再移植到Agent
|
||||
- **架构建议:** 非必要情况下,不要在Skill里面调用Sub Agent,会导致逻辑割裂
|
||||
|
||||
### 3. 需求文档相关问题
|
||||
|
||||
**Q5: 需求文档如何区分默认需求和核心需求?**
|
||||
|
||||
**问题描述:** 数字人PPT需求文档时间要求不准确(3-5分钟应为20-30分钟),说明需求理解存在偏差。
|
||||
|
||||
**解决方案:**
|
||||
- 先明确目标用户的真实使用场景(如PPT宣讲一般需要20-30分钟)
|
||||
- 区分"不提也会做"的默认需求和"必须明确"的核心需求
|
||||
- 需求文档要站在其他人角度思考,让非技术人员也能看懂
|
||||
|
||||
**Q6: 如何提升需求表达能力?**
|
||||
|
||||
**问题描述:** 需求文档分析问题大,不站在其他人角度思考,核心诉求没说清楚。
|
||||
|
||||
**解决方案:**
|
||||
- 给大模型的提示词必须写详细完整,口头表达时可以简略
|
||||
- 先交代背景和核心诉求,再说具体内容
|
||||
- 用deep research或GPT做方案校验
|
||||
- 把方案给大模型审查,看有什么值得借鉴或存在的问题
|
||||
|
||||
### 4. 前端重构相关问题
|
||||
|
||||
**Q7: 前端重构如何避免二次返工?**
|
||||
|
||||
**问题描述:** 前端重构方案只完成了一半,未考虑下一版本的交互逻辑更改。
|
||||
|
||||
**解决方案:**
|
||||
- 在重构时就考虑下一版本的功能需求
|
||||
- 后端先用代码审查工具审查一遍,记录问题
|
||||
- 用deep research或GPT生成前端重构方案对比
|
||||
- 对照流程图验证方案的准确性
|
||||
|
||||
---
|
||||
|
||||
## 三、重点工作方法
|
||||
|
||||
### 方法1: Gemini多模态视频转写方法
|
||||
|
||||
**方法描述:** 使用Gemini的多模态能力直接处理会议视频,生成会议纪要。
|
||||
|
||||
**适用场景:** 会议纪要生成、视频内容提取
|
||||
|
||||
**关键要点:**
|
||||
- 直接上传视频给Gemini,配合会议纪要模板
|
||||
- 多模态能力可以同时处理视频、音频、文字
|
||||
- 比纯文字转写后再处理效果更好
|
||||
- API调用成本可接受(半小时约6000字,2万多token)
|
||||
|
||||
### 方法2: PPT自动化生成方法
|
||||
|
||||
**方法描述:** 使用Gemini 3.0生成分镜脚本和图片,再通过视频生成平台合成视频。
|
||||
|
||||
**适用场景:** PPT自动生成、视频内容创作
|
||||
|
||||
**关键要点:**
|
||||
- 先用Gemini生成分镜头脚本
|
||||
- 让Gemini生成每个分镜的图片
|
||||
- 使用首尾帧+文字通过VEO 3.1等平台生成视频
|
||||
- 使用Playwright MCP实现浏览器自动化操作
|
||||
|
||||
### 方法3: Agent架构调试方法
|
||||
|
||||
**方法描述:** 先用Skill形式调试,调通后再移植到Agent中。
|
||||
|
||||
**适用场景:** 复杂Agent流程开发
|
||||
|
||||
**关键要点:**
|
||||
- 调试时用Skill形式,上下文可见便于定位问题
|
||||
- 调通后移植到Agent,实现上下文隔离
|
||||
- 使用绝对路径调用Sub Agent
|
||||
- 建议用Agent调Agent而非Skill调Agent
|
||||
|
||||
### 方法4: 需求文档审查方法
|
||||
|
||||
**方法描述:** 使用大模型对需求文档进行多角度审查。
|
||||
|
||||
**适用场景:** 需求文档质量提升
|
||||
|
||||
**关键要点:**
|
||||
- 先用deep research或GPT生成参考方案
|
||||
- 把自己的方案给大模型审查
|
||||
- 对比两个方案的差异
|
||||
- 关注核心需求而非默认功能
|
||||
|
||||
### 方法5: 代码审查方法
|
||||
|
||||
**方法描述:** 使用Claude 4.5或GPT codex对代码进行审查。
|
||||
|
||||
**适用场景:** 代码重构前的问题发现
|
||||
|
||||
**关键要点:**
|
||||
- 先审查再重构,避免带病开发
|
||||
- 审查出来的问题记录下来作为需求文档
|
||||
- 使用专业的code review工具或Agent
|
||||
- 下一次会议讨论是否需要修改
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-02
|
||||
**下次会议:** 2025-12-09
|
||||
79
会议转写测试/会议纪要生成效果对比/腾讯会议清洗前/云大所需求相关进度会议纪要_2025-12-02_第6次周会.md
Normal file
79
会议转写测试/会议纪要生成效果对比/腾讯会议清洗前/云大所需求相关进度会议纪要_2025-12-02_第6次周会.md
Normal file
@ -0,0 +1,79 @@
|
||||
# 云大所需求相关进度会议纪要 (2025-12-02)
|
||||
|
||||
## 一、会议信息
|
||||
- **会议时间:** 2025-12-02
|
||||
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉
|
||||
|
||||
---
|
||||
|
||||
## 二、需求项目进展
|
||||
|
||||
| 项目名称 | 负责人 | 本周进展 | 存在问题 | 下周计划 | 优先级 |
|
||||
|----------|--------|----------|----------|----------|--------|
|
||||
| 投标商务应答自动生成系统 | 郝倩玉、闫旭隆、江争达 | 需求文档已完成并已发给闫旭隆确认 | 架构设计尚未开始 | 需求文档确认+Skill架构设计 | P0 |
|
||||
| 数字人项目 | 江争达、陶西平、郝倩玉 | 江争达展示修改后的需求文档;陶西平完成数字人平台调研 | 时间要求理解错误(应为20-30分钟);缺少手势动作要求;数字分身需求不明确 | 完成真人训练视频样本(百度曦灵/黑镜);修改需求文档;Gemini分镜脚本测试 | P0 |
|
||||
| Gartner 报告解读转写系统 | 郝倩玉 | 需求文档已完成 | 架构设计尚未开始 | 架构设计(需求紧急,涉及年末签约) | P0 |
|
||||
| 运营商信息精准爬取系统 | 郝倩玉 | 进行中,持续跟进 | 需求方需求不明确 | 继续跟进沟通 | P1 |
|
||||
| 客户风险推送自动化系统 | - | 未讨论 | - | - | - |
|
||||
| 邮件自动处理转发系统 | - | 未讨论 | - | - | - |
|
||||
| 证书信息提取系统 | - | 未讨论 | - | - | - |
|
||||
| 云大阁新报告自动推送 | - | 未讨论 | - | - | - |
|
||||
|
||||
---
|
||||
|
||||
## 三、问题与风险
|
||||
|
||||
### 投标商务应答自动生成系统
|
||||
|
||||
**问题描述:** 需求文档已完成,但架构设计尚未开始
|
||||
|
||||
**解决方案:**
|
||||
1. 闫旭隆确认需求文档并设计Skill架构
|
||||
2. 江争达负责后期调试
|
||||
|
||||
**责任人:** 郝倩玉、闫旭隆、江争达
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
### 数字人项目
|
||||
|
||||
**问题1: 需求文档时间要求不准确**
|
||||
- 问题:需求文档写3-5分钟,实际需求应为20-30分钟
|
||||
- 解决方案:修改视频时长要求
|
||||
|
||||
**问题2: 缺少手势动作要求**
|
||||
- 问题:开场和结束时数字人不能呆呆站着
|
||||
- 解决方案:在验收标准中增加手势动作要求
|
||||
|
||||
**问题3: 数字分身需求不明确**
|
||||
- 问题:合作方需求一直不能明确
|
||||
- 解决方案:自己调研市面上的方案,做几个版本供选择
|
||||
|
||||
**责任人:** 江争达、郝倩玉
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
### Gartner 报告解读转写系统
|
||||
|
||||
**问题描述:** 需求紧急,涉及年末签约(可能有30万合同)
|
||||
|
||||
**解决方案:**
|
||||
1. 本周完成架构设计
|
||||
2. 优化可以后续迭代,先有个基本架构
|
||||
|
||||
**责任人:** 郝倩玉
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
---
|
||||
|
||||
## 四、下周重点
|
||||
|
||||
1. 🔴 **投标商务应答自动生成系统** - 需求文档确认 + Skill架构设计
|
||||
2. 🔴 **数字人项目** - 完成真人训练视频样本(百度曦灵/黑镜)
|
||||
3. 🔴 **数字人项目** - Gemini 3.0生成分镜脚本测试
|
||||
4. 🔴 **数字人项目** - 修改需求文档(时长+手势动作)
|
||||
5. 🔴 **Gartner 报告解读转写系统** - 架构设计
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-02
|
||||
**下次会议:** 2025-12-09
|
||||
246
会议转写测试/会议纪要生成效果对比/腾讯会议清洗前/工程类会议纪要_2025-12-02_第6次周会.md
Normal file
246
会议转写测试/会议纪要生成效果对比/腾讯会议清洗前/工程类会议纪要_2025-12-02_第6次周会.md
Normal file
@ -0,0 +1,246 @@
|
||||
# 工程类会议纪要 (2025-12-02)
|
||||
|
||||
## 一、会议信息
|
||||
- **会议时间:** 2025-12-02
|
||||
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉
|
||||
|
||||
---
|
||||
|
||||
## 二、工作内容
|
||||
|
||||
### 1. 重点项目进展情况汇总
|
||||
|
||||
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|
||||
|----------|----------|------------|--------------|
|
||||
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成改进版本,改为全量加载方式(不用索引搜索),绘制了映射逻辑图。领导评价:整体有进步,基本逻辑可以固化下来先用;建议尝试用主窗口全量处理 |
|
||||
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成二阶段专家博弈机制开发,新增专家交叉评价和交叉回应功能。领导评价:效果不错,专家博弈机制有价值;建议把评估意见和响应打成文档对比验证 |
|
||||
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已展示修改后的需求文档,但需求理解存在偏差。领导反馈:时间要求应为20-30分钟而非3-5分钟;缺少手势动作要求;需要本周完成用真人训练数字人视频样本 |
|
||||
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 进行中,合作方需求不明确。领导建议:自己调研市面上的方案,做几个版本供选择 |
|
||||
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 前端重构方案只完成了一半。领导建议:后端先用代码审查工具审查一遍;前端重构要考虑下一版本的交互逻辑 |
|
||||
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 需求文档已完成并已发给闫旭隆,被提升为P0任务。领导要求:需要尽快设计架构 |
|
||||
|
||||
### 2. 重点项目问题及解决方案
|
||||
|
||||
#### 问题1: 会议纪要语音转写准确性问题
|
||||
|
||||
**问题描述:**
|
||||
语音识别效率低,文字转写的准确性不足,上下文约束能力差。会议中很多语言不清晰,直接搜索提取不出来。转写文本有大量重复、错误和逻辑中断,导致难以阅读和处理。
|
||||
|
||||
**解决方案:**
|
||||
1. 使用Gemini多模态能力处理视频转写,直接上传视频给Gemini生成会议纪要
|
||||
2. 先清洗转写文本(去除重复、脏数据)再进行处理,生成紧凑的clean版本
|
||||
3. 改为全量读取上下文方式,不用索引搜索,让模型自己通过语义理解提取信息
|
||||
4. 考虑调用Gemini API在Claude里面处理转写,实现自动化
|
||||
|
||||
**责任人:** 闫旭隆
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题2: Sub Agent调用机制问题
|
||||
|
||||
**问题描述:**
|
||||
在项目目录下调用全局Agent时,使用相对路径调用不可靠。测试发现:不指定绝对路径时,Sub Agent会读取提示词但不会按照预期执行;只有使用绝对路径调用时才能正常工作。
|
||||
|
||||
**解决方案:**
|
||||
1. 使用绝对路径调用Sub Agent,确保路径指向正确位置
|
||||
2. 建议用Agent调Agent而非Skill调Agent,逻辑更清晰
|
||||
3. Skill调Skill在主窗口上下文共享,控制更精确
|
||||
4. 调试时用Skill形式,调通后再移植到Agent中
|
||||
|
||||
**责任人:** 江争达、闫旭隆
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题3: 数字人PPT需求文档相关问题
|
||||
|
||||
**问题描述:**
|
||||
- 时间要求不准确:需求文档中写的3-5分钟视频时长不准确,实际需求应该是20-30分钟的PPT宣讲视频
|
||||
- 缺少手势动作要求:第一阶段需求中没有包含手势动作要求,但开场和结束时数字人不能呆呆站着讲
|
||||
|
||||
**解决方案:**
|
||||
1. 将视频时长要求修改为20-30分钟,3-5分钟作为基础能力
|
||||
2. 在验收标准中增加开场和结束的手势动作要求
|
||||
3. 前十秒和后十秒必须有手势动作,可以没有躯体动作但手势必须有
|
||||
|
||||
**责任人:** 江争达
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题4: 问答系统前端重构方案未完成
|
||||
|
||||
**问题描述:**
|
||||
前端重构方案只完成了一半,只重构了前端展示部分和代码结构,但未考虑下一版本的交互逻辑更改,可能导致架构调整通不过或需要大量修改。
|
||||
|
||||
**解决方案:**
|
||||
1. 用代码审查工具(如Claude Code或Opus 4.5)先审查后端代码,找出问题记录下来
|
||||
2. 在重构时考虑下一版本的功能需求,避免二次返工
|
||||
3. 用deep research或GPT的research功能生成前端重构方案对比
|
||||
4. 对照流程图验证方案的准确性
|
||||
|
||||
**责任人:** 江争达
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题5: 数字分身需求不明确
|
||||
|
||||
**问题描述:**
|
||||
合作方(通过市场部对接)的需求一直不能明确,杜主任反馈合作方可能用不用还不确定,导致需求对接工作难以推进。
|
||||
|
||||
**解决方案:**
|
||||
1. 自己做几个版本的数字分身方案,让市场部/合作方选择
|
||||
2. 调研市面上做得好的数字分身案例,分别出方案
|
||||
3. 持续与相关人员(琳贤等)沟通跟进
|
||||
|
||||
**责任人:** 郝倩玉
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
### 3. 下周工作安排
|
||||
|
||||
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|
||||
|----------|--------|--------------|--------|----------|
|
||||
| 🔴 会议纪要Skill腾讯会议版本生成 | 闫旭隆 | 用腾讯会议转写文本生成一版会议纪要,与Gemini转写版本对比效果 | P0 | 2025-12-09 |
|
||||
| 🔴 会议纪要Skill Gemini版本生成 | 闫旭隆 | 使用Gemini视频转写功能直接生成会议纪要,测试多模态转写效果 | P0 | 2025-12-09 |
|
||||
| 🔴 需求Skill二阶段专家博弈字段映射 | 闫旭隆 | 整理二阶段专家交叉评价、交叉回应的字段映射逻辑,做可视化效果展示 | P0 | 2025-12-09 |
|
||||
| 🔴 数字人PPT真人训练视频样本 | 江争达 | 本周完成用真人训练的数字人视频样本,测试百度西林和黑镜两个平台 | P0 | 2025-12-09 |
|
||||
| 🔴 Gemini 3.0生成分镜脚本测试 | 江争达 | 使用Gemini 3.0生成分镜头脚本和分镜图片,再通过VEO 3.1等平台生成视频 | P0 | 2025-12-09 |
|
||||
| 🔴 数字人PPT需求文档修改 | 江争达 | 根据会议反馈修改需求文档,将视频时长从3-5分钟改为20-30分钟,增加手势动作要求 | P0 | 2025-12-09 |
|
||||
| 🔴 问答系统前端重构方案完善 | 江争达 | 继续完善前端重构方案,考虑下一版本交互逻辑的修改,结合大模型审查方案 | P0 | 2025-12-09 |
|
||||
| 🔴 问答系统后端代码审查 | 江争达 | 使用Claude 4.5或GPT codex等代码审查工具对后端代码进行一遍审查,记录问题 | P0 | 2025-12-09 |
|
||||
| 🔴 招投标文件Skill需求文档确认 | 郝倩玉 | 确认投标商务响应文件自动生成系统的需求文档,确保需求合理明确 | P0 | 2025-12-09 |
|
||||
| 🔴 Gartner报告解读转写系统架构设计 | 郝倩玉 | 设计Gartner报告解读转写系统的架构,需求紧急涉及年末签约 | P0 | 2025-12-09 |
|
||||
| 🔴 协助会议纪要Skill优化 | 郝倩玉 | 协助闫旭隆优化会议纪要Skill,包括学习类和Q&A类会议纪要逻辑 | P0 | 2025-12-09 |
|
||||
| 🔴 配合前端框架重构 | 陶西平 | 配合江老师完成问答系统前端框架重构相关工作 | P0 | 2025-12-09 |
|
||||
| 招投标文件Skill架构设计 | 闫旭隆 | 设计招投标文件自动生成系统的Skill架构 | P1 | 2025-12-09 |
|
||||
| 招投标文件Skill架构调试 | 江争达 | 协助调试招投标文件Skill架构 | P1 | 2025-12-09 |
|
||||
| 数字分身需求调研与方案 | 郝倩玉 | 调研市面上较好的数字分身版本,制定多个方案供选择 | P1 | 2025-12-09 |
|
||||
| 日报驱动项目管理系统Skill开发 | 丁康 | 开发日报驱动的项目管理系统Skill,包括基于会议纪要生成日报、与MCP对接等功能 | P2 | 待定 |
|
||||
| Claude Code Skill转LangGraph架构研究 | 郝倩玉 | 研究如何将Claude Code Skill转移到LangGraph低代码架构,作为探索性项目 | P2 | 待定 |
|
||||
|
||||
### 4. 组内成员工作进展
|
||||
|
||||
#### 闫旭隆
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制
|
||||
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文
|
||||
|
||||
**进行中:**
|
||||
- 🔄 会议纪要Skill架构持续优化
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **表扬:** 会议纪要Skill整体有进步,基本逻辑可以固化下来先用
|
||||
- **建议:** 尝试用主窗口全量处理一次,可能效果更好,不要过于依赖子Agent分块处理
|
||||
- **建议:** 先清洗转写文本(去除重复、脏数据),再做处理,保证信息全面同时内容紧凑
|
||||
- **表扬:** 需求Skill的专家博弈机制效果不错
|
||||
- **建议:** 把专家评估意见和最后响应打成一篇文档对比验证效果
|
||||
- **建议:** 映射逻辑图很重要,要把逻辑写进skill里保持一致性
|
||||
- **建议:** 会议纪要最核心目的是下周工作安排,所有逻辑都应围绕这个目标展开
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|会议纪要Skill腾讯会议版本生成
|
||||
- [ ] 🔴 P0|会议纪要Skill Gemini版本生成
|
||||
- [ ] 🔴 P0|需求Skill二阶段专家博弈字段映射
|
||||
- [ ] P1|招投标文件Skill架构设计
|
||||
|
||||
#### 江争达
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 数字人PPT需求文档初版
|
||||
|
||||
**进行中:**
|
||||
- 🔄 完成问答系统v1.1前端重构方案
|
||||
- 🔄 Sub Agent调用机制调研测试
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **批评:** 数字人PPT需求文档时间要求不准确,3-5分钟应为20-30分钟
|
||||
- **批评:** 数字人需求缺少手势动作要求,开场和结束不能没有动作
|
||||
- **建议:** 前端重构要考虑下一版本的交互逻辑
|
||||
- **建议:** 后端先用代码审查工具(如codex)审查一遍
|
||||
- **批评:** Sub Agent调用测试的背景说明不清楚,核心诉求没说清楚
|
||||
- **批评:** 表达能力/提问题表达能力需要提升,不站在其他人角度思考
|
||||
- **建议:** 给大模型的提示词必须写详细完整,口头表达时可以简略,但给大模型时必须写清楚
|
||||
- **建议:** 前端重构方案要用deep research或GPT做校验
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|数字人PPT真人训练视频样本
|
||||
- [ ] 🔴 P0|Gemini 3.0生成分镜脚本测试
|
||||
- [ ] 🔴 P0|数字人PPT需求文档修改
|
||||
- [ ] 🔴 P0|问答系统前端重构方案完善
|
||||
- [ ] 🔴 P0|问答系统后端代码审查
|
||||
- [ ] P1|招投标文件Skill架构调试
|
||||
|
||||
#### 郝倩玉
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 会议纪要Skill架构优化(协助闫旭隆)
|
||||
- ✅ Gartner报告解读转写系统需求对接及文档撰写
|
||||
|
||||
**进行中:**
|
||||
- 🔄 招投标文件Skill架构设计
|
||||
- 🔄 数字分身需求文档
|
||||
- 🔄 问答系统V1.0测试推动
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **任务分配:** 招投标文件Skill需求已确认,提升为P0
|
||||
- **任务分配:** Gartner报告解读转写系统需要先设计架构,提升为P0
|
||||
- **建议:** 数字分身需求继续跟进,自己调研市面上的方案,做几个版本供选择
|
||||
- **建议:** Gartner报告转写系统虽然不难,但优化比较难,先做出一个基本架构
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|招投标文件Skill需求文档确认
|
||||
- [ ] 🔴 P0|Gartner报告解读转写系统架构设计
|
||||
- [ ] 🔴 P0|协助会议纪要Skill优化
|
||||
- [ ] P1|数字分身需求调研与方案
|
||||
- [ ] P2|Claude Code Skill转LangGraph架构研究
|
||||
|
||||
#### 陶西平
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 数字人PPT需求文档(协助江老师)
|
||||
- ✅ 学习使用claudecode的document skill,使用pdf skill的表单填写功能
|
||||
- ✅ 调研数字人平台的公共数字人能力
|
||||
|
||||
**进行中:**
|
||||
- 🔄 数字人与ppt结合(生成指定PPT的数字人视频)
|
||||
- 🔄 前端框架重构(对问答系统前端功能进行分析)
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **建议:** 数字人PPT需求文档中视频时长需求不准确,应该将20-30分钟作为主要需求
|
||||
- **建议:** 需求文档应考虑数字人手势动作,至少前10秒和后10秒要有手势动作
|
||||
- **建议:** 使用Gemini 3.0生成分镜头脚本和图片,再用VEO 3.1等生成视频
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|配合江老师前端框架重构相关工作
|
||||
- [ ] P1|完成数字人调研报告
|
||||
- [ ] P1|完成PPT与数字人结合调研
|
||||
|
||||
---
|
||||
|
||||
## 三、会议总结
|
||||
|
||||
**核心议题:** 会议纪要Skill优化、数字人PPT需求文档、问答系统前端重构、招投标文件Skill架构设计
|
||||
|
||||
**关键决策:**
|
||||
|
||||
1. **会议纪要Skill方案确定:** 先用当前版本固化流程,后续尝试主窗口全量处理
|
||||
2. **会议转写方案:** 使用Gemini多模态能力处理视频转写,可能是最有效的路径
|
||||
3. **数字人平台选型:** 重点测试百度曦灵和黑镜两个平台,本周完成真人训练样本
|
||||
4. **Agent架构决策:** 建议用Agent调Agent而非Skill调Skill,更清晰
|
||||
5. **招投标Skill优先级提升:** 提升为P0,因为涉及潜在合同(30万)
|
||||
6. **Gartner报告系统优先级提升:** 提升为P0,市场部需要年末演示
|
||||
7. **日报驱动系统负责人确定:** 由丁康负责,作为P2任务
|
||||
8. **PPT自动化方案:** 使用Gemini 3.0生成分镜脚本+图片,再生成视频
|
||||
9. **数字人PPT讲解时长需求调整:** 从3-5分钟改为支持20-30分钟
|
||||
10. **前端重构需考虑下一版本交互逻辑**
|
||||
11. **后端代码先进行审查再重构**
|
||||
|
||||
**下周工作重点:**
|
||||
|
||||
1. 🔴 会议纪要Skill优化:腾讯会议版本 + Gemini版本对比测试
|
||||
2. 🔴 数字人PPT:完成真人训练视频样本(百度曦灵/黑镜)
|
||||
3. 🔴 数字人PPT:Gemini 3.0生成分镜脚本测试
|
||||
4. 🔴 问答系统:前端重构方案完善 + 后端代码审查
|
||||
5. 🔴 招投标文件Skill:需求确认 + 架构设计
|
||||
6. 🔴 Gartner报告解读转写系统:架构设计
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-02
|
||||
**下次会议:** 2025-12-09
|
||||
171
会议转写测试/会议纪要生成效果对比/腾讯会议清洗后/Q&A资源库类会议纪要_2025-12-02_第6次周会.md
Normal file
171
会议转写测试/会议纪要生成效果对比/腾讯会议清洗后/Q&A资源库类会议纪要_2025-12-02_第6次周会.md
Normal file
@ -0,0 +1,171 @@
|
||||
# Q&A资源库类会议纪要 (2025-12-02)
|
||||
|
||||
## 一、会议信息
|
||||
- **会议时间:** 2025-12-02
|
||||
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
|
||||
|
||||
---
|
||||
|
||||
## 二、工作问题 Q&A
|
||||
|
||||
### 1. 会议纪要Skill相关问题
|
||||
|
||||
**Q1: 会议转写文本语音识别错误多,说话者标记不准确怎么办?**
|
||||
|
||||
**A:**
|
||||
1. 使用Gemini多模态能力进行视频转写,直接上传视频而非仅依赖语音
|
||||
2. 对转写文本进行预清洗,去除重复和脏数据
|
||||
3. 多模态转写能提供画面切换、屏幕操作等额外上下文信息
|
||||
|
||||
**Q2: AI难以准确判断P0/P1/P2任务优先级怎么办?**
|
||||
|
||||
**A:**
|
||||
1. 让AI先给出优先级建议,人再确认反馈
|
||||
2. 在会上直接语音确认优先级,给AI明确输入
|
||||
3. 保留确认过程的所有材料作为后续微调素材
|
||||
4. 原因:AI缺少成员年龄、级别、工作时长等潜意识上下文
|
||||
|
||||
**Q3: 并行Agent处理会造成信息丢失和逻辑割裂怎么办?**
|
||||
|
||||
**A:**
|
||||
1. 采用全量加载让主窗口一次性处理,而非分块搜索
|
||||
2. 人的语言有大量不清晰表达,直接搜索难以匹配
|
||||
3. AI通过上下文语义理解能更准确提取信息
|
||||
4. 把skill写到主窗口里一次性处理,效果不比分块差
|
||||
|
||||
### 2. 数字人PPT相关问题
|
||||
|
||||
**Q4: 数字人PPT视频时长需求如何定义?**
|
||||
|
||||
**A:**
|
||||
1. 应定义为20-30分钟而非3-5分钟
|
||||
2. 实际场景包括PPT宣讲(20-30分钟)、创始人讲解、领导发言等
|
||||
3. 技术上没有难度,主要是花销问题
|
||||
4. 3-5分钟作为最小实现,但20-30分钟是主要需求
|
||||
|
||||
**Q5: 如何避免数字人看起来很假(如老外说流利中文)?**
|
||||
|
||||
**A:**
|
||||
1. 使用真人录制训练数字人语音和形象
|
||||
2. 在百度曦灵和黑镜平台测试定制数字人效果
|
||||
3. 避免使用看起来不真实的数字人形象
|
||||
4. 数字人的手势动作也要有,开场和结尾不能呆呆站着
|
||||
|
||||
### 3. Skill调用机制问题
|
||||
|
||||
**Q6: 项目级调用全局Agent不稳定怎么办?**
|
||||
|
||||
**A:**
|
||||
1. 使用绝对路径调用SubAgent,测试表现稳定
|
||||
2. 不指定路径时系统默认搜索全局目录,找不到就忽略
|
||||
3. 改用Agent调Agent方式,而非Skill调Agent
|
||||
4. 在子项目下定义主Agent,通过主Agent调用其他Agent
|
||||
|
||||
**Q7: Skill嵌套调用的最佳方式是什么?**
|
||||
|
||||
**A:**
|
||||
1. 精确逻辑控制场景:Skill嵌套Skill优于SubAgent
|
||||
2. Skill共享主窗口上下文,逻辑控制精确
|
||||
3. SubAgent不带上下文,容易出现逻辑割裂
|
||||
4. 调试阶段用Skill主窗口加载方式,调通后再移植
|
||||
|
||||
### 4. 前端重构相关问题
|
||||
|
||||
**Q8: 前端重构前需要做什么准备?**
|
||||
|
||||
**A:**
|
||||
1. 用大模型对后端代码做Code Review审查
|
||||
2. 找专门的code review agent或skill
|
||||
3. 记录发现的问题作为需求文档
|
||||
4. 重构时考虑下一版本的交互逻辑变更
|
||||
5. 提供示例代码给大模型,保持代码风格一致
|
||||
|
||||
---
|
||||
|
||||
## 三、重点工作方法
|
||||
|
||||
### 方法 1:多模态视频转写会议纪要
|
||||
- **方法描述:** 使用Gemini的多模态能力直接上传会议视频进行转写,而非仅依赖纯语音识别。视频包含文字、图像、音频等多种信息,能提供更丰富的上下文(如画面切换、屏幕操作等),转写准确性更高。可以直接给视频配合会议纪要模板,一步生成结构化会议纪要。
|
||||
- **适用场景:** 会议纪要生成、视频内容提取
|
||||
- **关键要点:**
|
||||
- 多模态信息比纯音频更准确
|
||||
- 可直接配合模板一步生成
|
||||
- 画面信息提供额外上下文
|
||||
|
||||
### 方法 2:模型工具组合策略
|
||||
- **方法描述:** 前端开发用Gemini(一句话就能生成完整前端),中间逻辑代码构造用Claude Code(工具调用和理解能力最强),整体项目修复和测试用GPT的Codex。如果只能选一个,主力还是Claude Code,因为做Agent时工具理解能力最重要。
|
||||
- **适用场景:** AI辅助开发、工具选型
|
||||
- **关键要点:**
|
||||
- 前端→Gemini
|
||||
- 逻辑代码→Claude Code
|
||||
- 修复测试→GPT Codex
|
||||
|
||||
### 方法 3:全量上下文处理优于分块搜索
|
||||
- **方法描述:** 会议纪要信息提取应采用全量加载转写文本让AI自行提取,而非分块搜索。因为人的语言有大量不清晰表达,直接搜索难以匹配,AI通过上下文语义理解能更准确提取信息。
|
||||
- **适用场景:** 会议纪要生成、文本信息提取
|
||||
- **关键要点:**
|
||||
- 分块搜索容易丢失信息
|
||||
- AI语义理解比关键词匹配更准确
|
||||
- 全文一次性处理效果最好
|
||||
|
||||
### 方法 4:文字转写预清洗
|
||||
- **方法描述:** 在进行会议纪要生成前,先对原始转写文本进行一次清洗加工:去除重复内容、脏数据,保证信息全面的同时内容紧凑。清洗后的文本再作为主窗口的上下文输入。
|
||||
- **适用场景:** 会议纪要处理、长文本处理
|
||||
- **关键要点:**
|
||||
- 去除重复和脏数据
|
||||
- 保持信息完整性
|
||||
- 减少每个Agent的处理负担
|
||||
|
||||
### 方法 5:优先级判断人机协作
|
||||
- **方法描述:** P0/P1/P2任务优先级判断是AI最难的部分,因为AI缺乏成员年龄、级别、工作时长等潜意识上下文。解决方案:让AI先给出优先级建议,人再确认反馈;或在会上直接语音确认优先级。
|
||||
- **适用场景:** 任务优先级评估、工作安排
|
||||
- **关键要点:**
|
||||
- AI给建议、人做确认
|
||||
- 保留确认材料用于后续优化
|
||||
- 尝试将隐性上下文显性化
|
||||
|
||||
### 方法 6:Agent调Agent优于Skill调Agent
|
||||
- **方法描述:** 在Claude Code中组织多Agent时,建议用Agent调用Agent而非Skill调用Agent。在子项目下定义一个主Agent,激活后用它调用其他子Agent。这样组织更清晰,不会出现Skill嵌套Skill的逻辑混乱。
|
||||
- **适用场景:** 多Agent编排、复杂Skill开发
|
||||
- **关键要点:**
|
||||
- 定义主Agent负责调度
|
||||
- 避免Skill嵌套的逻辑混乱
|
||||
- SubAgent必须用绝对路径调用
|
||||
|
||||
### 方法 7:试错式行为规范定义
|
||||
- **方法描述:** 定义Agent行为规范时,不要预先规定太多动作(会限制能力),而是先让它犯错,然后针对性地告诉它:'必须做什么'(漏了的)、'不要做什么'(错了的)。用正确示例和错误示例对比来规范行为。
|
||||
- **适用场景:** Skill开发、Agent行为规范
|
||||
- **关键要点:**
|
||||
- 预先规定太多会限制AI能力
|
||||
- 先测试再针对性规范
|
||||
- 正确/错误示例对比最有效
|
||||
|
||||
### 方法 8:代码审查先于重构
|
||||
- **方法描述:** 重构代码前,先用大模型(如Claude 4.5、GPT Codex)对现有代码进行审查(Code Review),找专门的code review agent或skill。记录发现的问题作为需求文档,评估后再决定是否修改,避免盲目重构。
|
||||
- **适用场景:** 代码重构、质量改进
|
||||
- **关键要点:**
|
||||
- 审查先行,避免盲目重构
|
||||
- 问题记录作为需求文档
|
||||
- 下次会议评估是否修改
|
||||
|
||||
### 方法 9:提问表达能力决定AI输出质量
|
||||
- **方法描述:** 与AI交互时,必须清晰交代背景、核心诉求和问题点。站在对方角度思考:如果不补充这些上下文,对方能否理解你要干什么?表达不清会导致AI给出糟糕的答案。
|
||||
- **适用场景:** AI交互、需求沟通
|
||||
- **关键要点:**
|
||||
- 清晰交代背景和核心诉求
|
||||
- 站在对方角度检查表达
|
||||
- 表达能力直接影响AI输出质量
|
||||
|
||||
### 方法 10:Playwright+Claude实现办公自动化
|
||||
- **方法描述:** 使用Playwright MCP扩展控制浏览器,配合Claude Code的Skill编排,实现办公自动化流程。例如:自动打开Gemini网页、上传文件、输入提示词、下载生成结果、组装PPT。对于浏览器外的操作(如保存对话框),用Python脚本通过scripts调用。
|
||||
- **适用场景:** 办公自动化、批量文档处理
|
||||
- **关键要点:**
|
||||
- Playwright控制浏览器操作
|
||||
- Python脚本处理浏览器外操作
|
||||
- Skill编排整体流程
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-08
|
||||
**下次会议:** 2025-12-09
|
||||
73
会议转写测试/会议纪要生成效果对比/腾讯会议清洗后/云大所需求相关进度会议纪要_2025-12-02_第6次周会.md
Normal file
73
会议转写测试/会议纪要生成效果对比/腾讯会议清洗后/云大所需求相关进度会议纪要_2025-12-02_第6次周会.md
Normal file
@ -0,0 +1,73 @@
|
||||
# 云大所需求相关进度会议纪要 (2025-12-02)
|
||||
|
||||
## 一、会议信息
|
||||
- **会议时间:** 2025-12-02
|
||||
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
|
||||
|
||||
---
|
||||
|
||||
## 二、需求项目进展
|
||||
|
||||
| 项目名称 | 负责人 | 本周进展 | 存在问题 | 下周计划 | 优先级 |
|
||||
| --- | --- | --- | --- | --- | --- |
|
||||
| 投标商务应答自动生成系统 | 郝倩玉、闫旭隆、江争达 | 需求文档已完成确认 | 需要先设计Skill架构 | 完成招投标Skill架构设计 | P0 |
|
||||
| 运营商信息精准爬取系统 | 郝倩玉 | 多轮沟通中,需求方需求尚未明确 | 需求方的具体需求一直不能明确 | 持续跟进需求 | P1 |
|
||||
| 数字人项目 | 江争达、郝倩玉、陶西平 | 已完成第一阶段需求文档整理和平台调研(百度曦灵、黑镜、可灵),已完成费用对比 | 1)视频时长需求定义不准确(原3-5分钟应为20-30分钟);2)需要加入手势动作要求;3)合作方需求时间点不确定 | 1)用真人训练数字人样本;2)研究端到端工作流;3)测试Gemini分镜脚本+视频生成路径 | P0 |
|
||||
| Gartner报告解读转写系统 | 郝倩玉 | 需求文档已完成,人员确认完毕,已发闫旭隆 | 无 | 设计Skill架构(涉及年末签合同和30万收入) | P0 |
|
||||
|
||||
> **说明:** 本次会议未涉及以下市场部需求项目:客户风险推送自动化系统、邮件自动处理转发系统、证书信息提取系统、云大阁新报告自动推送
|
||||
|
||||
---
|
||||
|
||||
## 三、问题与风险
|
||||
|
||||
### 投标商务应答自动生成系统
|
||||
|
||||
**问题:** 需要设计Skill架构
|
||||
|
||||
**解决方案:** 本周由郝倩玉完成架构设计,如需求需要讨论则先明确
|
||||
|
||||
**责任人:** 郝倩玉
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
### 数字人项目
|
||||
|
||||
**问题1:** 视频时长需求定义不准确
|
||||
- 原需求:3-5分钟
|
||||
- 实际需求:20-30分钟(PPT宣讲、领导发言等场景)
|
||||
|
||||
**解决方案:** 时长改为20-30分钟作为主要需求,技术上没有难度,主要是花销问题
|
||||
|
||||
**问题2:** 合作方(富友)需求时间点不确定
|
||||
|
||||
**解决方案:**
|
||||
1. 先自己做好数字分身方案,不以合作方需求为核心
|
||||
2. 多做几个版本让合作方选择
|
||||
3. 调研市面上比较好的方案,分别出方案
|
||||
|
||||
**责任人:** 江争达、郝倩玉
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
### 运营商信息精准爬取系统
|
||||
|
||||
**问题:** 需求方的具体需求一直不能明确
|
||||
|
||||
**解决方案:** 持续跟进,反复沟通,提供可行性方案给对方做参考
|
||||
|
||||
**责任人:** 郝倩玉
|
||||
**截止时间:** 待定
|
||||
|
||||
---
|
||||
|
||||
## 四、下周重点
|
||||
|
||||
1. 🔴 **数字人视频样本训练** - 本周末完成,使用真实人物在百度曦灵和黑镜平台各生成样本
|
||||
2. 🔴 **数字人工作流研究** - 测试Gemini 3.0生成分镜脚本+图片后用Veo3.1生成视频
|
||||
3. 🔴 **招投标Skill架构设计** - 完成投标商务应答自动生成系统的Skill架构
|
||||
4. 🔴 **Gartner报告转写Skill架构设计** - 涉及年末签合同和30万收入,优先级提升
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-08
|
||||
**下次会议:** 2025-12-09
|
||||
225
会议转写测试/会议纪要生成效果对比/腾讯会议清洗后/工程类会议纪要_2025-12-02_第6次周会.md
Normal file
225
会议转写测试/会议纪要生成效果对比/腾讯会议清洗后/工程类会议纪要_2025-12-02_第6次周会.md
Normal file
@ -0,0 +1,225 @@
|
||||
# 工程类会议纪要 (2025-12-02)
|
||||
|
||||
## 一、会议信息
|
||||
- **会议时间:** 2025-12-02
|
||||
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
|
||||
|
||||
---
|
||||
|
||||
## 二、工作内容
|
||||
|
||||
### 1. 重点项目进展情况汇总
|
||||
|
||||
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|
||||
| --- | --- | --- | --- |
|
||||
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成索引搜索改为全量读取的架构优化,完成字段映射逻辑图设计(负责人改为原负责人、截止时间改为原截止时间),已进行新旧版本对比测试。存在问题:文字转写准确性问题仍是最大挑战,P0/P1/P2优先级判断难以精准。**解决方案:** 1)先对转写文本做清洗处理;2)尝试主窗口全量处理替代分块并行;3)优先级判断让AI先给建议后人工确认 |
|
||||
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成专家博弈流程基本测试,实现独立评审→交叉评价→交叉回应→决策整合的完整流程。存在问题:专家博弈prompt可能没写好,评估水平需验证。**解决方案:** 把评估意见和响应打成问答文档判断质量,每个领域专家prompt需专门调优 |
|
||||
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成第一阶段需求文档整理(五个核心需求),完成数字人生成平台调研和费用对比。存在问题:视频时长需求不准确(原3-5分钟应为20-30分钟),手势动作第一阶段也需考虑。**解决方案:** 1)时长改为20-30分钟;2)加入手势动作要求;3)本周用真人训练数字人样本(百度曦灵+黑镜);4)测试gemini分镜脚本+图片生成视频的工作流 |
|
||||
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | Gartner报告解读转写系统需求文档已完成,已发闫旭隆。合作方(富友)需求有变化,时间点不确定。**解决方案:** 先做好准备,多做几个版本让合作方选择,自己找市面上好的案例做参考 |
|
||||
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 已完成前端重构方案设计,明确保留现有基础功能只重构展示部分和代码结构,已确认API接口规范文档。存在问题:功能清单对比尚未完成,需考虑下一版本交互逻辑修改。**解决方案:** 1)用大模型做后端代码审查;2)用research生成前端重构方案与当前方案对比;3)提前考虑下一版本功能需求 |
|
||||
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 需求文档已完成确认,本周需设计架构 |
|
||||
|
||||
### 2. 重点项目问题及解决方案
|
||||
|
||||
#### 问题1: 会议纪要相关问题
|
||||
|
||||
**问题描述:**
|
||||
1. 会议转写文本中存在大量语音识别错误,说话者标记不准确,上下文约束能力不足
|
||||
2. AI难以准确判断任务的P0/P1/P2优先级,缺少成员年龄、级别、工作时间等隐性上下文
|
||||
3. 并行Agent处理会造成信息丢失和逻辑割裂
|
||||
|
||||
**解决方案:**
|
||||
1. 使用Gemini多模态能力进行视频转写,直接上传视频并根据会议模板生成纪要
|
||||
2. 对转写文本进行清洗加工,去除脏数据和重复内容,保证信息全面同时内容紧凑
|
||||
3. 在会议上直接确认P0/P1/P2优先级,让AI先给建议后人再确认
|
||||
4. 尝试主窗口全量处理一次性生成,把skill写到主窗口里
|
||||
5. 保留确认过程材料作为后续微调素材
|
||||
|
||||
**责任人:** 闫旭隆、郝倩玉
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题2: 数字人PPT需求相关问题
|
||||
|
||||
**问题描述:**
|
||||
1. 需求文档中时长要求定义不准确(3-5分钟 vs 20-30分钟)
|
||||
2. 数字人生成存在真实性问题(老外说流利中文让人质疑真假)
|
||||
3. 使用界面/工作流方案尚未明确
|
||||
|
||||
**解决方案:**
|
||||
1. 将视频时长需求改为20-30分钟作为主要需求
|
||||
2. 使用真人录制训练数字人,用自己真实人物的语音和形象
|
||||
3. 测试百度曦灵和黑镜平台的定制数字人效果
|
||||
4. 研究端到端工作流(API调用或网站操作或剪映自动化)
|
||||
5. 测试Gemini 3.0生成分镜脚本+图片再用Veo3.1生成视频的路径
|
||||
|
||||
**责任人:** 江争达
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题3: 需求方需求不明确问题
|
||||
|
||||
**问题描述:**
|
||||
关于合作方(富友)数字分身需求一直不能明确,杜主任最新信息显示合作方时间点是否使用不确定。
|
||||
|
||||
**解决方案:**
|
||||
1. 先自己做好数字分身方案,不以合作方需求为核心
|
||||
2. 多做几个版本让合作方选择
|
||||
3. 自己调研市面上比较好的方案,分别出方案后与相关人员对接
|
||||
|
||||
**责任人:** 郝倩玉、江争达
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
#### 问题4: Subagent调用机制不稳定问题
|
||||
|
||||
**问题描述:**
|
||||
在项目目录下调用全局agent时,不指定绝对路径的情况下调用不稳定,有时会读取sub的提示词但不执行,表现不一致。
|
||||
|
||||
**解决方案:**
|
||||
1. 使用绝对路径调用subagent,测试表现稳定
|
||||
2. 改用agent调agent的方式,而不是skill调用subagent
|
||||
3. 在子项目下定义一个主agent,通过主agent调用其他agent
|
||||
4. 调试阶段用skill主窗口加载方式,调通后再移植到agent
|
||||
|
||||
**责任人:** 江争达、闫旭隆
|
||||
**截止时间:** 2025-12-09
|
||||
|
||||
### 3. 下周工作安排
|
||||
|
||||
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|
||||
| --- | --- | --- | --- | --- |
|
||||
| 🔴 会议纪要Skill测试对比 | 闫旭隆 | 使用当前版本生成会议纪要,再用腾讯会议转写生成一版,同时测试gemini直接喂视频生成纪要的效果 | P0 | 2025-12-09 |
|
||||
| 🔴 会议转写文本清洗优化 | 闫旭隆 | 把会议转写文本中脏的、重复的内容做一遍加工清洗,保证信息全面同时内容紧凑 | P0 | 2025-12-09 |
|
||||
| 🔴 需求Skill专家博弈流程优化 | 闫旭隆 | 查看二阶段专家交叉回应的字段映射,整理可视化效果,梳理整体流程图 | P0 | 2025-12-09 |
|
||||
| 🔴 数字人视频样本训练 | 江争达 | 使用真实人物训练数字人语音和视频,在百度曦灵和黑镜平台各生成一个样本 | P0 | 2025-12-08 |
|
||||
| 🔴 数字人PPT需求文档修改 | 江争达 | 时长改为20-30分钟,添加手势动作要求,完善第一阶段和第二阶段需求 | P0 | 2025-12-09 |
|
||||
| 🔴 数字人工作流研究 | 江争达 | 研究数字人生成工作流方案(API调用、剪映自动化);测试Gemini 3.0生成分镜脚本+图片后用Veo3.1生成视频 | P0 | 2025-12-09 |
|
||||
| 🔴 问答系统前端重构 | 江争达 | 完成前端重构方案,考虑下一版本交互逻辑修改,使用大模型审查方案并对比优化 | P0 | 2025-12-09 |
|
||||
| 🔴 招投标Skill架构设计 | 郝倩玉 | 完成招投标文件Skill的架构设计,先确认需求是否需要讨论明确 | P0 | 2025-12-09 |
|
||||
| 🔴 Gartner报告转写Skill架构设计 | 郝倩玉 | 设计Gartner报告转写的Skill架构(涉及年末签合同和30万收入) | P0 | 2025-12-09 |
|
||||
| 🔴 数字分身市场调研 | 郝倩玉 | 调研市面上较好的数字分身方案版本,分别出方案后与钱林对接 | P0 | 2025-12-09 |
|
||||
| 协助会议纪要Skill优化 | 郝倩玉 | 协助闫旭隆优化会议纪要Skill | P1 | 2025-12-09 |
|
||||
| 后端代码审查 | 江争达 | 使用Claude 4.5或GPT做后端code review,记录问题作为后续优化需求 | P1 | 2025-12-09 |
|
||||
| 天眼查自动更新需求确认 | 江争达 | 与小彤确认天眼查客户数据库自动更新需求是否还需要 | P1 | 2025-12-09 |
|
||||
| Cloud Skill转框架研究 | 郝倩玉 | 研究如何将Claude Skill迁移到LangGraph等低代码架构,作为技术储备 | P1 | 待定 |
|
||||
| 日报驱动项目管理系统开发 | 丁康 | 负责基于会议纪要的日报驱动项目管理系统Skill开发,包括与MCP对接 | P1 | 待定 |
|
||||
|
||||
### 4. 组内成员工作进展
|
||||
|
||||
#### 闫旭隆
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 需求澄清-需求文档skill优化、测试、视频录制
|
||||
- ✅ 会议纪要Skill开发(改为全量读取架构,整理流程图)
|
||||
|
||||
**进行中:**
|
||||
- 🔄 会议纪要Skill测试对比
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **表扬:** 总的来说比上一版有进步,整个逻辑可以先固化下来使用;该有的要点都有,比较接近了
|
||||
- **表扬:** 能把动作识别出来不容易,就算其他人明白也挺牛的
|
||||
- **建议:** 映射逻辑图很重要,AI目前最缺的是逻辑一致和前后连贯
|
||||
- **建议:** 转写文本需先做清洗加工,去除重复和脏数据后再处理
|
||||
- **建议:** 尝试主窗口全量处理一次性生成,减少并行Agent带来的信息丢失
|
||||
- **建议:** 整个文字转写换成gemini来做,生成全量版而非逐字转写
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|会议纪要Skill测试对比(腾讯会议+gemini视频两个版本)
|
||||
- [ ] 🔴 P0|会议转写文本清洗优化
|
||||
- [ ] 🔴 P0|需求Skill专家博弈流程优化
|
||||
- [ ] P1|招投标文件Skill架构设计和调试
|
||||
|
||||
#### 江争达
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 数字人PPT需求文档
|
||||
|
||||
**进行中:**
|
||||
- 🔄 问答系统v1.1前端重构方案
|
||||
- 🔄 数字人视频样本训练
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **批评:** 背景说明不清楚,核心诉求和问题点没有交代清楚,需求文档分析存在问题,不站在其他人角度思考
|
||||
- **批评:** 只看树木不看森林,关于数字人老外说中文的问题理解不到位
|
||||
- **建议:** 数字人PPT时长要求改为20-30分钟,而非3-5分钟
|
||||
- **建议:** 数字人视频需要有手势动作,开场和结尾不能呆呆站着
|
||||
- **建议:** 前端重构要考虑下一版本交互逻辑修改
|
||||
- **建议:** 后端代码需用大模型做code review审查
|
||||
- **建议:** 提供示例代码给大模型是有用的
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|数字人视频样本训练(本周末完成)
|
||||
- [ ] 🔴 P0|数字人PPT需求文档修改
|
||||
- [ ] 🔴 P0|数字人工作流研究+Gemini分镜测试
|
||||
- [ ] 🔴 P0|问答系统前端重构
|
||||
- [ ] P1|后端代码审查
|
||||
- [ ] P1|天眼查自动更新需求确认
|
||||
|
||||
#### 郝倩玉
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 会议纪要Skill架构优化协助
|
||||
- ✅ Gartner报告解读转写系统需求文档(已发闫旭隆)
|
||||
|
||||
**进行中:**
|
||||
- 🔄 数字分身需求对接
|
||||
- 🔄 招投标文件Skill架构设计
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **建议:** 数字分身需求由于合作方时间不确定,先自己做好准备,做几个版本备选
|
||||
- **建议:** Gartner报告转写因涉及年末签合同提升到P0,先设计架构
|
||||
- **建议:** 如果想学习Skill到LangGraph架构转换,需要先把skill底层知识全部学一遍
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|招投标Skill架构设计
|
||||
- [ ] 🔴 P0|Gartner报告转写Skill架构设计
|
||||
- [ ] 🔴 P0|数字分身市场调研
|
||||
- [ ] P1|协助会议纪要Skill优化
|
||||
- [ ] P1|Cloud Skill转框架研究
|
||||
|
||||
#### 陶西平
|
||||
|
||||
**上周完成:**
|
||||
- ✅ 数字人PPT需求文档协助(提供调研文档)
|
||||
- ✅ 数字人与PPT结合视频生成测试
|
||||
|
||||
**进行中:**
|
||||
- 🔄 前端框架调研
|
||||
- 🔄 数字人调研报告
|
||||
|
||||
**收到的反馈/学习建议:**
|
||||
- **认可:** 提供的数字人调研文档被江争达采用,作为需求文档重要参考
|
||||
|
||||
**下周任务:**
|
||||
- [ ] 🔴 P0|配合江老师前端框架重构相关工作
|
||||
- [ ] P1|完成数字人调研报告
|
||||
- [ ] P1|完成PPT与数字人结合调研
|
||||
|
||||
---
|
||||
|
||||
## 三、会议总结
|
||||
|
||||
**核心议题:** 会议纪要Skill架构优化、数字人PPT需求完善、问答系统前端重构、Subagent调用机制研究
|
||||
|
||||
**关键决策:**
|
||||
1. **会议纪要转写采用Gemini多模态视频处理路径**:多模态能力最强,上下文最长,视觉能力超强
|
||||
2. **模型工具组合确定**:前端用Gemini,中间逻辑用Claude Code,整体项目修复/测试用GPT Codex
|
||||
3. **会议纪要Skill改为全量读取方式**:放弃索引搜索,转写文本需先做清洗再处理
|
||||
4. **P0优先级判断采用AI建议+人工确认模式**:不能完全依赖自动判断
|
||||
5. **数字人视频时长改为20-30分钟**:技术上没有难度,只是花销问题
|
||||
6. **数字分身选型聚焦百度曦灵和黑镜两个平台**:本周需用真人训练样本
|
||||
7. **前端重构只改展示和代码结构**:保留现有功能流程不动,但要考虑下一版本交互逻辑
|
||||
8. **SubAgent调用必须使用绝对路径**:测试表现稳定,推荐Agent调Agent方式
|
||||
9. **Gartner报告转写提升为P0**:涉及年末签合同和30万收入
|
||||
10. **日报驱动项目管理系统由丁康负责**:包括基于会议纪要生成日报、与MCP对接
|
||||
|
||||
**下周工作重点:**
|
||||
1. 🔴 会议纪要Skill测试对比(腾讯会议转写 vs gemini视频直接生成)
|
||||
2. 🔴 数字人视频样本训练(百度曦灵+黑镜,本周末完成)
|
||||
3. 🔴 数字人工作流研究(Gemini分镜脚本+图片→Veo3.1视频)
|
||||
4. 🔴 问答系统前端重构方案完善
|
||||
5. 🔴 招投标Skill和Gartner报告转写Skill架构设计
|
||||
|
||||
---
|
||||
|
||||
**纪要整理人:** Claude
|
||||
**纪要时间:** 2025-12-08
|
||||
**下次会议:** 2025-12-09
|
||||
Reference in New Issue
Block a user