Files
AIEC_Skills/会议转写测试/会议纪要生成效果对比/腾讯会议清洗前/Q&A资源库类会议纪要_2025-12-02_第6次周会.md

157 lines
5.6 KiB
Markdown
Raw Normal View History

# Q&A资源库类会议纪要 (2025-12-02)
## 一、会议信息
- **会议时间:** 2025-12-02
- **参会人员:** 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉
---
## 二、工作问题 Q&A
### 1. 会议纪要Skill相关问题
**Q1: 会议纪要语音转写准确性不足怎么解决?**
**问题描述:** 语音识别效率低,文字转写的准确性不足,上下文约束能力差。转写文本有大量重复、错误和逻辑中断。
**解决方案:**
- 使用Gemini多模态能力处理视频转写直接上传视频给Gemini生成会议纪要
- 先清洗转写文本去除重复、脏数据再进行处理生成紧凑的clean版本
- 改为全量读取上下文方式,不用索引搜索,让模型通过语义理解提取信息
- 考虑调用Gemini API在Claude里面处理转写实现自动化
**Q2: 会议纪要P0/P1/P2优先级判断不准确怎么办**
**问题描述:** 模型很难准确判断任务的优先级,因为缺少成员的年龄、级别、工作时间等潜在上下文信息。
**解决方案:**
- 让模型先给出优先级建议,人再进行确认反馈
- 在会上直接确认P0/P1/P2给模型明确的文字信息
- 逐步把潜在上下文显性化,作为输入提供给模型
- 保留确认过程的所有材料,作为后续微调训练数据
### 2. Agent架构相关问题
**Q3: Sub Agent调用时相对路径不可靠怎么办**
**问题描述:** 在项目目录下调用全局Agent时使用相对路径调用不可靠。不指定绝对路径时Sub Agent会读取提示词但不会按照预期执行。
**解决方案:**
- 使用绝对路径调用Sub Agent确保路径指向正确位置
- 建议用Agent调Agent而非Skill调Agent逻辑更清晰
- Skill调Skill在主窗口上下文共享控制更精确
- 调试时用Skill形式调通后再移植到Agent中
**Q4: Skill调Agent和Agent调Agent哪个更好**
**问题描述:** 在编排复杂流程时,需要选择合适的调用方式。
**解决方案:**
- **Agent调Agent更推荐:** 逻辑更清晰,更智能
- **Skill调Skill的优势:** 主窗口上下文共享,控制更精确
- **调试建议:** 调试时用Skill形式上下文可见调通后再移植到Agent
- **架构建议:** 非必要情况下不要在Skill里面调用Sub Agent会导致逻辑割裂
### 3. 需求文档相关问题
**Q5: 需求文档如何区分默认需求和核心需求?**
**问题描述:** 数字人PPT需求文档时间要求不准确3-5分钟应为20-30分钟说明需求理解存在偏差。
**解决方案:**
- 先明确目标用户的真实使用场景如PPT宣讲一般需要20-30分钟
- 区分"不提也会做"的默认需求和"必须明确"的核心需求
- 需求文档要站在其他人角度思考,让非技术人员也能看懂
**Q6: 如何提升需求表达能力?**
**问题描述:** 需求文档分析问题大,不站在其他人角度思考,核心诉求没说清楚。
**解决方案:**
- 给大模型的提示词必须写详细完整,口头表达时可以简略
- 先交代背景和核心诉求,再说具体内容
- 用deep research或GPT做方案校验
- 把方案给大模型审查,看有什么值得借鉴或存在的问题
### 4. 前端重构相关问题
**Q7: 前端重构如何避免二次返工?**
**问题描述:** 前端重构方案只完成了一半,未考虑下一版本的交互逻辑更改。
**解决方案:**
- 在重构时就考虑下一版本的功能需求
- 后端先用代码审查工具审查一遍,记录问题
- 用deep research或GPT生成前端重构方案对比
- 对照流程图验证方案的准确性
---
## 三、重点工作方法
### 方法1: Gemini多模态视频转写方法
**方法描述:** 使用Gemini的多模态能力直接处理会议视频生成会议纪要。
**适用场景:** 会议纪要生成、视频内容提取
**关键要点:**
- 直接上传视频给Gemini配合会议纪要模板
- 多模态能力可以同时处理视频、音频、文字
- 比纯文字转写后再处理效果更好
- API调用成本可接受半小时约6000字2万多token
### 方法2: PPT自动化生成方法
**方法描述:** 使用Gemini 3.0生成分镜脚本和图片,再通过视频生成平台合成视频。
**适用场景:** PPT自动生成、视频内容创作
**关键要点:**
- 先用Gemini生成分镜头脚本
- 让Gemini生成每个分镜的图片
- 使用首尾帧+文字通过VEO 3.1等平台生成视频
- 使用Playwright MCP实现浏览器自动化操作
### 方法3: Agent架构调试方法
**方法描述:** 先用Skill形式调试调通后再移植到Agent中。
**适用场景:** 复杂Agent流程开发
**关键要点:**
- 调试时用Skill形式上下文可见便于定位问题
- 调通后移植到Agent实现上下文隔离
- 使用绝对路径调用Sub Agent
- 建议用Agent调Agent而非Skill调Agent
### 方法4: 需求文档审查方法
**方法描述:** 使用大模型对需求文档进行多角度审查。
**适用场景:** 需求文档质量提升
**关键要点:**
- 先用deep research或GPT生成参考方案
- 把自己的方案给大模型审查
- 对比两个方案的差异
- 关注核心需求而非默认功能
### 方法5: 代码审查方法
**方法描述:** 使用Claude 4.5或GPT codex对代码进行审查。
**适用场景:** 代码重构前的问题发现
**关键要点:**
- 先审查再重构,避免带病开发
- 审查出来的问题记录下来作为需求文档
- 使用专业的code review工具或Agent
- 下一次会议讨论是否需要修改
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-02
**下次会议:** 2025-12-09