yanxulong/AIEC_Skills

Fork 0

Files

闫旭隆 f4314c3ede 需求文档skill回溯专家博弈之前

2025-12-11 14:19:36 +08:00

5.6 KiB

Raw Blame History

Q&A资源库类会议纪要 (2025-12-02)

一、会议信息

会议时间: 2025-12-02
参会人员: 连云波(主持)、江争达、闫旭隆、陶西平、郝倩玉

二、工作问题 Q&A

1. 会议纪要Skill相关问题

Q1: 会议纪要语音转写准确性不足怎么解决？

问题描述: 语音识别效率低，文字转写的准确性不足，上下文约束能力差。转写文本有大量重复、错误和逻辑中断。

解决方案:

使用Gemini多模态能力处理视频转写，直接上传视频给Gemini生成会议纪要
先清洗转写文本（去除重复、脏数据）再进行处理，生成紧凑的clean版本
改为全量读取上下文方式，不用索引搜索，让模型通过语义理解提取信息
考虑调用Gemini API在Claude里面处理转写，实现自动化

Q2: 会议纪要P0/P1/P2优先级判断不准确怎么办？

问题描述: 模型很难准确判断任务的优先级，因为缺少成员的年龄、级别、工作时间等潜在上下文信息。

解决方案:

让模型先给出优先级建议，人再进行确认反馈
在会上直接确认P0/P1/P2，给模型明确的文字信息
逐步把潜在上下文显性化，作为输入提供给模型
保留确认过程的所有材料，作为后续微调训练数据

2. Agent架构相关问题

Q3: Sub Agent调用时相对路径不可靠怎么办？

问题描述: 在项目目录下调用全局Agent时，使用相对路径调用不可靠。不指定绝对路径时，Sub Agent会读取提示词但不会按照预期执行。

解决方案:

使用绝对路径调用Sub Agent，确保路径指向正确位置
建议用Agent调Agent而非Skill调Agent，逻辑更清晰
Skill调Skill在主窗口上下文共享，控制更精确
调试时用Skill形式，调通后再移植到Agent中

Q4: Skill调Agent和Agent调Agent哪个更好？

问题描述: 在编排复杂流程时，需要选择合适的调用方式。

解决方案:

Agent调Agent更推荐: 逻辑更清晰，更智能
Skill调Skill的优势: 主窗口上下文共享，控制更精确
调试建议: 调试时用Skill形式（上下文可见），调通后再移植到Agent
架构建议: 非必要情况下，不要在Skill里面调用Sub Agent，会导致逻辑割裂

3. 需求文档相关问题

Q5: 需求文档如何区分默认需求和核心需求？

问题描述: 数字人PPT需求文档时间要求不准确（3-5分钟应为20-30分钟），说明需求理解存在偏差。

解决方案:

先明确目标用户的真实使用场景（如PPT宣讲一般需要20-30分钟）
区分"不提也会做"的默认需求和"必须明确"的核心需求
需求文档要站在其他人角度思考，让非技术人员也能看懂

Q6: 如何提升需求表达能力？

问题描述: 需求文档分析问题大，不站在其他人角度思考，核心诉求没说清楚。

解决方案:

给大模型的提示词必须写详细完整，口头表达时可以简略
先交代背景和核心诉求，再说具体内容
用deep research或GPT做方案校验
把方案给大模型审查，看有什么值得借鉴或存在的问题

4. 前端重构相关问题

Q7: 前端重构如何避免二次返工？

问题描述: 前端重构方案只完成了一半，未考虑下一版本的交互逻辑更改。

解决方案:

在重构时就考虑下一版本的功能需求
后端先用代码审查工具审查一遍，记录问题
用deep research或GPT生成前端重构方案对比
对照流程图验证方案的准确性

三、重点工作方法

方法1: Gemini多模态视频转写方法

方法描述: 使用Gemini的多模态能力直接处理会议视频，生成会议纪要。

适用场景: 会议纪要生成、视频内容提取

关键要点:

直接上传视频给Gemini，配合会议纪要模板
多模态能力可以同时处理视频、音频、文字
比纯文字转写后再处理效果更好
API调用成本可接受（半小时约6000字，2万多token）

方法2: PPT自动化生成方法

方法描述: 使用Gemini 3.0生成分镜脚本和图片，再通过视频生成平台合成视频。

适用场景: PPT自动生成、视频内容创作

关键要点:

先用Gemini生成分镜头脚本
让Gemini生成每个分镜的图片
使用首尾帧+文字通过VEO 3.1等平台生成视频
使用Playwright MCP实现浏览器自动化操作

方法3: Agent架构调试方法

方法描述: 先用Skill形式调试，调通后再移植到Agent中。

适用场景: 复杂Agent流程开发

关键要点:

调试时用Skill形式，上下文可见便于定位问题
调通后移植到Agent，实现上下文隔离
使用绝对路径调用Sub Agent
建议用Agent调Agent而非Skill调Agent

方法4: 需求文档审查方法

方法描述: 使用大模型对需求文档进行多角度审查。

适用场景: 需求文档质量提升

关键要点:

先用deep research或GPT生成参考方案
把自己的方案给大模型审查
对比两个方案的差异
关注核心需求而非默认功能

方法5: 代码审查方法

方法描述: 使用Claude 4.5或GPT codex对代码进行审查。

适用场景: 代码重构前的问题发现

关键要点:

先审查再重构，避免带病开发
审查出来的问题记录下来作为需求文档
使用专业的code review工具或Agent
下一次会议讨论是否需要修改

纪要整理人: Claude 纪要时间: 2025-12-02 下次会议: 2025-12-09

5.6 KiB Raw Blame History Unescape Escape

Q&A资源库类会议纪要 (2025-12-02)

一、会议信息

二、工作问题 Q&A

1. 会议纪要Skill相关问题

2. Agent架构相关问题

3. 需求文档相关问题

4. 前端重构相关问题

三、重点工作方法

方法1: Gemini多模态视频转写方法

方法2: PPT自动化生成方法

方法3: Agent架构调试方法

方法4: 需求文档审查方法

方法5: 代码审查方法

5.6 KiB

Raw Blame History