310 lines
17 KiB
Markdown
310 lines
17 KiB
Markdown
# 工程类会议纪要 (2025-12-02)
|
||
|
||
## 一、会议信息
|
||
|
||
- **会议时间:** 2025-12-02
|
||
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
|
||
- **纪要整理人:** Claude
|
||
|
||
---
|
||
|
||
## 二、工作内容
|
||
|
||
### 1. 重点项目进展情况汇总
|
||
|
||
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|
||
|----------|----------|------------|--------------|
|
||
| 会议纪要Skill架构优化 | 闫旭隆、郝倩玉 | 2025-12-02 | 已完成整体架构改进:从索引搜索改为全量读取方式;完成字段来源映射逻辑图设计;修改负责人字段为"原负责人",截止时间改为"原截止时间"。存在问题:1)文字语义识别仍是最大问题;2)存在信息遗漏(日报驱动系统未提取);3)逻辑判断存在矛盾。**解决方案:** 1)转写工具换成Gemini多模态;2)生成Clean后的全量文字稿作为输入;3)全量主上下文窗口处理;4)将Subagent逻辑整合成单一Skill文件 |
|
||
| 需求澄清Skill测试与推广 | 闫旭隆、郝倩玉 | 2025-12-02 | 正在进行多专家博弈评审机制验证,已生成专家评审JSON文件。存在问题:1)多专家博弈的prompt可能没写好;2)需验证评审水平是否达标。**解决方案:** 1)把专家评估意见整合成可视化文档(一问一答形式);2)各领域专家Prompt需专人编写;3)尝试用AI模拟专家回答访谈问题 |
|
||
| 数字人PPT需求文档 | 江争达 | 2025-12-02 | 已完成需求文档删减和优化,保留有用需求,删除默认功能;分阶段规划保持不变;已整合数字人平台选型调研结果。存在问题:1)第二阶段功能规划缺失;2)时长需求定义不准确(当前3-5分钟,实际应为20-30分钟);3)数字人缺少手势动作;4)老外说流利中文的真实性问题。**解决方案:** 1)补充第二阶段说明;2)时长调整为20-30分钟;3)加入手势要求;4)用真实人容貌训练 |
|
||
| 数字分身需求文档 | 郝倩玉 | 2025-12-02 | 未在会议中讨论,需求方尚未明确反馈 |
|
||
| 问答系统V1.1前端重构方案 | 江争达、陶西平 | 2025-12-02 | 正在规划前端展示部分和代码结构重构,保留现有基础功能。存在问题:1)需考虑下一版本交互逻辑更改;2)后端代码质量未知。**解决方案:** 1)重构时考虑下一版本功能需求;2)用Opus 4.5或Codex对后端做Code Review;3)后端先不动,审查后再规划 |
|
||
| 问答系统V1.0测试推动 | 江争达、郝倩玉 | 2025-12-02 | 未在会议中详细讨论,多次与媛媛沟通,相关领导参与测试时间尚未确定 |
|
||
| 招投标文件Skill架构设计 | 郝倩玉、闫旭隆、江争达 | 2025-12-02 | 从P1提升到P0,比较紧急。投标商务响应文件自动生成系统需求文档已完成 |
|
||
| Gartner报告解读转写系统需求文档 | 郝倩玉 | 2025-12-02 | 已完成,已发闫旭隆 |
|
||
|
||
### 2. 重点项目问题及解决方案
|
||
|
||
#### 问题1: 会议纪要Skill信息提取准确性问题
|
||
|
||
**问题描述:**
|
||
会议纪要Skill在信息提取时存在以下问题:
|
||
- 文字转写的准确性不够,语义识别困难
|
||
- 缺乏上下文约束能力,无法理解会议背景信息
|
||
- 分块搜索导致信息遗漏,如日报驱动系统未被提取
|
||
- 逻辑判断存在矛盾,如周报显示完成但会议中反映未完成
|
||
- P0/P1/P2优先级判断不准确
|
||
|
||
**解决方案:**
|
||
1. 将文字转写工具从腾讯会议换成Gemini多模态转写,利用其视觉识别能力提高准确性
|
||
2. 对转写文本进行Clean预处理,去除脏数据和重复内容,保证信息紧凑
|
||
3. 采用全量主上下文窗口处理,将Clean后的转写文本直接加载给主窗口
|
||
4. 将子Agent提取的结果作为增强Prompt传给主上下文,减少信息损失
|
||
5. 尝试用Agent调Agent的架构替代Skill调Agent,使组织逻辑更清晰
|
||
|
||
**责任人:** 闫旭隆
|
||
**截止时间:** 2025-12-09
|
||
|
||
#### 问题2: Sub-agent调用不稳定问题
|
||
|
||
**问题描述:**
|
||
Sub-agent在项目下使用相对路径调用时几乎无法成功执行:
|
||
- 全局下调用Sub-agent能正常执行
|
||
- 项目下使用相对路径调用时,会读取Sub-agent的prompt但不执行
|
||
- 项目下使用绝对路径调用时才能稳定成功
|
||
|
||
**解决方案:**
|
||
1. Sub-agent调用时必须使用绝对路径
|
||
2. 采用Agent调Agent的架构,而非Skill调Agent
|
||
3. 定义主Agent后直接选定激活,其他Agent自动成为Sub-agent
|
||
4. 调试阶段可用Skill,调通后将Skill.md移植到Agent中
|
||
5. 非必要情况下用Agent组织Agent,不用Skill组织Agent
|
||
|
||
**责任人:** 闫旭隆
|
||
**截止时间:** 2025-12-09
|
||
|
||
#### 问题3: 数字人PPT需求文档产出问题
|
||
|
||
**问题描述:**
|
||
数字人PPT需求文档存在以下问题:
|
||
- 时长需求不准确,只写了3-5分钟,但实际PPT宣讲需要20-30分钟
|
||
- 第二阶段功能需求未写入文档
|
||
- 数字人动作要求不完整,缺少手势动作要求
|
||
- 真实性考虑不足,老外说流利中文会让人质疑真假(本末倒置)
|
||
|
||
**解决方案:**
|
||
1. 时长需求扩展到支持20-30分钟的PPT宣讲
|
||
2. 将第一阶段和第二阶段功能需求都完整写入文档
|
||
3. 增加数字人手势动作要求,避免前十秒后十秒呆板无动作
|
||
4. 数字人形象选型需考虑真实性,使用真人录制训练的语音和形象
|
||
5. 视频结尾增加数字人独立告别画面,有始有终
|
||
|
||
**责任人:** 江争达、陶西平
|
||
**截止时间:** 2025-12-09
|
||
|
||
#### 问题4: 前端重构方案考虑不全面
|
||
|
||
**问题描述:**
|
||
问答系统v1.1前端重构需要考虑更多因素:
|
||
- 只重构前端展示和代码结构可能不够
|
||
- 需要考虑下一版本的交互逻辑变更
|
||
- 后端代码质量未经审查
|
||
|
||
**解决方案:**
|
||
1. 重构时需考虑下一版本可能的功能需求和交互逻辑变更
|
||
2. 用Opus 4.5或Codex对后端代码进行一次Code Review审查
|
||
3. 将审查发现的问题记录下来作为后续重构的需求文档
|
||
4. 后端暂不动,先审查再规划
|
||
|
||
**责任人:** 江争达、陶西平
|
||
**截止时间:** 2025-12-09
|
||
|
||
#### 问题5: 需求Skill多专家评审效果不明确
|
||
|
||
**问题描述:**
|
||
需求Skill的多专家博弈评审机制效果无法确认:
|
||
- 只看到专家提问,看不到响应
|
||
- 无法判断专家评估水平是否足够
|
||
- 各领域专家的prompt可能没写好
|
||
|
||
**解决方案:**
|
||
1. 将专家评估意见和最后响应整合成可视化的一问一答文档
|
||
2. 评估专家提问和响应的水平是否匹配,判断是否有必要保留该环节
|
||
3. 各领域专家由专人负责编写专业的prompt
|
||
4. 第一版需求文档生成时可尝试用AI模拟专家回答访谈问题
|
||
|
||
**责任人:** 闫旭隆
|
||
**截止时间:** 2025-12-09
|
||
|
||
#### 问题6: AI优先级判断依赖人工介入
|
||
|
||
**问题描述:**
|
||
AI对P0/P1/P2任务优先级的判断非常困难,因为缺乏潜在上下文:
|
||
- 不知道团队成员的年龄、级别、工作时间长短
|
||
- 无法理解不同人员分配任务的差异
|
||
- 这些潜在上下文很难完全显性化给AI
|
||
|
||
**解决方案:**
|
||
1. 在会议上实时确认P0/P1/P2任务优先级
|
||
2. 让AI先给出建议排序,人再确认反馈
|
||
3. 将确认过程的材料保留,用于后续强化学习或微调
|
||
4. 尝试将潜在上下文逐步显性化
|
||
|
||
**责任人:** 连云波、闫旭隆
|
||
**截止时间:** 2025-12-09
|
||
|
||
### 3. 下周工作安排
|
||
|
||
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|
||
|----------|--------|--------------|--------|----------|
|
||
| 🔴 会议纪要Skill优化-全量主窗口处理 | 闫旭隆 | 先用现有版本生成会议纪要,然后在主窗口加载会议转写上下文做全量处理;将Subagent逻辑整合成单一Skill文件 | P0 | 2025-12-09 |
|
||
| 🔴 会议转写文本双版本对比 | 闫旭隆 | 分别用腾讯会议版本和Gemini视频转写版本生成转写文本,进行对比分析 | P0 | 2025-12-09 |
|
||
| 🔴 Gemini转写文本测试 | 闫旭隆 | 用Gemini转写文本套到现有Skill生成会议纪要 + 直接用Gemini喂视频一步生成会议纪要 | P0 | 2025-12-09 |
|
||
| 🔴 需求Skill专家交叉回应可视化 | 闫旭隆 | 整理二阶段专家交叉回应模块的可视化效果,把评估意见和响应整合成一问一答文档 | P0 | 2025-12-09 |
|
||
| 🔴 需求Skill流程图优化 | 闫旭隆 | 走一遍需求Skill流程图,查看未来流程需要怎么修改完善 | P0 | 2025-12-09 |
|
||
| 🔴 招投标Skill架构设计 | 闫旭隆、郝倩玉 | 从P1提升到P0,完成招投标Skill的架构设计 | P0 | 2025-12-09 |
|
||
| 🔴 数字人PPT样本生成 | 江争达、陶西平 | 用自己真实人容貌训练出来的语音和视频,生成PPT讲解样本 | P0 | 2025-12-09 |
|
||
| 🔴 数字人工作流研究 | 江争达、陶西平 | 研究数字人生成工作流,包括API调用、网站操作或剪映自动化工具等 | P0 | 2025-12-09 |
|
||
| 🔴 Gemini分镜头视频生成测试 | 江争达、陶西平 | 通过Gemini 3.0生成分镜头脚本和图片,再找平台试生成视频效果 | P0 | 2025-12-09 |
|
||
| 🔴 前端重构-后端代码审查 | 江争达 | 用Codex或Opus 4.5对现有后端代码做Code Review,记录问题作为重构需求 | P0 | 2025-12-09 |
|
||
| 🔴 前端重构方案优化 | 江争达、陶西平 | 用大模型重新生成前端重构方案,对比现有方案差异;考虑下个版本交互逻辑 | P0 | 2025-12-09 |
|
||
| 数字分身需求对接 | 郝倩玉 | 持续跟进需求方反馈,推动需求明确 | P1 | 2025-12-09 |
|
||
| 问答系统V1.0测试推动 | 郝倩玉 | 继续与张媛媛沟通,推动相关领导参与测试 | P1 | 2025-12-09 |
|
||
| 运营商信息精准爬取系统需求跟进 | 郝倩玉 | 持续跟进需求方反馈 | P1 | 2025-12-09 |
|
||
| 天眼查自动更新需求确认 | 闫旭隆 | 确认小童是否还需要天眼查客户数据库自动更新功能 | P1 | 2025-12-09 |
|
||
| 日报驱动项目管理系统开发 | 丁康 | 学习Asana架构和模块,设计日报驱动项目管理系统 | P1 | 待定 |
|
||
| Skill到LangChain架构迁移研究 | 待定 | 研究如何将Claude Code Skill转移到LangChain/LangGraph架构 | P2 | 待定 |
|
||
|
||
### 4. 组内成员工作进展
|
||
|
||
#### 闫旭隆
|
||
|
||
**上周完成:**
|
||
- ✅ 需求澄清-需求文档skill优化-增加多轮博弈机制
|
||
- ✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文
|
||
- ✅ 录制演示视频
|
||
|
||
**进行中:**
|
||
- 🔄 会议纪要Skill架构优化(全量主窗口处理)
|
||
- 🔄 需求Skill专家博弈机制验证
|
||
|
||
**收到的反馈/学习建议:**
|
||
- **表扬:** 会议纪要Skill的逻辑映射图做得很重要,有助于保持逻辑一致性和前后连贯性
|
||
- **表扬:** 生成的会议纪要比手动版本更具体详细,主要要点都有提取出来
|
||
- **批评:** 日报驱动系统没有总结出来,逻辑不全,存在信息遗漏问题
|
||
- **建议:** 整个文字转写换成Gemini,因为Gemini多模态能力最强
|
||
- **建议:** 把转写文本Clean一次,去除脏的、重复的内容,直接加载给主上下文
|
||
- **建议:** 尝试用全量主上下文窗口处理,把Skill全部写到主Agent里
|
||
- **建议:** P0/P1/P2优先级判断让AI先给建议,人再确认反馈
|
||
- **建议:** 调试时可以用Skill调用Sub-agent方式,流程调通后把Skill.md移植到Agent中
|
||
|
||
**下周任务:**
|
||
- [ ] 🔴 P0|会议纪要Skill优化-全量主窗口处理
|
||
- [ ] 🔴 P0|会议转写文本双版本对比
|
||
- [ ] 🔴 P0|Gemini转写文本测试
|
||
- [ ] 🔴 P0|需求Skill专家交叉回应可视化
|
||
- [ ] 🔴 P0|需求Skill流程图优化
|
||
- [ ] 🔴 P0|招投标Skill架构设计
|
||
- [ ] P1|天眼查自动更新需求确认
|
||
|
||
#### 江争达
|
||
|
||
**上周完成:**
|
||
- ✅ 数字人PPT需求文档
|
||
|
||
**进行中:**
|
||
- 🔄 问答系统v1.1前端重构方案
|
||
- 🔄 PDF Skill技术调研
|
||
- 🔄 Skill Plugin管理系统搭建
|
||
- 🔄 服务器采购
|
||
- 🔄 招投标文件Skill架构调试
|
||
|
||
**收到的反馈/学习建议:**
|
||
- **批评:** 数字人选型存在"只看树木不看森林"的问题——老外生成流利中文会让人质疑真实性,追求真实却选择最假的表现是本末倒置
|
||
- **建议:** 数字人PPT需求文档中分阶段规划部分,第二阶段内容缺失,建议都写上完整
|
||
- **建议:** 视频时长需求提得不够准确,应该考虑20-30分钟的PPT宣讲场景
|
||
- **建议:** 数字人标准中要把手势动作加进去,前十秒后十秒不能呆板无动作
|
||
- **建议:** 视频结尾可以增加数字人独立的告别画面,有始有终
|
||
- **建议:** 前端重构时要考虑下一版本的交互逻辑更改
|
||
- **建议:** 后端先不动,用Opus 4.5或Codex对后端代码做一次审查
|
||
- **建议:** 通过Gemini 3.0生成分镜头脚本,利用其视觉理解能力生成图片
|
||
|
||
**下周任务:**
|
||
- [ ] 🔴 P0|数字人PPT样本生成(真人训练)
|
||
- [ ] 🔴 P0|数字人工作流研究
|
||
- [ ] 🔴 P0|Gemini分镜头视频生成测试
|
||
- [ ] 🔴 P0|前端重构-后端代码审查
|
||
- [ ] 🔴 P0|前端重构方案优化
|
||
- [ ] P1|问答系统V1.0测试推动
|
||
- [ ] P1|PDF Skill技术调研
|
||
- [ ] P1|服务器采购
|
||
|
||
#### 郝倩玉
|
||
|
||
**上周完成:**
|
||
- ✅ 会议纪要Skill架构优化(协助旭隆优化学习类+Q&A类会议纪要Skill逻辑)
|
||
- ✅ Gartner报告解读转写系统需求文档(已发闫旭隆)
|
||
- ✅ 问答系统V1.0测试推动沟通
|
||
|
||
**进行中:**
|
||
- 🔄 数字分身需求对接(需求方尚未明确)
|
||
- 🔄 招投标文件Skill架构设计
|
||
- 🔄 运营商信息精准爬取系统需求跟进
|
||
|
||
**收到的反馈/学习建议:**
|
||
- 无(本次会议未针对郝倩玉工作进行专门讨论)
|
||
|
||
**下周任务:**
|
||
- [ ] 🔴 P0|招投标Skill架构设计(配合闫旭隆)
|
||
- [ ] P1|数字分身需求对接
|
||
- [ ] P1|推动问答系统V1.0测试
|
||
- [ ] P1|运营商信息精准爬取系统需求跟进
|
||
|
||
#### 陶西平
|
||
|
||
**上周完成:**
|
||
- ✅ 数字人PPT需求文档(协助江老师修改)
|
||
- ✅ 学习使用claudecode的document skill
|
||
- ✅ 调研数字人平台公共数字人能力
|
||
- ✅ 根据指定PPT生成数字人结合视频
|
||
|
||
**进行中:**
|
||
- 🔄 数字人与PPT结合优化
|
||
- 🔄 前端框架重构
|
||
|
||
**收到的反馈/学习建议:**
|
||
- **建议:** 需求文档分阶段规划中,第一阶段和第二阶段功能都应该写清楚
|
||
- **建议:** 数字人视频时长需求应该考虑20-30分钟的PPT宣讲场景
|
||
- **建议:** 数字人需要添加手势动作,前十秒呆站着讲是有问题的
|
||
- **批评:** 老外数字人说流利中文的问题是"只看树木不看森林",会让人质疑真实性
|
||
- **建议:** 视频结尾可以加数字人独立的告别画面,有始有终
|
||
- **建议:** 尝试用Gemini VEO 3.1测试视频生成效果
|
||
- **建议:** 可以通过Gemini 3生成分镜头脚本,分段生成图片再合成视频
|
||
- **建议:** 前端重构时要考虑下一版本的交互逻辑更改
|
||
- **建议:** 后端先不动,用Opus 4.5或Codex对后端代码做审查
|
||
|
||
**下周任务:**
|
||
- [ ] 🔴 P0|配合江老师数字人PPT样本生成
|
||
- [ ] 🔴 P0|数字人工作流研究
|
||
- [ ] 🔴 P0|Gemini分镜头视频生成测试
|
||
- [ ] 🔴 P0|前端重构方案优化
|
||
- [ ] P1|完成问答系统前端重构需求文档
|
||
|
||
---
|
||
|
||
## 三、会议总结
|
||
|
||
**核心议题:** 会议纪要Skill架构优化、数字人PPT需求完善、前端重构方案、AI工具选型
|
||
|
||
**关键决策:**
|
||
|
||
1. **AI工具选型方案确定:** 前端用Gemini处理多模态任务,中间逻辑用Claude Code,测试和问题修复用GPT Codex
|
||
2. **会议纪要Skill转写工具改用Gemini多模态:** 纯语音识别效率低,Gemini能识别画面内容且错误率低
|
||
3. **会议转写文本必须先Clean处理:** 去除脏数据和重复内容,保证信息紧凑后再输入
|
||
4. **尝试全量主上下文窗口处理:** 子Agent方式会导致信息丢失和逻辑割裂,全量处理信息损失最小
|
||
5. **P0/P1/P2优先级判断需人工确认:** AI缺少隐性上下文,优先级判断需人工在会上辅助
|
||
6. **Agent调Agent优于Skill调Agent:** 定义主Agent后其他都是Sub-agent,组织逻辑更清晰
|
||
7. **Sub-agent调用必须使用绝对路径:** 相对路径调用不稳定
|
||
8. **Skill嵌套Skill比Sub-agent更清晰可控:** 虽然上下文长,但逻辑控制精确
|
||
9. **数字人视频时长需求扩展到20-30分钟:** 这是PPT宣讲的主要需求
|
||
10. **数字人必须包含手势动作:** 前十秒不能呆站,真实性要求
|
||
11. **数字人平台选型优先百度希壤和HeyGen:** 价格合理,可定制
|
||
12. **前端重构前先做后端Code Review:** 用Opus 4.5或Codex审查,后端先不动
|
||
13. **前端重构必须考虑下一版本交互逻辑:** 避免架构调整后又要重改
|
||
14. **日报驱动项目管理系统由丁康负责:** 基于会议纪要生成日报,对接Asana
|
||
15. **Skill迁移到LangChain/LangGraph作为P1-P2研究项目:** 当前Skill用多了后需转化到正式Agent框架
|
||
|
||
**下周工作重点:**
|
||
|
||
1. 🔴 会议纪要Skill优化,改用Gemini转写 + 全量主窗口处理
|
||
2. 🔴 需求Skill专家交叉回应可视化整理
|
||
3. 🔴 招投标Skill架构设计(P1提升为P0)
|
||
4. 🔴 数字人PPT样本生成(真人训练)+ 工作流研究
|
||
5. 🔴 前端重构-后端代码审查 + 方案优化
|
||
|
||
---
|
||
|
||
**纪要整理人:** Claude
|
||
**纪要时间:** 2025-12-02
|
||
**下次会议:** 2025-12-09
|