yanxulong/AIEC_Skills

Fork 0

Files

闫旭隆 f4314c3ede 需求文档skill回溯专家博弈之前

2025-12-11 14:19:36 +08:00

17 KiB

Raw Blame History

工程类会议纪要 (2025-12-02)

一、会议信息

会议时间: 2025-12-02
参会人员: 连云波(主持)、闫旭隆、江争达、郝倩玉、陶西平
纪要整理人: Claude

二、工作内容

1. 重点项目进展情况汇总

项目名称	原负责人	原截止时间	项目进展情况
会议纪要Skill架构优化	闫旭隆、郝倩玉	2025-12-02	已完成整体架构改进：从索引搜索改为全量读取方式；完成字段来源映射逻辑图设计；修改负责人字段为"原负责人"，截止时间改为"原截止时间"。存在问题：1）文字语义识别仍是最大问题；2）存在信息遗漏（日报驱动系统未提取）；3）逻辑判断存在矛盾。解决方案： 1）转写工具换成Gemini多模态；2）生成Clean后的全量文字稿作为输入；3）全量主上下文窗口处理；4）将Subagent逻辑整合成单一Skill文件
需求澄清Skill测试与推广	闫旭隆、郝倩玉	2025-12-02	正在进行多专家博弈评审机制验证，已生成专家评审JSON文件。存在问题：1）多专家博弈的prompt可能没写好；2）需验证评审水平是否达标。解决方案： 1）把专家评估意见整合成可视化文档（一问一答形式）；2）各领域专家Prompt需专人编写；3）尝试用AI模拟专家回答访谈问题
数字人PPT需求文档	江争达	2025-12-02	已完成需求文档删减和优化，保留有用需求，删除默认功能；分阶段规划保持不变；已整合数字人平台选型调研结果。存在问题：1）第二阶段功能规划缺失；2）时长需求定义不准确（当前3-5分钟，实际应为20-30分钟）；3）数字人缺少手势动作；4）老外说流利中文的真实性问题。解决方案： 1）补充第二阶段说明；2）时长调整为20-30分钟；3）加入手势要求；4）用真实人容貌训练
数字分身需求文档	郝倩玉	2025-12-02	未在会议中讨论，需求方尚未明确反馈
问答系统V1.1前端重构方案	江争达、陶西平	2025-12-02	正在规划前端展示部分和代码结构重构，保留现有基础功能。存在问题：1）需考虑下一版本交互逻辑更改；2）后端代码质量未知。解决方案： 1）重构时考虑下一版本功能需求；2）用Opus 4.5或Codex对后端做Code Review；3）后端先不动，审查后再规划
问答系统V1.0测试推动	江争达、郝倩玉	2025-12-02	未在会议中详细讨论，多次与媛媛沟通，相关领导参与测试时间尚未确定
招投标文件Skill架构设计	郝倩玉、闫旭隆、江争达	2025-12-02	从P1提升到P0，比较紧急。投标商务响应文件自动生成系统需求文档已完成
Gartner报告解读转写系统需求文档	郝倩玉	2025-12-02	已完成，已发闫旭隆

2. 重点项目问题及解决方案

问题1: 会议纪要Skill信息提取准确性问题

问题描述: 会议纪要Skill在信息提取时存在以下问题：

文字转写的准确性不够，语义识别困难
缺乏上下文约束能力，无法理解会议背景信息
分块搜索导致信息遗漏，如日报驱动系统未被提取
逻辑判断存在矛盾，如周报显示完成但会议中反映未完成
P0/P1/P2优先级判断不准确

解决方案:

将文字转写工具从腾讯会议换成Gemini多模态转写，利用其视觉识别能力提高准确性
对转写文本进行Clean预处理，去除脏数据和重复内容，保证信息紧凑
采用全量主上下文窗口处理，将Clean后的转写文本直接加载给主窗口
将子Agent提取的结果作为增强Prompt传给主上下文，减少信息损失
尝试用Agent调Agent的架构替代Skill调Agent，使组织逻辑更清晰

责任人: 闫旭隆 截止时间: 2025-12-09

问题2: Sub-agent调用不稳定问题

问题描述: Sub-agent在项目下使用相对路径调用时几乎无法成功执行：

全局下调用Sub-agent能正常执行
项目下使用相对路径调用时，会读取Sub-agent的prompt但不执行
项目下使用绝对路径调用时才能稳定成功

解决方案:

Sub-agent调用时必须使用绝对路径
采用Agent调Agent的架构，而非Skill调Agent
定义主Agent后直接选定激活，其他Agent自动成为Sub-agent
调试阶段可用Skill，调通后将Skill.md移植到Agent中
非必要情况下用Agent组织Agent，不用Skill组织Agent

责任人: 闫旭隆 截止时间: 2025-12-09

问题3: 数字人PPT需求文档产出问题

问题描述: 数字人PPT需求文档存在以下问题：

时长需求不准确，只写了3-5分钟，但实际PPT宣讲需要20-30分钟
第二阶段功能需求未写入文档
数字人动作要求不完整，缺少手势动作要求
真实性考虑不足，老外说流利中文会让人质疑真假（本末倒置）

解决方案:

时长需求扩展到支持20-30分钟的PPT宣讲
将第一阶段和第二阶段功能需求都完整写入文档
增加数字人手势动作要求，避免前十秒后十秒呆板无动作
数字人形象选型需考虑真实性，使用真人录制训练的语音和形象
视频结尾增加数字人独立告别画面，有始有终

责任人: 江争达、陶西平 截止时间: 2025-12-09

问题4: 前端重构方案考虑不全面

问题描述: 问答系统v1.1前端重构需要考虑更多因素：

只重构前端展示和代码结构可能不够
需要考虑下一版本的交互逻辑变更
后端代码质量未经审查

解决方案:

重构时需考虑下一版本可能的功能需求和交互逻辑变更
用Opus 4.5或Codex对后端代码进行一次Code Review审查
将审查发现的问题记录下来作为后续重构的需求文档
后端暂不动，先审查再规划

责任人: 江争达、陶西平 截止时间: 2025-12-09

问题5: 需求Skill多专家评审效果不明确

问题描述: 需求Skill的多专家博弈评审机制效果无法确认：

只看到专家提问，看不到响应
无法判断专家评估水平是否足够
各领域专家的prompt可能没写好

解决方案:

将专家评估意见和最后响应整合成可视化的一问一答文档
评估专家提问和响应的水平是否匹配，判断是否有必要保留该环节
各领域专家由专人负责编写专业的prompt
第一版需求文档生成时可尝试用AI模拟专家回答访谈问题

责任人: 闫旭隆 截止时间: 2025-12-09

问题6: AI优先级判断依赖人工介入

问题描述: AI对P0/P1/P2任务优先级的判断非常困难，因为缺乏潜在上下文：

不知道团队成员的年龄、级别、工作时间长短
无法理解不同人员分配任务的差异
这些潜在上下文很难完全显性化给AI

解决方案:

在会议上实时确认P0/P1/P2任务优先级
让AI先给出建议排序，人再确认反馈
将确认过程的材料保留，用于后续强化学习或微调
尝试将潜在上下文逐步显性化

责任人: 连云波、闫旭隆 截止时间: 2025-12-09

3. 下周工作安排

项目名称	负责人	下周会前目标	优先级	截止时间
🔴 会议纪要Skill优化-全量主窗口处理	闫旭隆	先用现有版本生成会议纪要，然后在主窗口加载会议转写上下文做全量处理；将Subagent逻辑整合成单一Skill文件	P0	2025-12-09
🔴 会议转写文本双版本对比	闫旭隆	分别用腾讯会议版本和Gemini视频转写版本生成转写文本，进行对比分析	P0	2025-12-09
🔴 Gemini转写文本测试	闫旭隆	用Gemini转写文本套到现有Skill生成会议纪要 + 直接用Gemini喂视频一步生成会议纪要	P0	2025-12-09
🔴 需求Skill专家交叉回应可视化	闫旭隆	整理二阶段专家交叉回应模块的可视化效果，把评估意见和响应整合成一问一答文档	P0	2025-12-09
🔴 需求Skill流程图优化	闫旭隆	走一遍需求Skill流程图，查看未来流程需要怎么修改完善	P0	2025-12-09
🔴 招投标Skill架构设计	闫旭隆、郝倩玉	从P1提升到P0，完成招投标Skill的架构设计	P0	2025-12-09
🔴 数字人PPT样本生成	江争达、陶西平	用自己真实人容貌训练出来的语音和视频，生成PPT讲解样本	P0	2025-12-09
🔴 数字人工作流研究	江争达、陶西平	研究数字人生成工作流，包括API调用、网站操作或剪映自动化工具等	P0	2025-12-09
🔴 Gemini分镜头视频生成测试	江争达、陶西平	通过Gemini 3.0生成分镜头脚本和图片，再找平台试生成视频效果	P0	2025-12-09
🔴 前端重构-后端代码审查	江争达	用Codex或Opus 4.5对现有后端代码做Code Review，记录问题作为重构需求	P0	2025-12-09
🔴 前端重构方案优化	江争达、陶西平	用大模型重新生成前端重构方案，对比现有方案差异；考虑下个版本交互逻辑	P0	2025-12-09
数字分身需求对接	郝倩玉	持续跟进需求方反馈，推动需求明确	P1	2025-12-09
问答系统V1.0测试推动	郝倩玉	继续与张媛媛沟通，推动相关领导参与测试	P1	2025-12-09
运营商信息精准爬取系统需求跟进	郝倩玉	持续跟进需求方反馈	P1	2025-12-09
天眼查自动更新需求确认	闫旭隆	确认小童是否还需要天眼查客户数据库自动更新功能	P1	2025-12-09
日报驱动项目管理系统开发	丁康	学习Asana架构和模块，设计日报驱动项目管理系统	P1	待定
Skill到LangChain架构迁移研究	待定	研究如何将Claude Code Skill转移到LangChain/LangGraph架构	P2	待定

4. 组内成员工作进展

闫旭隆

上周完成:

✅ 需求澄清-需求文档skill优化-增加多轮博弈机制
✅ 会议纪要Skill优化-变为Read全量读取文字转写上下文
✅ 录制演示视频

进行中:

🔄 会议纪要Skill架构优化（全量主窗口处理）
🔄 需求Skill专家博弈机制验证

收到的反馈/学习建议:

表扬: 会议纪要Skill的逻辑映射图做得很重要，有助于保持逻辑一致性和前后连贯性
表扬: 生成的会议纪要比手动版本更具体详细，主要要点都有提取出来
批评: 日报驱动系统没有总结出来，逻辑不全，存在信息遗漏问题
建议: 整个文字转写换成Gemini，因为Gemini多模态能力最强
建议: 把转写文本Clean一次，去除脏的、重复的内容，直接加载给主上下文
建议: 尝试用全量主上下文窗口处理，把Skill全部写到主Agent里
建议: P0/P1/P2优先级判断让AI先给建议，人再确认反馈
建议: 调试时可以用Skill调用Sub-agent方式，流程调通后把Skill.md移植到Agent中

下周任务:

🔴 P0｜会议纪要Skill优化-全量主窗口处理
🔴 P0｜会议转写文本双版本对比
🔴 P0｜Gemini转写文本测试
🔴 P0｜需求Skill专家交叉回应可视化
🔴 P0｜需求Skill流程图优化
🔴 P0｜招投标Skill架构设计
P1｜天眼查自动更新需求确认

江争达

上周完成:

✅ 数字人PPT需求文档

进行中:

🔄 问答系统v1.1前端重构方案
🔄 PDF Skill技术调研
🔄 Skill Plugin管理系统搭建
🔄 服务器采购
🔄 招投标文件Skill架构调试

收到的反馈/学习建议:

批评: 数字人选型存在"只看树木不看森林"的问题——老外生成流利中文会让人质疑真实性，追求真实却选择最假的表现是本末倒置
建议: 数字人PPT需求文档中分阶段规划部分，第二阶段内容缺失，建议都写上完整
建议: 视频时长需求提得不够准确，应该考虑20-30分钟的PPT宣讲场景
建议: 数字人标准中要把手势动作加进去，前十秒后十秒不能呆板无动作
建议: 视频结尾可以增加数字人独立的告别画面，有始有终
建议: 前端重构时要考虑下一版本的交互逻辑更改
建议: 后端先不动，用Opus 4.5或Codex对后端代码做一次审查
建议: 通过Gemini 3.0生成分镜头脚本，利用其视觉理解能力生成图片

下周任务:

🔴 P0｜数字人PPT样本生成（真人训练）
🔴 P0｜数字人工作流研究
🔴 P0｜Gemini分镜头视频生成测试
🔴 P0｜前端重构-后端代码审查
🔴 P0｜前端重构方案优化
P1｜问答系统V1.0测试推动
P1｜PDF Skill技术调研
P1｜服务器采购

郝倩玉

上周完成:

✅ 会议纪要Skill架构优化（协助旭隆优化学习类+Q&A类会议纪要Skill逻辑）
✅ Gartner报告解读转写系统需求文档（已发闫旭隆）
✅ 问答系统V1.0测试推动沟通

进行中:

🔄 数字分身需求对接（需求方尚未明确）
🔄 招投标文件Skill架构设计
🔄 运营商信息精准爬取系统需求跟进

收到的反馈/学习建议:

无（本次会议未针对郝倩玉工作进行专门讨论）

下周任务:

🔴 P0｜招投标Skill架构设计（配合闫旭隆）
P1｜数字分身需求对接
P1｜推动问答系统V1.0测试
P1｜运营商信息精准爬取系统需求跟进

陶西平

上周完成:

✅ 数字人PPT需求文档（协助江老师修改）
✅ 学习使用claudecode的document skill
✅ 调研数字人平台公共数字人能力
✅ 根据指定PPT生成数字人结合视频

进行中:

🔄 数字人与PPT结合优化
🔄 前端框架重构

收到的反馈/学习建议:

建议: 需求文档分阶段规划中，第一阶段和第二阶段功能都应该写清楚
建议: 数字人视频时长需求应该考虑20-30分钟的PPT宣讲场景
建议: 数字人需要添加手势动作，前十秒呆站着讲是有问题的
批评: 老外数字人说流利中文的问题是"只看树木不看森林"，会让人质疑真实性
建议: 视频结尾可以加数字人独立的告别画面，有始有终
建议: 尝试用Gemini VEO 3.1测试视频生成效果
建议: 可以通过Gemini 3生成分镜头脚本，分段生成图片再合成视频
建议: 前端重构时要考虑下一版本的交互逻辑更改
建议: 后端先不动，用Opus 4.5或Codex对后端代码做审查

下周任务:

🔴 P0｜配合江老师数字人PPT样本生成
🔴 P0｜数字人工作流研究
🔴 P0｜Gemini分镜头视频生成测试
🔴 P0｜前端重构方案优化
P1｜完成问答系统前端重构需求文档

三、会议总结

核心议题: 会议纪要Skill架构优化、数字人PPT需求完善、前端重构方案、AI工具选型

关键决策:

AI工具选型方案确定: 前端用Gemini处理多模态任务，中间逻辑用Claude Code，测试和问题修复用GPT Codex
会议纪要Skill转写工具改用Gemini多模态: 纯语音识别效率低，Gemini能识别画面内容且错误率低
会议转写文本必须先Clean处理: 去除脏数据和重复内容，保证信息紧凑后再输入
尝试全量主上下文窗口处理: 子Agent方式会导致信息丢失和逻辑割裂，全量处理信息损失最小
P0/P1/P2优先级判断需人工确认: AI缺少隐性上下文，优先级判断需人工在会上辅助
Agent调Agent优于Skill调Agent: 定义主Agent后其他都是Sub-agent，组织逻辑更清晰
Sub-agent调用必须使用绝对路径: 相对路径调用不稳定
Skill嵌套Skill比Sub-agent更清晰可控: 虽然上下文长，但逻辑控制精确
数字人视频时长需求扩展到20-30分钟: 这是PPT宣讲的主要需求
数字人必须包含手势动作: 前十秒不能呆站，真实性要求
数字人平台选型优先百度希壤和HeyGen: 价格合理，可定制
前端重构前先做后端Code Review: 用Opus 4.5或Codex审查，后端先不动
前端重构必须考虑下一版本交互逻辑: 避免架构调整后又要重改
日报驱动项目管理系统由丁康负责: 基于会议纪要生成日报，对接Asana
Skill迁移到LangChain/LangGraph作为P1-P2研究项目: 当前Skill用多了后需转化到正式Agent框架

下周工作重点:

🔴 会议纪要Skill优化，改用Gemini转写 + 全量主窗口处理
🔴 需求Skill专家交叉回应可视化整理
🔴 招投标Skill架构设计（P1提升为P0）
🔴 数字人PPT样本生成（真人训练）+ 工作流研究
🔴 前端重构-后端代码审查 + 方案优化

纪要整理人: Claude 纪要时间: 2025-12-02 下次会议: 2025-12-09

17 KiB Raw Blame History Unescape Escape

工程类会议纪要 (2025-12-02)

一、会议信息

二、工作内容

1. 重点项目进展情况汇总

2. 重点项目问题及解决方案

问题1: 会议纪要Skill信息提取准确性问题

问题2: Sub-agent调用不稳定问题

问题3: 数字人PPT需求文档产出问题

问题4: 前端重构方案考虑不全面

问题5: 需求Skill多专家评审效果不明确

问题6: AI优先级判断依赖人工介入

3. 下周工作安排

4. 组内成员工作进展

闫旭隆

江争达

郝倩玉

陶西平

三、会议总结

17 KiB

Raw Blame History