This commit is contained in:
闫旭隆
2026-01-09 11:22:42 +08:00
parent f4314c3ede
commit 202d1cb5ba
1066 changed files with 179639 additions and 7618 deletions

View File

@ -1,199 +0,0 @@
# Q&A资源库类会议纪要 (2025-12-09)
## 一、会议信息
- **会议时间:** 2025-12-09
- **参会人员:** 连云波(主持)、闫旭隆、郝倩玉、陶西平、江争达
- **记录整理:** Claude
---
## 二、工作问题 Q&A
### 1. 项目名称:数字人视频生成相关问题
**问题1数字人视频生成流程存在逻辑不自洽**
- **问题描述:** 当前数字人视频生成流程需要先录制绿幕视频训练数字人模型,再上传图片生成动作参考视频,最后生成口播视频。如果可以通过图片直接生成动作视频,为什么还需要先上传真人视频训练模型?两个视频同时训练一个东西在逻辑上存在矛盾。
- **解决方案:**
1. 测试直接用图片创建数字人专家,不拍摄绿幕视频,对比效果是否一致
2. 使用剪映等外部软件先抠背景再导入黑镜平台
3. 删除现有专家账号重新测试流程,验证是否必须上传真人视频
- **责任人:** 江争达、陶西平
- **截止时间:** 2025-12-16
**问题2数字人视频背景抠不干净**
- **问题描述:** 生成的数字人视频存在背景抠不干净的问题,有浅蓝/浅绿色阴影残留。
- **解决方案:**
1. 不要依赖平台自身的抠图功能
2. 使用剪映等外部软件先进行背景去除
3. 将处理后的视频再导入平台使用
- **责任人:** 江争达、陶西平
- **截止时间:** 2025-12-16
### 2. 项目名称VEO视频生成相关问题
**问题1VEO视频生成工具使用不当导致效果差**
- **问题描述:** 使用VEO Three生成分镜脚本视频时使用中文prompt且首尾帧图片完全相同导致生成的视频人物几乎不动动作指令完全没有执行。VEO Three对英文prompt的遵循效果远好于中文。
- **解决方案:**
1. 必须使用英文promptVEO Three对英文指令遵循效果最好
2. 首尾帧应使用不同的图片(如尾帧是往前走两步后的状态)
3. 多学习网上其他人的使用经验YouTube、Twitter、Reddit
4. 重新用英文prompt制作视频
- **责任人:** 陶西平
- **截止时间:** 2025-12-16
### 3. 项目名称:问答系统前端重构相关问题
**问题1前端重构缺乏明确目标和需求文档**
- **问题描述:** 汇报前端重构工作时PPT直接展示做成什么样缺乏"为什么要重构"(Why)的分析。没有说明前端具体存在哪些问题、想要达成的目标是什么、理想的展示效果是什么样的。"没有需求文档就开发"、"先生成代码再倒回来补文档"是错误做法。
- **解决方案:**
1. 先明确目标,说清楚想要什么样的效果,画出设计草图
2. 整理前端代码存在的具体问题案例
3. 按照"Why-How-What"的逻辑结构重新组织汇报材料
4. 需求文档必须先批准才能开发,不准先开发再补文档
5. 需求可以分阶段开发,但必须有整体的阶段设计
- **责任人:** 江争达
- **截止时间:** 2025-12-16
### 4. 项目名称Gartner报告转写相关问题
**问题1报告转写规则和风格提取困难**
- **问题描述:** 转写后的英文翻译生硬(如"构建者"、"综合者"等不符合信通院用语习惯AI痕迹明显缺乏观点风格规则难以精确提取写多了约束可能偏写少了表现不好。
- **解决方案:**
1. 先提取每段要点总结,再重新生成文章(骨架提取法)
2. 不必完全忠实于原文英文词汇,可以进行意义转写
3. 使用NotebookLM做Deep Research融合相关资料后再写
4. 请信通院专家来审核和调整专业术语
5. 转写后需要有检查优化的流程
- **责任人:** 闫旭隆
- **截止时间:** 2025-12-16
### 5. 项目名称:工具使用能力相关问题
**问题1工具使用能力不足不会学习**
- **问题描述:** 团队成员对AI工具黑镜、VEO、Claude Code等的使用能力不足不会主动学习。同样的工具在不同人手里效果完全不同90分的工具用出50分都不到的效果。遇到问题不去网上搜索学习而是闷头自己试。
- **解决方案:**
1. 多上网学习看YouTube、Twitter、Reddit上别人的使用经验和案例
2. 遇到问题先用Deep Research等工具搜索解决方案
3. 利用多个AI工具GPT、Claude、DeepSeek等交叉验证和获取建议
4. 不要自以为是要AI First从别人那里学习
- **责任人:** 江争达、陶西平
- **截止时间:** 2025-12-16
### 6. 项目名称:汇报表述相关问题
**问题1汇报表述不清晰、逻辑混乱**
- **问题描述:** 多名成员在汇报时存在表述不清、逻辑混乱的问题。解释技术流程时反复说不清楚,无法用简洁明了的语言描述工作内容和技术流程。
- **解决方案:**
1. 汇报前先理清思路,用一句话概括核心流程
2. 练习表达能力,学会用简洁语言描述复杂流程
3. 汇报时按照步骤一二三清晰说明,不要东一下西一下
- **责任人:** 江争达、陶西平
- **截止时间:** 2025-12-16
---
## 三、重点工作方法
### 方法 1需求文档先行原则
- **方法描述:** 在开发之前必须先完成需求文档的撰写和批准。需求文档必须包含三个核心要素Why为什么要做、What要做成什么样、How怎么做。不能先生成代码再倒回来补文档需求不明确时不准开发。需求可以分阶段开发但必须有完整的阶段设计不能走一步看一步。
- **适用场景:** 前端重构、问答系统开发、任何需要开发的项目
- **关键要点:**
- 需求文档必须先批准才能开发
- 包含Why-What-How三要素
- 分阶段开发也要有整体设计
### 方法 2问题驱动的重构方法
- **方法描述:** 重构前必须先明确1现有系统存在哪些具体问题需要案例展示2想要达到的目标是什么理想效果3为什么现有方案达不到目标。不能简单说"代码冗余"就重构,必须有具体的问题分析和目标定义。
- **适用场景:** 代码重构、系统优化、架构调整
- **关键要点:**
- 用案例展示具体问题
- 明确目标和理想效果
- 分析现有方案的不足
### 方法 3AI工具使用的英文优先原则
- **方法描述:** 使用VEO等AI视频生成工具时必须使用英文Prompt才能获得最佳效果。中文Prompt的指令遵循能力很弱可能导致生成的视频完全不符合要求。需要先学习工具的使用规范不能想当然地使用。
- **适用场景:** VEO视频生成、AI图像生成、大模型调用
- **关键要点:**
- 英文Prompt效果远好于中文
- 先学习工具使用规范
- 参考网上优秀案例
### 方法 4外部工具增强法
- **方法描述:** 当平台内置功能效果不好时,不要依赖平台自身功能,应该使用外部专业工具先进行预处理,再将处理后的素材导入平台使用。例如使用剪映先进行视频背景去除,再导入黑镜平台。
- **适用场景:** 数字人视频制作、视频后期处理、图片编辑
- **关键要点:**
- 识别平台功能的不足
- 选择合适的外部工具
- 预处理后再导入使用
### 方法 5AI First学习方法
- **方法描述:** 遇到不会的问题时要主动到网上学习YouTube、Twitter、Reddit等搜索别人的先进经验而不是闭门造车自己摸索。使用AI工具前要先学习官方文档和最佳实践内化为自己的能力。不会学习的时候把学习过程也告诉大家让大家帮助纠正。
- **适用场景:** 新工具学习、问题解决、技能提升
- **关键要点:**
- 主动搜索别人的经验
- 学习官方文档和最佳实践
- 利用AI工具交叉验证
### 方法 6逻辑结构四维度框架
- **方法描述:** 文档和汇报应遵循清晰的逻辑结构包含四个维度1时间维度发展历程2空间维度范围边界3层次维度从粗到细4认知维度是什么-为什么-怎么做。从Why开始不能上来就是How。
- **适用场景:** 需求文档编写、PPT汇报、方案设计
- **关键要点:**
- 时间、空间、层次、认知四维度
- 从Why开始不是从How开始
- 由粗到细逐层展开
### 方法 7首尾帧差异化设计原则
- **方法描述:** 使用VEO等工具生成视频时首帧和尾帧图片不能用同一张。如果两张图片完全一样视频默认就是静止不动的。应该生成一张有动作变化的尾帧图片如往前走两步这样生成的视频才会有动态效果。
- **适用场景:** VEO视频生成、AI视频制作
- **关键要点:**
- 首尾帧必须不同
- 尾帧应体现动作变化
- 避免静止画面输出
### 方法 8报告转写的骨架提取法
- **方法描述:** 转写报告时,可以先提取每一段的要点总结,形成骨架结构,然后再基于骨架重新生成文章。这样可以避免生硬地照着原文翻译,产生更自然的转写效果。原文只保留骨架逻辑和关键数据,表达方式可以完全重写。
- **适用场景:** 报告转写、文档翻译、内容改写
- **关键要点:**
- 先提取要点形成骨架
- 基于骨架重新生成
- 保留逻辑和数据,重写表达
### 方法 9多模态融合工作流设计
- **方法描述:** 未来工作应该把多模态能力文字、图片、视频、语音融合到日常工作中。PPT制作可以用AI直接生成图片中的文字可以直接编辑修改。要思考如何将多模态能力集成到自己的业务流程中形成更高效的输出。
- **适用场景:** PPT制作、视频生成、内容生产
- **关键要点:**
- 多模态能力融合
- 思考业务流程集成方式
- 形成高效的生产工作流
### 方法 10Skill持续进化学习机制
- **方法描述:** Skill应该设计成可以自我学习和进化的。方法是在使用过程中遇到问题后把对话记录发给AI让它帮助总结问题并改进Skill。随着每天的使用Skill会自动进化。这种方式可以让知识持续沉淀在Skill中。
- **适用场景:** Skill开发、知识管理、自动化流程优化
- **关键要点:**
- 设计自我学习机制
- 对话记录用于改进
- 知识持续沉淀进化
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-09
**下次会议:** 2025-12-16

View File

@ -0,0 +1,195 @@
# Q&A资源库类会议纪要 (2026-01-06)
## 一、会议信息
- **会议时间:** 2026-01-06
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉
- **记录整理:** Claude
---
## 二、工作问题 Q&A
### 1. 项目名称:科普视频生成
**问题描述:**
- AI视频提示词生成质量不足无法"一次成型"
- prompt质量不高需反复调整
- 工具选型调研不充分未对比ChatGPT与其他工具
- 错误删除高质量AI生成图片alpha蛋白质折叠图
- 流程未自动化,仍需大量人工介入
**解决方案:**
1. 使用ChatGPT生成文本类prompt文本能力最强Gemini生成图片
2. 全文案一次性给AI处理让AI自动拆分关键帧减少人工干预
3. 不要主观判断AI生成的图片好坏应交给专业人员审查
4. 先做调研再动手让AI推荐各环节最佳工具组合
5. 尽快完成端到端自动化工作流:图片生成→可灵视频生成→代码拼接→音频对齐
6. 使用浏览器自动化操作方案实现批量生成
### 2. 项目名称:服务器部署
**问题描述:**
- 服务器已到货但上来就动手装系统,没有先做规划方案和文档
- 缺乏工程化思维,未考虑文档记录和未来维护需求
**解决方案:**
1. 先做服务器框架规划方案(需求文档),再做实施方案
2. 使用ask you the question工具让AI帮助规划进行40轮问答
3. 参考领导分享的服务器配置相关资料
4. 考虑泛化:单机部署→大型机房规划→运维管理
5. 做好文档工作,为未来自己和他人留下参考
### 3. 项目名称:咨询信息库
**问题描述:**
- 咨询信息库项目核心需求不清晰
- 具体要给所领导什么报告、达成什么目的都未明确
- 目前是"有什么就给什么"的思维,而非从目标出发
**解决方案:**
1. 明确目标:给谁看(所领导/业务部门主任)、看什么、达成什么目的
2. 不要做庞大的全面规划,先做一个最小版本的报告给窦主任看
3. 先做一个点(如技术动态追踪),验证可行性后再扩展
4. 不要纠结于信息源问题,有什么就分析什么
5. 尽快落地一个skill跑通一次流程不要停留在纸面
### 4. 项目名称Vibe Engineering框架
**问题描述:**
- 框架实现细节不完善,有些设计没有真正使用
- 框架选型众多Cloud官方双代理、Super Power、Continuous Claude等需要确定使用哪个
**解决方案:**
1. 优先采用Cloud官方的双代理长时间运行方案简单有效
2. 结合rough rag做迭代验证
3. 由简入繁,不要上来就加太多功能
4. 研究hooks的使用这是流程自动化的重要手段
5. 做虚拟验证先让AI模拟方案可行性再实际执行
---
## 三、重点工作方法
- **方法 1先调研后动手原则**
- 做任何事情之前先做调研不要上来就动手。先调研学习内化成自己的知识结构之后提出新一轮的问题和目标让AI再做一次方案验证方案可行性后再开始操作。
- 适用场景:服务器部署、工具选型、任何新任务开始前
- 关键要点:
- 先做调研完出来之后赶快学习
- 内化成自己的知识结构之后提出新一轮的问题
- 让AI做方案后验证可行性再操作
- 脑子里的东西基本都是过时的,不要按照自己的脑子想到的去做
- **方法 2工程化文档规范**
- 做事情要有章法,先做规划方案(需求)再做实施方案。服务器部署等工程操作必须有文档记录,既为现在所用,又能为未来所用,还能为别人所用。
- 适用场景:服务器部署、系统开发、任何工程类项目
- 关键要点:
- 先做规划方案(需求),再做实施方案
- 一定要有很好的文档工作
- 既为现在所用,又为未来所用,还为别人所用
- 就像README一样每个人上来都能快速理解
- **方法 3Ask You The Question访谈法**
- 使用AI持续提问的方式来完成需求澄清和规划。让AI不断问你问题约40轮你听不懂的问题到网上查查完学习后回答回答完就形成了很好的部署开发文档。
- 适用场景:需求文档生成、服务器规划、缺乏规划能力时
- 关键要点:
- 让AI持续用问题来帮你澄清需求
- 大概能问40轮问题
- 听不懂的问题到网上查,查完学习后回答
- 问答完毕就形成了很好的开发文档
- **方法 4提问必须有完整上下文**
- 提出问题时必须提供完整的背景信息和操作路径。别人不知道你怎么来的,就没办法帮你解决问题。清晰的组织你的思路和问题比直接问问题带来巨大的时间节省。
- 适用场景:团队沟通、问题反馈、求助他人
- 关键要点:
- 提问前先整理好背景信息
- 说明你的操作路径(走了什么路走过来的)
- 让别人听懂比你的问题还重要
- 语言组织不好,别人听到的时间都浪费掉了
- **方法 5泛化思维**
- 做一件事情时一定要想将来它的泛化怎么做,不只做点上的问题解决。把这次做的事情能够推广到更多场景,形成可复用的能力。
- 适用场景:服务器部署、知识图谱、任何技术项目
- 关键要点:
- 不只做点上的问题,要考虑泛化
- 把服务器部署方法泛化到大型机房
- 能力泛化出来才有商业价值
- 花时间解决一个点上的问题是巨大的浪费
- **方法 6双代理长时间运行架构**
- Claude官方的双代理架构一个Starter代理负责初始化和规划一个Builder代理负责逐步推进编码。通过progress.md文件记录完成的工作利用git历史实现增量扩展。
- 适用场景长时间自动化开发、Vibe Engineering框架
- 关键要点:
- 前台对话代理+后台任务代理
- 通过progress.md记录工作进度
- 利用git历史实现增量扩展
- 功能裂变:一次只处理一个功能
- **方法 7账本+Handoff持续工作机制**
- Continuous Cloud框架的核心机制通过账本Ledger记录工作状态和决策通过Handoff在上下文压缩前保存关键信息。
- 适用场景:跨窗口持续性工作、长时间任务
- 关键要点:
- 账本记录工作状态、关键决策、进度
- Handoff在压缩前保存对话记录
- 支持跨会话的工作连续性
- 自动从日志提取关键信息
- **方法 8错误回滚学习法**
- 在Claude Code中当发现错误时先总结错误然后按两下ESC回到上一个prompt操作点把错误信息告诉它不要这么操作。这样大量的错误上下文就去掉了保留有效信息。
- 适用场景Claude Code使用、AI对话纠错
- 关键要点:
- 发现错误后先总结错误原因
- 按两下ESC回到上一个操作点
- 告诉AI不要这么操作
- 保留有效信息,去掉错误上下文
- **方法 9信任AI生成结果原则**
- 在自己不具备专业判断能力的领域要信任AI生成的结果不要凭主观臆断删除或修改。Gemini在专业领域的理解已经超过大部分人。
- 适用场景:视频生成、图片生成、专业领域判断
- 关键要点:
- 不具备专业判断能力时信任AI
- 你看不懂不代表它错了
- 质疑之前先问"这是什么"
- 没有证据不要轻易否定AI结果
- **方法 10端到端自动化优先**
- 开发工作流时,先做一个端到端的自动化流程跑通,不要一开始就追求完美和优化。先把流程走通,再做第二期的修改优化。
- 适用场景:视频生成工作流、任何新流程开发
- 关键要点:
- 先做端到端流程跑通
- 不要一开始追求完美
- 先解决能解决的快速解决的问题
- 质量优化无止境,可以后续迭代
- **方法 11自进化知识图谱架构**
- 设计一个自动化知识图谱系统:通过查询反馈驱动图谱重建,经过多跳找到的路径自动压缩成新边,长期不用的边自动退化,成功多次的边提高权重。
- 适用场景科研知识图谱、Deep Research智能体
- 关键要点:
- 查询反馈驱动图谱自动重建
- 多跳路径自动压缩成直接边
- 长期不用的边自动退化
- 强化学习模拟进化图谱
- **方法 12Hooks流程编排**
- 使用Claude Code的Hooks机制进行流程自动化编排。Hooks有六类情况pre/post tool use等真正的高手都在用Hooks而不是完全用Skill。
- 适用场景Claude Code自动化、流程编排
- 关键要点:
- Hooks有六类触发情况
- Skill是知识Hooks是流程控制
- 高手都在用Hooks做自动化
- 研究每类Hook的使用场景
- **方法 13测试驱动开发(TDD)**
- 在写代码之前先写测试代码。先编写一个失败的测试,然后按照测试来编写代码,确保代码是可测试的。
- 适用场景Vibe Engineering框架、质量控制
- 关键要点:
- 先写失败的测试
- 根据测试来写代码
- 产出可测试的代码
- 质量保证内置于流程中
---
**纪要整理人:** Claude
**纪要时间:** 2026-01-06
**下次会议:** 2026-01-13

View File

@ -1,91 +0,0 @@
# 云大所需求相关进度会议纪要 (2025-12-09)
## 一、会议信息
- **会议时间:** 2025-12-09
- **参会人员:** 连云波(主持)、闫旭隆、郝倩玉、陶西平、江争达
- **记录整理:** Claude
---
## 二、需求项目进展
| 项目名称 | 负责人 | 本周进展 | 存在问题 | 下周计划 | 优先级 |
| -------- | ------ | -------- | -------- | -------- | ------ |
| 投标商务应答自动生成系统 | 郝倩玉、闫旭隆 | 架构设计已完成,企业信息库建设存在困难 | 企业信息库格式混乱Excel、Word、PDF混杂图片库来源分散缺少描述保密信息处理问题响应文件模板不统一 | 周四客户交流后确定最终方案,从最新招投标响应文件提取企业信息作为基础库 | P0 |
| 数字人项目 | 江争达、陶西平、郝倩玉 | 基本可用已完成阶段一样本视频VEO3分镜脚本测试效果不理想 | 黑镜平台背景抠图有浅色阴影残留数字人生成流程存在逻辑不自洽VEO3使用中文prompt效果极差 | 测试直接用图片生成数字人模型VEO3用英文prompt重新测试为领导制作数字人演讲视频郝倩玉参与视频学习 | P0 |
| Gartner报告解读转写系统 | 郝倩玉、闫旭隆 | 架构设计和可行性单元测试已完成 | 翻译生硬不符合信通院风格AI痕迹明显缺乏专家观点输出字数难以控制图片处理尚未完成 | 抓紧测试API额度快到期先提取每段要点总结再重新生成文章使用NotebookLM做deep research后融合生成 | P0 |
| 邮件自动处理转发系统 | 江争达 | 新版本已投入使用(功能优化) | 无 | 持续优化 | P1 |
> **备注:** 市场部需求清单中的其他项目(运营商信息精准爬取系统、客户风险推送自动化系统、证书信息提取系统、云大阁新报告自动推送)本次会议未涉及讨论。
---
## 三、问题与风险
### 1. 投标商务应答自动生成系统
**问题描述:**
- 企业信息库格式混乱Excel、Word、PDF混杂
- 图片库来源分散,缺少描述和映射关系
- 保密信息处理问题部分内容不能给AI读取
- 响应文件模板不统一,每个招标文件要求不同
- 逻辑映射规则复杂,难以移植
**解决方案:**
1. 从最新招投标响应文件提取企业信息作为基础库
2. 使用AI读取历史文件中的图片和位置生成索引后让市场部审核标注
3. 保密内容由市场部先筛选删除后再提供
4. 不够的信息再去原有库补充
5. 周四客户交流后再确定最终方案
**责任人:** 郝倩玉、闫旭隆
**截止时间:** 2025-12-16
### 2. 数字人项目
**问题描述:**
- 数字人视频生成流程存在逻辑不自洽(先录绿幕训练+再用图片生成动作可能冗余)
- 黑镜平台背景抠图效果不理想
- VEO3使用中文prompt效果极差首尾帧相同导致视频无动作
- 工具使用方法需要学习提升
**解决方案:**
1. 测试直接用图片生成数字人模型,验证是否需要先录制绿幕视频
2. 使用剪映等外部软件先抠背景再导入黑镜平台
3. VEO3必须使用英文prompt首尾帧需使用不同图片
4. 多学习网上优秀案例YouTube、Twitter、Reddit
**责任人:** 江争达、陶西平
**截止时间:** 2025-12-16
### 3. Gartner报告解读转写系统
**问题描述:**
- 转写后的英文翻译生硬,不符合信通院用语习惯
- AI痕迹明显缺乏专家观点
- 风格规则难以精确提取
- Gemini API额度快到期还剩一天
**解决方案:**
1. 允许意义转写而非忠实于原词
2. 先提取每段要点总结再重新生成文章(骨架提取法)
3. 使用NotebookLM做Deep Research后融合生成
4. 抓紧时间测试API在额度到期前跑完报告
**责任人:** 闫旭隆
**截止时间:** 2025-12-16
---
## 四、下周重点
1. 🔴 **投标商务应答自动生成系统**:周四客户交流后确定最终方案,从最新招投标响应文件提取企业信息作为基础库
2. 🔴 **数字人项目**测试直接用图片生成数字人模型VEO3用英文prompt重新测试为领导制作数字人演讲视频
3. 🔴 **Gartner报告解读转写系统**抓紧测试API额度快到期使用骨架提取法优化转写效果
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-09
**下次会议:** 2025-12-16

View File

@ -0,0 +1,57 @@
# 云大所需求相关进度会议纪要 (2026-01-06)
## 一、会议信息
- **会议时间:** 2026-01-06
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉
- **记录整理:** Claude
---
## 二、需求项目进展
| 项目名称 | 负责人 | 本周进展 | 存在问题 | 下周计划 | 优先级 |
| -------- | ------ | -------- | -------- | -------- | ------ |
| Gartner报告解读转写系统 | 闫旭隆 | 等待专家反馈中,图片修改工作暂未进行,计划等全部反馈汇总后一起修改 | 专家反馈尚未完成 | 等待专家反馈后汇总修改图片生成相关内容 | P1 |
| 数字人项目 | 郝倩玉 | 仍在可行性调研中,本周主要精力在咨询信息库项目 | 调研未完成就需要尽快落地skill | 抓紧时间把调研完成并做出实际可用的skill | P0 |
---
## 三、问题与风险
### Gartner报告解读转写系统
**问题描述:** 专家反馈尚未完成,图片修改工作暂时搁置
**解决方案:** 等待全部反馈汇总后一起修改
**责任人:** 闫旭隆
**截止时间:** 待定
---
### 数字人项目
**问题描述:** 调研工作推进缓慢,主要精力被咨询信息库项目占用
**解决方案:**
1. 抓紧时间把数字人技术调研完成并做出实际可用的skill
2. 不能一直停留在需求调研层面
**责任人:** 郝倩玉
**截止时间:** 2026-01-13
---
## 四、下周重点
1. 🔴 数字人视频生成技术调研完成并落地skill郝倩玉
2. Gartner报告图片生成优化等待专家反馈
---
**纪要整理人:** Claude
**纪要时间:** 2026-01-06
**下次会议:** 2026-01-13

View File

@ -1,291 +0,0 @@
# 工程类会议纪要 (2025-12-09)
## 一、会议信息
- **会议时间:** 2025-12-09
- **参会人员:** 连云波(主持)、闫旭隆、郝倩玉、陶西平、江争达
- **记录整理:** Claude
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
| -------- | -------- | ---------- | ------------ |
| 会议纪要Skill全量处理优化 | 闫旭隆、郝倩玉 | 2025-12-09 | 已完成初步对比测试Gemini画面效果带来一些提升。存在问题gemini视频上传限制不能超过1小时、200MB、清洗力度难以控制、主窗口上下文不够用200KB文件需90kTokens、Sub-agent并行写文件权限问题。**解决方案:** 1使用Gemini进行清洗Gemini上下文更大2压缩视频后再上传Gemini3尝试Gemini API直接生成4清洗后再用Claude做会议纪要 |
| 数字人PPT视频样本生成 | 江争达、陶西平 | 2025-12-08 | 基本可用,已完成阶段一样本视频。存在问题:黑镜平台背景抠图有浅色阴影残留;数字人生成流程存在逻辑不自洽(上传真人视频训练+上传图片生成动作可能存在冗余);汇报表述不清。**解决方案:** 1使用剪映等软件先抠背景再导入黑镜2测试直接用图片生成数字人模型验证是否需要先录制绿幕视频3郝倩玉参与视频学习和制作 |
| Gemini分镜脚本生成测试 | 江争达、陶西平 | 2025-12-09 | 已完成测试但效果不理想。存在问题VEO3使用中文prompt效果极差模型不遵循指令首尾帧使用相同图片导致视频无动作对工具理解不够。**解决方案:** 1必须使用英文promptVEO3对英文指令遵循度高2首尾帧需使用不同图片如走动前后的姿态3学习网上优秀案例YouTube、Twitter、Reddit |
| 问答系统V1.1前端重构 | 江争达、陶西平 | 2025-12-09 | 已完成前端代码重构,采用麦肯锡风格。存在问题:缺少需求文档、缺少目标定义、缺少问题分析;汇报逻辑混乱,直接展示"怎么做"而非"为什么做";代码生成后倒着补文档。**解决方案:** 1补充完整需求文档问题分析、目标定义、验收标准2遵循"Why-How-What"逻辑结构3需求文档不批准不准开发 |
| 需求澄清Skill专家博弈优化 | 闫旭隆 | 2025-12-09 | 已完成。可视化结果及录制视频已完成,专家交叉回应的字段映射整理完毕 |
| 投标商务应答自动生成系统Skill架构设计 | 郝倩玉、闫旭隆 | 2025-12-09 | 架构设计已完成企业信息库建设存在困难。存在问题企业信息库格式混乱Excel、Word、PDF混杂图片库来源分散缺少描述保密信息处理问题响应文件模板不统一。**解决方案:** 1从最新招投标响应文件提取企业信息作为基础库2AI读取历史文件图片生成索引后让市场部审核标注3保密内容由市场部先筛选删除4周四客户交流后确定最终方案 |
| Gartner报告解读转写Skill架构设计 | 郝倩玉、闫旭隆 | 2025-12-09 | 架构设计和可行性单元测试已完成。存在问题:翻译生硬(如"构建者"、"综合者"不符合信通院风格AI痕迹明显缺乏专家观点输出字数难以控制图片处理尚未完成。**解决方案:** 1允许意义转写而非忠实于原词2先提取每段要点总结再重新生成文章抽骨架换血肉3使用NotebookLM做deep research后融合生成4抓紧测试API额度快到期 |
| 数字分身方案调研及方案撰写 | 郝倩玉 | 2025-12-09 | 进行中。发现市场上数字分身应用已比较成熟,需研究自研还是定制化定位。**解决方案:** 1郝倩玉参与视频生成学习2探索黑镜、VEO3等工具的融合使用 |
### 2. 重点项目问题及解决方案
#### 问题1: 数字人视频生成流程存在逻辑不自洽问题
**问题描述:**
当前数字人视频生成流程需要先录制绿幕视频训练数字人模型,再上传图片生成动作参考视频,最后生成口播视频。领导质疑这个流程的必要性,认为如果可以通过图片直接生成动作视频,为什么还需要先上传真人视频训练数字人模型,两个视频同时训练一个东西在逻辑上存在矛盾。另外,生成的视频存在背景抠不干净(有浅蓝/浅绿色阴影)的问题。
**解决方案:**
1. 测试直接用图片创建数字人专家,不拍摄绿幕视频,对比效果是否一致
2. 使用剪映等外部软件先抠背景再导入黑镜平台,效果可能比黑镜自带抠图更好
3. 删除现有专家账号重新测试流程,验证是否必须上传真人视频
**责任人:** 江争达、陶西平
**截止时间:** 2025-12-16
#### 问题2: VEO视频生成工具使用不当导致效果差
**问题描述:**
陶西平使用VEO Three生成分镜脚本视频时使用中文prompt且首尾帧图片完全相同导致生成的视频人物几乎不动动作指令完全没有执行。对比领导用英文prompt生成的视频手势动作完全按照指令执行。问题核心是1)VEO Three对英文prompt的遵循效果远好于中文2)首尾帧使用相同图片会导致视频没有动作变化3)花了一周多时间但产出质量很差。
**解决方案:**
1. 必须使用英文promptVEO Three对英文指令遵循效果最好
2. 首尾帧应使用不同的图片,比如尾帧图片应该是往前走两步后的状态
3. 多学习网上其他人的使用经验如YouTube、Twitter、Reddit上的VEO使用案例
4. 重新用英文prompt制作视频
**责任人:** 陶西平
**截止时间:** 2025-12-16
#### 问题3: 前端重构缺乏明确目标和需求文档
**问题描述:**
江争达汇报前端重构工作时PPT直接展示做成什么样缺乏"为什么要重构"(Why)的分析。没有说明1)前端具体存在哪些问题和案例2)想要达成的目标是什么3)理想的展示效果、交互体验是什么样的。领导严厉批评这种"没有需求文档就开发"、"先生成代码再倒回来补文档"的做法,认为这是思想懒惰的表现。
**解决方案:**
1. 先明确目标,说清楚想要什么样的效果,画出设计草图
2. 整理前端代码存在的具体问题案例,分析代码扫描和人工智能读取后暴露的问题
3. 按照"Why-How-What"的逻辑结构重新组织汇报材料
4. 需求文档必须先批准才能开发,不准先开发再补文档
5. 需求可以分阶段开发,但必须有整体的阶段设计,不能走一步看一步
**责任人:** 江争达
**截止时间:** 2025-12-16
#### 问题4: 汇报表述不清晰、逻辑混乱
**问题描述:**
多名成员在汇报时存在表述不清、逻辑混乱的问题。江争达解释数字人视频生成流程时反复说不清楚陶西平解释VEO视频生成流程时也无法清晰表达是用首尾帧还是视频扩展。领导多次要求"你们回去好好学练习语文"。核心问题是无法用简洁明了的语言描述工作内容和技术流程。
**解决方案:**
1. 汇报前先理清思路,用一句话概括核心流程
2. 练习表达能力,学会用简洁语言描述复杂流程
3. 汇报时按照步骤一二三清晰说明,不要东一下西一下
**责任人:** 江争达、陶西平
**截止时间:** 2025-12-16
#### 问题5: 工具使用能力不足,不会学习
**问题描述:**
团队成员对AI工具黑镜、VEO、Claude Code等的使用能力不足不会主动学习。领导指出1)同样的工具在不同人手里效果完全不同90分的工具用出50分都不到的效果2)遇到问题不去网上搜索学习而是闷头自己试3)没有AI First的思维不懂得利用AI来帮助分阶段、规划需求。
**解决方案:**
1. 多上网学习看YouTube、Twitter、Reddit上别人的使用经验和案例
2. 遇到问题先用Deep Research等工具搜索解决方案
3. 利用多个AI工具GPT、Claude、DeepSeek等交叉验证和获取建议
4. 不要自以为是要AI First从别人那里学习
**责任人:** 江争达、陶西平
**截止时间:** 2025-12-16
#### 问题6: 报告转写规则和风格提取困难
**问题描述:**
在做Gartner报告转写工作中发现1)转写后的英文翻译生硬(如"构建者"、"综合者"等不符合信通院用语习惯2)AI痕迹明显缺乏观点3)风格规则难以精确提取写多了约束可能偏写少了表现不好4)转写较忠实于原文用词,但信通院的专业术语和表达方式不同。
**解决方案:**
1. 先提取每段要点总结,再重新生成文章,相当于把骨架抽出来重新填充
2. 不必完全忠实于原文英文词汇,可以进行意义转写
3. 使用NotebookLM做Deep Research融合相关资料后再写
4. 请信通院专家来审核和调整专业术语
5. 转写后需要有检查优化的流程
**责任人:** 闫旭隆
**截止时间:** 2025-12-16
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
| -------- | ------ | ------------ | ------ | -------- |
| 🔴 数字人视频生成流程优化测试 | 江争达 | 测试不使用绿幕视频直接用图片生成数字人的效果:删除现有专家数字人,直接上传图片生成动作视频,验证是否可以省略绿幕拍摄步骤。同时尝试用剪映等外部软件先抠图再导入黑镜平台 | P0 | 2025-12-16 |
| 🔴 VEO3视频生成重新测试 | 陶西平 | 使用英文prompt重新测试VEO3视频生成功能参考领导发送的英文prompt示例确保指令执行效果。首尾帧需使用不同图片如人物走动两步的图片 | P0 | 2025-12-16 |
| 🔴 问答系统前端重构需求文档完善 | 江争达 | 需求文档必须包含1明确的目标和期望效果包括UI草图/设计图2现有问题的具体案例分析代码扫描结果、组件冗余示例3为什么要重构的充分论证4分阶段的需求规划设计。需求文档未批准前不准开发 | P0 | 2025-12-16 |
| 🔴 视频制作学习与多模态工作流探索 | 郝倩玉 | 参与数字人视频的学习和制作开通Gemini/API账号探索如何将多模态能力PPT生成、视频生成、图片编辑融合到市场部工作中形成高效的视频生产工作流 | P0 | 2025-12-16 |
| 🔴 数字人演讲视频制作 | 江争达、陶西平 | 为领导制作数字人演讲视频用于即将到来的演讲场合。需要:领导提供一张图片和声音,以及演讲稿文字内容,团队负责生成完整的数字人演讲视频 | P0 | 2025-12-16 |
| 🔴 会议纪要Skill全量处理优化 | 闫旭隆、郝倩玉 | 使用Gemini进行转写清洗清洗后再用Claude做会议纪要尝试压缩视频后上传Gemini测试Gemini API直接生成 | P0 | 2025-12-16 |
| 🔴 投标商务应答自动生成系统Skill架构设计 | 郝倩玉、闫旭隆 | 周四客户交流后确定最终方案,从最新招投标响应文件提取企业信息作为基础库 | P0 | 2025-12-16 |
| 🔴 Gartner报告解读转写Skill架构设计 | 郝倩玉、闫旭隆 | 抓紧测试API额度快到期先提取每段要点总结再重新生成文章使用NotebookLM做deep research后融合生成 | P0 | 2025-12-16 |
| Gartner报告转写优化 | 郝倩玉 | 继续优化报告转写效果1考虑分段提取要点后重新生成文章2调整prompt允许意译而非直译3处理图片提取和匹配插入4优化英文术语的中文表达 | P1 | 2025-12-16 |
| 知识库整理与管理 | 郝倩玉 | 接手知识库整理工作从江争达处转交系统化整理1市场部知识文档2云大哥相关知识3AIEC团队从成立至今的各类文档、文章、视频、会议纪要等 | P1 | 2025-12-16 |
| 前端重构问题反思总结 | 江争达 | 整理并总结代码问题的典型案例1记录哪些具体问题导致需要重构2分析问题成因3形成经验教训文档供后续学习借鉴 | P1 | 2025-12-16 |
| 数字分身方案调研及方案撰写 | 郝倩玉 | 继续调研市面上做得好的版本,研究自研还是定制化定位 | P1 | 2025-12-16 |
### 4. 组内成员工作进展
#### 闫旭隆
**上周完成:**
- ✅ 会议纪要Skill开发生成市场部需求相关会议纪要、主窗口加载转写文本优化、三种方式对比测试
- ✅ 需求澄清Skill专家博弈优化可视化结果整理及录制视频
- ✅ Skill-designer-v1开发完成
- ✅ Gartner报告解读转写Skill架构设计及可行性单元测试
- ✅ 投标商务应答自动生成系统Skill架构设计
**进行中:**
- 🔄 会议纪要Skill全量处理优化Gemini清洗方案测试
- 🔄 Gartner报告转写优化API测试
**收到的反馈/学习建议:**
- **建议:** 会议纪要skill技术选型基本确定接下来是优化工作。建议把相关流程、需求、开发文档管理起来形成1.0版本发布
- **建议:** gemini视频上传问题建议尝试视频压缩因为大量静止画面编码可以压缩另外可以调用API而非界面端稳定性会更高
- **建议:** 清洗工作交给gemini处理更合适因为gemini上下文更大清洗后再用Claude做会议纪要
- **建议:** skill开发设计时建议先画一个大逻辑框架图把大的模块架构先理清楚
- **表扬:** 在自动化方向上的探索尝试是值得鼓励的,但现在是一步一步完善,不要期望一步到位
- **建议:** Gartner报告转写skill需要考虑长上下文处理问题单份报告可以拆开一段一段翻把上一段翻译压缩后作为下一段的上下文
**下周任务:**
- [ ] 🔴 P0会议纪要Skill全量处理优化
- [ ] 🔴 P0Gartner报告解读转写Skill架构设计API测试
- [ ] 🔴 P0投标商务应答自动生成系统Skill架构设计
- [ ] P1Claude Code需求文档-Skill套壳Web前端交互测试
#### 郝倩玉
**上周完成:**
- ✅ 会议纪要Skill架构优化协助旭隆优化学习类+Q&A类会议纪要Skill逻辑
- ✅ Gartner报告解读转写Skill架构设计
- ✅ 投标商务应答自动生成系统Skill架构设计和开发人员讨论需求细节
- ✅ 数字分身方案调研
**进行中:**
- 🔄 投标商务应答自动生成系统需求待明确(市场部反馈需求可能会变)
- 🔄 数字分身方案撰写
**收到的反馈/学习建议:**
-
**下周任务:**
- [ ] 🔴 P0视频制作学习与多模态工作流探索
- [ ] 🔴 P0会议纪要Skill全量处理优化
- [ ] 🔴 P0投标商务应答自动生成系统Skill架构设计
- [ ] 🔴 P0Gartner报告解读转写Skill架构设计
- [ ] P1Gartner报告转写优化
- [ ] P1知识库整理与管理
- [ ] P1数字分身方案调研及方案撰写
#### 陶西平
**上周完成:**
- ✅ 数字人PPT视频样本生成完成数字人阶段一的样本视频
- ✅ 数字人与ppt结合完成数字人讲解PPT视频生成步骤文档
- ✅ Gemini分镜脚本生成测试完成veo3.1调研结果文档
**进行中:**
- 🔄 VEO3视频生成优化需用英文prompt重新测试
**收到的反馈/学习建议:**
- **批评:** VEO Three工具使用错误使用中文prompt而VEO Three根本不认中文prompt至少需要八个英文单词才能启动导致prompt完全没有起作用生成的视频动作和节奏完全没有执行指令
- **批评:** 汇报表述不清:无法用简洁的语言说清楚工作流程,领导多次追问才能理解其工作内容,被批评"回去好好学练习语文"
- **批评:** 工作方式偷懒:使用同一张图片同时作为首帧和尾帧生成视频,被批评为"把偷懒发挥到极致"、"完全不动脑子工作的最新最高境界"
- **批评:** 工作效率低下:一整周时间都在做数字人视频,结果却不理想,被批评"效率太低了"
- **建议:** 使用英文promptVEO Three需要英文prompt才能正常工作应参考领导发送的示例提示词进行学习和改进
**下周任务:**
- [ ] 🔴 P0VEO3视频生成重新测试英文prompt
- [ ] 🔴 P0数字人演讲视频制作
- [ ] P1继续推进数字人讲解ppt视频
#### 江争达
**上周完成:**
- ✅ 问答系统V1.1前端重构:前端采用麦肯锡风格进行重构
- ✅ 数字人PPT视频样本生成完成样本生成完成制作步骤和费用分析
- ✅ Gemini分镜脚本生成测试指导西平完成测试
**进行中:**
- 🔄 问答系统前端重构需求文档完善缺少Why和目标定义
- 🔄 服务器采购
**收到的反馈/学习建议:**
- **批评:** 逻辑表达不清晰,思维混乱。在汇报数字人视频技术方案时,领导多次指出"你脑子就是乱的"、"东一下西一下的"、"逻辑全变了",要求其先理清思路再表达
- **批评:** 对底层技术理解不透彻。关于黑镜数字人生成流程,领导指出"你们对黑镜根本没有了解清楚",质疑为什么需要先拍绿幕视频训练模型再用图片生成参考视频的必要性
- **批评:** Cloud Code的PDF Skill功能没有研究透。领导明确指出"你们还没研究透它的PDF"要求深入研究PDF处理能力
- **批评:** 前端重构缺乏明确目标和需求文档。领导严厉批评"你这不叫需求文档,你这叫开发动机"、"你连目标都不清楚,你能做出个需求文档出来"、"需求文档不批准的时候不准开发"
- **批评:** 汇报缺乏案例支撑,只有空洞描述。领导指出"你缺乏案例展示别人是没有直观感觉的",要求展示具体的代码问题案例
- **批评:** 先开发后补文档的做法错误。领导强烈反对"先生成代码再回头补文档"的做法,认为这是"糊弄鬼",明确表示"如果没有需求文档去开发以后就不要干了"
- **批评:** 工具使用方法有问题。当说让AI严格按接口规范生成17个接口结果只生成9个时领导指出"说明你一次生成17个是错的你工具不会使用"
- **批评:** 问答系统前端重构的PPT汇报逻辑混乱。领导评价"上来就是HOW不是这样的是WHY",批评缺少为什么要做这个决策的分析
- **建议:** 需要从问题中吸取经验教训。领导建议"把这些问题找出来",分析为什么会出现不规范的现象,结果是因为之前什么原因造成的
- **建议:** 汇报应该有完整的逻辑链条。需要先说明"饿不饿"(为什么要做),再说"吃什么"(怎么做),而不是上来就讲具体操作
- **建议:** 前端设计需要先画草图和交互逻辑图
- **建议:** 数字人视频流程需要验证是否真正需要拍摄绿幕。领导建议测试直接用图片生成动作视频,如果效果差不多,"那证明前面这个绿幕你们就是脱裤子放屁"
- **建议:** Gemini API额度快到期还剩一天需要抓紧时间测试报告转写功能
**下周任务:**
- [ ] 🔴 P0数字人视频生成流程优化测试
- [ ] 🔴 P0问答系统前端重构需求文档完善
- [ ] 🔴 P0数字人演讲视频制作
- [ ] P1前端重构问题反思总结
- [ ] P1服务器采购
---
## 三、会议总结
**核心议题:** 数字人视频生成、VEO3视频测试、问答系统前端重构、Gartner报告转写
**关键决策:**
1. **需求文档不批准时不准开发:** 针对江争达前端重构项目,领导明确指出在需求文档没有明确目标、没有经过批准之前,不允许进行开发工作
2. **数字人视频工作流需要重新测试优化:** 针对黑镜平台数字人视频生成流程,要求测试直接用图片生成数字人模型是否可行,如果效果相同则绿幕录制步骤是多余的
3. **VEO视频生成必须使用英文prompt:** VEO对中文prompt执行效果很差必须使用英文prompt才能获得好的指令遵循效果
4. **视频生成工作由郝倩玉参与学习和制作:** 考虑到视频将成为市场部重要方向,决定让郝倩玉加入视频学习和制作工作
5. **知识库整理工作从江争达转交给郝倩玉统一负责:** 系统化整理市场部知识、云大哥知识、AIEC团队各类文档
6. **需求可以分阶段开发,但不代表需求没有阶段设计:** 可以把所有需求都设计出来,然后分段开发,而不是想到多少算多少
7. **转写报告风格规则需要调整,不完全忠于原文:** 可以进行意义转写,更重要的是保持逻辑框架和数据引用的准确性
8. **采用先提取每段要点再重新生成的工作流:** 针对报告转写的优化方案,先做每一段要点的总结,把骨架抽出来,然后基于骨架重新生成文章
**下周工作重点:**
1. 🔴 数字人视频生成流程优化测试,验证是否需要拍摄绿幕视频
2. 🔴 VEO3视频生成重新测试使用英文prompt
3. 🔴 问答系统前端重构需求文档完善补充Why和目标定义
4. 🔴 视频制作学习与多模态工作流探索(郝倩玉)
5. 🔴 数字人演讲视频制作
6. 🔴 会议纪要Skill全量处理优化使用Gemini进行清洗
7. 🔴 投标商务应答自动生成系统Skill架构设计周四客户交流后确定方案
8. 🔴 Gartner报告解读转写Skill架构设计抓紧测试API
---
**纪要整理人:** Claude
**纪要时间:** 2025-12-09
**下次会议:** 2025-12-16

View File

@ -0,0 +1,255 @@
# 工程类会议纪要 (2026-01-06)
## 一、会议信息
- **会议时间:** 2026-01-06
- **参会人员:** 连云波(主持)、闫旭隆、江争达、郝倩玉
- **记录整理:** Claude
---
## 二、工作内容
### 1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
| ------------------------------------ | -------------- | ---------- | ------------------------------------------------------------ |
| 科普视频生成初版方案 | 江争达 | 2026-01-02 | 已完成3分钟演示demo并提交给富友和窦主任审核正在制作算力科普主题完整视频。技术路径Nana Banana Pro生成图片→可灵生成视频→heygen复刻声音→剪映拼接。存在问题prompt优化不足、工具选型调研不充分、错误删除AI生成的高质量图片alpha蛋白质折叠图、工作流程未自动化。**解决方案:** 1端到端自动化工作流全文案交给Gemini自动拆分生成关键帧2使用ChatGPT生成文本prompt、Gemini生成图片3浏览器自动化批量生成4代码实现视频拼接和音频对齐5先做10-20秒短视频验证流程 |
| Gartner报告转写-图片生成优化 | 闫旭隆 | 2026-01-06 | 等待专家反馈中,图片修改工作暂未进行,计划等全部反馈汇总后一起修改。**解决方案**:先对已知的待改进点(图片相关)进行改进,边等待完整反馈 |
| Deep Research智能体知识图谱方案设计 | 闫旭隆 | 2026-01-06 | 完成初步科研类知识图谱调研1基础覆盖类2021年元老级知识库2成果关系类聚焦文献引用关系3逻辑推理类I-CRAFT2025年Nature Machine Intelligence4精神疾病领域知识图谱云南大学Nature Communication。存在问题现有知识图谱都是静态的缺乏自进化机制。**解决方案:** 1研究自进化知识图谱方案可以基于开源知识图谱做MVP验证2重点研究iKragh、MDKG知识图谱的结构 |
| Vibe Engineering学习 | 闫旭隆、江争达 | 2026-01-06 | 闫旭隆完成Continuous-Claude项目学习并分享核心是账本(Ledger)+Handoff实现跨窗口持续性工作、hooks机制在session start和pre-compact时触发、BringTrust平台用于学习自进化。江争达待启动。存在问题框架实现不够完善、交接处保留信息是难点。**解决方案:** 1采用Claude官方双代理方案Starter+Builder+拉尔夫自动化+SuperPower组合框架2研究hooks的6种生命周期 |
| 数字人视频生成技术调研 | 郝倩玉 | 2026-01-06 | 仍在可行性调研中,本周主要精力在咨询信息库项目。**解决方案:** 抓紧时间把调研完成并做出实际可用的skill |
| 铭凡服务器采购 | 江争达 | 2026-01-06 | 已购买并到货体积很小像桌面机出厂自带Windows系统。存在问题缺乏规划方案和实施文档。**解决方案:** 1先做服务器框架规划方案再做执行路径实施方案2使用"ask you the question" skill进行40轮问答完善规划3把所有配置和操作记录成文档 |
| 问答系统前端上线测试版本 | 江争达 | 2026-01-06 | 还没做,还没测试。服务器到了但软件部署工作未启动。存在问题:所有时间都耗在视频生成项目上,问答系统被跟丢了。**解决方案:** 一周至少同时开展两个项目 |
| 咨询信息库搭建、分析报告生成需求对接 | 郝倩玉 | 2026-01-13 | 本周主要工作,与窦主任持续沟通中,目标一季度做出成型系统。信息库包括公开信息源抓取和所内现有合同数据整合。存在问题:核心需求不明确(给领导什么报告?目的是什么?)、信息源获取困难、讨论容易跑偏。**解决方案:** 1必须先明确目的服务对象是谁、要让他们知道什么、达成什么效果2先做最简版本的分析报告给领导看3尽快跑通一个最小MVP版本 |
### 2. 重点项目问题及解决方案
#### 问题1: 科普视频生成相关问题
**问题描述:**
1. **AI视频提示词生成质量不足**prompt质量不高需反复调整工具选型不充分未对比ChatGPT文本能力更强判断能力不足错误删除高质量AI生成图片alpha蛋白质折叠+神经网络融合图,代表诺贝尔奖级别科学成就);流程未自动化,仍需大量人工介入
2. **工作思维惯性问题**上来就试不做调研规划提出问题时缺乏背景上下文自以为是地判断AI生成内容好坏过于依赖直觉而非理性分析
**解决方案:**
1. 使用ChatGPT生成文本类prompt文本能力最强Gemini生成图片
2. 全文案一次性给AI处理让AI自动拆分关键帧减少人工干预
3. 不要主观判断AI生成的图片好坏应交给专业人员审查
4. 先做调研再动手让AI推荐各环节最佳工具组合
5. 尽快完成端到端自动化工作流:图片生成→可灵视频生成→代码拼接→音频对齐
6. 使用浏览器自动化操作方案实现批量生成
7. 做任何事情之前先做调研,内化知识后再提出问题和目标
**责任人:** 江争达
**截止时间:** 2026-01-13
#### 问题2: 服务器部署相关问题
**问题描述:**
服务器已到货,还没有做规划方案和文档。
**解决方案:**
1. 先做服务器框架规划方案(需求文档),再做实施方案
2. 使用AskUserQuestionTool让AI帮助规划进行40轮问答
3. 参考领导分享的服务器配置相关资料
4. 考虑泛化:单机部署→大型机房规划→运维管理
5. 做好文档工作,为未来自己和他人留下参考
**责任人:** 江争达
**截止时间:** 2026-01-13
#### 问题3: 咨询信息库需求不明确
**问题描述:**
咨询信息库项目核心需求不清晰。窦主任虽然重视此项目,但具体要给所领导什么报告、达成什么目的都未明确。目前是"有什么就给什么"的思维,而非从目标出发确定需要什么信息。
**解决方案:**
1. 明确目标:给谁看(所领导/业务部门主任)、看什么、达成什么目的
2. 不要做庞大的全面规划,先做一个最小版本的报告给窦主任看
3. 先做一个点(如技术动态追踪),验证可行性后再扩展
4. 尽快落地一个skill跑通一次流程不要停留在纸面
**责任人:** 郝倩玉
**截止时间:** 2026-01-13
#### 问题4: 问答系统前端未推进
**问题描述:**
问答系统前端还没做、没测试。把所有精力都耗在视频项目上。
**解决方案:**
1. 尽快测试问答系统前端
2. 合理分配时间,一周至少开展两个项目
**责任人:** 江争达
**截止时间:** 2026-01-13
#### 问题5: Vibe Engineering框架选型
**问题描述:**
Continuous Claude开源项目的学习成果包括账本机制、hand off、自学习进化系统等。但存在问题框架实现细节不完善有些设计没有真正使用框架选型众多Cloud官方双代理、Super Power、Continuous Claude等需要确定使用哪个。
**解决方案:**
1. 采用Claude官方的双代理长时间运行方案简单有效+尔夫+Superpower框架方案
2. 由简入繁,不要上来就加太多功能
3. 研究hooks的使用这是流程自动化的重要手段
4. 做虚拟验证先让AI模拟方案可行性再实际执行
**责任人:** 闫旭隆
**截止时间:** 2026-01-13
### 3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
| -------------------------------- | ---------------------- | ------------------------------------------------------------ | ------ | ---------- |
| 🔴 科普视频生成端到端自动化流程 | 江争达 | 完成端到端自动化工作流全文案输入让AI自动拆分生成关键帧prompt使用浏览器自动化操作可灵生成视频代码实现视频拼接和音频对齐。先做10-20秒短视频验证流程 | P0 | 2026-01-13 |
| 🔴 问答系统前端测试 | 江争达 | 问答系统前端测试,一周至少同时开展两个项目 | P0 | 2026-01-13 |
| 🔴 梳理最近一个月的会议纪要 | 闫旭隆,江争达 | 看看有什么工作被遗漏并对现有会议生成skill进行这部分优化 | P0 | 2026-01-13 |
| 🔴 Vibe Engineering框架研究与搭建 | 闫旭隆 | 研究Claude双代理长时间运行架构结合拉尔夫、superpower框架搭建质量可控的AI自动化开发框架。目标质量可控、成本时间可控、架构简单研究hooks的生命周期及重要实现融入架构 | P0 | 2026-01-13 |
| 🔴 知识图谱相关调研 | 闫旭隆 | 重点研究iKragh、MDKG知识图谱静态结构研究知识图谱自进化机制 | P0 | 2026-01-13 |
| 🔴 客户信息库分析系统需求文档撰写 | 郝倩玉 | 尽快完成需求调研及需求文档撰写,之后先做一个最小版本的客户分析报告先给窦主任看,迅速把需求实现出来 | P0 | 2026-01-13 |
| 🔴 Gartner报告图片生成优化 | 闫旭隆 | 先改图片相关的已知待改进点,等待专家反馈后汇总,先修改图片生成相关内容 | P0 | |
| 🔴 铭凡服务器部署方案设计 | 江争达 | 先做服务器框架规划方案(需求);再写实施方案(执行路径)使用AI辅助的AskUserQuestionTool方法进行40轮问答学习做好文档记录。后续考虑大型机房规划方案 | P1 | |
| 🔴 数字人视频生成多模态工作流方案 | 郝倩玉 | 尽快完成技术调研方案 | P0 | 2026-01-13 |
| 培训资料库建设方案 | 郝倩玉 | 做调研出方案:群里发的学习资源如何整合,培训知识库和培训体系怎么建。这个可泛化,将来非常有价值 | P1 | 2026-01-13 |
| Claude Code教程学习 | 郝倩玉、江争达、闫旭隆 | 学习领导发的Claude Code系统教程 | P1 | 2026-01-13 |
| 开源视频生成模型调研 | 江争达 | 调研开源视频生成模型(如可灵开源版等),评估是否可部署到自有服务器降低成本 | P2 | 2026-01-13 |
### 4. 组内成员工作进展
#### 闫旭隆
**上周完成:**
- ✅ Vibe Engineering学习完成Continuous-Claude项目学习学习自动上下文接续机制+自学习进化系统+Rules规则+Hook-Skill推荐
- ✅ 基于Claude Code的类Kosmos的研究智能体系统编排思考完成初步系统科研类知识图谱项目调研
- ✅ 基于Claude Code的智能问答系统重构规划设计主窗口——Sub-agent——Skill三层架构的重构规划
**进行中:**
- 🔄 基于Claude Code的类Kosmos的研究智能体系统编排思考准备精读iKragh、MDKG知识图谱结构
- 🔄 Gartner报告转写-图片生成与文字细节优化:等待专家反馈
**收到的反馈/学习建议:**
- **表扬:** 在团队中相对稳定,学习状态较好。领导评价"除了旭龙可能稍微稳定一点,你们其他人都还处于一个学习阶段"
- **表扬:** Continuous-Claude项目的学习汇报得到认可"账本机制和自动学习经验总结"的思想值得借鉴
- **建议:** 要研究hooks的使用这是未来自动化流程编排非常重要的组成部分
- **建议:** 知识图谱研究方向结合Kosmos机制+自进化机制,基于开源知识图谱做评测验证,如果可行可以发表论文
**下周任务:**
- [ ] 🔴 P0Vibe Engineering框架研究与搭建测试
- [ ] 🔴 P0iKragh+MDKG知识图谱结构研究+自进化知识图谱研究
- [ ] 🔴 P0Gartner报告图片生成优化先行不要死等专家反馈
- [ ] P1测试GLM-API在Claude Code体系下的表现准备后续接入SDK进行本地化部署
- [ ] P1基于Claude code的RAG后端系统重构规划
#### 江争达
**上周完成:**
- ✅ 科普视频生成初版完成3分钟视频制作
- ✅ 铭凡服务器采购:已购买并到货
**进行中:**
- 🔄 科普视频生成:正在制作算力科普主题完整视频
- 🔄 Vibe Engineering学习待启动
**收到的反馈/学习建议:**
- **表扬:** 这次视频是可用的视频生成项目产出的结果得到表扬。但这是建立在AI能力普遍提升的情况下Gemini和可灵救了你
- **建议:** 关于服务器部署任务不要闷头搞要先做方案规划要有工程化思维做好文档工作可以先用GPT的访谈skill来帮助规划
- **批评:** 汇报问题时缺乏上下文和背景信息,别人无法帮助解决问题。只聚焦自己感兴趣的点,不管别人能不能理解
- **批评:** 不去思考就开始试,浅尝辄止性思维。工具选型时没有理论支撑,凭直觉选择
- **批评:** 追求快而不是追求优。手很快但是原地踏步,效率很低
- **批评:** 把Gemini生成的专业图片alpha蛋白质折叠+神经网络融合图)判定为"抽象不好"并删除,暴露了知识局限性。这张图代表诺贝尔奖级别的科学成就
- **批评:** 思维惯性非常明显在AI原生时代思维惯性是最大的障碍
- **建议:** 做任何事情之前先做调研,不要上来就试。先调研学习,内化知识后再操作
- **建议:** 服务器部署要先做规划方案和实施方案,做事情要有章法,工程化思维
- **建议:** 尽快把视频生成端到端流程跑通,先做最简版本。问答系统前端也要推进,一周至少同时开展两个项目
**下周任务:**
- [ ] 🔴 P0科普视频生成端到端自动化流程
- [ ] P0问答系统前端测试
- [ ] P1铭凡服务器部署方案设计
- [ ] P2开源视频生成模型调研
#### 郝倩玉
**上周完成:**
- ✅ 咨询信息库搭建、分析报告生成需求对接与窦主任持续沟通中PRD文档撰写中
- ✅ 数字人视频生成技术调研:技术可行性方案调研中
**进行中:**
- 🔄 咨询信息库搭建、分析报告生成需求对接:进行中
- 🔄 数字人视频生成技术调研:可行性方案重新调研中
**收到的反馈/学习建议:**
- **批评:** 咨询信息库项目需求不明确,核心问题在于信息源到底获取什么信息没有想清楚。不要以自己有什么东西就给领导看什么,而是要先明确领导想看什么
- **建议:** 数字人视频生成项目要抓紧时间自己上手做出来。不要停留在需求调研层面,迅速把需求实现出来
- **建议:** 学习Claude Code教程这是领导看到的最系统的一个教程
- **建议:** 做咨询信息库项目时,先做调研,先做一个点(如技术动态追踪),一个模块一个模块来。同时要考虑泛化
**下周任务:**
- [ ] 🔴 P0客户信息库分析需求调研及需求文档撰写
- [ ] P0数字人视频生成多模态工作流方案
- [ ] P1培训资料库建设方案
---
## 三、会议总结
**核心议题:** 科普视频生成端到端自动化、Vibe Engineering框架研究、自进化知识图谱、咨询信息库分析报告、服务器部署方案
**关键决策:**
1. **需求文档生成流程确定**先用人工智能做需求澄清快速产出高质量需求文档AI产出质量超过90%的人
2. **服务器部署必须先做规划方案再执行**:需要有完整的文档记录,工程化思维
3. **采用"AskUserQuestionTool"提示词方法进行需求澄清和规划**通过AI持续提问40轮的方式完成需求澄清和规划
4. **知识图谱研究方向确定**:在传统知识图谱基础上增加自进化机制(查询路径压缩、边压缩、反馈学习、动态演化)
5. **Vibe Engineering框架采用Claude官方双代理模式为基础**:逐步增加功能,由简入繁
6. **视频生成工作流采用端到端自动化流程**不需要人工审查每一帧信任AI生成能力
7. **视频生成技术栈确定**ChatGPT生成prompt、Gemini生成图片、可灵生成视频、代码自动化拼接
8. **客户信息库项目先做一个最简版本给领导看**:不纠结信息源和流程问题,快速产出验证
9. **团队工作流程确定**:任何任务开始前必须先做调研研究
10. **Skill开发必须考虑泛化复用**:不为单一功能开发,只有可复用的工程化项目才值得投入
11. **hooks机制研究作为重要任务**用于流程编排自动化真正的高手都在用hooks
12. **培训资料库和培训体系建设需要尽快启动调研**:把群里分享的学习资源整合,这个可以泛化
13. **江争达需同时开展两个项目**:视频生成工作流和问答系统前端测试,一周至少开展两个项目
14. **采用开源视频生成模型作为备选方案进行调研**:如果视频需求量大,考虑部署开源模型自建算力
**下周工作重点:**
1. 🔴 科普视频生成端到端自动化流程(江争达)
2. 🔴 铭凡服务器部署方案设计(江争达)
3. 🔴 前端页面重构(江争达)
4. 🔴 Vibe Engineering框架研究与搭建闫旭隆
6. 🔴 iKragh+MDKG知识图谱结构研究+自进化知识图谱研究(闫旭隆)
7. 🔴 客户信息库分析需求调研及需求文档撰写(郝倩玉)
---
**纪要整理人:** Claude
**纪要时间:** 2026-01-06
**下次会议:** 2026-01-13