21 KiB
工程类会议纪要 (2025-12-09)
一、会议信息
- 会议时间: 2025-12-09
- 参会人员: 连云波(主持)、闫旭隆、郝倩玉、陶西平、江争达
- 记录整理: Claude
二、工作内容
1. 重点项目进展情况汇总
| 项目名称 | 原负责人 | 原截止时间 | 项目进展情况 |
|---|---|---|---|
| 会议纪要Skill全量处理优化 | 闫旭隆、郝倩玉 | 2025-12-09 | 已完成初步对比测试,Gemini画面效果带来一些提升。存在问题:gemini视频上传限制(不能超过1小时、200MB)、清洗力度难以控制、主窗口上下文不够用(200KB文件需90kTokens)、Sub-agent并行写文件权限问题。解决方案: 1)使用Gemini进行清洗,Gemini上下文更大;2)压缩视频后再上传Gemini;3)尝试Gemini API直接生成;4)清洗后再用Claude做会议纪要 |
| 数字人PPT视频样本生成 | 江争达、陶西平 | 2025-12-08 | 基本可用,已完成阶段一样本视频。存在问题:黑镜平台背景抠图有浅色阴影残留;数字人生成流程存在逻辑不自洽(上传真人视频训练+上传图片生成动作可能存在冗余);汇报表述不清。解决方案: 1)使用剪映等软件先抠背景再导入黑镜;2)测试直接用图片生成数字人模型,验证是否需要先录制绿幕视频;3)郝倩玉参与视频学习和制作 |
| Gemini分镜脚本生成测试 | 江争达、陶西平 | 2025-12-09 | 已完成测试,但效果不理想。存在问题:VEO3使用中文prompt效果极差,模型不遵循指令;首尾帧使用相同图片导致视频无动作;对工具理解不够。解决方案: 1)必须使用英文prompt,VEO3对英文指令遵循度高;2)首尾帧需使用不同图片(如走动前后的姿态);3)学习网上优秀案例(YouTube、Twitter、Reddit) |
| 问答系统V1.1前端重构 | 江争达、陶西平 | 2025-12-09 | 已完成前端代码重构,采用麦肯锡风格。存在问题:缺少需求文档、缺少目标定义、缺少问题分析;汇报逻辑混乱,直接展示"怎么做"而非"为什么做";代码生成后倒着补文档。解决方案: 1)补充完整需求文档(问题分析、目标定义、验收标准);2)遵循"Why-How-What"逻辑结构;3)需求文档不批准不准开发 |
| 需求澄清Skill专家博弈优化 | 闫旭隆 | 2025-12-09 | 已完成。可视化结果及录制视频已完成,专家交叉回应的字段映射整理完毕 |
| 投标商务应答自动生成系统Skill架构设计 | 郝倩玉、闫旭隆 | 2025-12-09 | 架构设计已完成,企业信息库建设存在困难。存在问题:企业信息库格式混乱(Excel、Word、PDF混杂);图片库来源分散缺少描述;保密信息处理问题;响应文件模板不统一。解决方案: 1)从最新招投标响应文件提取企业信息作为基础库;2)AI读取历史文件图片生成索引后让市场部审核标注;3)保密内容由市场部先筛选删除;4)周四客户交流后确定最终方案 |
| Gartner报告解读转写Skill架构设计 | 郝倩玉、闫旭隆 | 2025-12-09 | 架构设计和可行性单元测试已完成。存在问题:翻译生硬(如"构建者"、"综合者"不符合信通院风格);AI痕迹明显缺乏专家观点;输出字数难以控制;图片处理尚未完成。解决方案: 1)允许意义转写而非忠实于原词;2)先提取每段要点总结再重新生成文章(抽骨架换血肉);3)使用NotebookLM做deep research后融合生成;4)抓紧测试API(额度快到期) |
| 数字分身方案调研及方案撰写 | 郝倩玉 | 2025-12-09 | 进行中。发现市场上数字分身应用已比较成熟,需研究自研还是定制化定位。解决方案: 1)郝倩玉参与视频生成学习;2)探索黑镜、VEO3等工具的融合使用 |
2. 重点项目问题及解决方案
问题1: 数字人视频生成流程存在逻辑不自洽问题
问题描述: 当前数字人视频生成流程需要先录制绿幕视频训练数字人模型,再上传图片生成动作参考视频,最后生成口播视频。领导质疑这个流程的必要性,认为如果可以通过图片直接生成动作视频,为什么还需要先上传真人视频训练数字人模型,两个视频同时训练一个东西在逻辑上存在矛盾。另外,生成的视频存在背景抠不干净(有浅蓝/浅绿色阴影)的问题。
解决方案:
- 测试直接用图片创建数字人专家,不拍摄绿幕视频,对比效果是否一致
- 使用剪映等外部软件先抠背景再导入黑镜平台,效果可能比黑镜自带抠图更好
- 删除现有专家账号重新测试流程,验证是否必须上传真人视频
责任人: 江争达、陶西平 截止时间: 2025-12-16
问题2: VEO视频生成工具使用不当导致效果差
问题描述: 陶西平使用VEO Three生成分镜脚本视频时,使用中文prompt且首尾帧图片完全相同,导致生成的视频人物几乎不动,动作指令完全没有执行。对比领导用英文prompt生成的视频,手势动作完全按照指令执行。问题核心是:1)VEO Three对英文prompt的遵循效果远好于中文;2)首尾帧使用相同图片会导致视频没有动作变化;3)花了一周多时间但产出质量很差。
解决方案:
- 必须使用英文prompt,VEO Three对英文指令遵循效果最好
- 首尾帧应使用不同的图片,比如尾帧图片应该是往前走两步后的状态
- 多学习网上其他人的使用经验,如YouTube、Twitter、Reddit上的VEO使用案例
- 重新用英文prompt制作视频
责任人: 陶西平 截止时间: 2025-12-16
问题3: 前端重构缺乏明确目标和需求文档
问题描述: 江争达汇报前端重构工作时,PPT直接展示做成什么样,缺乏"为什么要重构"(Why)的分析。没有说明:1)前端具体存在哪些问题和案例;2)想要达成的目标是什么;3)理想的展示效果、交互体验是什么样的。领导严厉批评这种"没有需求文档就开发"、"先生成代码再倒回来补文档"的做法,认为这是思想懒惰的表现。
解决方案:
- 先明确目标,说清楚想要什么样的效果,画出设计草图
- 整理前端代码存在的具体问题案例,分析代码扫描和人工智能读取后暴露的问题
- 按照"Why-How-What"的逻辑结构重新组织汇报材料
- 需求文档必须先批准才能开发,不准先开发再补文档
- 需求可以分阶段开发,但必须有整体的阶段设计,不能走一步看一步
责任人: 江争达 截止时间: 2025-12-16
问题4: 汇报表述不清晰、逻辑混乱
问题描述: 多名成员在汇报时存在表述不清、逻辑混乱的问题。江争达解释数字人视频生成流程时反复说不清楚;陶西平解释VEO视频生成流程时也无法清晰表达是用首尾帧还是视频扩展。领导多次要求"你们回去好好学练习语文"。核心问题是无法用简洁明了的语言描述工作内容和技术流程。
解决方案:
- 汇报前先理清思路,用一句话概括核心流程
- 练习表达能力,学会用简洁语言描述复杂流程
- 汇报时按照步骤一二三清晰说明,不要东一下西一下
责任人: 江争达、陶西平 截止时间: 2025-12-16
问题5: 工具使用能力不足,不会学习
问题描述: 团队成员对AI工具(黑镜、VEO、Claude Code等)的使用能力不足,不会主动学习。领导指出:1)同样的工具在不同人手里效果完全不同,90分的工具用出50分都不到的效果;2)遇到问题不去网上搜索学习,而是闷头自己试;3)没有AI First的思维,不懂得利用AI来帮助分阶段、规划需求。
解决方案:
- 多上网学习,看YouTube、Twitter、Reddit上别人的使用经验和案例
- 遇到问题先用Deep Research等工具搜索解决方案
- 利用多个AI工具(GPT、Claude、DeepSeek等)交叉验证和获取建议
- 不要自以为是,要AI First,从别人那里学习
责任人: 江争达、陶西平 截止时间: 2025-12-16
问题6: 报告转写规则和风格提取困难
问题描述: 在做Gartner报告转写工作中,发现:1)转写后的英文翻译生硬(如"构建者"、"综合者"等不符合信通院用语习惯);2)AI痕迹明显,缺乏观点;3)风格规则难以精确提取,写多了约束可能偏,写少了表现不好;4)转写较忠实于原文用词,但信通院的专业术语和表达方式不同。
解决方案:
- 先提取每段要点总结,再重新生成文章,相当于把骨架抽出来重新填充
- 不必完全忠实于原文英文词汇,可以进行意义转写
- 使用NotebookLM做Deep Research,融合相关资料后再写
- 请信通院专家来审核和调整专业术语
- 转写后需要有检查优化的流程
责任人: 闫旭隆 截止时间: 2025-12-16
3. 下周工作安排
| 项目名称 | 负责人 | 下周会前目标 | 优先级 | 截止时间 |
|---|---|---|---|---|
| 🔴 数字人视频生成流程优化测试 | 江争达 | 测试不使用绿幕视频直接用图片生成数字人的效果:删除现有专家数字人,直接上传图片生成动作视频,验证是否可以省略绿幕拍摄步骤。同时尝试用剪映等外部软件先抠图再导入黑镜平台 | P0 | 2025-12-16 |
| 🔴 VEO3视频生成重新测试 | 陶西平 | 使用英文prompt重新测试VEO3视频生成功能,参考领导发送的英文prompt示例,确保指令执行效果。首尾帧需使用不同图片(如人物走动两步的图片) | P0 | 2025-12-16 |
| 🔴 问答系统前端重构需求文档完善 | 江争达 | 需求文档必须包含:1)明确的目标和期望效果(包括UI草图/设计图);2)现有问题的具体案例分析(代码扫描结果、组件冗余示例);3)为什么要重构的充分论证;4)分阶段的需求规划设计。需求文档未批准前不准开发 | P0 | 2025-12-16 |
| 🔴 视频制作学习与多模态工作流探索 | 郝倩玉 | 参与数字人视频的学习和制作,开通Gemini/API账号,探索如何将多模态能力(PPT生成、视频生成、图片编辑)融合到市场部工作中,形成高效的视频生产工作流 | P0 | 2025-12-16 |
| 🔴 数字人演讲视频制作 | 江争达、陶西平 | 为领导制作数字人演讲视频用于即将到来的演讲场合。需要:领导提供一张图片和声音,以及演讲稿文字内容,团队负责生成完整的数字人演讲视频 | P0 | 2025-12-16 |
| 🔴 会议纪要Skill全量处理优化 | 闫旭隆、郝倩玉 | 使用Gemini进行转写清洗,清洗后再用Claude做会议纪要;尝试压缩视频后上传Gemini;测试Gemini API直接生成 | P0 | 2025-12-16 |
| 🔴 投标商务应答自动生成系统Skill架构设计 | 郝倩玉、闫旭隆 | 周四客户交流后确定最终方案,从最新招投标响应文件提取企业信息作为基础库 | P0 | 2025-12-16 |
| 🔴 Gartner报告解读转写Skill架构设计 | 郝倩玉、闫旭隆 | 抓紧测试API(额度快到期),先提取每段要点总结再重新生成文章,使用NotebookLM做deep research后融合生成 | P0 | 2025-12-16 |
| Gartner报告转写优化 | 郝倩玉 | 继续优化报告转写效果:1)考虑分段提取要点后重新生成文章;2)调整prompt允许意译而非直译;3)处理图片提取和匹配插入;4)优化英文术语的中文表达 | P1 | 2025-12-16 |
| 知识库整理与管理 | 郝倩玉 | 接手知识库整理工作(从江争达处转交),系统化整理:1)市场部知识文档;2)云大哥相关知识;3)AIEC团队从成立至今的各类文档、文章、视频、会议纪要等 | P1 | 2025-12-16 |
| 前端重构问题反思总结 | 江争达 | 整理并总结代码问题的典型案例:1)记录哪些具体问题导致需要重构;2)分析问题成因;3)形成经验教训文档供后续学习借鉴 | P1 | 2025-12-16 |
| 数字分身方案调研及方案撰写 | 郝倩玉 | 继续调研市面上做得好的版本,研究自研还是定制化定位 | P1 | 2025-12-16 |
4. 组内成员工作进展
闫旭隆
上周完成:
- ✅ 会议纪要Skill开发:生成市场部需求相关会议纪要、主窗口加载转写文本优化、三种方式对比测试
- ✅ 需求澄清Skill专家博弈优化:可视化结果整理及录制视频
- ✅ Skill-designer-v1开发完成
- ✅ Gartner报告解读转写Skill架构设计及可行性单元测试
- ✅ 投标商务应答自动生成系统Skill架构设计
进行中:
- 🔄 会议纪要Skill全量处理优化(Gemini清洗方案测试)
- 🔄 Gartner报告转写优化(API测试)
收到的反馈/学习建议:
- 建议: 会议纪要skill技术选型基本确定,接下来是优化工作。建议把相关流程、需求、开发文档管理起来,形成1.0版本发布
- 建议: gemini视频上传问题建议尝试视频压缩,因为大量静止画面编码可以压缩;另外可以调用API而非界面端,稳定性会更高
- 建议: 清洗工作交给gemini处理更合适,因为gemini上下文更大;清洗后再用Claude做会议纪要
- 建议: skill开发设计时,建议先画一个大逻辑框架图,把大的模块架构先理清楚
- 表扬: 在自动化方向上的探索尝试是值得鼓励的,但现在是一步一步完善,不要期望一步到位
- 建议: Gartner报告转写skill需要考虑长上下文处理问题,单份报告可以拆开一段一段翻,把上一段翻译压缩后作为下一段的上下文
下周任务:
- 🔴 P0|会议纪要Skill全量处理优化
- 🔴 P0|Gartner报告解读转写Skill架构设计(API测试)
- 🔴 P0|投标商务应答自动生成系统Skill架构设计
- P1|Claude Code需求文档-Skill套壳Web前端交互测试
郝倩玉
上周完成:
- ✅ 会议纪要Skill架构优化(协助旭隆优化学习类+Q&A类会议纪要Skill逻辑)
- ✅ Gartner报告解读转写Skill架构设计
- ✅ 投标商务应答自动生成系统Skill架构设计(和开发人员讨论需求细节)
- ✅ 数字分身方案调研
进行中:
- 🔄 投标商务应答自动生成系统需求待明确(市场部反馈需求可能会变)
- 🔄 数字分身方案撰写
收到的反馈/学习建议:
- 无
下周任务:
- 🔴 P0|视频制作学习与多模态工作流探索
- 🔴 P0|会议纪要Skill全量处理优化
- 🔴 P0|投标商务应答自动生成系统Skill架构设计
- 🔴 P0|Gartner报告解读转写Skill架构设计
- P1|Gartner报告转写优化
- P1|知识库整理与管理
- P1|数字分身方案调研及方案撰写
陶西平
上周完成:
- ✅ 数字人PPT视频样本生成:完成数字人阶段一的样本视频
- ✅ 数字人与ppt结合:完成数字人讲解PPT视频生成步骤文档
- ✅ Gemini分镜脚本生成测试:完成veo3.1调研结果文档
进行中:
- 🔄 VEO3视频生成优化(需用英文prompt重新测试)
收到的反馈/学习建议:
- 批评: VEO Three工具使用错误:使用中文prompt,而VEO Three根本不认中文prompt,至少需要八个英文单词才能启动,导致prompt完全没有起作用,生成的视频动作和节奏完全没有执行指令
- 批评: 汇报表述不清:无法用简洁的语言说清楚工作流程,领导多次追问才能理解其工作内容,被批评"回去好好学练习语文"
- 批评: 工作方式偷懒:使用同一张图片同时作为首帧和尾帧生成视频,被批评为"把偷懒发挥到极致"、"完全不动脑子工作的最新最高境界"
- 批评: 工作效率低下:一整周时间都在做数字人视频,结果却不理想,被批评"效率太低了"
- 建议: 使用英文prompt:VEO Three需要英文prompt才能正常工作,应参考领导发送的示例提示词进行学习和改进
下周任务:
- 🔴 P0|VEO3视频生成重新测试(英文prompt)
- 🔴 P0|数字人演讲视频制作
- P1|继续推进数字人讲解ppt视频
江争达
上周完成:
- ✅ 问答系统V1.1前端重构:前端采用麦肯锡风格进行重构
- ✅ 数字人PPT视频样本生成:完成样本生成,完成制作步骤和费用分析
- ✅ Gemini分镜脚本生成测试:指导西平完成测试
进行中:
- 🔄 问答系统前端重构需求文档完善(缺少Why和目标定义)
- 🔄 服务器采购
收到的反馈/学习建议:
- 批评: 逻辑表达不清晰,思维混乱。在汇报数字人视频技术方案时,领导多次指出"你脑子就是乱的"、"东一下西一下的"、"逻辑全变了",要求其先理清思路再表达
- 批评: 对底层技术理解不透彻。关于黑镜数字人生成流程,领导指出"你们对黑镜根本没有了解清楚",质疑为什么需要先拍绿幕视频训练模型再用图片生成参考视频的必要性
- 批评: Cloud Code的PDF Skill功能没有研究透。领导明确指出"你们还没研究透它的PDF",要求深入研究PDF处理能力
- 批评: 前端重构缺乏明确目标和需求文档。领导严厉批评"你这不叫需求文档,你这叫开发动机"、"你连目标都不清楚,你能做出个需求文档出来"、"需求文档不批准的时候不准开发"
- 批评: 汇报缺乏案例支撑,只有空洞描述。领导指出"你缺乏案例展示别人是没有直观感觉的",要求展示具体的代码问题案例
- 批评: 先开发后补文档的做法错误。领导强烈反对"先生成代码再回头补文档"的做法,认为这是"糊弄鬼",明确表示"如果没有需求文档去开发以后就不要干了"
- 批评: 工具使用方法有问题。当说让AI严格按接口规范生成17个接口结果只生成9个时,领导指出"说明你一次生成17个是错的,你工具不会使用"
- 批评: 问答系统前端重构的PPT汇报逻辑混乱。领导评价"上来就是HOW,不是这样的,是WHY",批评缺少为什么要做这个决策的分析
- 建议: 需要从问题中吸取经验教训。领导建议"把这些问题找出来",分析为什么会出现不规范的现象,结果是因为之前什么原因造成的
- 建议: 汇报应该有完整的逻辑链条。需要先说明"饿不饿"(为什么要做),再说"吃什么"(怎么做),而不是上来就讲具体操作
- 建议: 前端设计需要先画草图和交互逻辑图
- 建议: 数字人视频流程需要验证是否真正需要拍摄绿幕。领导建议测试直接用图片生成动作视频,如果效果差不多,"那证明前面这个绿幕你们就是脱裤子放屁"
- 建议: Gemini API额度快到期(还剩一天),需要抓紧时间测试报告转写功能
下周任务:
- 🔴 P0|数字人视频生成流程优化测试
- 🔴 P0|问答系统前端重构需求文档完善
- 🔴 P0|数字人演讲视频制作
- P1|前端重构问题反思总结
- P1|服务器采购
三、会议总结
核心议题: 数字人视频生成、VEO3视频测试、问答系统前端重构、Gartner报告转写
关键决策:
- 需求文档不批准时不准开发: 针对江争达前端重构项目,领导明确指出在需求文档没有明确目标、没有经过批准之前,不允许进行开发工作
- 数字人视频工作流需要重新测试优化: 针对黑镜平台数字人视频生成流程,要求测试直接用图片生成数字人模型是否可行,如果效果相同则绿幕录制步骤是多余的
- VEO视频生成必须使用英文prompt: VEO对中文prompt执行效果很差,必须使用英文prompt才能获得好的指令遵循效果
- 视频生成工作由郝倩玉参与学习和制作: 考虑到视频将成为市场部重要方向,决定让郝倩玉加入视频学习和制作工作
- 知识库整理工作从江争达转交给郝倩玉统一负责: 系统化整理市场部知识、云大哥知识、AIEC团队各类文档
- 需求可以分阶段开发,但不代表需求没有阶段设计: 可以把所有需求都设计出来,然后分段开发,而不是想到多少算多少
- 转写报告风格规则需要调整,不完全忠于原文: 可以进行意义转写,更重要的是保持逻辑框架和数据引用的准确性
- 采用先提取每段要点再重新生成的工作流: 针对报告转写的优化方案,先做每一段要点的总结,把骨架抽出来,然后基于骨架重新生成文章
下周工作重点:
- 🔴 数字人视频生成流程优化测试,验证是否需要拍摄绿幕视频
- 🔴 VEO3视频生成重新测试,使用英文prompt
- 🔴 问答系统前端重构需求文档完善,补充Why和目标定义
- 🔴 视频制作学习与多模态工作流探索(郝倩玉)
- 🔴 数字人演讲视频制作
- 🔴 会议纪要Skill全量处理优化,使用Gemini进行清洗
- 🔴 投标商务应答自动生成系统Skill架构设计,周四客户交流后确定方案
- 🔴 Gartner报告解读转写Skill架构设计,抓紧测试API
纪要整理人: Claude 纪要时间: 2025-12-09 下次会议: 2025-12-16