Files
AIEC_Skills/会议转写测试/会议视频转写-gemini/会议视频转写-1.txt
2025-12-11 14:19:36 +08:00

587 lines
32 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

以下是该视频内容的逐字语音转写及画面内容提取:
**画面内容:** 视频开始,画面全黑。随后屏幕中央显示白色文字:“信通院云大所市场部-张媛媛”。
**发言者(闫旭隆):** 呃我看用媛姐正好开组会好像不太...不太方便。
**发言者(连云波):** 嗯。对。我记得好像...学号...或者是学号过去更好。
**发言者(闫旭隆):** 呃,可以啊。
**发言者(连云波):** 它这个叫什么专业版?尚未认证。
**发言者(闫旭隆):** 专业版。应该是个人的吧,感觉,个人的。
**发言者(连云波):** 如果是企业版,那就可以选好几个账户了。
**发言者(闫旭隆):** 嗯,嗯,对。
**画面内容:** 00:28 画面出现白色加载圆圈。
**发言者(连云波):** 我叫他了。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 听得到吧焦老师?
**发言者(焦老师):** 嗯听得到。
**发言者(连云波):** 喂?听得到吧焦老师?
**发言者(焦老师):** 喂?喂?听得到。
**发言者(连云波):** 喂?
**发言者(焦老师):** 你...你那没声音?
**发言者(连云波):** 没声音吗?
**发言者(焦老师):** 能听到,但是就是说...你那是不是没听到我声音?
**发言者(连云波):** 听到了呀。
**发言者(焦老师):** 昂。
**画面内容:** 01:05 屏幕变黑。01:09 屏幕显示“信通院云大所市场部-张媛媛”。01:14 屏幕变黑。01:20 画面切换显示 Windows 桌面,正在打开一份 Excel 表格标题显示“P0项目进展情况”。01:23 画面切换至微信电脑版界面。
**发言者(连云波):** 那个,关于这个会议纪要这个...基本上找到一条路径了。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 这条路径...我看一下啊,这里面应该能不能找到。
**画面内容:** 01:36 微信界面点击切换到与“江达”的聊天窗口显示发送过一个名为“20251201-问题摘录...md”的文件。
**发言者(连云波):** 这条路径...呃...我是发给过你是吧?
**发言者(闫旭隆):** 嗯,是不是...
**发言者(连云波):** 不行你你你来那个...分享那个。你把我发给你的那个对话...
**发言者(闫旭隆):** 不在这里啊,应该是个人的。
**发言者(连云波):** 好像是发给我的那个...但是你只截了个图。
**画面内容:** 02:07 微信界面点击切换到与“连云波”的聊天窗口。02:11 打开一张聊天记录截图。02:14 滚动浏览微信聊天记录,显示关于 Gemini 的讨论内容。
**发言者(闫旭隆):** 不知道你发没发截图...
**发言者(连云波):** 哎哟,我也我也...稍等啊...
**发言者(连云波):** 那我就描述一遍吧我这个。
**发言者(闫旭隆):** 行。
**画面内容:** 02:32 切换至 Google Chrome 浏览器,显示 Gemini 界面标题为“信息系统建设方案书工作指导”。02:37 点击浏览器插件栏。
**发言者(连云波):** 我一直认为那个...我们的语音现在识别是不是...因为会议纪要识别效率很低嘛。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 我一直认为纯粹的语音,它因为好多背景信息都是没有的。文字它不知道的,我们的文字稿它不知道。我们的这个视频,它也不知道,对吧,我们的切换它也不知道。
**发言者(连云波):** 所以从这个角度来说,多模态以后一定是做文字识别的最重要的一个...或者说最...最...最终的路径。
**发言者(连云波):** 后来呢...上周那个Gemini出来之后...我觉得是...非常好。然后我就拿那个...那个视频去测试了一下我和...正好我跟江南达开了大概半小时的会议。
**画面内容:** 02:58 浏览器中点击右侧历史记录打开名为“信息系统建设方案书工作指导”的对话记录。页面显示上传了一个名为“2025112618...的继续会议-视频.mp4”的文件。
**发言者(连云波):** 我记得我上传中国最多一个小时的。半个小时的会议我上传上去了。上传上去之后我让他原文转写我这所有视频里的...这个文字稿。你们大家往下看一下啊。
**画面内容:** 03:01 页面向下滚动,显示 Gemini 输出的“时间轴00:00-03:40”及其对应的文字描述内容。
**发言者(连云波):** 基本上...你看,它是...呃...可以看得到什么Lian正在操作电脑查找文件。
**发言者(闫旭隆):** 对吧。
**发言者(连云波):** 然后画面静止黑屏连接,往下可能还有吧。
**发言者(闫旭隆):** 对,开始讲解。
**发言者(连云波):** 它里面是什么呢?当然也有很多其实画面就没有没有...没有变化了。它现在...我特意对了一下,基本上...没有错误的那个单字了。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 没有了。更重要的是什么?这个模型...最厉害的是...它本身就是多模态的你可以什么你可以对这个视频需要提取的内容直接用prompt来进行调整。
**发言者(闫旭隆):** 知道吧?
**发言者(连云波):** 所以有可能...最厉害的做法,如果它具备这样的能力的话,原字能够写好的话,如果我们测试下来确实很好的话...直接给它一个会议模版...
**画面内容:** 04:42 页面继续向下滚动,显示更多文字转写内容。
**发言者(连云波):** 你就可以...就把视频给它,给它一个会议模版,它就有可能直接生成,就一步行之到位了。
**发言者(连云波):** 那方法有可能在Gemini上做也有可能...直接...我...或者...那个Gemini里面也有那种Gem...那种...
**画面内容:** 05:04 视频画面黑屏。05:07 视频画面恢复显示浏览器 Gemini 界面。05:15 点击浏览器左上角的 Gemini 图标回到主页。
**发言者(连云波):** 呃...要不我上回我先好像忘了好一点了,我上回把它共享吧。
**发言者(连云波):** 那,这里面有...有一个这个...Gem...就是在...就有点像什么呢?那比如说...
**画面内容:** 05:57 鼠标点击“Writing editor”图标。06:02 进入 Writing editor 界面。
**发言者(连云波):** 哦,稍微有点慢啊。那,它是可以...里面好多定义的你可以自定义自己的Gem就是在这里面你把会议纪要什么那个模版全部放进去。
**画面内容:** 06:14 点击输入框左侧的“+”号,显示上传文件选项。
**发言者(连云波):** 然后你把视频上传给它,在这里面你可以把视频上传给它,比如说在这把视频上传给它。上传给它之后根据你的这个会议纪要...呃那个模版,就自动给你生成。
**发言者(连云波):** 所以这个是我找到的目前最有效的路径。所以Gemini大家肯定要用了因为它的多模态能力是最强的而且它上下文是最长的。
**发言者(连云波):** 好吧?那这回我交给那个...旭隆,去白薅一个月的,你们先薅一个月试试看。对吧,那个通过上它那个...试用用户。
**发言者(闫旭隆):** 是。
**发言者(连云波):** 呃,那到时候你把那链接分享给大家就行了。
**发言者(连云波):** 其实...我用下来Gemini目前...就是...应该说...就是...能力是最全面的。不应该说不一定是最聪明的啊...就最聪明我现在觉得GPT...GPT那个5.1啊,还是聪明。
**发言者(连云波):** 但是最全面的...就是就是这个...Gemini。而且它最强最强的是它多模态尤其是视觉能力是超强超强的。强到你都不敢想象。
**发言者(连云波):** 呃,我这段时间用下来我看外网的...所有Gemini的这个介绍。我到时候告诉你们我用它来做PPT的过程。
**发言者(连云波):** 好吧。所以,这个...是我觉得大家一定要用好Gemini至少在接下来的这这这个一段时间里面可能除非有下一个模型超越它了。就这个用好主要就是赋能我们日常的工作。
**发言者(连云波):** 嗯...我先把它用来做会议纪要的这个转写。对吧,只要有了会议纪要转写之后,这些东西留下来之后,你看视频也留下来之后...后面能做很多很多很多加工的工作。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 知道吧?
**发言者(闫旭隆):** 嗯嗯。
**发言者(连云波):** 这就非常非常容易,就后面包括学习啊,包括研究啊,什么都可以再在这个...我们这个视频或者说这个转写的基础上面。
**发言者(连云波):** 所以我们下接下来会...看看第一,我们的那个视频怎么保存。它现在因为大量的重复静止的画面嘛,就其实压缩下来就效...那个叫什么...视频压缩的那个大小,或者说整个文件的这个...提...体积不会太大的。
**发言者(连云波):** 所以我觉得可以考虑一下把视频作为一个...作为我们以后素材留下来,因为它它是最全面的。文字也有了,对我如果转写的文字也有了。文字、图像、音频都在里面。好吧,所以把这个留下来。
**发言者(连云波):** 第二个呢...就是多模态一定是我看到的未来...最接近...就最...最...说呢,使用起来最方便的一个模型。它不用你专门去再思考怎么去转换。
**发言者(连云波):** 呃到时候我再告诉大家。好吧所以这个从这个角度来说给大家的建议就是Gemini这个Pro...1.5 Pro这个模型一定要用起来了。而且我还没来得及使用它...外网是非常非常的火爆利用...我还没利...来得及使用它做那个...编程。大家认为编程它的前端...我自己试下来的前端...已经...不需要再有什么...任何模型什么其他复杂的造作了。那给他一句话,他一个前端就全部给你做好了。非常非常的好。而且做出来的效果比一般人做都好。
**发言者(连云波):** 好吧,所以...能用它来做非常多的开发工作。非常非常多。好吧,所以前...我现在给大家推荐什么就是前端用Gemini。对吧然后...中间逻辑...整个代码的构造部分就用那个...Cloud。然后整个项目的...如果可以的话...如果在有的话就是整个项目的那个...修复或者说整个的这个查找问题或者整个测试可以用Gemini...那个什么GPT的那个Codex。他们三个应该是这么来理解。但是如果说只有一个那也是能用的。好吧在最好的组合可能就是这样的。但是不管怎样你得首先把它每一个工具里面的擅长搞清楚。那主力我现在用下来还是Cloud Code。主力还是Cloud Code。
**发言者(连云波):** 所以我现在基本上Cloud Code...为什么主力是Cloud CodeCloud Code是因为它的工具调用能力目前无人能及。就它的工具调用和工具理解能力是没有人能赶过它的。所以我们做Agent的话...对于工具的理解肯定是第一位的。
**发言者(连云波):** 好吧。行吧,先先这么多。你先接着往下。所以会议纪要这个事情就是这样的。
**发言者(闫旭隆):** 嗯。那先会议纪要。
**发言者(连云波):** 嗯。
**画面内容:** 10:17 屏幕黑屏。10:24 屏幕恢复显示浏览器界面。10:39 切换至 Windows 桌面,显示文件夹内容。
**发言者(闫旭隆):** 呃...会议纪要Skill主要是...改了一下整体的架构。就之前是用那个索引...搜索。
**发言者(连云波):** 嗯。
**发言者(闫旭隆):** 然后我改成了就是全量的...
**发言者(连云波):** 全量读取。
**发言者(闫旭隆):** 确实确实可以。
**发言者(连云波):** 可以的是吧?
**发言者(闫旭隆):** 确实可以。
**发言者(闫旭隆):** 然后我...大概演示一下那个...
**画面内容:** 11:15 打开文件夹 `AA_Work` -> `skills合集` -> `.claude` -> `skills` -> `meeting-minutes-generator-v1`。11:32 打开文件夹内的 `Phase2执行流程图.drawio` 文件。
**画面内容:** 11:42 `draw.io` 软件正在加载。11:48 打开了流程图,标题为“工程类会议纪要 Skill 执行流程图”。
**发言者(闫旭隆):** 这个是那个映射逻辑。
**发言者(连云波):** 哦。
**发言者(闫旭隆):** 就是每...每一...每一个的...每一个字段...每一个字段的来源。
**发言者(连云波):** 嗯。
**发言者(闫旭隆):** 来源,就是画了一个映射逻辑的图。
**发言者(连云波):** 你在Skill里面会把它这样的逻辑写进去吗
**发言者(闫旭隆):** 对。
**发言者(连云波):** 我跟你说...你这个很重要。我自己在做Skill过程当中啊...我总有时候觉得Claude自己的逻辑...清晰。它容易瞎改。而且改完之后它...改前忘后,改后忘前。
**发言者(闫旭隆):** 对。
**发言者(连云波):** 好人。目前...我认为它现在最...最...最缺的就是逻辑的一致和前后的连贯性。
**发言者(闫旭隆):** 这个算是工程类的,就是每一个字段的来源。包括...一些就是上周都提到的...负责人要改为原负责人。
**发言者(连云波):** 哦。
**发言者(闫旭隆):** 就是第一个字段代表着这个项目原本交给谁了。然后...呃...
**发言者(闫旭隆):** 截止时间我也改为原截止时间,就是上周会议纪要定下的这个任务的截止时间。
**发言者(闫旭隆):** 然后改动还有...最核心就是那个Agent内部它是全量读取的。
**发言者(连云波):** 其实把这个做完。
**发言者(闫旭隆):** 然后...那个...哦对,还有这个。这个上周没提...没提到就是...不是没提到,就是上周发现它那个进展情况应该以会议转写为优先。
**发言者(连云波):** 啊改进去。
**发言者(闫旭隆):** 这个也改进去了。
**发言者(闫旭隆):** 然后下周逻辑我也顺了一下,也是应该优先,就是会议转写优先。
**发言者(闫旭隆):** 然后我...我测下来发现它可能最...最大的问题还是那个文字的语义识别...就交给谁了,交给谁了...
**发言者(连云波):** 目前...我我就觉得就是...目前会议纪要里面最头疼的一件事情就是文字转写的准确性和上下文的...这种叫约束能力。这两个是最核心的。你转写能力如果不清晰,然后没有又没有很好的约束,那它基本上...因为我们是在...已经非常清晰的上下文背景下来开这场会议的。
**发言者(闫旭隆):** 对。
**发言者(连云波):** 它是不知道的。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 所以这些上下文不给它它是很难处理的。
**发言者(连云波):** 所以从这个角度来说...后面...到底怎么...就是怎么来怎么怎么用什么样的工具。比如说到底还是继续用Claude这个来Skill来做这个Claude的这个这个来来处理会议纪要还是用Gemini。比如说文字出来之后用谁来...谁谁来处理。
**发言者(连云波):** 因为有可能不行就调Gemini那个API。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 然后在Cloud里面调Gemini的API来做。
**发言者(闫旭隆):** 对。我觉得这样自动化程度更高。
**发言者(连云波):** 对。然后API现在我看好像还行。我们这个...如果转写成文字了也没多少。
**发言者(闫旭隆):** 嗯。还行,还可以。
**发言者(连云波):** 我记得好像半小时6000多字嘛。一分钟200多字嘛。
**发言者(闫旭隆):** 对。差不多。
**发言者(连云波):** 6000多字你就算一个拥...5个小时不也才3万字嘛。3万字也就差不多2万多个token。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 2万多token对于它20万token来说...哦对于它100万token来说太小了。
**发言者(闫旭隆):** 对吧。
**发言者(连云波):** 嗯,所以我说这个都是可以考虑的。
**发言者(闫旭隆):** 呃实在不行就切开组。
**发言者(连云波):** 好吧所以这个没关系的按照这个Skill先往下走通过这个Skill来...来来...先把整体的那个识别...工作Gemini做完之后再用这个Skill来加工。
**发言者(闫旭隆):** 嗯,我觉得可以。
**发言者(连云波):** 我觉得那个就是有点高。
**发言者(闫旭隆):** 下周工作安排。
**发言者(连云波):** 你知道吧,整个会议最重要的,是下周的工作安排。以后你们一定要知道,开会的目的不是为了...首要目的是为了解决问题。其次才是为了分享知识。分享知识其实不完全一定需要工作里面讨论的。对吧,不一定是要周会的。有的时候就直接在...我们里面就直接分享了,讨论也避开。所以只有会议纪要是需要大家共同坐在一起的。
**发言者(连云波):** 尤其是未来以后我们如果人多了,项目分散以后就更是了。
**发言者(连云波):** 好吧,每人每个人都做一部分,那完全需要一个大项目,对吧,有人负责前有人负责后。就需要信息沟通。
**发言者(连云波):** 好吧,所以整个这个...会议里面最核心最核心的目的是为了得到下周的工作安排的合理安排。
**发言者(连云波):** 所以一切一切的逻辑都是往这儿聚的。能把这个写清楚,基本上大部分都问题不大了。因为你前面你想想,你信息...前面的信息得提取正确,你汇报的信息得提取正确,然后才能...逻辑理顺清楚,然后才能得出下周工作纪要。
**发言者(连云波):** 好吧。所以我说这个是非常非常重要。
**发言者(闫旭隆):** 嗯,然后...基本上...基本上这些其实都是要以那个文字转写...为为...最优先。
**发言者(连云波):** 对。下周工作安排一定是文字转写。
**发言者(闫旭隆):** 是的。
**发言者(闫旭隆):** 所以这些下周任务也基本上是...周报作为补充。
**发言者(连云波):** 补充嘛。对,基本上所有的都是...上下文,每一个都要给它一个上下文。
**发言者(闫旭隆):** 对。
**发言者(连云波):** 但是这里面有一个问题,你是每一次都是分...比如说...这些目标啊...是一次性的提取完成,还是说分次提取?一次性提取完成?
**发言者(闫旭隆):** 我是并行用搜索Agent。
**发言者(连云波):** 并行的。
**发言者(闫旭隆):** 对并行搜索Agent去搜然后把搜到的信息都反馈给主窗口然后主窗口负责读所有的信息然后写。
**发言者(连云波):** 哦。
**发言者(闫旭隆):** 那么再看那个整体的那个。
**发言者(连云波):** 我这...不,我的意思等会看那个结果。就啥意思呢,就这个方法,我觉得...呃...比较...就是清晰。但是...第一,我觉得它这个资源浪费太大了,每...每一个过程全部全量处理一遍。
**发言者(闫旭隆):** 对,这一个。
**发言者(连云波):** 这个肯定是太浪费了。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 第二个...会造成逻辑的割裂。因为你要在主窗口...主上下文窗口里面...我已经再去做一个...
**发言者(闫旭隆):** 我我我自己的改造啊,我试了。
**发言者(连云波):** 那个下周逻辑,就是大概这样。
**画面内容:** 18:03 闫旭隆在流程图中点击查看“三、会议总结...”部分。
**发言者(闫旭隆):** 呃,对,这个就是...映射逻辑。
**发言者(连云波):** 对。
**发言者(闫旭隆):** 然后可能...还有一个点是它识别...下周任务的时候...P0...它是根据语义来识别。
**发言者(连云波):** 比如领导说紧急...什么优先...
**发言者(闫旭隆):** 它就会识别为P0。
**发言者(连云波):** 对。就这个里面,这个是最难的。
**发言者(闫旭隆):** 对对对。
**发言者(连云波):** 就是...作为...我跟你说实话,如果它能做得到,比你们都强。
**发言者(闫旭隆):** 确实。
**发言者(连云波):** 因为因为人第一啊,我看你们现在的能力是低...目前...对于...就是整个项目里面的轻重缓急判的没那么清晰的。第二,我跟你说实话,你们都忘的。就说了这么多之后你们早就忘掉了。
**发言者(闫旭隆):** 对。
**发言者(连云波):** 会议当中内容你们早就忘掉了。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 你知道吧?有好度重要的就说到弄...所以你提取不出来的。
**发言者(连云波):** 所以它如果能提取出来,你可以这样...你可以让它给个建议。
**发言者(闫旭隆):** 明白吗?
**发言者(连云波):** 你让它先给出建议不要上来就生成P0。
**发言者(闫旭隆):** 建议优先级。
**发言者(连云波):** 哎建议排序是什么。然后人再给它一个反馈。
**发言者(闫旭隆):** 哦。
**发言者(连云波):** 这个里面是最重要的。就每个人,你看啊,每个人...其实都会得出一个你们下周工作的P0到P2的。
**发言者(闫旭隆):** 对吧。
**发言者(连云波):** 最好是让它发给你们。生成之后,每个人生成一个这个之后给你们确认一下。
**发言者(闫旭隆):** 对吧。
**发言者(连云波):** 给你们确认一下。这个是最好的。
**发言者(连云波):** 这样的话呢...把这个确认过程所有的材料你都保留下来。作为后续的强化学习也好啊,微调也好啊...
**发言者(闫旭隆):** 就知道,它就知道以后...
**发言者(连云波):** 知道了。不然的话它每次只能固定在这里。它每次就提取出来就是这么着,就是这样。它也没法优化。
**发言者(闫旭隆):** 明白。
**发言者(闫旭隆):** 嗯对,这个就是映射逻辑。
**发言者(连云波):** 嗯。
**发言者(闫旭隆):** 然后,你看所有的最后都是要到下周重点的。
**发言者(连云波):** 是。
**发言者(连云波):** 好吧。
**发言者(闫旭隆):** 嗯。
**发言者(闫旭隆):** 然后Skill的执行流程...
**画面内容:** 20:49 滚动查看 `draw.io` 文件中的“Phase 2: 工程类会议纪要生成 - 并行执行流程图”。
**发言者(闫旭隆):** 主要就分两步。
**发言者(连云波):** 哎,我告诉你们啊,现在已经有个新的...drawIO有一个开源项目有一个叫AI drawIO了我今天上午发给你们看啊。它这里面可以...就是你生成drawIO不是有有些错误啊什么的吗逻辑上有问题吗。你可以在这个里面直接...但是它要那个什么...它要API的。它要API它不要钱。但是API要用...就Gemini内个...我觉得它那个免费的API那个调用次数肯定是够用的。
**发言者(闫旭隆):** 嗯,那就行。
**发言者(连云波):** 对。所以你们用它可以直接在这里面修改。所以drawIO以后可能用起来更方便。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 另外一个到时候告诉你们可能有Gemini直接生成...现在不能修改啊,它直接生成可能...或者直接生成矢量图也是一种方案。
**发言者(闫旭隆):** 嗯。
**发言者(闫旭隆):** 这个就是工程类会议纪要的...流程...从上往下的。
**发言者(连云波):** 呃Phase 1就是...
**发言者(闫旭隆):** 呃Phase 1就是一些输入数据...这个是都加载到了主窗口然后子Agent也都没加载。就是搜索Agent每次都会加载。
**发言者(连云波):** 加载这些所有数据是吧?
**发言者(闫旭隆):** 对,所有数据。
**发言者(连云波):** 嗯。
**发言者(闫旭隆):** 然后...呃...Phase 1是刚刚那个...输入数据的加载。
**发言者(连云波):** 啊。
**发言者(闫旭隆):** 然后...会议信息就是主窗口直接生成。因为主窗口已经有有这些了。就是已经足够生成。
**发言者(连云波):** 等会你这个P0任务列表是...是谁是上一个从会议转写里面出来的吗?
**发言者(闫旭隆):** 呃不是P0任务是...上周会议纪要...如果是有一个上周P0任务...
**发言者(连云波):** 你这两个P0任务列表我说了P0任务...
**发言者(闫旭隆):** P0任务列表是...它确定,就是它会整合...
**发言者(连云波):** 就是映射。
**发言者(闫旭隆):** 这个这个可能它是...呃...哦,我判断...啊整...重合...呃去重之后然后它给了子Agent。
**发言者(连云波):** 我是你意思。P0任务列表是指周报P0任务列表。那你写上。
**发言者(闫旭隆):** 就本周...
**发言者(连云波):** 周报,周报任务列表。这就不清晰了。周报。
**发言者(连云波):** 那个上周P0任务写...上周纪要的P0任务。对吧
**发言者(闫旭隆):** 对。
**发言者(连云波):** 嗯。
**发言者(闫旭隆):** 呃,这个...这个好像...这个任务列表...应该是它去重之后的。
**发言者(连云波):** 对。
**发言者(闫旭隆):** 它去重就是...呃...这两块去重之后形成了一个最终的P0任务列表。然后它就传递给子Agent的时候是会传递这个信息。就让子Agent知道我现在已经确认了...P0任务有哪些然后去搜索。交给子Agent去搜索。这也是给子Agent的一个上下文。
**发言者(连云波):** 那你给它那个上周P0任务...纪要里的P0任务是...周报的P0任务列表是指把所有人里面的P0任务列表全部提取出来了是吧
**发言者(闫旭隆):** 对。提取出来之后每个人生成一个...
**发言者(连云波):** 对,然后还有上周纪要的都整合起来,去重一下。
**发言者(闫旭隆):** 对。
**发言者(闫旭隆):** 然后就是并行提取。就是并行提取它会根据那个...会议纪要模版的字段...判断...就是哪些字段,刚刚那个映射表里需要涉及到...所有的字段。
**发言者(闫旭隆):** 呃...不是所有字段,主要是涉及到需要去文字转写里面去搜索。
**发言者(连云波):** 嗯。
**发言者(闫旭隆):** 就差不多是所有字段。有有很多字段都要去...都要依据那个文字转写去搜索。就是会议的转写文字。
**发言者(闫旭隆):** 它每次去搜的时候会调用这个Agent。所以这个Agent是通用的。只是...也不是通用,它里面是预设了很多种任务类型,然后...呃对,每一种任务类型它返回做了一个...Json的格式的约束。
**发言者(闫旭隆):** 所以它就...呃...能够并行执行。然后只要只需要主Agent交给它任务...输入是什么,输出是什么。
**发言者(连云波):** 嗯,懂了。呃...你是到里面去搜索是吗?
**发言者(闫旭隆):** 呃不是搜索。就是...就是全量加载嘛。全量加载,然后给它任务,自己去找,自己执行。不叫搜索。
**发言者(连云波):** 叫搜索是很容易出问题的。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 你知道为什么?就人的语言里面有大量的...
**发言者(闫旭隆):** 跳脱。
**发言者(连云波):** 对,就是...就就很多语言是不清晰的。所以我们会议当中很多语言没那么清晰,你直接搜索是搜索不出来的。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 但是...人只能上下文它通过上下文Attention的处理它是能够理解这个...能够把这东西可能能提取出来。
**发言者(连云波):** 如果你搜索你RAG你是绝对RAG不出来的。
**发言者(闫旭隆):** 嗯。对吧。对吧。
**发言者(闫旭隆):** 然后搜索并行完之后就每一步都会...项目进展都会...每一步把...这些都是我预设的Json就是每一个任务会对应不同类型然后它根据那个类型会反馈出这些我要的信息。
**发言者(连云波):** 那我问你一个问题。你把这几个问题同时合到一个问题...就传给它。就几个Agent并发的时候我把这几个全部合进到一个里面让它执行。
**发言者(闫旭隆):** 因为都是加载一次性全量的。
**发言者(连云波):** 嗯。
**发言者(闫旭隆):** 嗯...合并...行肯定是行。
**发言者(连云波):** 行肯定是行。
**发言者(闫旭隆):** 呃我现在...也行。但是...我现在就是靠主窗口,其实...我觉得每一个Agent...
**发言者(连云波):** 啊你现在是把所有的东西全加载到主窗口了?
**发言者(闫旭隆):** 呃对就就靠主窗口来进整合对。可能每一个Agent它只执行特定任务会找得更多一点。然后...意思它冗余重叠部分更多,它主窗口可能也更好给它整合出来。
**发言者(连云波):** 嗯,明白。
**发言者(连云波):** 那我问你,你主窗口里面...上下文其实也是,就是所有的上下文也都是加载的。
**发言者(闫旭隆):** 主窗口...包括...包括你...
**发言者(连云波):** 输入数据是给它了对吧?
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 然后你上周转写文本给它了吗?
**发言者(闫旭隆):** 也给...没给它。没给它。
**发言者(连云波):** 没给它...除了转写文本都给了。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 也就可能也能给。谁肯定能给。我听下什么意思...就是你接下来可能要讨论一个问题啊。这种方式是比较...可能是比较精准的。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 但是...逻辑会割裂的。就是你每个Agent提取出来东西...直接给到主Agent主Agent的时候...它没法建立起每个之间的相关关联性。
**发言者(闫旭隆):** 呃...相关关联性我是给它写了那个啥...
**发言者(连云波):** 嗯。
**发言者(闫旭隆):** 就是这些Agent...
**发言者(连云波):** 出来了。
**发言者(闫旭隆):** 出来之后我会给每一种返回的形式做一个映射的约束就是把我那个映射规则体现在这个Skill.md里。就是它主窗口接收到每一种类型的返回之后它会根据这每一种类型的返回去按照我给它的...给它的方法论去映射,然后...然后一起去合并整个主窗口。
**发言者(连云波):** 行。我我我...先看个结果啊。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 我这...不,我的意思等会看那个结果。就啥意思呢,就这个方法,我觉得...呃...比较...就是清晰。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 但是...第一,我觉得它这个资源浪费太大了,每...每一个过程全部全量处理一遍。
**发言者(闫旭隆):** 对,这一个。
**发言者(连云波):** 这个肯定是太浪费了。
**发言者(闫旭隆):** 嗯。
**发言者(连云波):** 第二个...会造成逻辑的割裂。因为你要在主窗口...主上下文窗口里面...我已经再去做一个...
**画面内容:** 视频结束。