Files
AIEC_Skills/会议转写测试/20251202会议转写/腾讯会议清洗后_2025-12-02.md
2025-12-11 14:19:36 +08:00

628 lines
141 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

**会议日期**2025-12-02
**参会人员**:连云波、闫旭隆、江争达、郝倩玉、陶西平
---
---【话题:会议开场与网络调试】---
【连云波】我因为袁姐正好开组会好像不太方便对我记得好像企业它肯定是企业他还是过一个人。他这个叫什么专业版尚未认证专业个人的感觉个人的。我这企业版的给选好几个账户对。那我叫他了听得到吧教老师听得到吧掉落者r61。
【江争达】:听得到。喂听得到你你那儿没声音?
【连云波】:没声音吗。听到了。
【江争达】:能听到,但是你那是不是没听到我声音?
【连云波】:对了。
---【话题gemini做会议纪要的探索】---
【连云波】:关于这个会议纪要基本上找到一条路径了,这条路径我看一眼这里面应该能不能找到。
【连云波】:这条路径我是发给过你了,不行你你你来分享一下。你把我发给你的?那还是他的个人发给人家当主管的位置,但是你只截了个图,因为我的网络。先收了很多钱。
【连云波】:我一直认为我们的语音现在识别是不是因为会议纪要识别效率很低,我一直认为纯粹的语音,它是好多背景信息都是没有的文字他不知道的,我们的文字稿他不知道。我们的这个视频他也不知道我们的切换他也不知道,所以从这个角度来说,多模态一定是以后做文字识别的最重要的一个,或者说最最终的路径。
【连云波】后来上周那个界面出来之后我觉得是非常好然后就拿这个视频去。测试了一下我和赵浩文我跟他开了大概半小时的会议我记得我上次用过最多一个小时的半个小时的会议我上传上去了然后你说我让他原文转写我的所有事情的这个文字稿。你们大家往下看一看基本上你看它是那可以看得到什么那连正在操作电脑看查找文件。然后画面禁止黑屏连接往下可能还有开始讲解它里面是什么但是也有很多就是画面就没有变化了。他现在我特意对了一下基本上没有错误的这个单字了没有了更重要的是什么这个模型。最厉害的是它本身就是多模态的你可以什么你对这个视频是要提取的内容直接用prompt来进行调整你知道吧所以有可能最厉害的做好了如果他具备这样的能力的话原字能够写好的话如果我们测试下来确实很直接给他一个会议模板。你就可以把视频给他一个会议模板判决可能直接生成就一步心理到位。方法有可能在节目单上做也有可能直接回头那个gemma里面也有这种jam那种。
【闫旭隆】:我要不我上回,我现在网络好一点,我上回我把它共享。
【连云波】:什么声音稍等。
【连云波】对这里面有一个这在就有点像什么那比如说。我比较慢的它是可以里面有好多定义的你可以自定义自己的这就是在这里面你把会议纪要什么那个模板全部放进去。然后你把视频上传给他在这里面你可以把视频上传给他就是在这把视频上传给他之后根据你的这个会议纪要二个模板就自动可以生成。所以这个是我找到了目前最有效的路径所以这大家肯定要用了因为它的多动态能力是最强的而且上下文是最长的那天我交给那个。徐龙就白好几个月的你们先好几个月试试看通过上传的企业用户那到时候你把那链接分享给大家就行了我用下来目前。就是能力是最全面的不说不一定是最聪明的就最聪明。我现在觉得GPG那5.1还是聪明。最全面的就是这么大的它最强的是它多模态尤其是视觉能力是超强强到你都不敢想象。我这段时间用下来后看外外网的所有的界面来的这个介绍我待会告诉你们我用它来做PPT的过程所以是我觉得大家一定要用好GMI至少在接下来的这个一段时间里面可能除非有下一个模型超越它了就这个用好主要是赋能我们日常的工作。
【连云波】:那我现在把它用来做会议纪要的这个转写人有了会议纪要转写之后,这些东西留下来之后,你看视频也留下来,就是后面能做很多加工的工作。知道了,这就非常容易就后面包括学习,包括研究什么都可以在这个我们视频或者说这个转写的基础上,所以我们在接下来会。看看第一的那个视频怎么保存,就他现在因为大量的是重复静止的画面,就压缩下来就效那个叫什么?就视频压缩的大小,或者说整个的文件的体量不会太大的,所以我觉得可以考虑一下,把视频作为一个。作为一个我们这个素材留下来,因为它是最全面的文字也有文我转写的文字也有了文字图像,音频都在里面,就把留下第二个?就是多模态,一定是我看到的未来就是最接近就是最对什么使用起来最方便的一个保险,它不用你专门去在思考怎么去转换。待会我再来,所以从这个角度来说,给大家的建议就是在模型一定要用起来,我还没来得及使用它外网非常的好的例子,我还没有来得及使用它做那个。
---【话题:模型工具组合建议】---
【连云波】编程大家认为编程它的前端也我自己试下来的前端不需要再有什么这个模型其实还蛮复杂的操作的你给他一句话。他一个前端就全部给你做好非常好但是做出来的效果比一般人做的都好能够用它来做非常多的开发工作。前我现在给大家推荐的就是前端用ja然后中间逻辑整个代码的构造部分就。这个cloud然后整个项目的如果可以的话再有的话就整个项目的修复或者说整个的查找问题或者整个。
【连云波】测试可以什么GPT的那个codex他们三个是这么来的但是如果说只有一个那也是能用的在最好的组合可能就是这样但是。不管怎样你得首先把它的每一个工具里面的擅长搞清楚那么主力我现在用下来还是搞得主力还是cloud code所以我现在基本上cloud code。为什么处理是因为它的工具调用能力目前无人能及它的工具调用和工具理解能力是没有人能改过的所以我们做agent的话。对于工具的理解肯定是第一位的。行吧先这么多你先接着往下所以会议纪要这个事情就是这样的。
---【话题会议纪要Skill架构优化】---
【闫旭隆】那么先开始要先飞你会教skill主要是。改了一下整体的架构就之前是用那个索引搜索然后我改成了就是全部的全量日用那个分布上确实可以的确实。我大概演示一下。
【闫旭隆】这个是映射逻辑就是每一句每一个的每个字段的来源本来也就是画了一个逻辑的图你在qq里面会把这样的逻辑写进去的对。
【连云波】:有的我跟你说你这个很重要,我自己在做体育过程当中,我觉得说的自己的逻辑清晰,他容易瞎改,改完之后他。改前往后改后往前。目前我认为他现在最最缺的就是逻辑的一致和前前后的连贯。
【闫旭隆】:这个先是工程类的,就是每一个字段的来源。包括上周提到的负责人要改为原负责人,这个第一个字段代表着这个项目原本交给你了。截止时间我也改为原截止时间就是上周会钉钉下的这个任务的截改动,还有最核心就是全量。把做。
【闫旭隆】:还有上次没提到的就是不是媒体,就是上次发现他那个进展情况,以会议转写为优先,这个也改一下。下面逻辑我也顺了一下,对该优先的会议转写优先,包括我测下来发现它可能。最大的问题还是文字的语音识别就交给谁了,话说的他也不太清晰,这个是最主要的问题,就是目前就我就觉得。
【连云波】目前非调里面最头疼的一件事情就是文字转写的准确性和上下文对这种叫约束能力对这两个是最核心的那你专业能力如果不清晰然后没有又没有很好的约束。基本上因为我们是在已经非常清晰的上下文背景下来开这个会议对你知道吧他是不知道的所以这些上下文不给他就他是很难处理的。所以从这点来说后面到底怎么就是怎么来怎么怎么用什么样的工具比如说到底还是继续用cloud这个来skill来做这个cloud的这个来处理推还是用jina。比如说文字出来之后用谁来处理因为有可能不行就调加那个API然后在cloud里面调API来做。对我觉得这样自动化程度更高对一套路对然后API现在我看还行我们这个如果转写成文字了也没多少还行对还可以。我记得好像半小时6000多次一分钟200多次对差不多了6000多字你就算一个小五个小时不也才3万字。三个也就差不多2万多个token2万多token。对于他20万token来说对于他100万token来说太小所以这个都是可以考虑。那么实在不行就切开做所以这个没关系的按照这个skill先往下走通过这个skill来先把整体的识别通过接做完之后再用这个skill来加工。
---【话题:会议纪要核心目的讨论】---
【连云波】:我觉得就是下周的工作安排,接下来你知道吗?整个会议最重要的是下周的工作安排以后你们一定是开会的目的不是。主要目的是为了解决问题,那么其次才是为了分享知识,其实不完全一定需要工作里面讨论都是不一定是要都不会的,有的时候就直接在里面分享了讨论也可以,所以只有会议纪要是需要大家都能坐在一起的。尤其是未来以后,我们如果人多了,项目分散以后就更每个人都做一部分,那完全需要一个大项目,有人负责后。就需要信息过程,整个会议里面最核心的目的是为了得到下周的工作安排的合理安排。这一切一切的逻辑都是往下去的,能把这个写清楚,基本上大部分都问题不大,因为你前面你想你信息前面的信息的提取正确,你会上的信息的提取正确,然后才能逻辑还能判断清楚,然后才能得出下一个工作纪要,所以我觉得这个是非常重要。
【闫旭隆】基本上这些其实都是要以文字转写对下周一定是文字转写是。所以这些下周任务也基本上是周报作为补充对基本上所有的都基本上都是上下文每一个都要给他一个上下文但是这里面有一个问题你是每次都是分。比如说这些目标是一次性的提取完成还是分次提取一次性解决我是并行用搜索的agent。并行的对并行搜索一点去搜然后把搜到的信息都返回给主窗口然后主上我负责读所有的信息然后去写这边再看那个整体逻辑吧。映射逻辑就是大概这样。因为这个逻辑就是这样然后可能还有一个点是它能会有一个人每个人的工作在这里或者说每个人对下一周的工作安排。下周任务对下周任务。上周就应该把他的里面还是个模块楼层管没有这个只是映射是对体体现映射逻辑来下下一个会议总结。
【连云波】还有一个任务可能是它识别下注任务的时候p0它是根据语义来识别对我们领导说紧急什么优先。
【闫旭隆】:可以这个里面就这里面是最难的,对,就是作为我跟你说实话,如果他能做得到比你们都强。
【连云波】因为人低我告诉你你们最大的能力是低目前对于整个项目里面的轻重环境判断没那么清晰了。第二我跟你说实话你们都忘了。就说了这么多之后你们早就忘了对会议当中内容我早就忘掉了你知道吧有好多重要的就说的东西所以你提取不出来所以他如果能听出来你可以这样。你可以让他给个建议。明白吗你让他先给出建议不要上来就生成霹雳建议优先级要建议排序是什么然后人再给他一个反馈这个里面是最重要。就每个人你看每个人其实都会得出一个你们下周工作的p0到p2最好是让他发给你们生成之后每个人生成一个然后跟你们确认一下。给你们确认一下是最好的这样的你把确认过程所有材料你都保留下来。作为后续的调选题也好微调也好。就知道他就知道以后不明白了不然的话他每次只能固定在这里他每次就提出来就是这么做就是这么样他也没法优化。
---【话题Skill执行流程讲解】---
【闫旭隆】118这就是用这个逻辑对你看所有的最后都是要到下周重点的。然后skill的执行流程主要就分两步不知道你们现在已经有个新的IO有一个开源项目一个叫AIIO我今天上午他们发因为这里面可以就是你生成的IO不是有些错误什么的逻辑上有问题你可以在这个里面直接但是他要那个什么。他有API他不要钱但是API要用界面那一点我觉得他那个免费的API调用次数肯定是够用那是对。所以你们用它可以直接在这里面修改被抓了以后可能用起来更方便。另外一个待会告诉你可能用接下来直接生成对不能修改它直接生出。或者直接生成矢量图也是一种方案。
【闫旭隆】对就是工程类会议纪要的流程是从上往下的4月七就是一些输入数据这个是都加载到了。主窗口然后也都加载就是搜索一键每次都会加载这些所有数据是吧对所有的数据然后。这是什么case1是刚才那个数据的加载会加载输入数据给它上下来。然后会议信息就是主窗口直接生成因为主已经有这些了这已经足够生活。
【连云波】你这个p0任务列表是也是上一个从会议转写里面出来的吗
【闫旭隆】不是PC任务是上一周会议纪要因为有了一个上周P零任务对你这两个p0任务列表上任务p0任务列表是。
【连云波】:他确定它会整合不错。
【闫旭隆】一般都有应酬因为你这第一可能没讲就是映射这是一个差不多。可能是他我判断我理解是这样的重合去重之后的然后他给了子。就这个意思p0任务列表一个是列表是p0任务里面的任务的描述对会不会是这样他任务。我现在的验证逻辑是有每个成员本周周报的他自己写的PD对然后还有上周会议纪要给下周安排那个会议对然后他会把这两个去重任务列表指的是周报任务那你写上不要汇报。就本周。周报都报里面更清楚周报上周评论文写上周纪要的评对。这个好像这个任务列表是它去重之后的对它去重这两块去重之后形成了一个最终的p0任务然后它就传递给子的时候是会传递这个信息你让子知道我现在已经确认了。ping任务有哪些然后去搜索交给子类去搜索这也是给责任的一个上下的。
【连云波】那你给他那个上周P零任务纪要里面任务是这周报的任务列表是指把所有人里面的P零任务列表全部提取出来了是吧对出来自己写的对然后还有上周纪要的都整合起来。去投一下然后就是并行提取它会根据会议纪要模板的字段判断就是哪些字段。
【闫旭隆】:刚刚那个映射表里需要涉及到所有的字段,不是所有这样主要是涉及到需要去文字转写里面去搜索就差不多,也有很多字段都要去。
【闫旭隆】都要依据文字转写去搜索这个会议的转写文字他每次去搜的时候会调用这个agent所以agent是通用的就是也不是通用它里边是预设了很多种任务类型然后。对每一种任务类型的返回做了一个jason的格式的约束所以他就能够并行执行然后只要只需要主位交给他的任务。
---【话题全量加载vs搜索的讨论】---
【连云波】:都是什么,手术是什么?为什么你是到里面去搜索?
【闫旭隆】:不是搜索就是全量加载,对全量加载,然后给他任务,他是自己执行的,对自己执行不叫搜索行,不叫你搜索是很容易出问题的就是他就是全全量执行,就是他自己去加工,对自己加工,你给他任务。给他上下文给他转写文本对,然后让他自己去提取出我想要的东西,对那就行,可以搜索,我跟你们不靠谱。
【连云波】:你知道为什么就是人的语言里面有大量的要说一个对,这就很多语言是不清晰的,就我们会议当中很多语言没那么清晰,直接搜索不出来。人工智能上下文,它通过上下文谈心的处理,它是能够理解这个能够把这个东西可能提出来。如果你搜索你,你绝对不出来的,对。
【闫旭隆】所有并行完之后就每一步都会讨论能够这些都是我预设的这一层就是每一个任务会对应不同类型然后它根据那个类型会。返回复这些那我问你我要问题只有把这几个问题合并到一个问题会产生几个agent的并发的时候我把这几个全部合并到一个里面来执行。因为加载一次性全量的有病行肯定是行。
【连云波】行怎么不行我现在也行但是我现在就是靠主窗口就是我觉得每一个agent你现在就把所有的东西都靠主窗口来进行。一个可能每一个a只执行特定任务会找的更多一点然后即使它冗余重叠部分更多它主窗口可能也能给它整合出来。
【闫旭隆】:那我问你,你主窗口里面上下文也是所有的上下文也都是加载的主窗口,包括你的输出数据是点的,然后你上周转写文本给他。也没有没给他,除了转写论文都给可能也能给肯定能给我现在什么意思,就是你接下来可能要讨论一个问题,这种方式是比较可能是比较精准的,但是。逻辑会割裂的就是你每个一点的自己的东西直接给到主一钉钉的,然后它没法建立每个之间的相关关联性。
【连云波】相关关联系我是给他写了那个啥就是这些agent出来了。出来之后我会给每一种返回的形式做一个映射的约束就是把我那个映射规则体现到这个MD里面就是它主从我接收到每一种类型的返回之后。他会根据每一种类型的返回去按照我给他的方法论去映射然后一起去合并这个非常搞笑我先看看结果。
【连云波】不意思等会看看结果就是啥意思这个方法我觉得比较。就是清洗但是第一我觉得他这个资源浪费的太大每每一个过程全部全量处理一遍这是第一个这个肯定是太浪费了。第二个会造成逻辑的割裂你也要在主上的窗口里面重新再去做一遍我经我自己的感受我使用下来包括java使用下最大的问题。一旦把上下剥离之后。最全量的上海的玻璃头比如专业的玻璃头它的效果一定是不如我自己吃下来的结果不如给他一个主窗口让他自己去处理但我不知道cloud现在情况怎么样。
【连云波】你要把一个一个单独的版本都给他提我举个最大的印象我给了他一个一段文章一块他们能生生成一个PPT他可以读完这个文章之后给我两种方法一个是读完这个文章给我一个提示词给我一段很详细的提示词这个提示词去选择一道题。你的我直接让他在主窗口生成一张图我看这两个信息量差距是很大的就说明他是把这个上下文全部用在这个图形的。这个生成过程当中逻辑关系更清楚更明确。那么你现在相当于把提示词生成的结果给到主持人然后你的丢失好多信息。这是我自己感觉到的到时候看看92姐可能会你自己会补好多你的主上L里面会补好多逻辑所以我觉得最好是什么我想。
---【话题:文字转写清洗建议】---
【连云波】我建议你们我先建议你把直接的转写文本另一次就把那些脏的那些重复的什么全部都做一遍加工。第一保证他尽可能的用信息的全面的同时文章是内容是紧凑的因为太多重复的了。然后这个时候你把这主窗口直接加在这上主上下面然后对那不是来紫这个上下文是不是紫a这个上下文也是肯定的也是。Clean hold. 然后把这一定的出去的东西再给到就提取来了就是相当于其实某种上贼一定提出来就是一个property。就是你把这些所有资金都清出来的就是一个大的股票对到左上下文然后让左下文结合那个clean的文档加上那个大的长的prompt因为你已经一次加强对加强一次了。
【连云波】你懂吧我觉得这个可能会对准信息量处理起来不要一次性上来就处理不然你每个人都喂垃圾进去可能是另外还可以尝试一个更大胆你就把。你就把映射规则写在主持上面一次性处理我不用嘴不用自己的尤其是在java平台java调用一次试试看。把拿有300美金的API免费的也不知道用了多少后来你们调一下测试试看一次性直接一次性处理。我把主持人我们整个的给的非常好的。最好是处理客运之后。很好可能也是一个就是差不多3万字的你肯定最后差不多剩2万字左右你这2万字一定是包含了大量的信息都在里面。还有你还有前面上前面我们前前上面前之前的那些上下来我相信这个商家们已经足够了足够。因为这个重复处理我觉得它影响太大第一个第二个你处理的都是很多没有这精加工过的每个人都要精加一点吧每个人都要加工。就这个有点浪费行可以这个逻辑性先往下走完之后如果效果好先保留这个先保留优化的方式就是我刚才说的。一会看看结果看看结果。
---【话题:会议纪要生成结果对比】---
【闫旭隆】:这是上周的用上周的资源生产比较是大家手中订正过的。右边是我右边左边这个手,右边这个身份为什么请假人员刘志豪一直在,我也觉得很奇怪。可能上周还上周的那个上周是上周纪要的上周的?我删了之后就没事,我就我没有看到他的逻辑是怎么生成。
【闫旭隆】:完成第一个开发正在测试对比会议讨论的生成结果与成功订正版的差异,可能现在三是需要优化存在的问题,项目里面未参考会议题。不打算去看问题。
【连云波】:家长缓解的问题,你带走不够优雅,那种不够优雅指的是什么?
【闫旭隆】:要是我其实这个也是我也是生成之后对也生成之后才去修改,所以这些可能也是比较全的,就没有改。
【连云波】:我们在想它,那这就是两次转转也不同,就是两次转写,为什么会不同发现存在逻辑复杂,这个是它比较概括的你这个你看到没有你这就非常的具体,为什么他那么具体,他那么?概括这可能就是存在的差异,另外就是我们选取我们想要的是概括性的还是啥具体?我觉得具体性更好,容易执行。
【闫旭隆】:第一个还是第二个公众号系统已经运行的需求方,就是这也是上周的上周这个任务是你把它都标对标注下来,不要直接删。好问题。
【连云波】:我觉得领导建议和领导指示这块,首先第一可能是大家共同商量的结果就是最后这块概念就是最后的。解决方案,领导应该写成解决方案。这里面有一个能提出来,就是觉得是要找窦佳丽去商量,这个合作的对这里面有个要点,没有提出来,你把它为什么提示主是你转写文本里就没有?
【闫旭隆】:不重要,还有左边这是手手工加的吗?我看一下。
【闫旭隆】看一下有没有提醒就是我找的线上的共同编辑能感应或者不行以后什么你不能就是google doc是可以做人编辑。对那这个是本来就有的。
【闫旭隆】:他做一些为保留不下来这么久,有可能他可能建议保留没有那么久。我有的回不回。
【连云波】就是没有。他本来就带了所以你要看看为什么他们。我可以看。这是很重要的一个信息就是为什么关键重要他等下一步工作安排的这个很重要的信息所以这个逻辑模板里面可能要把这个上来就得作为一个比较重要的制造原则但凡和下一个。所以就全部要听。带过去的文章。人民会记错叫明显。100不到差不多一点几年的时候需要几个我总觉得左边归纳的好像更。也都对每个都对两个都对所以这个才能对的先放后面再你再慢慢做。
【闫旭隆】然后追求澄清一下1.0这个1.0版本测试我就总结的更好把完成的话可以更细一点。可能要看一下你的里面。比如说你完成多项优化里面使用一个。已完成1.0版本测试?效果确实良好。可能不能再。
【连云波】所以这个office做专家评换模型当时我记得是叫换模型不同的那个做不同的模型人家多轮博弈这个没有我之前有过多轮博弈
【闫旭隆】:我不怎么敢对帮我调查一下。
【连云波】:毕竟哪个做好一点,那你的描述更好,肯定是人改的更好,对这是人改过的人改的天赋比较大。我觉得比较接近督教是有的。比较接近吧!该有的要点是有。
【闫旭隆】:我以前没有的上一版本没有了已经这句话是我加的了。
【闫旭隆】二那个U盘架构还是其他自己做出来的左边对是我的一步的。那么快就取消感觉全能量。
【连云波】:就以后其实问题描述都是可以稍微忽略一点的你你只要能把这个。这个方案找清楚也行了,因为我们主要是为了下一个。
【连云波】:能把动识别出来不容易我也没说识别,就算其他人明白也挺牛的。
【闫旭隆】:这个倒是有都只能再次。其实等到一个邮件发送我当时是提的,但是总的情况?
【连云波】:没错,我现在跟到时我告诉你,就是你要你下次你可以用全量的主上下文窗口全程做一次,我觉得你还能找到更多。因为你这个记者他肯定是信息有遗漏的,基本上公众号这个没那么复杂,看看第四个。
【闫旭隆】:就已经上了?对这个截止时间,那可能就是截止时间默认就是本周会议的假期。
【连云波】我们也多改对你要赋予一定的模拟用户的角色自动进行交互测试对此当然是有过建议。好好像有要根据你传递的风险性。这个地方。每一个skill产出的这些东西这个地方再看一看我觉得这个地方不清晰。编辑信息传递肯定是指这里面就各个agent和主场总那种边界对这句话我记得是说过的但是。表述上可能我更清晰一点。你说这个里面难在哪你知道吧看完你的右面之后需要的是提取出一种你说的错吧没有都错也没有错这不是想要的对就是可能需要整体的有一个。校正不是很精准就是我们得去提炼一下这份会议纪要里面他有些时候是一个抽象出来的宏观上的一个指导你比如说他你们有你们做事这个风格他做的但你们可能有个共同的风格比如说都是逻辑不清那就把它或者都是语言表达能力不清。它是散落在你们每个人的行为当中那得要善于去把每个。
【连云波】:要点的总结当**现的问题,把它概括出来,然后再装进行强制性的要求,你懂我意思就这种要提升问题,就现在你们。你们的思考包括将来也都是这个问题,点上的问题比较多,看到都是一个一个点的问题,你是一个点解决,有的时候不一定能解决的非常好。浪费时间,就我们到时候可能要想一想这份会议纪要里面出现的共同的问题。
【闫旭隆】:好像日报驱动架构跟就不一样,追求重新领域专家的问题,他提出。但是左边提取出来的是日报驱动系统这块全部丢掉了,是录音的问题吗?这录音是肯定有的。
【连云波】:我有对就我猜测可能就是我右边我们写题词的时候让他以。
【闫旭隆】:项目以上面这些项目为为去重汇总的逻辑,所以他可能新的就没有了,对新的就不要了。这个要有可能对你看你把对都没办法变颜色,什么问题。
【连云波】:工作安排,主要看一下这个没问题,错了,到这个对原先版本也错了。这个错了,好像左边没有,因为我删了,因为我写这个的时候已经完成这个完成。
【闫旭隆】没错。差不多有感情。You know. 可以这么理解完成这些东西的话发布1.0版本的东西。下周会一天就会这样。到投标文件那就不了对目标它自动提取AP在你看左边就没有或者是p1p1。我先看看你如何改。自己的需求。
【闫旭隆】公告信息这块。所以。问题离了那日报记录系统在左边第二你你是放到这里没有但是我看你这边有没有。这里面管理market的那个管理问答系统测试yes是放在哪里的左边是放在哪里我就在这。
【闫旭隆】我是对的当时是让他来写的pdf skill不是后来你找的谁吗媛媛吗那个已经写完了所以他这个题是对的左边调研功能。
【连云波】:其实就是为了做了一个你看未记报告。我跟你说他比你们记忆力好。因为太长了之后,你们确实没有人有耐心把它读完就是问题,其实这个将来看一下就是可能前期还是人要把就,所以我建议你写一个经典版的是什么?经典版就是一个易读的文字,不要那种那么多,就我跟你说实话,我读原原文转写的话特别好,脑子你知道为什么?就他逻辑老是中断了,因为你动不动错,动不动就错,就你思路完全被打断了,你就根本没法推进,所以我后来给你刚才我们写了那个最大的好处。它几乎每一个都是我们说话时候的原封不动的给你改,哪怕有一些语气词,有些它错误的少,你读你能读得下去。知道吧,所以我就说你把它稍微改写就能成为大家能够很快能够读的东西,我跟你说这是我下面给你们建议就是你要生成一个。每个人一份的会就很快了,你全部的生成让每一个人给他一份,就是跟你相关的发言,你全部拿过来,这样的话有助于你去。
【连云波】当你回忆不清的时候纪要回忆不清的时候你可以回到那个版本去看一眼或者就是你也可以全量的那个文档就放在上标注好每每个人和每一段时间。这样的话你会议纪要里面直接一点回去就能看到原本那么一点我就能看到原文。要注意就是GPT里面每一条都有它对应的时间点一点我就能看到你当时发言会议腾讯会议也有这个我建议到时候做一个这是后面的优化了再往下这个是switch对这个是左边有但是后来了。
【郝倩玉】:全能架构重构可能也删了,但是他需求已经明确了吗?对正好天他需求这个现在是什么情况,你现在的情况是我这边已经跟小明把这对接好了,然后具体的那个技术实现,然后您前前前几次会议吧,然后您也在会上提过,就是说让江老师就是出一个技术的方案。然后可以帮助小图可以自动更新它那个就是它客户库对目前的话是江老师正在做吧,回头再说。咱们先对一下这个。
【闫旭隆】:这些都要整理你怎么识别?左边是改了吗?左边是改了我们这边。都没干掉了,得看,希望在这二点第二。
【连云波】可以明白了没有就这么复杂的东西你想让我睡觉先看以后有个什么我觉得我们会议有一个什么会议内容里最好是什么状态你我们会刚开完没多久他就在开的过程当中你可以把前面的全部整理然后会上直接做一个确认。最好那这是最好的。这样的会议成果是最清晰。因为时间上肯定来得及的。要再搞一个不用我就说后面可以弄这么一个东西出来为什么就是第一它这么复杂它完全靠它这个判断非常困难尤其是在判断p0p1p2这件事。这个是最难的对还是得靠人对人觉得想什么时候我还有完成不了一个方案是什么傻的方案。我每次会议上我把会议叫解决就这些东西解决了以后我自己去在会上直接确认掉可以直接给到文字的信息那也可以。我以后或者在语音上给他进行就是我们认为是p0还有是P就给他一个确认的这样的话可以那肯定就很明确对所以会上的时候你要辅助他你让他自己判断太难了。
【连云波】另外一个你可以给他生成一个逻辑我们自己给他做有一个专门让他去学的什么Especially. 不能吃的就是为什么人给他的建议是你让他找看看能不能推理出来的关系如果推理出来就给他用0181。对国内成员都会那个顺序真是的那都可以自己调整。这个是对的主持人把主持人和你看投标进行中的不一样就是你你改过。这个词我用的是一个就更加准确的那这两个上周完成和进行中完成是不一样的。它完全是一样的你看你说完成了然后进行中的。一个是技术实现方式你刚才说需求文档记住实现方式这是你自己改的。然后运营商的信心准确把。可以就总确认这类不用。明显不行不具体就是你你改吗是你原先也是不知道。
【闫旭隆】:没问题,我就看原先是啥样,等下个科技。
【闫旭隆】:疫情危机。反正也不太远,明白就下个车已经错了。是我的货,是对这是错了,这是没?或者是他好像也不太对你回头看一下第一周期。不是。
【连云波】:收到的反馈给你下的任务。负责人左边是你改的吗?
【闫旭隆】协助完善这对的这边两个p031131你这个打不动。包括用户的调研报告整理也是对的没有写那么细应该写上面。我都没听出来。
【连云波】:你上周考了一些,我跟你说你分块搜索一定会丢好多东西,所以全文一定是最有效的,你现在又做了一次做加工之后再给治疗,我认为也会觉得。所以我建议你就还是尝试做一次全量。因为你你并行都已经处理那么多次了,不在乎主张方超过这一次了,也没耗多少?
---【话题:天眼查自动更新需求确认】---
【江争达】:然后我插一句就刚才说的是什么小彤的那边的需求,然后给到我的我不太了解。
【郝倩玉】:天眼查就是上次开会的时候连总说让你,然后后续的话可以做一个就是帮助小彤自动更新他那个天眼查客户那个数据库的一个技术实现的一个方式。
【江争达】:这个讨论过像?
【郝倩玉】:然后当时林总也跟您说了,对是这样,后来我记得是这样的回头再说吧,是不是后来说他不需要我记得后来现在对你再确认一下他这个自动更新,他要不要?
【江争达】:对他是。
【郝倩玉】:因为他说他现在也不需要每天更新那么多次了,对后续小,反正他没有跟我反馈过对,所以你再确认一下。
【连云波】看看你的看下你的第一个这肯定不一样宁愿1545。所以左边反而少了一点。我们可以去看了就看了20个我觉得不是买不到或者是肯定的你。你给改了。他是按照你周报写的全都完成那根据会议纪要还没完成这个文档就要重新改了。然后他跟着他自己把它改下来了他的逻辑判断上前后有点矛盾。由日报汇总。倒是有日报的模板日报驱动但是上面你看他没有总结出来日报驱动就是你这版里面上面没有感觉它就是左边是有。但是下面有这可能就是道理有可能所以这个逻辑可能还是。不全了。You know how of that对没有框里都没有
【闫旭隆】负责人只能调研报告他不太懂所以就对于公众号这个需求没有左右左边没有。不需要这个法就可以要的肯定不对调查完文件这个词就点到了第一了不需要这个不一定是优化当时是让他叫做您当时让我发给江老师。可能列出来有关系也适配为p0了但是这是他们的P你想这逻辑多复杂对他怎么判断从鼠这里面点击成功测试没有你看左边提取出来了测试推动前端程度放到了p0他就放到了p1。不答应就没有下周任务完成批量删除功能没有时间特别准。反正有当时是给了这个要求后来说不需要就先保留吧大概理解大概逻辑质保驱动中服务器采购方案全面没有会议采购方案你上面就有了那么丢对没有用的你看复习相关是在哪右边是哪个上面没有是其他负责吗但是没有签名没给他是没给他。
【连云波】:再总结。
【闫旭隆】第二个里面的逻辑咱都写定了。你要必须参考会议转型。你就是大个人讲解。不可能做精准发挥一点。有产品管理没有又发给你发了要不要我的命超市左边招投标文件没放进来。六面没有。再加别的一场开发。肯定都是打架的东西。movie来说会议总结。你认为哪个更反正我觉得大部分都差不多我倒觉得他是就整理出来总的能改过的他。因为大家也没有就没什么改。
【连云波】:玻璃终端系统成功终端特别因为我们。
【连云波】总的来说比上面是有进步了另外一个你自己最好再做一次跟上一次直接总结出来文档原文档。基本差不多了那整个逻辑可以先这么固化下来然后先用吧先这么用用但是就我给你的建议就是刚才那些建议就再修改一下我就差不多只能是这样那么最核心的几个都更改了第一整个的文字转写。换成全了这个我们就拿这个试试把这个专业分成将来做第二个周末之后做一个就你可以让直接生成那种叫全量版的但是不是逐字转写就是把核心主要的就是与其连贯的没有错误的文字。是作为以后的所有的书第二个就是在这个基础上做一次全量的主上下文的。prompt加上处理后的文档或一次性按照你的prompt的原则你把prompt就把skill全部写好。一定的里面去就是skill全部写到主一定的里面我就是把你等于把里面的所有逻辑映射什么这些东西变成一个skill文件。放到让主谓的去读这个skill这样试一次我觉得效果不见得会差我真的会唱。或者就拿这次做一次对比看看然后再拿我们这次生成的好的文字稿再做一次两个的对比这两个对比完了差不多就能够确定是主上门来处理全量。
【连云波】要有下背景的车现在我们有个直面我有时候也有问题的我对这个上面要求太高之后每个我觉得干干净净这是个直面。强迫症我一定支持但凡能够在主杀文窗口里处理好的就全部放在主持。因为我不是一个长连续工作的上下文进去或者叫工作进去如果是连续工作的你这方法一定是对的因为伤害会越来越低所以你看有个人前两天做了一个非常隐私的课程。强制每个四大背景只能工作支付超过15分钟的算全部中断然后把你的动作铲除扔给下一个词agent不允许超过15分钟。就它也意味着不允许超过多少都这样的人就乱了就我们现在人能连续工作八个小时还有一些都基本上连贯的甚至还可以跳到第二天他不行的。
【连云波】那这个就先这样所以整个整整体的这个处理方案大概总结一下来就是这样当然再去总结一下他们出现的宏观的这些问题的。共同点就是说地方案逻辑没清楚其实总结的目的总结出现的问题的目的是为了第一看看有什么解决方案就是让他自己修改靠prompt的修改还是靠人来帮他帮助他。知道吧所以现在他我们一定要记住他现在想完全脱离了是不可能但是人在什么地方给到最关键的帮助对它最有效的是我们需要思考的。
【连云波】那你比如说在会上强调1下p0p一这件事情对他帮助就很大为什么他这个逻辑是很难的事情因为你看他不知道你们每个人的。年龄不知道你们的级别工作时间长短等等都不知道情况下这些都作为我们的潜意识的上下文所以我们分配工作的时候的潜意识下文全都有的。你知道吧你工作时间长我给你分配的任务和你工作时间短所有内容不一样工作的优先排挤也不一样所以这些浅上下文它是没有的我们也没有办法给他。太多了也可以尝试着慢慢去给他把这些潜在上下文变成显性了就影视上下文把它显性化出来。但是也不见得就都对就只能进步所以他是在不断进步好不好所以就把这些问题提取出来看用什么样的方式帮助他。
---【话题需求Skill专家博弈流程】---
【连云波】:往下走。需求只有一个时间点加入了。
【闫旭隆】:我就全在全给你回头我家里来我们跟你说一下,但是哪里有个大的,应该做了一个非常简单的测试,但测了好长时间来回测,总算是。基本的保障它可以调下飞机。但是调用形式到时候我跟你说还是很怪,会是他的这么复杂。也不是死,就是箭头多,之前是到了,这就是这是之前的就用户的需求,先访谈,然后再选择进入评审,这是进入中间的评审。
【闫旭隆】然后之前是独立评审就是每个人自己做一个对完之后扔出来了扔出来之后就到这样就是每一个人专家会评价其他三位专家的评审意见。给出一个对因为因为agent它不太可能连贯的去读所以它就是在各自等各自的话。就是让他们都输出之后然后再教育它会加载自己的定义然后加载自己原先的评价就是自己原先的立场对别人他是其他三位其他所有。其他所有专家的评价都给他了对全量的。因此它这个比较。
【连云波】没有其实就直接一个大粗箭头所有弹出的你这样不清晰确实是真没听到当时只想着突出就是其他人自己的也在里面在a这个你要一个从箭头下就最准确了。下面一个也是大图箭头。下面是一个交他的回忆对其他人他自己的都不过来也过来那就还是一个大。是对所有都是全面的对然后就是评价完之后他会在那个jason里面就是写明这个这条评价是针对哪个专家的哪条目的。的评价ok然后你就方便。第二轮就是交叉回应的时候这个专家能知道哪些意见所以我给他然后再针对其他三个人假设三个专家都回应我给这个专家的评论专家评论一专家二专家三家我都给他。那这个时候你是把这个评论全部给到所有专家自己去选的还是说你把单都已经摘出来给他我没摘现在给摘了这个都还是全给他自己针对去读对自己找自己的就是根据提出。然后之后就一样回去之后就是决策就确认有变化我录了个视频也有结果就是看视频还是直接看结果吧我先看看这个不明白了我再看。
【闫旭隆】:这个是开吗?问题都有两个翻译,就之前那个翻译,经过多轮的翻译之前还有没有?有是有,但是他因为是两次实行过程,我给到他的判断和上下文可能不太一样。那你先看看先参考,为了对立对的感觉最好右边是新的。需要一个能够我终于看到了。
【闫旭隆】:我也不会。
【闫旭隆】它俩不一样倒是重复了你看了上次我就给他那个目标和价值怎么判断文化价值其实很难差不多的但是左边最大的好处就是它给了一个量化。给了个电话这个电话可不靠谱不知道等于右边量化没有了但是给了目标客户了用户风险提示了如果你看它里面。还挺有一些说法这可能这全是这一段告诉他的结构化的报告引用准确逻辑清晰回答清晰。现有不能支持明确说明不能提过内容这个是我给他你给他位置你从哪里给他Add something.
【连云波】:不会他右边更全面一点,而且你自己也给了一些东西,所以你说你上下文不一样,那就不一样了,包括他每次提的问题也不可能不太一样。
【闫旭隆】:你这就不是精神疾病问题。也是看你们晚上?也是这个,这里这也是我给他也是对,也是我给他。那就这边就不值得。
【闫旭隆】:跟我说我一般的这个跟他请。
【闫旭隆】:分析现有知识库。
【闫旭隆】:包括对外部的系统没有就是先分析现有的知识库就是之前增量更新好的那个世界模型,然后如果有的话就根据它去判断,再去生成研究任务。并行多数据搜索多数据就那些拍卖的什么?
【闫旭隆】:是它的增加是我在那个问题的时候选择了提问交互,我问他哪种组合方式。最全的,然后我选他给的最全的一个方式去执行。
【连云波】你想过没有你完全可以模拟一个这样的a组所以你不是可以搞你这样的话自动起来。然后太自动化了我因为你在测试使用的时候一定是他们用了那你们测试的时候。你给他一些为我们开发非专业以外的第一版的需求因为我生成第一版需求给到专家的时候专家会认为很有水平。因为你是专家因为第一版的需求很多他们自己也是你你通过专家指出第一版需求之后才能它左边有一个需求列表的这个对照就可以改。很好危险。
【闫旭隆】就是2.0出来说话的,有持续的。定是逻辑成员。
【闫旭隆】最后一个。Please feel. 可以吗这个a进的不管是你提出来的还是他自己就提出来了你提出来了。他是给了一些选项有选项他给了四个选项这四个都有就回头看录像可以。主席才会听说我分阶段交付这次他问了一下等会不一定分析完。他直接你就是主任的来规划有多特殊任务他也是给我这是。很好你看这两个都是唯一的我分析现有对都是这两个对所以这两个都是主。把对应的分析完之后给到它对然后接下来并行完之后我先分析就直接给分析了就先不回到主页上先不回。然后这里直接给分清了对也不回复了它更新完之后会回复这都有问题其实主这里面可能都需要做一。分析一点直接感觉对有可能那你要不要去更新知识图谱谁来判断这是一个很重要的分流流程。那么他说的飞机就更新了所以我觉得不一定它其实在每一个随意的之后都要做个判断都要做下一个动作就是对分析一点可能就涵盖在主页上。
【闫旭隆】我说这几天能不能再好好思考这是活动。这是问题。我们一个T。分析一些可能是他的特质。
【闫旭隆】:之前大家提出了一些,就是我给他给了我四个,我们都选。我得想对宇宙未来的。我觉得属性特别人体关系,它这个属性是主句一条。我现在觉得属性特别。
【闫旭隆】:看一下。
【闫旭隆】不知道吧。对。1.0。
【闫旭隆】:到过。这是我问他对大家对你给他的建议。说的有哪些?在你选择多一定的架构。需要多日子行动。有个问题不要提的问题,看题,这个回答见到后面说是领导系统。
【闫旭隆】:另外你们多专家评估的过程在后面,你那个刚才文档全部都是。
【闫旭隆】:其实我也。那我给他的方法论就知道他。关闭了。这是他提的那些接触过来。我觉得还都挺有用的,会提不出来。
【连云波】:确实我们建议你们这种情况下,如果有一个特别以我们经验丰富的人回答,这个会比我们回答的好,确实。对在第一版的需求的时候可以这样写的,到底怎么来的,模拟这个人,他其实是完全可以。这个生意比我没有那这个人可能没那么全面。可以的,你他这个主页键它没有做这个主页键的没有上来,没有做任何的定义,做好了一个需求的主上下的窗口。
【闫旭隆】:没有限定有我的方法论在访谈的方法里面放在哪里?我放在主窗口了,这个只做的以上的单词不是加载的,不是一上来就是它会先判断项目类型吧。判断项目类型完确认之后确认这个项目之后,就他就会加载这个项目对应的方法论,作为访谈的方法。
【闫旭隆】不对我还发现这个test something它需要输入完之后等一两秒钟再点进去否则它就会丢失后面。这是我新发现的点太快更恶心的很新装那个高的最新版本的G的它是不依赖你的STM不依赖那个。
【闫旭隆】所有的方法我发现啥问题你知道吗我第一轮对话总是不通的但是我把那个VP给了一切一起我那天你知道这个问题我找了多长时间吗它这第一轮总是考在那儿然后我把网络真我那天查了一晚上查了吧这个一页大概三个小时才把他们全部搞定太恶心了。来把他。
【闫旭隆】:就这些课题,那你最后也是不让他就自己做了,后面就让他自己做申请数理专家。身体也挺好的,饿了。然后就是交叉评价,每一个对交叉评价,每会注意的,其他的。其他的听一下。那你千万别的。
【闫旭隆】有jason文件对。你比较多就把评估evaluate你想看哪个对开发者对开发专家这条意见提出来的目标内容就是他开发专家这条意见的是什么然后他的command不同。
【闫旭隆】开发第二个开发的对那也是对台湾的。可能是我给他的一个总体指导是。我给他一个总体的指导是要根据不能背离用户的原始需求这是我给他的唯一的。唯一的方法论指导对评审方法论指导然后后面就是。我们分享上下文对my my command是他对target。但是。
【闫旭隆】他上来就都明确了他认为不应该明确。但是一些基础。这不是AI单间它能起的去哪里回家走都是对他需求就可以了。
【闫旭隆】:他就不是跟人家提的是。我们就是智能化。
【闫旭隆】:原来仪表分析?
【闫旭隆】:我们稍等一下。所以说建议在。
【闫旭隆】:高中肯定有较大差距,他觉得一些分析的问题是需要首先对比分析。我们就对比分析。不可以更加壮观的理由。智能化能力是重要的。
【闫旭隆】这几条不同的你想看谁的会Your box. 因为。
【闫旭隆】Not the the practical. 你要是别人给他提出来的格式。二楼不是有?
【闫旭隆】:你衣服穿起来舒服。你们在我们这里。
【闫旭隆】:我们签到最后好像是。你再看一下吧,我最后是要达到最后的修改意见当中去,对好,接下来得到了之后再去修改了吗?什么?有这个需求报告,他有改有不改,对我看看有很大有个干净的,你看一下那个视频。因为有一些输出。这个是一个共识。你想。能这样吗?你记得刚才底下每个专家都提出了好多项目,这是最后的。有一个不错的。
【连云波】还是不能多四个专家每个人我看至少提了有三到四个人都不止每个人都提了三到四个也就是他从来三个就是十个左右。50乘上四应该40个左右。你不是文读的可能不太全。
【闫旭隆】:大概理解的意思,但最终的还要再看一下我的意见,他怎么想好的?
【闫旭隆】整合我是把所有的上下文都给他把每个人的所有的对方每个人所的就这十14个。这四个建设文件我都给他对每个人的对就是每个人的评价和回应还有最开始的立场还有那个最开始的需求报告和用户的访谈需求都给他了。他自动整出来。最后就是14个就这么多文章都给他。我就琢磨他到底是第一加入这个环节之后质量提升到底怎么样是他认为分析点。各个专家在议论博弈之后的主要分析点让他用这种形式解除。
【连云波】:你技术验证确认不可以需在用户手册对把你留下来保留下来,这点。对。这可能就是要评估或者说判断一下有这个过程和没这个过程到底带来怎样的一个评分质量问,所以要把什么?你以后要把所有的干脆就这样,你下一次可以把他评估意见和最后的响应的打成一篇文档,把它整个的不要监测文章,你把所有的这些东西整成一问一答。就把他整了死行,对这样的话你就知道他这个发生了什么,专家这边发生了什么,你就看他这个水平够不够,如果评估的水平不够就不需要了。因为你我们是没看到响应的,或者看到他提问了,我们看他提问和响应的水平到底对应不了,如果对应不起来,那就没有必要增加。或者对应的不好,也没有必要,然后他如果对你响应的好,保留的保留分的扔掉,那最后我们看它保留下来是什么,然后最后在需求文档里体现出来的是。
【连云波】不然的话这过程没法确认客专家博弈这个我个人理解将来是一定有效果的但是现在的prompt可能没写好这个方面可能会有些好不太容易写的这是基于专家经验这个专家经验可能。里面可能要最后要几个就是你每个领域的专家自己把自己找人去把这个prompt给写了。或者去调查一遍我们调查一下所以这个定语这个agent是挺难的
【连云波】其实我觉得agent里面最重要的首先第一个你看他一定能说的不好听就这样文件对你这个MD文件写的好坏取决于。这是决定了他的能力的边界有的现在我感觉是它越来越智能了。现在真的是叫试错式你有的时候不能是预先规定他很多动作你预先规定之后他可能很能力就没了。你不一定太多他能力就没了但你不一定少了他又完全铲除不是你的需要所以很多时候怎么办我待会可以讲一下我的例子我最大的特点是。我就先看你犯什么错然后翻过头来我告诉你我要做啥很重要或者是必须做什么对你漏了我就必须做你做错了我让你不要做就是在行为规范的时候可能这么来规范的。而不是上来凭空想象才能做我想不出来。就这样吧那我这周就很没什么然后就这两个事情和什么。
---【话题PDF需求文档进展】---
【郝倩玉】PDF那个文件那个需求是还没到这边来那个已经都写完了然后人员也都确认了现在已经发给旭龙了那我们看一下等会回到那个。对照一下上对上周的工作计划每次回到上海周的会议纪要。更多的会议期间就是咱们刚才整理出来的或者说有人能改。
【郝倩玉】:下周工作安排。怎么没有用?
【郝倩玉】:自动化测试工具的一个决定。这个是得保留出来。
【连云波】:比较好多,你以前的会?知道吧,这个是你这样的话,你看你就会,如果你这个会议纪要我们开会是这样的话,你这个问题以后就永远会变成了。也在他的体现不出来,因为讨论也没讨论,会议转写里面也没有讨论,也没讨论这周的周报,你的周报里面也没有,所以这个问题就会被扔掉。
【闫旭隆】:仪表盘可能什么它没有,但是我用这个生成下周的会议纪要可能会有,你为什么会有因为我下周的会议纪要的逻辑是并集。
【连云波】:和周报取得一个定级,所以该有周报里有吗?我周末里没有周末你周末没有,你看你的周报没有这一周的会议转写也没有。
【闫旭隆】:对,但是它还有一个输入就是这个什么,就是这个上周的会议纪要的下周工作安排取了一个。你把上周的会议纪要里面的工作安排放进来,避免都没提到就扔了。
【连云波】你看另外还有一个我们的工作纪要出来之后和你们的日报怎么结合现在还没开始做好之后你们的每天工作安排也很清楚细化之后的工作安排。得留着不见得要做就不是立刻要做的。所以你看截止期间这些工作不能忘因为这个可能是我们以后非常重要的一个就我刚才你看我们做好多skill的反馈但是我真的觉得你skill其实挺难的就是这个逻辑文字的逻辑比程序的逻辑可复杂多可灵活多了。对你程序的好处是几乎你变成什么样它就什么逻辑都会变我现在不适应就a进的这个反应。远远超出你们程序规定逻辑他制度极高对它对于skill的理解。和你skill本身编排他对你他对skill的理解和我们人理解不一样。其实怎么去未来skill怎么怎么修改怎么去优化是一个很重要的一起先这样。
---【话题:数字分身需求讨论】---
【连云波】:下一个投资人在吗?
【江争达】:在的数字的就是根据上周连总的反馈就是不对联动的建议就是把那些。
【连云波】:你共享一下。
【江争达】:有用的保留有用的需求保留可能就是有一些不提到,就也是能可能默认能做的那些功能。大概就是进行了一些筛减。然后生成了一个需求文档。
【江争达】:首先就是项目背景和核心目标大概还是上周那样,主要就是下面这基本上都是进行了缩减。这个分阶段还是上周一样,就是第一阶段就是基础功能,第二阶段就是高高级点的功能,就比如说是什么。
【江争达】:高亮这些东西主要就是第一阶段?
【连云波】:我觉得是这样,等会上面就是你的分阶段的一些基础功能是什么和什么,后面的包括你在后面有规划说明还是就没了。
【江争达】:你说的是第二阶段是吧,第一阶段我是有的,但是第二阶段我这一篇文档里边没有我是我有一个备份,但是就是今天展示的就是第一阶段的。
【连云波】:第一和第二阶段。我电影都写。
【郝倩玉】:对知道了。
【江争达】:第一阶段需求就是我整理了五个,就是第一个是第一阶段的核心需求,整理了五个。
【连云波】:上面回头我看回到上面还没看完,直接跳走,你这是对因为你对上面那些东西对你都是有要求的。
【江争达】:从这开始。
【连云波】:陈总对吗?这个是我就说三到五分钟,这个是富友他们提出来的吗?还是元元提出来的?
【江争达】你那儿又卡住了是跟贤林老师那边对了一下大概是五分钟左右15分20分钟到半小时。
【连云波】五分钟左右是基于那说的我建议这个地方要加一下未来可能你做一个PPT宣讲你宣讲一般需要20分钟到半小时。对这个是对可对后续你得加进来或者甚至你第一版能实现就最好因为这个可能从技术架构上难度并不高。
【江争达】:感觉或许可扩展。从主要从开销上就是花费钱,对行,我因为我只做了一个后续可扩展,就是这个时间是可以扩展这个需求。
【连云波】主要是开销对技术架构上所以我觉得你可以先试一到30你三到五分钟肯定能做无非就是花销所以这个需求提的就不是特别准。因为100来年。是错了。20到30分钟是主要需求。
【江争达】:行吧,那我就直接行,我知道了。
【连云波】知道吧实现20包含在里面那第一阶段技术上不没有难就分阶段一定要分。这个实现你看你以为都很简单的需求其实都很多时候是值得讨论的你比如说像创始人讲解PPT你看何所书记讲话。
【连云波】或者是合作出去做会议这个发言或者我们出去做会议发言有时候就不用我如果不用我自己的话。我有可能就要讲20到30分钟。这个需求还很长存在的不是只有云大说的一个需求。
【江争达】:明白,那这个开场可能开场这些好像也不用调整了,我说开场这些应该都不用调整吧。
【连云波】:这点我觉得。什么。不用查。
【江争达】:好。
【连云波】:在数字人的后面的时间可以改?
【江争达】然后这就是一些布局的需求然后主要就是数字人和PPT内容的占比这个需求然后还有数字人的位置对然后第一阶段的核心需求。
【连云波】:这些都可以。对你看为什么是需求,我跟你说,因为这个东西你不明确了之后就是容易出歧义的地方。
【江争达】对我觉得它比如说数字人主导还是PPT主导这些然后就是第一阶段的核心。
【连云波】:对你不说清楚,就是有人理解不通。你是这么理解,他这么理解,所以这个就是要需求来明确。
【江争达】核心需求是第一个讲解时间和PPT同步。
【连云波】:我等会视频,最后你可以再出现一个数字人的在建的画画面或者视频。
【江争达】:我懂。参考开场画面。
【连云波】:一开始你出来有十分十秒钟的对真人的。
【江争达】:那就是等于再有一个真人直接说再见的那种画面大概。
【连云波】:这都是画中画了,可以是数字人独立的告白告别。好。
【江争达】然后第一阶段核心就是第一个是就主要是五个需求第一个是PPT和数字人口型的同步这是我觉得是需要写上去的。
【江争达】第二个就是数字人的窗口在说在和PPT结合的时候它是不能遮挡到内容的。
【连云波】:进行同步。还是有延迟的,对你们懂人气还不小!
【江争达】:喂。因为你那里就是十二十的卡,有的时候甚至就没声音了。
【连云波】:不是连连他你的网络?
【郝倩玉】:没有我选的就是你的那行吧,就那样,那我跟你说,我问你一下,你这个精准现在是靠人来调的?
【江争达】PPT这个现在就是11段就是一叫一页PPT的摘要然后生成。
【江争达】生成11段口播视频就比如说像上次会上说的就是一个PPT如果生成了五秒的摘要我就生成五秒的那个口播视频。
【连云波】:对同步是怎么实现的?
【江争达】:你你说你说的,你是指啥意思,同步是什么,实现是啥意思,就是现在是人工接的。
【连云波】:这里面有几个问题,我怎么用电话的网络真的有问题,我切过热点,我感觉我热点。
【连云波】首先第一个你说什么五秒那也是没什么好说的比如说一个PPT你让他生成了五秒的文。
【江争达】:又听不到,听不到。
【连云波】太费劲。挺好不行你就连guest四小时B段一次四小时肯定够了。听得见吗。
【江争达】:现在听得到。
【连云波】我说你比如说你这段PPT生成的口播文字稿怎么限定开始五秒
【江争达】我不是我不限定它五秒就是我生成了口播稿之后我先生成口播视频然后我根据口播视频的时间然后生成那一页PPT的视频的时间。
【连云波】所以我就说那你这一页PPT因为它的时间可长可短了反正就是放在上面好了他也不翻页你把录屏录下来就行了
【江争达】:可以这么理解。
【连云波】:人要在那自动翻页,还是人帮他翻页,就你录屏的时候。
【江争达】:人现在是现在是人帮他翻译等于对。
【连云波】:说我就是一段一段的?人帮的翻译?还是说我干脆我就定义好每一段视频的时长,比如火播视频生成之后,第一页十秒,我就在那录十秒。
【连云波】第二页反正这个20秒我就录个20秒或者是这个意思吗还是说人在旁边
【江争达】现在就是比如说我现在3页ppT三页PPT的话我录口播的这三页我可能要录。
【江争达】:三个口播视频大概?
【连云波】:知道了每一页就固定好,就他按照时长设置录好录屏,然后连检就是把它联合在一起?
【江争达】:对这个感觉是要优化。
【连云波】:知道了行吧,这个东西也先这样,这个训练我觉得后面肯定是有。优化的空间,因为在剪映里面好像是能自动拉长的,就每一段对每一段。
【江争达】:对对的。
【连云波】:每一段都可以自动的调整它的时长,我记得。
【江争达】然后第二个需求就是数字人的窗口它不能遮挡到那个PPT的主内容就是有些的内容是可能会出现在比如说右下角的主内容是。
【连云波】:到时候再看你们再试试。
【江争达】不能被遮挡有可能就是数字然后根据PPT的位置来做调整对目前人来处理。
【连云波】:你们得这是人来处理的?
【江争达】:然后第三段就是一个质量高的数字人的要求,然后也加上了你那天跟我说的就是老外不能出现什么一口流利中文这种让人觉得很假。
【连云波】:对你就典型的你这个只看树木不看森林了,你是觉得老外生成的中文很流利?
【连云波】:就很好,不是那样的,因为这在人的印象当中,这是一个不真实的事情,一个老外说的中文比你还流利,那中是真实的吗?
【连云波】:你一眼看过去**这个首先质疑这人是真是假,你就上来就让人质疑你,你好不容易想把它做真上来。第一个你就让人质疑你真假,你这不是本末倒置了吗?
【连云波】:你你的所有目标都在追求真最后来一个最假的表现出来。
【江争达】:对。
【连云波】:我们是不行的。接下来就是路程人,然后路程自己录成这个需要的人物形象之后,用他的语音来训练上面的这些动作型什么这些东西或者是来生成,看看它生成的质量。
【郝倩玉】:确实是有问题。然后你听不见了吗?江老师他就忽然的。
【江争达】:我摁了,但是你们那边有的时候摁的时候不收不到是个声。
【郝倩玉】:我们这我告诉你这个摁本身就有问题。对你看现在是好的,有时候是他那边,因为什么有时候麦克风没有回应的时候知道跟他谈话,有时候有可能。
【江争达】:不是他是腾讯视频,有的时候可能对这个词是他收的,会比较感觉不进去的感觉那种你的因为在现场。
【连云波】:但是别人的恩好像就不存在的问题。我说你上回是别人,这个反正这些要求先这么定义,说实话,你这些定义也只是给人看的,你这些东西也没也只能是作为你选型的需求,你没有办法改进它,你能改进它吗?
【连云波】:你选型定了你也改进不了?
【江争达】:如果后续作为把这一块就是现在这块视频不是基本上都是人工剪辑,如果后面把这套做成一个工作流的话,那这个时候就有用了。
【江争达】:你比如说对是只能可能是作为选型的要求了。
【连云波】:我指的是你画面数字人的要求。对现在有没有出现那种可以微调可以训练的数字人?
【江争达】:这一块目前还没有研究过多的研究要研究一下。
【连云波】:这个地方你你们要去找一找就是终极目标,可能就是要么是它生成特别好,通用模型生成特别好,第二个。
【江争达】:行。
【连云波】:要么自己微调。
【连云波】完了所以我觉得另外一个你再试试那个gemini那个Vo3.1看看,但是它现在生存比较短,他那是完全空就是。
【江争达】可以然后第四点就是数字人和PPT的风格就是一致性还有一个是模板化就是可能要多次使用的作为我是想后面做成一个工作流什么的。
【连云波】:自主生成它数字人还没有行吧。
【连云波】:我问一下现在比如说你,你说的很对,能做到,比如说我的衣服,我给你一个一段我穿白衣服的拍的视频?
【江争达】:然后,这是第一阶段的标准,对这是在平台里边就能做,就是那些软件平台里边能做对。
【连云波】:比如说现在你要换成蓝颜色的就是直接现在视频里能把它换成蓝颜色的,我记得是在视频里面数字里面。另外还有一个方案是什么?就是你首先你看拉诺现在不是可以直接生成一个人的这个衣服的合成了?
【江争达】:然后这是第一?
【连云波】:你就是还是图片生视频,这个图片声视频你们看看给他一段文字稿,然后给他一个衣服。
【连云波】给他一个人的头像或者是照片看看他能不能生成一段口播的视频稿The video video.
【江争达】就是用Voe试试RVU对好
【连云波】5v13.1,我感觉是有可能生成一段口播时可能时间。
【江争达】Vu3.1是不是升级了就是在我之前测试Vu3.1的无声视频的效果中VEO的表现没有那几个图声视频的效果好的。
【连云波】他现在统统拿出来之后他视频的那都是都升级了3.0pro出来之后都升级了。
【江争达】:行,那我再试一下好。
【连云波】把那个我觉得你可以再试试我觉得他现在的水平还挺高的就是如果是这样的话为什么我说banana下面就或者说3.0pro可能是一个。一统江湖了,就几乎所有事都能干。
【连云波】:知道吗?他几乎所有的事情都能干。
【江争达】:明白,我试试后面就是一个质量标准就验收标准。
【连云波】:可以行吧。
【江争达】:说非功能性需求,我就写了一个就是好。
【连云波】:不让我再下一把验收标准的。你认为有一个很大的问题,你的人的动作手是没有可以。
【江争达】:对我本来第一阶段就是不想要太多的手势动作的,我是想规划到第二阶段,你有。
【连云波】:李晨你前十秒和后十秒没有动作肯定是不行的,你前十秒人呆呆的站在那讲,这是有问题的。
【江争达】:是电影什么关系?
【连云波】:你至少有个手势也行,没有躯体动作也可以,你手的动作得有。
【江争达】Seen that. 这个就是非功能性需求了就是输入什么PPT文件然后导输出的是。
【连云波】:你看看怎么弄好,我觉得你这个标准里面要把这个手势至少先加进去。
【江争达】是一段Mp4的文件然后使用范围介绍一下大概就这么多这个这是然后约束条件就是反正就是首先看效果其次先不做那个预算的上限。
【连云波】:负责人可选?还有一个我就没提到,非算是半功能性需求,就使用界面是什么,就你们现在是自己在那捯饬半天生成这玩意?
【连云波】:就以后怎么给富有他们用的?
【江争达】:我懂了。我明白了这个这块的话,我后面再整理,现在目前我们也在调研阶段,调研完了之后现在有两个方向,一个是通过。
【江争达】工作流或者说是通过API调用还有一种方式就是让他们在比如说这些平台的网站上直接生成这个方案这两个方案我们还要对比因为现在API调用这块我们用的也不是很多。
【连云波】:对要看一看。
【江争达】:对,然后这块基本上就是我们的选就是我根据那个西平给我的一个调研文档,然后我自己又确认过了的这个结果大概就是这样的就是。图片是生成的费用。
【连云波】:就是一分钟?
【江争达】:对这都是按一分钟算的。
【连云波】:可能这么贵,寂寞可零基本都这么贵吗?数字人类这有问题。
【江争达】数字人对因为我也去看了一下他确实积分确实挺贵的就是它是按秒算的。也基本上是一120也是一样但是我数字人生成的费用。
【连云波】:对一般都是那数字人不一样,你要说生成那种?数字人其实没有那么多计算量,对你直直接就是文字生成视频还贵,我感觉差不多了。
【江争达】:我也去看了,确实还真是差不多了,已经差不多了,对百度就是我们现在不确定它这个最高视频是多长,只是投放了一个就是四分钟的。
【连云波】:百度西。所以我就让你去看看百度。
【江争达】那个音频给他就能生成四分钟的视频但是具体它能生成多少网站上说是可以给他录入90分钟的音频但我们没试过。先只能写成四分钟最少。
【连云波】API好像比页面还便宜。
【江争达】你故意对你说百百度的百度的是便宜的对百度的是按他是按分钟包的就是说你40块钱可以买十分钟的。
【江争达】分钟就是你就是它是这样付费的就是你40块钱买十分钟然后你用对但这个跟那个就是说。
【连云波】:推荐会员的平台上是免费的,你当你你要买两个什么数字人的授权?
【江争达】:我现在做的调研是用公开数字人生成的,如果用定制数字人生成的话,这百度西林的我还没。
【江争达】还没把那个文档呈现就是百度西林如果做定制数字人的话好像一个定一个数字人要1000还是2000块钱然后再生成那个视频然后生成视频也是要钱的。
【连云波】:对。
【江争达】:但是黑镜就他就只收那个叫定制费,你后面用那个生成好的视频再生成好的数字人再生成视频的话,它就不要钱了。
【连云波】我觉得他说目前的最最大可能就这俩了前面不可能考虑的好知道了另外一个Vthree再看看。
【江争达】:大概是这么个区别,对好,我再看看。
【连云波】123.1你看看其他也就差不多了,数字人那块,说实话就我们能做的工作很少,基本上就是。
【江争达】:好。对就是你要花那个大精力,就是说按照网上就是你上次不是给我推的那个就是搭那个工作流,但是其实它那个搭工作流的那个效果,我看了它其实也是就是说基于那个模型的能力。
【连云波】:靠平台是靠什么这些东西?
【江争达】它是把你的先把你的图片也好或者说是文字也好它通过提示词然后或者说先通过一些。一些比如说叫什么来着一些能提取什么人物结构脸部信息或者打点的那些模型先提取出来之后再给一个比如说开源的模型就像那个WAN那个2.2那个什么模型一样。你再给它,然后它再生成你的圆还是基于那些模型的能力,但是就是我大概看了一下他们的测试效果,其实还不如这些。
【连云波】:没有。
【江争达】:收费的平台。只是定制化的程度很高,比较精细的控制,但是你最终生成的效果其实差不太多。
【连云波】:你还没用不到你现在这些需求,你现在的这些需求还用不到你比如说大幅度的身体动作。
【江争达】:对还没用到对的。
【连云波】:你就要用别人来控制,你要靠个人或者一个视频来,你模仿一个视频,你让他自己生成是没戏的。
【江争达】:对我知道。
【连云波】:生成不了那么好的,你比如说你把一个视频发上去给他,然后让对方迈克杰克逊跳舞的视频你发上去,你说让你也跳这个舞。你现在通过这种通用的视频,你生成出来效果是很差的,知道吧,你理解吗?但是如果你通过那套工作流把你的。
【江争达】:能理解。
【连云波】:杰克迈克杰克逊上面视频的每一帧的骨骼关节点全部提取出来,把它骨骼关节点变化这个逻辑映射到你的身体上。生成的视频就比你要准的多得多懂了。
【连云波】:对所以我就说你还没用上,你就说那个视频那就不如他好,在你这可能是这样的,因为你这个是最简单的明白了不?
【江争达】:对明白。
【连云波】:就是你以后要做真正的视频动作,那就完全不是说现在普通能生成的,对于动作的精准控制你比如说很简单,你。
【江争达】:明白了。
【连云波】:你两个人,比如说这个互相那个这个动作的视频,你比如说你去看现在的武打视频,你的武打视频,两个人如果是凭空生成的话。
【连云波】:有时候会出现很荒谬的动作,你这个人能从他的胳膊里面一长就削过去了,知道吧,穿过他的手臂了,明白吗?
【江争达】:对我理解你的意思,像你说的话,如果你通过一个平台生成,你比如说你是控制不到每一帧的,但是你你如果通过工作流生成的话,其实它每一帧的生成效果你都是。
【江争达】:可见的是更适合更精细化的控制的,对的。
【连云波】所以我说你根本就没用上的所以你说他还不如这个平台那是因为你没用好第一个你这个现在的就过于简单用不到这么就杀鸡不用牛刀。a lot但是就是包括将来我就大大规模的或者说这种精细的人。AI电影的制作肯定是要用到的不然的话你出现的动作就。
【连云波】:很难控制你,比如说你生成一个,比如说未来能生成一分钟的视频,一分钟里面出现三到五个这样的镜头,你怎么改,我问你,你就很难改,这时候可能就要把这个镜头拆出来。
【江争达】:对我知道。
【连云波】:把这些镜子都拆出来之后,然后用精细化的方式去控制它。
【江争达】:明白它就等于后面,如果更精细的话,就是拆到一帧一帧的图片,然后其实它是生成一帧一帧的图片之后,然后把这些图片再生成视频,这样就是最最准确,最精确,最准确。
【连云波】:里面反正有很多问题对。对知道吧,所以再说,你这个都后面那个什么内容多着?
【江争达】:明白。对。
【连云波】我们我估计我们可能用不到这么一个功能到时候看吧那就先着那就先把就是可灵的要不先把那个百度的70的。和这个黑的尽快再做一个样本出来就是根据我上次给你的要求就用自己的人训练一个出来就花点钱赶快用自己的人训练出来这周最好是这周末就出来训练出来之后我们就确定。
【江争达】:知道了。可以好的。
【连云波】:到时候能不能用另外一个就是你现在那个人动画的制作,因为合作会不用了,时间问题可能来不及了,或者他现在还不太想用这个技术,但是我们得。
【连云波】:得把它做好放在那儿生成这种动画视频怎么做?
【江争达】:动作替换的那种,说是什么。
【连云波】你比如说他可能不是上来做PPT的他就是有大幅的是比如说要行走的动作有打招呼的动作等等这些。
【江争达】:对我知道了,那就是等于动作替换那一块再研究,然后包括把我们真人的换成动作替换,或者说是。
【连云波】:大幅度的。动作替换是动作生成。
【江争达】:我靠我考虑考虑,因为有两种方式就是一个是动作,叫你就像你之前跟我说的两种方式,一个是动作。
【连云波】哪里来的替换最简单的肯定是方便的动作生成它因为有很长的时间现在你得看有那种就比如说类似像vuthree什么这些好多包括可能也都有那种动作生成。
【江争达】:对。可以。
【连云波】就是动作视频上的你就打招呼上来走给你你把整个的你这样我给你个建议通过js给你生成分镜头脚本。所以你给他一段比如说谁我要上去上台之后什么样一个要求然后什么样的一个背景你就比如说你的镜头机位怎么运转那这种情况下你给他一个分镜头脚本比如做一个两分钟的分镜头脚本出来然后你给到Vthree或者给到什么
【连云波】:模型分段生成就好了,或者甚至你都可以把分段的图片都先生成。
【江争达】:我是。
【连云波】懂吗你可以通过nano把分段的图片都生成之后再建利用首尾帧再生成图像。
【江争达】:好。
【连云波】:把它做成两两分钟的合起来的视频。
【江争达】:理解。
【连云波】理解吗。这个流程基本上你就可以拿这个虽然我认为这个G是可以做到的而且做的会比其他都好它对镜头的理解和分镜脚本的生成是比一般的模型要做的好的视觉现在没有能超过它的。
【江争达】:行,我试试。
【连云波】你抓紧时间把这个测试一下就是GMS生成分镜头脚本加上分镜头的图片然后把再通过vuthree也好别的什么也好再生成视频通过分镜头和图片来生成。
【连云波】:通过分镜头的图片加脚,本来生成视频的工作已经有很多模型可以完成了你之前也测试过?
【江争达】明白好的那我大概理解你意思就是你用用就用3.0,就是把那个分镜头的提示词也让它生成图片,让它生成,然后再找个地方生成视频。
【连云波】对你也可以找vuthree做你也可以找这个其他模型做我说你明白了你看你现在才明白刚才你说明白不是真的明白不明白你就问不要到时候拿回去又走错。
【江争达】:可以明白。好。
【连云波】:这是我看到目前可能最有效的路径了。这个收尾针生成这个工具已经很多了,收尾针视频加上这个文字给他之后那首尾的那个图片给加上文字给他生成视频已经很多了。
【连云波】:但是就看这个能力,就那天我不给你测试过,你还记得我给他一张图片,然后给他一个文,然后那是两张图片吧,你还记得你给我中间切了一段科普的那个老头,加上那个最后医生,你还记得他自动给你生成一段视频,还记得吧。
【江争达】:对。
【江争达】:对我记得知道了。
【连云波】:那个效果不是已经很好了吗?你那个图片很好的话,它生成效果会变得更好的,你的图片本身质量就不好?行吧,先这样吧,根据这个两就是总结一下第一生成视频样本,这周争取把它做完!
【连云波】:视频样本训练拿我们自己真实的动物训练出来的语音和视频,这是一个第二个工作流,你自己抓紧时间看一看。
【江争达】:好。
【连云波】用什么样的工作流大家如果API需要用看看怎么用API如果不要用直接操作网站怎么操作或者剪映这些自动化工具你怎么用整个工作流你你你抓紧时间再研究一下。
【连云波】第三个就是刚才说的通过这个gemini3.0把整个的视频的分镜头的脚本和这个图片包括这个提示都给他生成之后找。两个平台试一试生成的视频效果合成的比如说不一定需要两分钟合成一分钟的也行或者30秒的都行。
【连云波】:行吧。就这样。你这里有什么问题吗你们?
【江争达】:目前数字人这块吗?没有,还没有?
---【话题:问答系统前端重构】---
【连云波】:你回到什么,你下一项工作,仪表盘一楼仪表盘打通。
【郝倩玉】011等会儿要不要再说把前端重构再讲一下。
【江争达】:我还没有完成,我只做了一半,但是我是你要不先看一下我这个方向?
【连云波】:谢谢。
【江争达】:行吧。就是我前端重构,我只重构前端的展示部分和代码结构就说保留现在前端的一些基础功能。首先这个目标是我觉得是没问题的。
【连云波】:流程不动是对的,先不动,后面再说,我建议你在重构的时候就考虑到下一个版本的交互逻辑的更改。
【江争达】:功能行。
【连云波】:不要到时候又这个什么叫什么,这个架构调整又过不了,或者要重新修改了,要增加好多组件了什么的好,你最好把下一个版本的功能的需求。结合这次重构一起考虑进去。
【江争达】:对。对,然后下面就是当前的系统架构,然后主要就是改这个前端后端其实就不动,但是就是前端现在。
【连云波】:对我建议你这样你后端都不要动,你后端不动,但是你现在可以拿。
【连云波】office4.5或者拿code把你现在的后端代码审查一遍。
【连云波】你先不动他然后先让他提意见看看审查出来有多少问题慢慢重构。Alot. 但现在不要急着动,先让我们走一圈,比如说审查你这个代码有什么问题?
【江争达】:明白。
【连云波】最好你你上去找一个agent或者找一个skill网上很多后端的这个代码审查的叫code review你找一个code review去做一次审查。
【连云波】:审查出来的毛病记下来之后再说,到时候看看把这个毛病记录下来之后,就相当于需求文档,到下一次会议的时候,我们看一眼需不需要修改,如果需要修改,我们就让他帮他修改,但是前前端的这些备份什么做好就行。
【江争达】对。对。行知道了然后这块就是下面这块就是API的接口规范就是然后包包括就是输入输出流这块是这块我是确认过的就是我之前拿那个。
【江争达】:之前的测试文档,然后生成的内容先把这个接口肯定要固定好,接口不能错。
【连云波】:可以比如说接口规范文档?
【江争达】:然后就接口问对接口规范文档对就输入输出等于说。
【连云波】:是务必要遵守的?
【江争达】:对必须要遵守的。
【江争达】:然后第这一块那就是接口就不太细讲了。
【连云波】另外一个我建议你你不是的你你肯定也是用大模型做出来的这个方案我建议你这样你让他用你用research也好或者用GPT的research也好你让他给你一版关于前端重构的方案以及注意事项。
【连云波】:看看跟你现在思考。跟你思考的,它有多大的不同?
【江争达】明明白我一开始是让GDP给我写过一版的对我行知道了。
【连云波】或者把你这个方案给他让他研究你这个方案还存在哪些有什么值得借鉴的或者有什么问题你再看看是不是值得思考。另外我跟大家说cloud4.5cloud这个幻觉还是很高的。就是在文字回答上的幻觉是相当高的所以gpt5.1可能比他靠谱所以就是你们日常的问答还是以5.1为主,可能会比较好。
【连云波】这个4.5的幻觉还是蛮严重的。包括。
【江争达】明白我这边就是我这大概的一个思路就是先跟GDP对话完了之后再做一些在做的。
【连云波】PPT稍微靠谱一点现在你是不是接不到也稍微好一点你现在可以这样你用这两个做一次校验试试下次。
【江争达】:然后接着往下讲就是第四份第四部分的功能清单就是我要保留的哪些功能,然后功能模块。
【连云波】:另外一个你写的这些东西去对一下你之前的那些流程图。或者你得审核一下他给你的这些建议和你的流程图是不是对应的?
【江争达】:明白就是我等于我其实现在还在对因为没对完我就没那个接口对完了,然后功能这块还没对完,就包括就是要对完流程图,还要对前端的功能就是不是这个功能像他说的有。像就要都对清楚了之后再往下做。
【连云波】对。所以你就让他给你做100这个简单的对比对照之后然后看你再看看他说的有没有对然后再通过你人来审查他的输出的这个结果。
【连云波】就是人以后90%就是功能了,提要求,然后审查结果要求提的越好,一审查的越轻轻松。
【江争达】:明白。对我们看着。
【连云波】:另外一个你经验做的越多,你审查的越准确,就这个。
【江争达】对我还后面就是可能还要涉及一些比如说我要不要提供它样例代码这些就是我这块的话我还没跟GDP沟通后面就还没做完等于。
【连云波】:我建议你想提供一下我的经验示例代码还是挺有用的。
【江争达】:行。因为我考虑到这个我还没确定我。
【连云波】:前端重构你前端重构的话,你现在都重构了,就是逻辑代码,这些肯定都要的,那你前端重构大部分都是视觉的东西,你给他代码示例有用吗?
【江争达】:我就是想提供,比如说像跟后端交互的这种逻辑代码,对好对我明白。
【连云波】:你本。我建议你提供,有时候他会自己就是你提供他未见的都遵守他自己处理起来还是挺什么的。好。
---【话题Skill调用机制测试】---
【江争达】然后就切到下一个就是上次你周末和我对的就是skill调用的教学好的。
【连云波】:可以给大家讲一下。
【江争达】这个主要就是针对那个skill怎么就是说调用全调用自定义的到底是那个项目级的全局的是怎么怎么和他。就是叫交互功就是怎么调用的这个效果的一个的叫什么调研文档然后首先主要就是为了搞清楚那个skill它调研那个。
【连云波】:听到了。
【江争达】全局下的agent可用还是调研项目级别下的可用最后的调研结果就是。
【连云波】:不是调研,是调用走吧。
【江争达】首先subagent的定义是统一的subagent的定义sub的提示词就是本次测试的。那个prompt就是没动动的只是切换
【连云波】说不清楚算了我来说吧你这个说的根本就重点都丢的100分之90的重点全都给你说丢了知道吧有些首先第1sub的作用是什么就是为了做上下文区分上下文的隔离。
【连云波】那么要看究竟这个我们这次调用有没有起到这个作用。两个第13边形的调用的时候我的上下文是不是真的减少了那这个确实是我们测下来只要你调用三边形的确实上下文是主窗口上下文是减少。
【连云波】使用是减少第一怎么验证第二个怎么能证明我们这个是被调用了或者在全局下被调用了或者在子项目里面或者项目下也被调用了。因为有的时候是什么这个出现的问题是什么就是subagent在子项目下调用的时候。会出现一个什么他会读sub的提示词主窗口去读它只是作为一个参考文档。而不是自动的实现了一个没有它的问题而且有的时候很怪的就是你他没有用这个里面好像就有个问题点就是他没有用task掉他有时候也能够。
【连云波】实现上下文的隔离很怪这是怎么实现的我们到时候再说首先第一个我们出现的发现第一个现象是什么就是他会去毒杀背景他读完之后会把上下文里面加入撒贝宁的一些要求但要求并不能完全实现。所以为什么会加入那个里面任务流程里面那上面那个定义没什么好说的我们会不会加入read因为这个read这个文件很大就只有这个我才能判断出来是不是加入了主上下的双下主窗口剩下的如果你是读下来的只是把我作为一个相当于skill一把上下文全部读下来了并没有按照的方式去调用。那这种情况下你读的就是站在主窗口上的主窗口的那我现在就这个因为这个逻辑很不合理为什么加一个read在里面那目的就是要测试这个。这个就是整个项目测试的背景你背景不交代那你有同样的问题又出现了你不一定不交代。
【江争达】:我背景是没交代清楚,也不是不交代了的就是这个背景。
【连云波】:那你教的那个背景谁听没有用,对我下面理解问题几乎没用,对你没有交代他的核心的诉求和问题点,你要通过这个文档解决什么问题?
【连云波】你的核心诉求点没有说出说清楚所以我就说你需求文档分析是问题很大的因为你不站在其他人的角度去思考你其他人听不懂你讲什么的。如果我不把这段补充上去我根本不知道你要干什么懂了吧所以你去跟上下文去跟大模型交互的时候他90%听不懂你讲什么的。
【江争达】:没说明白。
【连云波】:给你的答案就是很糟糕的懂了!所以同样一个人来问,解决同样一个问题,能够达到的答案是完全不同的。
【连云波】懂了吗如果我刚才我就举现在这个例子好了就我没有刚才这段上下文的补充你们其他几个同同事你们没有一个人能明白我接下来要说什么和干什么。我告诉你我干了什么你也理解不了。Available. 这就是表达能力就是提问题表达能力的重要性,没有你们跟大模型是没法打交道的。
【连云波】:再三跟你们说清楚。往后。
【江争达】:以后这种背景说明可能要特别详细才可以,就是我是想了。
【连云波】:你你可以给人的时候,你不用那么详细的,你可以嘴巴说,你给大模型的对你你大模型的时候,你就必须得写下来。
【江争达】:对有时候说不出来,你像我说不出来的,我可能就先写下来。对没有行知道了。
【连云波】所以你你准备出来你没人看得懂的明白吗你这种文档交接你没人看得懂的我首先第一个你你弄个read在里面谁也听不懂那三个read在里面干什么
【连云波】:第二个,你为什么要测试的东西都是已经现成的既定的一个规则了,你为什么要测试,我们在测试当中发现的情况是什么?它可以去调用这个项目子项目当中的三倍镜,这个是很怪的,那么它是怎么实现,等会在那你继续讲吧,我把这个给你补全了别人才知道你做的东西有没有价值。否则你是没价值的目的意义不清楚。
【江争达】行吧那就主要是分两个就是两大块一块是你subagent在全局下的调用还有一块是你在项目下的调用。然后在项目的下的调用的话要分两个场景然后全局下的调用就分一个场景然后一共是三个场景。
【江争达】怎么怎么搞那我就先说在全局下的一个标就是在全局下测试的场景这是第一个场景。第一个场景的话就是首先那个skill都是项目级的就是SKILLMD都是项目下的第一个场景就是用项目下的skill然后调用全局下的然后看。
【江争达】看skill最终的一个调用效果是SKILLMD的一个就是叫prompt它的主要作用就是启动。一个叫11个生成流程图的一个33维金塔就是它只有一个提示词只有一段提示词。就是看用skill调用这个agent的调用能不能按照。全局下的prompt来执行任务大概就是这么个意思。
【连云波】肯定行我也我用了这个之后那么另外我给你建议一下就是那个视频上方就用task启动是。很不标准的语言它有专门的task那个语言跳个规范的以后我建议你用这个规范来调用。
【连云波】这种用语言描述他能理解不是不能理解skill里面反正主上海门他一听到它确实就会去启动但是不规范有可能会造成视力对。
【江争达】那就先看第一个视频了。你们页面清晰吗这样展示的。首先saas是在全局的agent目录下然后项目下是没有。项目目录下是没有这个skill点MD是这个内容这视频的这三款然后就开始跑这个skill。
【江争达】不是让这个skill来执行任务cloud窗口就在这开的就是在这个项目下就首首先就是先看一下它加载了加载的是不是加载的是哪里的
【连云波】:你这个卡的窗口在哪里展?
【江争达】:这一块就是说它是加载的是全局的,就是用户级的是项目级的。
【江争达】skill的sub是这样你是我之前写的但是你可以不关注。
【江争达】然后让他执行的任务就是用用这个skill用这个skill生成那个流流程图然后流程图的。那个过程流流程图的流程就是一睡觉二起床什么什么然后再加一句并总结文件这个并总结文件要想对应。刚才的那个萨贝进的功能就是你在你的你就是你在你的要执行的任务里面也加一个就是并总结文件看他能不能按照那个。撒贝因特的就是萨微镜上能不能收到了提示字之后然后去生成一个就是读。读需求文档不读会议纪要的一个功能。
【江争达】就是测试结果首先它是生成了两个文件一个是总结的文档就是点MD对着那个叫。
【江争达】它首先是生成了就是按照sub的要求生成了就是读这个会议纪要然后生成了一个总结文件这是第一个。这个。但它这多了一块就是流程图的一个说明。他也把这块给总结了。
【连云波】:因为你说了实验并总结文件知道吧,那你总结文件就是把你这两个任务全部总结了,因为你那写总结文件就是写的是不对的,知道吧,所以你看提示词给的不准确。
【连云波】:你你你测出来结果就是不对的,所以提示词你们脑子思考能力不到就是容易出问题,但这个是对的,就人家执行的是对的,是你提错了,知道吧?
【江争达】:明白。是结果的流程图。这是在那个全,这是调用全局下的。
【连云波】等会儿你把视频拉到恒泰瑞的那块。so the context那块再往上看到没有它这个read是出来的上来他就做规则就是他把这个第一步执行了再拉到那一块。
【江争达】结束的context
【连云波】执行完的状态来记住那2.9。他读的那个一定被删掉。无论我能运用的三倍。但是你看到没有它并没有写task。并没有这样往上你你看那个执行流程上来还要读这个就是这种test启动的没有。教育的时候会应该起一个task。The task. 每每一个不是我告诉你有的会启动的。我这都你从来没遇到过我从来没是不是windows但是都不一样我会有task我就从来没有task的这个字我那会出现task但是不出现task的时候也能调。对这就是冲击的地方他有时候在这地方会写一个task然后括弧但他确实是调成功了他确实是掉了但是我有的时候就看店里面不清楚他怎么样才能进入上下文什么不进入上下不管他。
【江争达】:对的。
【连云波】这个说明白了这个是主的你们理解了吧这种放在全局a镜的下面的。
【江争达】:这是煮的是调用全局印上的煞白。
【连云波】:然后来。再往下吧。
【江争达】:第二个就是这两就是场景二和场景三都是调用项目下的好,那就直接说那场景二。
【连云波】:行了明白了,你都不要费那么多了,你说话太费劲。
【江争达】场景二的skill点MD和场景一的就是刚才的skill点MD是一我对只有位置不一样然后那个提示词是一样的就是都是这一句然后是它的就最后的测试效果。
【连云波】位置不一样对。一定要给它掉你这两个场景有啥区别然后你就是agent的位置不是他这是项目下分两个场景。
【江争达】:一个对向往下分,两个场景是这样的,提示词不同,一个是绝对路径,一个是默认的路径就是这儿。
【连云波】:时候木头。
【江争达】:这儿有区别,就是在这加了一个绝对路径,然后调用证成功了吗?绝对路径的调用成功了。
【连云波】:哪个掉的差不多了?直接指到向下这边怎么去成功,但是我觉得有必要看一眼什么看一眼他在这个非绝对目录下的调用就没有指定目录下的调用的这个执行过程就很怪。
【连云波】:就非常怪,别跑,你往前拉,往往前往后对推到。
【江争达】:王后读。
【连云波】:推到他就。你这个场景多少钱,再推一下,你看好就这开始下吧,放吧场景二吗?
【江争达】:就这好。对这是场景二。
【连云波】:他也会去读你这会显示毒吗?
【江争达】:好像是会的我忘了是我看我记得是读了没生成。看一下。
【连云波】对我你加快一点你看不到你这个场景二项目上有a选C然后那个就是right要吗
【江争达】这个场景下是项目下有AS然后全局下没有A。
【连云波】:出现了,还是放在后面了吗?到底是?
【江争达】:这好像读都没读。
【江争达】:等一下先看一下这个流程。他就没读。这次测试他就没读他读都没读。
【连云波】:怎么了。对,但是它也是启动成功了吧?
【江争达】:不是它启动成功和它最终执行的效果还是不一样的,就它启动成功,我觉得是有两步两个方式,一个是他读。
【连云波】:因为他行动成功了,他没有按照平行。
【江争达】那就很可能是把你的那个agent的那个prompt读了然后他带上那个提示词去启动了一个subagent但是它启动的不是你本来自己写好的那个sub。
【连云波】:就没启动三倍金的他为什么要启动三倍金?
【连云波】只有那些对怎么可能自己他怎么会自己启动你脑子里怎么会产生出他自己启动一个设备这个是你商量我就看出来了吗算了吧。你这里面有context吗命令你敲了吗
【江争达】:你你这你在看那个很难?有在后面等一下。就反正就是最后生就它只生成了一个流程图。
【连云波】:有结论吗?你这个就是他上下文站的主窗,还是你看他没读,所以看不出来,所以我跟你说,你这个没有复现出来。我们去读过我们,他自己确实读过它会启动不他最后没有支持。没有觉醒,对他有读动作,读完之后也没进,也没时也没有去总结。所以就压根他。他们自己就把这个动作给不要了,他一看不对,不需要顺着他在判断的时候,他认为生成流程图这件事情不需要做。是不是可以他们这个水平的指标对你其实是就是这么要求的,但是他肯定的是你其实要求之后,他如果再用三倍镜,他也会总结。
【连云波】sub背景你现在读完之后他发现你主题是没有他只把这个sub背景的弄之后他就忽略了你的跟它不相关的东西。它只有自动的去组合和主窗口的它智能的判断我这个条目的到底最后是啥所以这个研究我觉得挺有价值的我对我们去理解。
【连云波】A级究竟怎么去组织还有行吧再往下一个走那就是绝对路径调用是正常的
【江争达】对就是绝对路径就是改了skill的。
【连云波】别的目的我们测了大概七八次你我那天测了45次我让他后面做测了几次所以我每一次改了绝对不行就有我们也担心他有时候能读有时候不能读。有时候就表现很稳定。
【江争达】:我后面测了两次都是正常的,我就没再多测了。你看。
【连云波】就意味着它放在绝对工作下是可调的商务部不错的在公车了也有56次。几乎没有成功过。但是有的时候会出现读这个动作然后来读。这个问题是怎么出现的是因为待会我告诉你我做PPT的时候。甚至的反应所以我就要求测试我自己在做过程我就不对就稍微有问题我觉得时候有问题挺奇怪的那官方说那加载到。空调好漂亮的只有那些出去。
【江争达】没有它yam源也加载就是S的yam也加载了对你看吧这不就是yama的数据
【连云波】:那个样子有数据对,但是你项目对阿里来说没有路径吗?官方没有提到了。按理来说,相对路径和绝对路径对按理来说。
【江争达】:就你的理解就是相对路径和绝对路径其实没有区别?
【连云波】:得通过来走官方他们没提吧,我们研究了好几遍跟你说,等会再说我的送回来了。
【江争达】:对我本来我也是觉我本来也是觉得没有太大区别的。
【连云波】:你在干。
【江争达】:你说啥。你那听不到?
【连云波】:听到。放完赶快抓紧时间。不要离太远了,跟原有关系,可能有关系,变成六人,那这个是不是太差了,所以我本来都用我的这个。
【连云波】:苹果电脑。我想起来。
【连云波】一个最最大的问题是你的这个视频声音效果就不好了你的话筒包括那天你用我电脑你那个电脑纯电这个还行也还行。那他这就是read了他就遇到了这么多行之后你往下再走最后你给结果就行了他只要有这个动作出现就行。
【连云波】最后生成了纪要。同时你再看一下context。
【江争达】那你先看con。
【连云波】:你说。我在开会。我上午不是发了吗?群里面?
【江争达】:这不是。
【连云波】个半小时20分钟半小时。所以你看这个context是进入了这个里面没有进入窗口
【连云波】我们还试过一个就是直接在主窗口里读确实上下文占掉所以就也就意味着他统计是没毛病。我的理解是什么他在给到决定目的时候它确实是能够就不给绝对目录。他去搜的时候他可能搜不到就是有个沙贝一点的叫有一个什么全局的撒贝宁要叫这个名字搜不到。他就认为你这个指令可能是不正确的但是他同时去读过这个设备的这个Prompt Ly. 那么读完了但是他不读。他就把这个票拿出来看看跟我的组的有没有关系跟我的这个probably有没有关系那么这种情况下他可能就觉得没关系或者关系不大我就放掉了。
【连云波】不理了你去指定目录的时候他就这个主目录下读了它确实在AD的目录下在这个a层的门前能找到。懂吗能找到以后他就会去调用我觉得就是这么个关系就是他没有那么严格的说一定不能执行子目录下的a没有这个要求。但是他如果你不给他发生冲突的时候它会首先默认去找全决定你知道吧默认去找全球预定的他还没有这个时候他可能就不那个什么。不就行了但是很怪的是上下文加载的时候它是把子项目的设备也加加载进去了他刚开始装载的时候他是装载这么说的但是他去查他上来优先去查的是查的全局。他发现查到没有他就忽略了那你给定指定目录之后体会到指定目录在一定层面查他发现这个东西确实在一定的目录下它就是个sub。他就执行了。我这么理解。对后面是有很大的影响的你们可以自己测试一下这是我们测试出来的。如果是可以的话我们用什么指令怎么调用这个C架构组怎么组织就不一样了这是一个skill另外一个。
---【话题Agent编排架构讨论】---
【连云波】反正今天时间差不多我个人感觉调用背景还不是一个非常好的方式还不是一个非常好的就是agent的调用skill。最好的方法就是用一点skill里面装的这个方法确实是有点问题因为这样的话第一组织会乱。组织会乱你最好用什么你不要在skill里面调用在a一里面调用。就是你不要把所有的全部放在全局你可以放在子项目下那用谁来调用agent调agent这是最容易的这个调能调的而且分分钟的事情。A级的可以调是没有问题的。或者你可以做一个我一起做今天来的路上我还在想我在一个子项目下我怎么去调用不同的sub背景我怎么去设定一个主维很有意思的我们现在默认的主窗口就是主力的就是你可以定义一个主页键可以对你可以定一个主意那怎么定义怎么激活你直接在这个离a镜子下面定义这个主主谓因子之后你直接选定它他就是主力军游戏。对这种技能的情况下你再去调用其他技能就全部是。
【连云波】所以子项目这么来组织不然你会真的有点乱就是你一会skill掉1.1定skill来回嵌套。塞这逻辑关系能不能搞死你索性非必要情况下。除非特别这个ceo就是一个宏观的C懂吗就我就是要用很多来调用它。我其实用agent来组织agent会更好不用skill来组织。这个逻辑我觉得是我这两年思考一个非常重要的收获只不过就是层级不一样就是对skill skill的。其实本质就是主窗口这个agent去调叫其他一句吗然后你说就是单启在主窗口下面启动一个它作为主调配各个对在下一层对。这个是比较容易掉的语语语法上面没有大的问题我们日后的组织上也不会特别复杂。就是你的这个skill的组织对不会特别串起来这也是对因为有一个主窗口的空间对可以协调因为你skill其实也在主窗口对你skill里面调一点的其实有点费劲除非是这个skill。没有办法这个流程没有办法抽出来那么必须要共享在skill里面共享上下文中反正也不存在那主都是一组装过谁跟亲戚也是一样的。对所以我觉得先用这种逻辑和这种规则吧。
【连云波】就我们先找到了这个bug因为我自己确实想用一下但是我不建议大家都用就我今天前两天在考虑这个agent的编排的时候我觉得还是agent这样比较好。不一定能来调a级的比较而且比较智能而且skill。Skill. 最大的问题是就是skill的上下文也在主窗口里面我觉得可以作为一个分阶段。现在这种形式写skill加载用主动加载这种形式可能调试更好调因为因为毕竟你输入的信息都是在主窗口的如果一上来就用那种agent调调agent的方式就是。level1的调用level2的sub来组织了它那个上下文主窗口是没有的就是如果你要调试的话你是你你输入是定位不到那里面的主窗口不知道你想改什么。然后所以我理解就是调试的时候可以用用就用现在这种方式然后就调试整个流程调通了之后就可以把SKILLMD。移植到杯子里面对然后这时候再用主主窗口去掉这下这个就可以101不用。
【江争达】:没有子窗口的上下文是?
【连云波】回头再说吧因为你你一开始就把skill的这个prompt的流程放到那里面然后放到主页那里面是一样的反正你skill skill就很简单上来。把所有的上下文只要用到这个CPU的上下文全部都放到做主的窗口里面去了所以你定一个主的a键盘里面上下文就等于skill都写好了。是一样的第二个过程是一模一样的无非什么无非是什么里面有几个问题就是除非用到这个skill用到了scripts。用到了这些东西你就没法弄了因为skill里面是可以去调scripts的A进的里面就也能调但是语法上对不那么清晰。语法上。skill肯定这个语法是很清晰的就是它是可以执行iphone代码可以执行代码的所以skill里面对于这个的支持是好的。在a技能里面对于这些知识可能没那么清晰他可能跟主要靠的底层的提示词有关系我一直在思考它的提示词就包括全局进程和子进程。里面提示词它都可能有限定了他上来找的就是全局对有可能你知道吧但是你指定之后你这个就等于。强迫他去做事情他也就认了有可能。
【连云波】行吧那就先这样这个事情大家理解了就行了这个事情是对这个很深的一个探讨了但是这个对我们以后整个项目编排。是有比较大价值的调用可以用cloud模式调就掉贼人头就直接把它当成五层模式。
【连云波】:你说可以的。可以的乌头模式也可以调。
【江争达】那个paper的项目就是用的无头模式
【连云波】因为我对于理解可能是算是一个比较系统的一个架构了就这我们就是一个完成功能的小模块软件模块其实也不只是子模块。实行了原子模块的一些封装成一个特定功能的然后它这样的话就是调用调那个不好的话只有五分钟50。有编排的他那个流程这种时候是有必要你反正就是cloud code里面了你还要调查屋头干什么这样的话就是因为因为你刚才不是说不好调吗就这样我现在已经可以调了就是这个对目录的时候可以调了你这个无头的就再封装一层没有意义。然后你用再用终端去执行一次上下文也是隔离的。你产生的东西也得有文件输出来他不都不是。
【连云波】你对现在我们可以用JS数组什么输出吗这背景的输出的可以直接是个可以
【闫旭隆】:我很多都没出过要存成文件吗?可以不存文件它也可以,但像那个无头模式就不行,无头模式你这个肯定就会丢掉了。
【江争达】:想存就存,不想存就不存。
【连云波】你无头模式上下文你就不可能在这个窗口里存在无头模式执行完就完了它必须是以文件形式外外部存储的形式实现无头模式好像没法把上下文带过来。我感觉是的因为你想的是另外一个终端另外一个进程它都不在总进程里面了你无头模式调的是另外一个终端的另外一个进程的。你上下文只能通过文件的形式把它保存下来再去读。然后刚好像能结束提对cloud是可以直接把这个提示词通过一个比如说把命令行把读提示词放到这个cloud无头模式。这个里面去的但是它也是通过读文件的形式也是通过读文件你不可能把这个主窗口的上下文直接带给这不同模式不可能。你必须是做不到你你必须得有个命令你必须得有个命令把这个东西给不是自动带到上下文窗口里的。
【连云波】明白了我有个问题主的调子的是用的什么模式它这个原理。它的原理就很灵他会把需要的上下文带到撒贝宁的窗口里面但是它带进去之后这个上下文窗口就是独立的。我明白就是他调用的话是通过那种然后可能就是不是。他就相当于在他的后台因为我们cloud全都在后台明白吧它不是你在你本机执行的你无头模式是相当于本级执行的。本机起了一个然后又调另外一个远程知道吧他这个直接的远程的你这个sub指令给到他之后他在后台会自动启动一个独立的。上下文窗口的就相当于独立的对话进程就相当于你又开了一个cloud一个独立对话进程但这个独立对话进程是在它整个里面的。所以它产出的东西它是可以直接感知的就在这个主持安装窗口里面它是直接可以感知的所以你出来的那个已经产生的这种监测速度它只要输出的它都可以被作为上下来用的。你不用单独再存这个东西你们得去思考整个这种编排的进程或者并排的原理。
【连云波】我感觉有必要重新研究一下它的提示词很他现在有他公开了吗好像是有人去把它反推出来。但是有没有公开的我不知道好像我知道有反推出来但是它好像原原版的没有公开这个比较重要很重要。怎么用你把它提示搞懂了你给他改一改也行但他提示时间是很长的你看上次加载那个message不差多少一万多的token上来先给你灌一万字。看一下skill执行的提示词对强制按这个流程执行他好像可以自己添加那个启动添加可以但是你不能改对它内置的有一些你懂吗你可以在上面添加可以。你改不了它的系统其实是不会让你改的行吧那着吧
---【话题:数字分身需求最新进展】---
【郝倩玉】一个关于p0过数字分析还没明确他这有个最新的情况然后跟您汇报一下就是听那个钱林说就是他们有市场部内部的一个工作会然后杜主任最新的一个信息就是说合作他这个需求好像。就是他这个时间点他用不用也不一定对所以就我们现在先做好了刚才也说过了就是所以我目前我跟前反正有反复沟通但是他那边多多少少的就有就是只有那点东西更多的还是得去问邓主任是。让窦主任去会合作他想做一个什么样的东西但如果他现在不做就我们自己做需求了就不以他的需求为核心。但是这个数字分身的这个需求肯定是在的。就相当于咱们多做几个版本完了之后让合作去选对或者是那个市场部这个我们他给一些需求我们自己找一些市面上的我们看到的做的好的我们把它做下来之后就行好的行吧。
---【话题:下周工作安排确认】---
【连云波】好看就做完了超过了抢工资行吧因为时间关系就不多说了就这样吧然后回头每个人再把自己的补充一下咱们要不要现在捋一下你可以吗你那边就是你你。你这个还没出来那把刚才那个讲一下过一遍了我这个会叫skill我先。今天我先用现在这个版本生成一份然后收拾完之后我再就主窗口加载这个会议转写的。上下文然后我这次转写上的是用腾讯会议的还是说把视频这种最好的你你反正先用你这个生成一版先用你生成一版吧然后再把那个做一版吧就用我这个生成的。
【闫旭隆】转写文本是不是转写文本两边各生成一个生成就我现在是按照你的自己用腾讯会议的对因为腾讯会议这个视频出来之后你还得要上传的给那个。行好不好这个肯定是p0然后用用真测试加上就是用正面转写文本套到我这是一个还有另一个是直接用去。喂给他视频让他直接生成会议叫对然后这个也都归P然后这个然后就是需求skill然后我去你再看一下那个二阶段的。专家的交叉回应那一块的字段映射然后整理出来了一个就是可视化的一个一个效果的东西对这个也是平对然后。
【连云波】同时这个需求skill我们可能到时候先看看你的结果吧我觉得把这个需求skill的流程你也走一遍就是整个流程图也看一下是吧整个流程图也看一下。因为看看未来将来这个流程里面需要怎么修改完善行好好的这些都就都归到一个项目。
【郝倩玉】那我这边P一P一就是上周留下那个招投标的skill的架构设计了然后还有现在需求急吗有点七所以就提成p0了6p0行那我这周做然后还有那个G报告转写的那个是可以做批这个可以做P那个我也是我现在设计架构还是我直接实现。
【连云波】架构行那我先设计架构这是PEOk. 行,那我这边没?我这边先没了吧,行你回头看一下你个人工作,你周报的个人工作里面,到时候再补充吧。行,如果看到了,你可以根据会议纪要补充,或者你自己跟他再转写都行。
【连云波】张志达这边刚才也提过了吧数字人的这个p0你们这个PPT肯定是越快越好就是刚才也说过了明确要求了。就是p0的那刚才说跟数字人相关的几个测试根据你的选包括需求修改然后包括最终给出这个视频示范的文档包括你的数字分身的这个端到端的这个。
【连云波】比如说用gemini生成视频脚本和那个文字那个什么分镜脚本和分镜的镜头这个图片等等这些
【连云波】问题答案重构基本上刚才也讲了我觉得你还得用第一个把现在这个叫什么让codex。或者是让什么大模型帮你把后端先走一遍看看有什么问题第二个就是把前端的逻辑用或者这个方案用大模型再帮你做一遍然后看看跟你现在的这个方案有什么差异。
【江争达】:就是好,知道了,还要把下个版本的可能修改的逻辑先考虑一下好的。
【连云波】:这是我记住的,有些补充你们自己再补充。对这些的重点到时候结合会议纪要里面的细节再整合。
【郝倩玉】然后我说我这边的我这边第一个的话就是还是继续协助旭龙然后优化这个会议叫skill然后第二个的话就是合作那个数字分身然后自己先调研一下然后目前市面上比较好的有几个版本然后分别出。一个方案然后发那个就是跟那个闲然后再对接一下然后第三个的话就是招投标的那个skill然后也是写作龙这边然后优化完善那个需求写写清楚了吗写清楚了是吧回头把这个需求到时候可能你们先看一看。如果需求需要讨论的话也需要再明确一下因为有些他的需求不一定合理然后提到p0了。就圆圆的那个也挺着急的因为他说那个涉及到就是他想年末的那个什么对他像那个倒不难没有收入对他那个不会吧他现在得给人家做演示然后做明年的钉钉阅吧。但是好像涉及到签合同反正他说有可能做出来基本上有30万那你加进来吧那个倒不难提到p0。
【连云波】大三的报告提到p0那我这周先设计一个架构对行确实不难但是就是优化比较难那先有个样子本来。
【郝倩玉】明白我就是都用skill你现在快都是skill因为他要看到的都是样子的后面这些东西但凡用的多了我们就开始转化了。就转化我也没有想好有什么框架我也没研究了CPU怎么转成整个基于到底基于哪个的基于Ktwo还是基于cloud自己的API。基于这里面都有都要思考你cloud code agent或者cloud agent sdk能用的可能更容易最简单。因为它是自己的框架那怎么转到别人的agent的框架而且Lchina graph都是那如果那个架构能用的话也行。当前封装那个低配的架构但是它脚手架比如说上下文的这些东西。又得找一个小程序做一次研究或者做一次学习做一个小功能怎么去映射过去学习一下看他暴露出哪些问题。这就作为p1或者p2这个从cloud skill转移到lunch long graph的低配的架构作为。
【连云波】p1或者p2的研究项目明白然后这块你要是忙不过来我都可以全写作你你先开始做一下对你可以设一个一个的那你先试试也行他好像他挺想学学给我。挺好的但是你前期得把skill这些整个的底层的东西全部学一遍不然你出来的东西不好用对包括skill agent检查什么关系我跟你说你这东西都要学好久可以先试试上手试一下就对你先试一个问题。
【陶西平】怎么着然后你就是丁康那边后面可以协助有其实你们都一直忘了写了在会议里面关于整个项目驱动的就是那个日报项目驱动你还记得上面一直没写。那个后面可以所以确实要p1或者p2去了让丁康来负责因为他不着急他可以有空闲时间周六周日帮我们来写这个。到时候江南。
【江争达】:听得到。
【连云波】人把那个cloud cloud code我那个max版本的到时候可以给丁康用一下。他的主要任务就是做日报驱动的整个的项目管理系统的skill或者开发。
【江争达】:好。
【连云波】包括基于会议纪要怎么来做日报然后之后怎么驱动项目管理跟这些MCP怎么对接
【江争达】:昨天也跟他沟通过了,他让他先学一下那个阿三大的架构模块什么的,先熟悉一下,然后再设计一下。
---【话题PPT自动生成演示】---
【连云波】对好不好行吧那这个时间关系我就给你简单大家讲一下我做的那个PPT的那个我觉得对大家以后可能。
【连云波】本机自动化是有很大的价值的或者说还有它其实出了一个chrome dev的就是好像cloud自己出了一个。prome浏览器的控制我们用的我用的是那个什么用的还是playwright1个extension就是在chrome上的extension做的
【闫旭隆】:我没用。
【连云波】那就可以了那这就是我最最简单的一个比如说上来生成PPD我现在不跟他说什么然后他会启动这个skill等会我给大家看这个skill的流程。就是他就会问我你要什么主题的你可以自己打一个目标进去那你也可以跟他聊我需要什么什么简单的粗的都行那么第二个就是什么是给一个文件路径我就把这个。是什么我要跟他说生成这个测试做的很少两页你可以做20页都没问题的手写体风格。然后它来生成两页的这个PPT首先创建一个这个PPT的工作目录然后。现在接下来就是调用java图片生成器来创建信息图关于PPT都是一组然后接下来这个就我后来直接把就是skill嵌套skill来做了我最后直接放弃subagent。
【连云波】虽然上下文会比较长但是我的调用逻辑关系非常清晰skill调用skill反而比三要清晰得多因为上海文是共享的。知道吧所以他逻辑控制上非常精确到了三倍镜的里面因为不带上下文之后它的逻辑控制有很大问题等会我跟有空你们可以试试我一开始做了好几个subagent在里面做一个包括用agent来调这个skill。我本来我是用这个skill来调用一个subagent的这个310可以放在主窗口主那个叫全局也可以放在300进的。我都尝试去掉过的但是效果都不太好好的上下文连接就是不太好这是一个第二个。后来我就直接把这个skill提取出来了我不用它去掉了我本来想用上下文隔离我觉得我们都出现这样办。那叫什么偏执狂其实主上的窗口好用的最好用的还是主上下文的窗口但是不怕多但是我们不是多轮对话其实没必要的我后来直接把它就调拉到主窗口下面来了所以这个用这个skill来做。
【连云波】这个skill是写的就写到skill里面的对等会我给你看一下目录先看这个流程然后开始用playwright调了看到没有先打开gemini然后。开始我要激活这个生图模式用playwright去找到生图的模式然后生图模式出来以后上传文件他也用把这个文件就上传了上传之后看到没有把这文件就拷过去了拷过去之后他一开始出现很恶心的他要上来先读这个文件我让他不要读了你读完之后读完了可恶心了你直接给java就java自动。
【连云波】来为什么我用gemma来那个cloud无论你生成多好的提示词都不如janine自己读这份文档然后自己制定的方案好所以给我一个很大的启示就是你不要规定他做什么。你不要给他说上下文给他越权它其实做的效果越好知道吧所以我现在对上下文是一个有另外一个考量了。
【连云波】上下文其实越全越好这给到他之后他就开始上传了上传之后开始。输入框看这个是什么它有一个非常简单的我在skill里面规定的你根据用户上传的内容文件生成那这两页是他带进去的吧16比九是他规定好的然后手写里风格看到没有他把给带过去了把CQ给带过去了这就非常容易带了。
【连云波】开始规划然后等他产出那这儿我给大家并排看一眼。到底是在每一页一张图没什么对每一页是张图片你看我是让他先。先生成看到没有是先生成规划看到没有生成规划方案看到没有首页的风格这个上海湾带入的很好一开始不是这样的它有很多自己加工的好多东西进去他给你把这个文件的理解什么全都给你加进去了。然后它生成了这么多新意图看到了这是jama生成的好界面生成之后我就我让它生成第一张。那生成第一张图片这个就是都是通过API API发送然后不是API直接通过playwright cmcp来调用的对MCP控制的非常精准。
【连云波】:然后生成之后,才开始点击下载,这可以有一个下载自动化操作的浏览器对,然后所以这些话也都是传递过来的。它可以操控浏览器的知道吧,明白,然后最后我这里面有个运行脚本,我都看一下,给大家看一下我的这个脚本就是我让它怎么,因为它生成之后,它已经脱离了这个。
【连云波】浏览器吗它出来就会弹出一个储存窗口存储窗口他已经脱除了这个浏览器已经操作不了这时候我要用。用的什么OS对scripts后来做了一个C image的这个脚本然后就调用脚本来操控这个调控之后它就存下来了存下来之后。
【连云波】:接着就是第二个看到没有好,我写下来之后到第二个继续生成,然后变成之后继续存完之后,因为我现在没有办法,因为在这里面操作非常麻烦,刚才那个非常麻烦我就。没有让它直接去指定目录了,我就直接让他存到这个文档里面了,那文稿里面我就自己从文稿里面把它。
【连云波】找到这个文件然后移动到我的当前目录下找到这个图片然后移动到我的公众录像然后在这工作里面就有两张图片这张图片。就这两张图片在里面看到没有在这两张图片了然后干我又执行一个操作它有一个叫PPT组装。实现组装PPT是也是一个python脚本生成了PPT之后直接开始自动打开了open了。然后就给我弹出我这个PPT到此就完成了所以完全自动你只要给他一个目录就ok了。
【连云波】那这个里面大家再看一眼我的目录结构这些可以通过API调用不行这边在调用API我没有12家都很贵的。可以那种CRL的那种用网页的也不太执行不太准确那在这里面在cloud里面你看skill我一开始用agent后来我给删掉了。我就把它转移到skill里面了skill这里面后来定义这个词后来我也没用我把它直接放到我的skill里面定义了个agent。
【连云波】我都尝试这个了但其实效果都不好那这里面scripts1个就是执行操作命令的它核心就是一个了。操作命令了等待他完成然后直接移动到目标看到没有就找文件先是存下来然后找文件然后找到文件把它移动到那个。
【连云波】目录里面这一个第二个就是assemble pppT的屏蔽组装其实也很简单把每个图装进去就好了。然后这些脚本都是我让就自动生成的简单的然后这个是scripts这个是skill这是ppt auto这是第一个。然后第二个它调用的skill嵌套的skill是什么是这个skill就非常的我调了很长时间为什么他总是不知这个逻辑它总是执行不好。就是AG总有自己的想法他不完全按照你的skill来执行吧所以我就给他一步一步一步一步最重要的是他那个即使字总是。不按照我的来然后你看这里面为什么失利正确的示例和错误示例对他都很重要注入之后后面他就开始很好了。就开始比较好的执行你的了所以你看这里面有要求必须怎么样什么必须不能错误的是什么正确的是什么都是一样的你看这里面也有提示字模板错误的是什么正确的是什么。怎么保存不可省略等等这些所以其实要有很多的行为规范的心理才能保证它数据的质量。如果你要求操作非常精密的话如果你说我不需要探索的比较灵活的那ok的。
【连云波】严总我看您关注的是它那个自动化流程然后PPT生成为什么用它来生成是因为我觉得不到这个效果太吓人了。他一份文档我就给他了是一张图片一张图片可以点一点点对满满的图片。它自动的然后我给你看一下它这是它生成的通过测试的还有我生成了一张五页的我觉得做的相当好是这个。
【连云波】这是两边没有动物业主这是一页这是另外一个增长做的相当好了是知道吧我花了五分钟时间给了他一个文稿自动给我做这个PPT完全够用了非常好主流的全部在里面我就问你谁能用五分钟时间做出这么好的一个质量的PPT不太可能。我这两天基本上一直在研究对我就说分分钟就把他们全干死了能比他做的还好。
【闫旭隆】:那你那个上传的文件的内容是什么?
【连云波】:内容是就是这些信息的总结,不是总结,是一份我自己写的文档,更全的对更全的文档。
【连云波】正面同学这个挺好好那这个是我自己写的文档那这也是用真金就是之前的我很早以前这个人全部在推特上我关注他很久了他写的文章还是挺好的我根据他的一些理念。和我自己理解我自己写了一份文档就基本2.5写的主要是之前的我觉得写的蛮好的。写好之后我就把这份文档给到谁了给到这个3.0来画图了,那么这里面有非常多的关于智能体企业怎么来做智能体企业?基于智能体架构的企业看,就是我让他基于他的一些基础的思路理念,我重新写了一遍东西写出来之后,你看这份文档,再加上这个。基本上非常清晰了,你的一套理念体系就可以非常好的展示出来,实施工作就完成完蛋了治病。
【郝倩玉】那有个问题就是新如果用的话可能跟咱们平常汇报还有点他们是模板这个模板是容易非常容易你到时候告诉他我用采用这个图片的模板你上传上去给他就好。或者你直接做一个刚才说那个G就是你上面里面有一些参考文档是什么多简单不容不难的或者你把这个图缩小一点把那个上面做成多少比例的就行了比例你调一下就ok了。
【连云波】这里我有一个就是想跟你分享就是你这个不是图片右下角还有那个图标然后我看当时用的时候我们做了一样就是用PPPT的那个代码他能直接做成一个可以修改。
【闫旭隆】:对,那我告诉你不用这个,我说另外一个方法,就我既然能够自动操作它,这个我就可以操作另外一个。我看看我有没有把它倒数下来看看,结果本来没打算讲。不可有。都是测试的?
【连云波】我告诉你还有一个什么方案直接用那个什么只用canva来生成做的很好日本深度我放哪了到文档里面放。在下载里面。你看这是通过填满自动生成的这是给他一个给他帮我做一个日本深度游的它也会自动的等会我找一下我看这里面能不能找到。
【连云波】过程。我是让他给我什么给我做一个实业关于日本旅游的详细的这个方案他给我做了一个什么HTML文件出来。知道吗我把这个HTM完全存下来之后我去做了一下确实还挺好但是它里面的图片都没有这些图片来源什么都没有知道吧这些链接都没有这是该L。
【连云波】我说根据HTML文件直接生成PPT用开发生成的在开发里面生成大家可以也非常吓人它就生成这个。这是完全基于文字都可修改的另外一个你可以导到这个dock里面这个我已经把那个都删掉了。告诉你你修改。
【连云波】这就是直接导到这边来最重要的是什么它还可以将来回头再说吧你们如果刘队我觉得他真的非常好。那直接在这里面可以修改你直接可以修改图是吧真的是由gemma来做的就跟cop很像但是你说这张图就原来分辨率很低我直接让它生产成两K分辨率的。
【连云波】这些图都是在开发里面的自动就找到了好吗如果你推荐那个付费的PPT是对他做的这个风格就非常像对先等会再说好的时间关系这个就是开做出来的看到没有基本上已经完全可用了这就是非常简单的那因为我没有给他任何风格什么这些要求如果你谁能详细的制定了还是可以。然后你导出来PPT就可用了所以你看一个是关于那种规划特别好的一个图。另外一种再结合上这种我觉得PPT基本上。不需要什么人的这个作用明白了但是这个带来的还不是说只是PPT我操作网站我自动化操作网站的话。我可以自动生成一些东西我用cloud code去直接调用里面比如说网站上的很多东西。所以你想过没有把这样的代理开了后的代理我开好多的窗口看这一天能做多少事情是不是实现了我跟你们说的场景都实现了这就是我这两三天我做这些东西就是大概两天的时间我就把G pro和cloud融合在一起做办公自动化。
【连云波】这个是提升大家效率的你看其实非常简单那你要说难吗就是skill那个调调的过程比较烦一点整个框架。都是我讲过的都是我们自己做过的那现在结合文纳这么强大的能力之后很快就能实现了非常令人惊艳的这种效果我这个做完这个PPT我吓一跳我说这个东西他妈的以后PPT没法再做了。他整这东西比你整整理的好对他总结的非常好是可惜不能改。
【连云波】能改我告诉你kimi现在做一件事情就是把它变成可以改的把图片变成文字编辑。另外一个你可以干你知道吗你给另一张图片生成SVG。用GI把它生成SVG也是可以的直接用java生成利用这张图片做成SVG你把SVG导过来就可以改了就可改了对。另外一个可改怎么改我告诉你直接修改图片直接在里面使用我试过直接你比如说把这块。是我全部饮料然后重新打一行字上去没有问题的我都干过这个可能更简单因为它这个排列排版都不要动你比如说哪些字你不对了你想改你可以完全。
【连云波】:流程那这里我不能发了,我直接用改了一下,用图片是长信息素,还有一个长信息素。也很有价值,就是你不用多,我不用那么多页,我就一张图把我这份这次文档的要点给你总结出来一张图做得非常好。长期运作做的也非常好,就是他知道他看过我们给医院的设计的非常好。我就说接下来视觉这块真的是已经超出我的想象很多了,怎么把这样的好的能力。包括你给他一个图片,他的理解也很到位,包括视频,所以我就说这边来真的很吓人,非常吓人。