Files
AIEC_Skills/.claude/skills/meeting-minutes-generator-v1/input/本周会议转写文本/20260113140013-信通院云大所市场部-张媛媛预定的会议-转写智能优化版-1.txt
2026-01-19 13:49:00 +08:00

1943 lines
211 KiB
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

线下人员: 我这能找到不行就把这个扔那算了,去吃点那出来,这里边是您的流量卡对我。回头再买一个流量卡里买的,我还没有,我现在用的,我现在可能也用完,我就正好多一个本身用的。我根本就不。
线下人员: 丁康他说他线上参会。让他先说。都没有,那到时候不行他就下了东西在那跟着我们的,他自己把他在车外,他做了多少?
线下人员: 怎么开都在线了吗?加利达和丁康在签吗?
丁康: 在的你走。
线下人员: 你这样不行,把你的东西先讲一下,然后你就休息去吧,别在这耗了,然后你不是生病了吗?抓紧时间你你有什么要说的吗?这项目。
丁康: 连总您上周不是说让我等那个工具到了再写吗?
线下人员: 什么工具。
丁康: 裤子。
线下人员: 不是谁没给你吗?标志拿你新账号没给他吗?
江争达: 没找我要我给了郝天玉。
线下人员: 对你们就对你看到了吧行吧那你先下去吧这个这啥情况这是就一个不要一个不给你们这都啥什么工作态度算了迪康你也别在这做了。你给你个活跟了三个月34周了没有任何进展这啥我就再不急的活我也经不起这么耗。你一点都自己不着急吗你你还是去你那算吧在我们这我发现你也做不出来什么东西那一会工具不行一会那个一会说又出差了我这真是放羊的了。好吗。你自己考虑一下你能做就做不能做你就是别在这了浪费你的时间浪费我们的时间。这啥这是。那你弄好账号之后你不是说定康需要吗我不跟你说定康需要吗你也不给他不找你要你。这也是。
江争达: 没有郝玉,我跟你说的是郝倩玉要,然后我给了郝倩玉。
线下人员: 我们在回答里说了吗?好像一个定康合一个账号,你还记得吗?要把聊天记录翻出来吗?我翻。
江争达: 我自己去看一下吧!
线下人员: 看我说不行,就丁康那边正好也要用在会上不提出来了吗?你这个没有这个愿望,就别在这工作了,我这不养这种人也养不起这种人,这个啥都是干干工作,我这一个活我一两天干完了,是不是三周四周过去了,啥动静都没有。你自己看吧,丁康我觉得你你要这种情况的话,你就来我这啥用也没有。而且还真的会耽误我们自己的整体的项目进展,这项目管理都指望你都啥都没有,我从来不可能允许这样的情况存在,我们这个队伍里怎么可能有这种效率?这都什么时代了,人工智能时代会这个工作效率没法玩了。要我要是在你这样,市场上早被淘汰了,你们就跟着喝西北风吧!走吧。能做就做,不能做算了。那你如果没什么好讲的,你就先下线。我们接着开始。
江争达: 那就第一个是我和旭龙的任务,然后我主要负责先把最近一个月的会议纪要,遗漏掉的那个任务先捡起来,然后旭龙打开一下,我刚才发群里的那个。我发群里的遗漏的任务,然后我们来过一遍,然后看一下是不是就确认一遍大家一起来确认一遍。
线下人员: 好的。
江争达: 然后第一个是丁康的,第一个是定康的任务日报的驱动管理这块的话就是后续的会议纪要中就没有了。
线下人员: 你共享了。
江争达: 然后那这款?
线下人员: 对事情这样!丙康我再问你一句,你能不能做,我就自己接过来了。金刚还在不在?那我们自己接接过来做吧,他已经改变了。
江争达: 但是他私聊找我了,他说他尽快做完。
线下人员: 就给他一个时间,礼拜如果做不出来就算了。
江争达: 那我跟他说一下。
江争达: skill 的话是我的任务,然后就是在后续的会议纪要中丢掉了,最近没做。
线下人员: 所以我就跟你们说了,你能怪你,你能怪我们吗?我跟你们说了,跟就跟丢跟你这还是现在我跟你说都是我们自己内部的一些自我团队建设和管理这个能力建设了。我跟你说是客户这样的话,你们都等着被开除懂吗。你怎么可能这么样,跟把事情就跟丢了,当然我有责任,我也没给你们直接,但是我觉得你不论是这个会议纪要系统还是都有问题,跟着就把这东西跟丢了。我也不知道这次梳理出来的处理它是不是全面的。这很多问题。是找到这个了,还有没找到的,或者说为什么会漏掉,你们得从这个会议纪要系统里面重新思考一下,所以这也是这个任务管理系统要需要的原因。
线下人员: 懂吗?你们如果之前这些东西都录入项目了,不靠会议纪要不完全靠会议纪要的话,那不就能跟踪了吗?你现在啥都没有,就全凭,那每每每次的会议纪要跟你们也跟就会跟漏,就缺了个系统,知道吗?所以这个会议纪要的任务系统就迟迟没有就很怪的。那做个破玩意,做那么长时间,现在你做开发这个东西不要太简单了?以后就不用在这个界面来管理了,知道吧,我们就直接回心化的 web 页面直接上 web 页面看就完了,你天天就这种关系完全没有逻辑,没有积累的。
线下人员: 你这个 plugin我也说了包括整个的开发规范的等等这些是。这个是什么这个是需要在后台去建这样的一个同步的你可以说是数据库也好或者说一个文件系统也好去建一个在哪怕是 github 上或者自己建的一个地址上面做一个这样的文件管理。以后把整个 plugin 里面包含很多有 agents有 hooks commands还有 SKILL S 这些都是一旦用好的。这些我们就可以分门别类的,把这 plug in 直接放到那个服务器上,然后服务器上直接安装就完了。所以你比如说像我和旭龙,我们就是研究出来了一个比较好的了,或者 skill 了就直接放上去了。或者说我们觉得我们建一个自己的库,现在那个 skill 或者说整个 AT 的库跟网网上的开源浩如烟海,我们也没有人去评估,我们只能和我在天天看,看完之后给你们转转都是零散的。没有人做了一个组织化的工作,你还没有组织就都会丢,就是这个问题,所以你看我们现在就很多,捡了西瓜丢了西瓜就是点了芝麻,丢了西瓜就是老熊掰玉米。你你怎么你整个组织怎么成长,你没有成长的可能了都好吗。所以要把它制系统化的管理起来。
江争达: 好。
线下人员: 给你两个星期时间?
江争达: 好。
线下人员: 这就是对当时准备用低配来做的。那现在还我觉得还是需要的,因为两个问题,一个是我们现在让你在一两两条路径,一个是用 cloud code 的 cloud agent sdk 在做这个事这是一种方式其实我觉得低的那块我现在觉得还是要跟一下。cloud code。目前看基本上是可用了但是低配的那个架构我觉得不能放因为他们肯定也在不断的演化试一下可能那可以这么作为一个技术储备放在那。做一个技术储备就把你研究过程那些文档放上去就好了。然后如果 cloud code 我觉得 cloud agent 有一个什么问题?它本身它很灵活,很方便,但它的效率其实是不高的,它的效率,而且定制化程度也没那么高,所以我觉得如果有一些比较。这种定制开发任务比较重的,或者说比较高的,那我们可能还是会到低配性的里面来看。对就后来说准备放到我们外部前端就再也没有了,到底怎么跟外部前端结合,这个就没再开展了。
线下人员: 你比如说在问答的时候,我们现在就只有 reg 出来的信息。你是说哪个?不是 still web 开发他写错了什么需求文章?当时是我需求,你知道 skill 就是我当时不是以先以那个 skill 需求的 skill 你是 skill 开发对,就是你,你这个套盒是用 skill 做的吗?是当时不是把我那个需求文档需求澄清我知道了那个层我都理解错了,那这是一个还有也跟丢了,这里面也没了,就是那个张长,你后面有那个关于前端和这个。
线下人员: cloud sdk 融合的吗?
江争达: 它好像是放到一起了,你看一下它最后的进展,你看学习了 cloud 那个 app 那个框架和 cloud code那个 SDK 相关内容。
线下人员: 他就是说那个咱们对当时有还有一个就是准备,所以这个没写进去吧,这个我没丢,我在弄周报里一直是有的是吧?那这个就是你的对是需要的,对我套完了,测试测完,然后就等那个服务器上看看怎么部署 cloud code。对服务器那个服务器现在等会看看那个谁吧那就这样等你的服务器装完之后看看试一下
线下人员: 好,然后我这边也在你上周教我那个 GRM API 测试对等会看一下就好了,如果那个能成功,他服务器部署好了,我觉得有可能的。要是能成功的话,可能就不需要部署在服务器上,就是 SDK 代码直接接 API 了,你也得装,他就是需要依赖。他装那个你你你安装那个 cloud sdk 并不包含整个 cloud code 里面的代码就是其实我这是我的理解,我是我认为克拉克的封装。把 CRI 封装了一层。你说 SDK 对是 SDK 是封装了,所以你底层的运营你要有 cloud 作为运营,你不运行它,你没法用了,所以你 clock 还得装。这是我的理解。是我之前只测试那个用 max 用户,那个是必须得做 CRI然后这个 API 的我再看看 API 我记得也是,就他是在 a 上封装,就把这个包包进去了。行,也有可能正好我要跟你讨论这个事情,这就是我的理解,所以我觉得跟我们之前理解不同,就上次你还记得你说你,你以为是反过来包的,你以为是 CLI 包了 a 级的 SDK那实际上我现在要理解下来是。
线下人员: 北京的 SDK 是架构在 cloud code cr 上面,我之前是这么以为我上周就发现确实是对那这样的话,他如果是包他的话,那你不运行它就不行了,那你还得做。有那这就和 CI 里边用那个环境变量设置那个 API 是一样的,差不多。
线下人员: 行。我这周还没来得及?这周可能下周测一下,没有行了,就这个事情和是融合在一起的,这样的话我们就可以把需求的。另外一个前端界面上,到时候看这个时间没那么,但是我认为是需要做的两件事情,一个就是等你有空把那个 A TWO UI 你还记得我发给你吗?
江争达: 我去查查。
线下人员: A TO UI 是啥?就是这些需求,现在都是啥都是用命令行界面出来的,对不对,你的都是命令行界面吧。最后我觉得你在那个封装完之后,你是用 web 页面展现的,你怎么展现?你的需求就交互,你怎么怎么展现?肯定还封装成被渲染 web 页面渲染它,其实你渲染不如用 AI。这个协议可以这是你在共享对我的你上网去看一下今天。cowork 里面你搜一下 cowork 里面有一段小视频演示,其实就是这么做的也可以皇后的 Claude Code, C. Cowork.
线下人员: 就这么做,你说完之后你把视频给共享一下,就大概一分多钟的视频不动,那我不行,我下载给你我这个。激动。那你刚才还有个视频,简单看看就好。那这一分钟就放大?第四。你不能全屏没事,我给你发下来。翻译我下载的。刚才咱们群里马上到。
线下人员: 是在 APP 上 code1定要简单一点。Meeting note 以后我们的明天都是这么写了,还有 skill skill。这就是你的那个选择就九点了所以还有后面的那些就是你的选择反馈都通过这种外部页面渲染了。我觉得非常吓人但现在我现在因为网络老是不让本地作为一些路由。我现在没用起来你回家我调整一下就好了或者到时候把你给我把那个 WRP 装上所以就说我们如果做的话不见得非要用。外部渲染的方式我们可以用图图我就比它更好。可以尝试一下。U Ai to us. 这个张拉你是不是我记得我给你讲过一次你应该都忘了?
江争达: 我再看看。
线下人员: 这是谷歌的?我就一直跟你们说,这些东西都是为了开发的一个非常重要的方向。就你怎么通过把这个 A AI 出来的这些文本或者语言这些东西渲染成。跟人交互的界面,以前的很麻烦的,你都是固定的,你现在准备实时生成 UI 界面,那么就很灵活了,而且很方便了。就这个用户使用体验会大幅提升,这个,其实我觉得不一定要花去了多长时间,你你自己先做个 demo 出来之后让他们两个去开发就行,让詹达和千。你们俩去做那个 UI 没那么复杂,就是把用户协议那个协议理解了就行,对这个需求。
线下人员: 这个需求这个 skill 我觉得可以看看怎么把它包装成一个网络可用的需求澄清完了,后续其实单独一个需求就是最生成一个需求文档,最后会出来一个需求文档,可以是或者说生成 HTML 的动态渲染的一些东西。你需求文档出来之后做一个渲染出来就可以了那这个需求文档其实就可以后用来做后面的开发这样的话需求这件事情。先交给他们看看你看包括现在他们根本提不出问题来所以我就说把这样的一个交互过程扔给他们就因为说实话我们没有必要一定用外部页面。That's part of that. 这些我们的一些非技术人员的用户,他没办法,所以我们要把它渲染成页面的形式给他们用。给他们的过程不断的交互,甚至 skill 都可以让他们改,然后再照顾出他满意的同时,我们也能接受的一个东西就 ok 了。这样的话你后面直接拿过来去开发,就不用你天天去问问问你也问不明白,我真的觉得。他们也说不清楚。甚至你自己就可以先做一个拿给他们看他们想改了让他们改就完了可以。
线下人员: 就感觉跟他们沟通需求得启发式诱导,那是起来,这就是其他的,因为他没有不怪他们,他没有概念。他确实没有概念,比如说现在让你提一个关于剧务的服装的需求,来电影剧务服装来给我提需求。你肯定提不出来,肯定的,这很正常,所以这时候人工智能上他比你聪明,他能百分之七八十的都能。都能理解到,这个时候你有专家再增加个百分之一二十就很好的,你们现在是你们俩小白在一起混,你怎么混出个专家来,是我就感觉我没办法像你一样给他们一些启发,就是引着他们走。今天就是这个状态,人工智能快速介入,把你们水平拉起来,就这么个定位!
线下人员: 交接后来有哪些问题没有交过来?
江争达: 这样的那个新报告自动推送就是在1月9号的时候也正常运行了然后那个运营商信息系统的话是之前。
江争达: 之前说是我们只运行两周,然后后面这个需求就没有继续跟进,这一块的话可能还需要需求继续跟进一下,然后数字上 PPT 也交接过来了。
线下人员: 那你好好就因为他一直在跟这块就关于做数据库,其实就这玩意就是那个运营商是吧,现在相当于是这个等于交给了郝倩玉了。就这个运营商需求这个信息库怎么搭,这个事情是他们一直在讨论的,我也跟他们说你不能瞎搭了没有用,所以就看看他们到底能给出一个什么样的需求文档你也可以把这些东西都给人工智能,然后人工智能,所以你这样的需求文档里面可能还得允许他上传文件。肯定可以,你用的可能做事你都能干,现在也可以对,无非就是别人给他入口,就你得渲染出一个入口出来。
线下人员: 你懂我意思吧,所以我们这就是规范开发的一步一步一步,其实这个就是我们规范开发的第一步,后面我们会一层一层一层加,但是这一步为什么要做是因为。要给别人用后面都不需要别人用,那后面都是我们自己开发队伍用的,其实我们做成 skill 就够了,其实我们直接用的 skill 是直接完成了,所以在他们没这个界面的这个掌控能力,所以就给他们图形界面。让他们把该有的信息什么都往里填完之后。咱们读完了之后。给他们一些反馈,认为你们怎么做比较好?我下了。你我一直对你抱有希望,我现在我一个问题就是你还能不能做这个事情,首先是不是跟丢不丢的问题?而是你能不能的问题了。就我这个工作分配是不是有问题,我自己也在想,你能不能做这块东西,你想不想做?
江争达: 现在确实首先一个从自己的学习能力来说,现在我只能说是构建一个,比如说线上的一个管理平台,但是这个管理体系我现在确实也。也没时间学自己的学习效率不够,所以时间是学学不过来了。但是你比如说你部署个 GT 或者什么的,我是可以,但是这个整体的一个流程建设,现在是不没能力。
线下人员: 这个需要一个做过软件工程的人才行,我先交到我手里来了,他确实没这个能力,因为我跟他说了那么多遍,他都推不动,就证明他们没有能力推。他有能力他早就做了。我跟你说。等一下我把我们的那个外边框架打完了,我就直接盖出来,昨天我给你们看的那个加上 rough 那个 search rough research 跟我们 deep research 就差不多了,只是他非常粗暴。非常粗暴不断的一轮一轮的 research research反正他就 token 多不怕后那就来这些这几个班准的项目其实都有这个都有理念在对你说这也不好说但是初期可以这么先试。这个超标文件响应的后来不知他们到底什么时候演示就是中华的什么这个月底了我看一下好像是21号吧然后我也侧面打听一下联通好像他们想买。为啥买了。来第一个问题它一体机它怎么怎么部署deep seek 他不可能到外面服务器上用的,他给他买吗?他有钱买吗?也不知道他们咋谈的。
线下人员: 这个是我的江老师?
江争达: 我们一起的这个你是,然后我是用户还有?
线下人员: 一个对这也就丢了,你看我这边是我是针对咱们 reg 和对话系统做了一个有个插件叫。
江争达: 认真的。
线下人员: 克劳特刚推出来的那个词给我叫 C 就是 code 的这代码的经典就是你可以对他可以重新帮你去理这个甚至我都认为你可以用这个做。做精简的时候然后把测试加上再把加上让我也给加上我估计一定能很快就把它做完了然后做完之后帮你把所有的整个测试的过程和整个的逻辑架构重新出一份文档就行了。这个说难听点用会了你你你就是花15到20分钟的事情剩下活都是人工智能干所以我就说现在基本上对你们的要求。
线下人员: 如何高效的使用人工智能了,已经不再是使用了你们现在的效率用起来就不太高,其实有很多你们同时可以并行十件事情。那你现在不会用这些工具,你只能盯着这一件事情做,所以我就说你们的效率包括加拿大也一样的,你总说时间不够,我是觉得你没有学会很好的分配你的注意力。如果你把人工智能就 cloud code就是 cloud code 用好,你就能节省出好几倍的时间出来。所以现在这个问题是在于你们能不能真的快速搭建,就我们搭建这样一个可靠的执行框架。我看这里有你把这个框架执行传说拿出来之后,你们的注意力就会极大的节省出来,就可以做很多事情好吗?
线下人员: 现在问题我真的觉得你差距会越来越大的你如果不会用数字智能你看我们现在和你们已经会用了会用的人可能高效用的人又需要一个很长的很大的阶梯。高效用的人和高质量的人又一个阶梯。这个阶梯是一层一层差大概不会用的和会用的十倍的差距十倍的和高效率使用的再是十倍的差距。高效率使用的人和高质量既高质量又高效率的人就是十倍的差距差不多。你想看会用人工智能顶尖的人跟现在普通人就是1000倍的差距。差不多就这个水平就是这个所以我一直跟你说那个 cosmos 那个做研究的12个小时干完了一个博士生六个月的活。六个月以前要多少一个月30天乘上六180再乘上二。就感觉他们特别知道自己该干啥就跟一个老板一样他们很知道自己要什么东西所以就要定义好所以这种事情现在的。技术环境下再去做这件事情就简单多了你不像你们过去要自己手好像不停的跟他对话甚至部分还有手搓详细的这个稿现在都不用了。说实话那现在这些东西做完之后最难的是上面的管理体系的架构就是人干活的人用来干活的时间也很少。
线下人员: 好,我先走。是我没听明白,是 PPT 和框架图自动成功就上来。
江争达: 我是在之前的会议纪要里的,但具体这个是干啥的,我也不太确定。
线下人员: 你别看我就知道这个好像是不是有一次连总您在群里面艾特了我跟徐龙然后让我俩好像是跑一下这个。我不是把给你们了吗PPT 自动生成工具我已经给你们了。之后的事情对在之前不是12月30号首次提出12月23号提出来的。他那个我结婚代理差不多12月20几号你们再查大概我觉得好像那东西是不是至于之后我们做一个市场部的需求不是市场部的学校。我记得当时好像是说什么市场会有这个需求他们没有肯定是有框架图是这是我们自己的吗我今天再测一个就是 I O 的一个 skill OIO 的,但是我觉得也一般,我正在测,到时候我先给你们愿意的话,它是什么,它是用一个。先用这个 blood 或者是 codex 生成一个 DOML 代码,然后再把它转成 HTML 文件,然后在这里面自动 cloud。
线下人员: 这种浏览器操作工具在 cloud 里面在浏览器里面渲染出这个图,再把这个图截屏截下来,然后展示出来之后你可以根据这个再来修改。这个这么个过程,其实就是加了一个浏览器操作,那不就是截屏就浏览器就是为了截屏吗?就是为了展示图片对,就为了图片,那和他直接生成 I然后自己打开区别。所以我觉得这有什么意义
线下人员: 所以我就说我在测的时候,我说还有人做这个,但是我觉得最需要的是什么?连续修改的过程对校对的对,所以现在那个装 IO 里面自己是不是好像是带 AI 功能,但是要收费的。等于我们怎么把它渲染出来之后。在开发里面是不是可以?台湾里面就可以把它渲染出来,我没用过,可以把这个 skill 放到 cloud app 里面去做,可能在 APP 里面可以渲染那个 P。把它打开让它一边左边看右边看左边就会改。
线下人员: skill 我觉得有价值的。PPT 那个我不是那把生图的和那个提取文字都给你了吗?我是觉得未来是还是会有用的,但是有一个问题,我周六测了一个。巨长的信息图里面的巨多文字的他就不行,哪不行了,就是图就提示,不是文字都提出来消除不了那么彻底,它在消除过程当中好像就不是有这样的就是你抽卡里抽很多次才能抽到一张全部消除干净。非常困难,那有可能,所以就是这是他的极限了,就是他去消除少量的文字的他那个记忆不会爆掉,你有那么多的这个像素都要去处理,它就爆掉了。我估计他一次性的修改。不能太多。
线下人员: 有可能对我感觉就是这么样一个过程,所以我们基本上是因为我这个常用信息图其实很少作为 PPT 的,但是一页盖了,反正那个。到时候单独提取也是可以的,单独就切开来提取也可以或者给他一段提取也可以。那 PPT 这个我觉得提取出来是目前看是可用的,那这个情况下,我们是不是可以做一个?怎么样的一个工具来赋能我们自己来用这个东西 PPT我们自己生成 PPT 的时候就可以对外沟通,生成公众号文章,这些都需要。那个骆驼不开他们总是生成那玩意,还有一个方案是什么,就把老头给拿过来。把拿过来之后,我们来帮它文字重新生成它图其实留的还可以。这样就最快的方案?能可以对另外那个我给江南我做,我找到了一个去水印的那个,我们去的是柬埔寨那个水印,但是我觉得可以把 notebook L 的值也可以去掉。我们到时候修改一下,真的。
江争达: 带的。
线下人员: 这个事情你可以做利用去水印那个程序去那个 notebook 那个边角那个水印可以吗?
江争达: 我研究一下,我记一下。
线下人员: 你你把我估计你把给到谁给到他应该自己都能把你去掉。你就让他参照那个程序重新写一个弄不开的去水用的你弄张试试看其实我跟你说你知道我现在上面如果好像又懂的话。他直接就开始干了。在会上我让他去做那个楼上去水印这件事情。他在十分钟之后就可以给我答案。那这就是以后的我觉得我甚至觉得以后我们的工作就是这么开展就每一天我们这几个人不管是半天的时间就放在这里。大家讨论问题的时候讨论什么思路另外一个人执行或者他有个什么思路别人执行就是我们讨论过程中这样的话就非常快了所以我觉得接下来可能有这么样一个。高强度的融合的过程。这就是为何未来高质量会议的一个雏形就绝对不是现在记录下来再去做现场就坐这你想这项目推进多快对。那100。因为你所有人的智慧都在这里。
线下人员: 这个 PPT 生成我觉得是必要的。对尤其是生成之后,像以后好像你的这个内容,就我们把工具交给你内容就你生成就完了,他现在唯一需要的就是我们先坐下来,唯一需要就是把文字大小位置稍微调一调,对一对就是其他的什么文字什么都写好了,都给你提取出来,图像也都生成好,都位置基本摆的也差不多,就是字号调一调。然后有的时候可能自己调一调好就没了,所以那一篇 PPT 我估计就是生成的过程可能五到10分钟改一改差不多五到十分钟差不多一个 pp T 十到20分钟而且质量很好。所以先用到图给他们试一试你先示一个出来然后拿去处理一下用 notebook L 先生成一个 PPT对你生成比如说10月左右的然后再去把这个 PPT 的美元去交给这么去提字去就用那个 process。
线下人员: 处理 slice 有一个代码,那个代码你运行一遍,已经完了,说因为它是个 PDF 文件。你还得把 PDF 文件里面全部分割成图片。全是 PDF。对你你用 MU 或者什么样的图片识别出来就好。PDF 可以切成图片,可以切就是 PDF 自己 PDF那个代码就是可以直接提取图片也可以行你把它提取成图片之后保存在那个目录下然后让那个就是用那个代码一个的提。一个一个的消消完看看再组合起来这个我认为这个 PPT 工具如果做出来,我觉得会有比较多的人需要。
线下人员: 你当时那个报告交给袁姐反馈第一条是图片没有出处,我跟他说图片是 AI 生成的对是我们自己生那个云大锁。他可能以为我是别追他以为是自己他不知道那谁肯定不知道我们已经做到这个水平了你说这就是我画的就是。这就是我画的。完全一个原创的报告了。我那天跟何总说了他说你们这帮我写的很干说我说这个清新风格他说没有的风格很水合作自己都这样其实就是咱们这个。就是我让你生成那天我让你实时生成那天你说因为它比较多是这样的包太大了7070多页好像是。咳嗽耳目一新。
线下人员: 合规提醒工具。对这个他们提的对,就是小彤,然后他不是最近在忙那个年底那盘点的事,然后我还催了他几次,但他还没有发给我,就是他需要把咱们 CRP 上相关那个合规那些东西他得发给我。就还得整,这个我就跟你说这个需求工具的第一使用人是他知道吗?他会有很多的问题要去提问题,他们都提不出来。他有可能自己要根据他们给的那些文件资料,自己去一轮一轮的去跟人工智能交互出来一个需求文档,然后扔给他们,让他们跟他们讲讲,如果说他们觉得可以了,直接拿过来就可以改一改就可以开发。
线下人员: 懂吧,所以需求文档的第一使用人是你对是那个 skill 我已经下载好了,然后我那天还试着跑了跑跑了吧,他那个。就感觉生产出来的东西就是怎么说,感觉就反正我设置出来之后,我还得自己再调,还得再改,那你把那个调的过程和你的想法记录下来。现在有个 skill 那天我不给你发了吗skill 自进化的那个东西用的过程当中不断的调整,所以我觉得这个资金化,所以我就说的东西是慢慢外面人都做完了。你们我们没时间,或者你们没能力或者没有时间来做的事情,外面人确实都在做,这个是怎么说,就是但凡稍微用脑子想的都会想到这条。
线下人员: 是对。反正感觉跟他们对接过程当中感觉其实真的就是主负责人确实就是在我这边,他们如果我没有引导的话,他们也不会就是自己为他们自己的业务去多想,因为因为说实话没有 AI他们现在业务也是可以跑通的是。所以就是感觉确实是得我这边多为他们也都要靠不用就看他们在做什么回头我们就把他那一套整体业务直接搬过来我一个人都不要自动完成。明白了吗你就把他们业务流程拉通之后我就告诉你我把每个岗位都给你批了到时候就该急了我跟你给贺总一看来你们这个任务都完全不要人。这么讲我把这条线给你拉通了你们还有什么好想的不会用就等着完蛋。
线下人员: 合规到时候拿过来再研究一下,我相信有的时候做好了可能。现在我觉得人工智能这种语义理解能力应该够。应该够去做这个事情合规这个方面,因为它大量的就是文字的匹配,有一些可能描述性的东西,到时候我们把它这个描述性的没那么清晰的我们自己做个 skill把它清晰化。就行了。
线下人员: 他合规的听小朋友说,他主要就是想把咱们 CRP 上面那些大段的文字拆成一些小卡片,然后每天通过邮箱,然后给全所的人发一下。那是一方面重要的是合规 a就是合规工具里面最重要的是他合同上面一些包括一些平常日常的文件的合规那你要去检查的。他说一句什么什么规定那这些规定怎么落到我们的合同条款或者我们的文件里面去那这些合同条款你要去查的他有没有违反这个规定那有些时候很明确不准用什么什么字眼那轻松就查出来有些就是个模糊的表述我懂您意思就是您其实是相当于是嵌套进去然后日常都可以这是他们本来提出来他们的要求他们希望是这样的但我当时跟他们说这个难度在于这个模糊的东西没法量化。
线下人员: 你怎么量化,有些东西很难的,所以你这个东西是需要控,需要很长时间开发的,那现在如果你要是人工智能这个能力到了之后我们可以试试。就把那些模糊的我们自己变成清晰的,或者说把他们修改那些案例集中起来,你为什么要修改,你把这个统计出来,然后把它做成案例就完了,对这些案例就是 SKILL S。不就行了。
线下人员: 然后下面这个我还在那个整理当中,然后看梁总有没有一个明确的时间节点,我在那之前我这里完成,你想我们现在很快就有新的员工来了。那他的培训怎么做,那这些资料当然原来我们有一些资料,这些资料是不是要赶快给他们了,你可以不用一步到位,你可以按优先级,比如说。上来第一步要看的哪些内容,先把它整理好,原来谁原来知识库的你给了天宇了吗?
江争达: 给了我们上次总结了一份?
线下人员: 对先给他,后面就把当然对你,你可能还不具备这种筛选的能力,就把我在我们有些时候你可能后面进来的晚,你把我们在微信群里的那些东西。
江争达: 九9月份以后的都给天宇那边了现在。
线下人员: 不行,你把那些东西和我们后来发的那些东西,你用人工智能全部整理一遍,让他给你整理出来一个培训的文档的组织的。叫架构就不用你去做,你就还是那句话,你看人工的这些转发给你东西,你把它导出来,你把它都导出来,你你导出来之后,你用这个人工智能说帮那个分析一下这里面有哪些内容,有的是视频的,有的文章的有什么的,你把它全部整合在就是一个就是思维导图下面。那原来就有个思维导图就是你一开始发的那个联总对,然后这是一种方式,还有一种就是比较系统的框架重点培训,比如说有些是零散的知识,用所有导师把它组合起来,有一些重点的就独立成章,你比如说我在前两天给你推那个培训,那个是我见过最详细的了?基本上看完一遍的肯定会有。甚至学的很细,比我们用的都细致,然后在这个基础上再增加克的更新太快了,你知道克拉克的上周更新了几次吗?上一周更新了五次,你知道吗?不睡觉更新太快,不用他睡觉,他照样睡觉,主要是自己更新。你知道了吧?
江争达: 现在那个 cloud 用 skill 好像都不用像我们以前就是写那个 command 了,现在你直接斜杠加 skill 的名字他就直接用了。
线下人员: 不是对他就可以直接用了,同时好像在 a 里面调 skill 也很容易了,那我理解是反了,它是在镜子里面调 SKILL S 很方便的。是对 skill agent我现在还没看到那不是把上下文带过去了原来的是独立上下文。是直接把前面的上下文给他直接就跟那个分支一样对分支一样的等于你前面的上下文全部带过去了所以这个好处是可以有连续的理解对但是那个。我们用我们的用法在 skill 里面调 agent 还是没可以看到,好像还没看到,但是我现在想他们是不是就是不愿意这么组织?这确实会乱,但是从我的理解,我的 skill 里面就有一个 a 的带,就是我比如说我要做一件什么事情,我的技能里面,我的经验告诉你,但我需要有个 a 的报告。完成一件事情,但是他的说。你用主页去掉好了,你不要用 SKILL S。这种情况下。
线下人员: 其实没还是得想没什么问题,那 skill 掉不也是注意什么掉吗SKILL S 就其实。只不过在上下文里面编排的时候。那就跟有一些可通的地方,你 SKILL S 本身是上下文的编排,他 skill 已经读进去了,对你读进去之后,如果你复合进去了,是把 skill 全部读进去了。你这个 a 是在整个的 SKILL S 内容的是其实可以这么考虑。可以是这么理解但是谁去调这个词agent 主主的去调了,主主一定的调,根据什么来调?根据 SKILL S 的要求来调。可以的,那差不多就是意思也可以用,就不给我想就外班这件而言,我觉得。用我可能待会再详细讨论一下,好理解,所以你理解了理解回头你先拿一个。
线下人员: 框需求框架先分析一下,分析完之后你给了一个框架之后讨论一下之后如果可以,你就往下走,那里面有不同的主题的不同的专题的。然后有不同的组织形式的你比如说有文字的,有图,就整个的这个公众号文档,还有视频的这些怎么整合在一起?有一些重复的能不能重合,明白就是你就不用自己去做了,就浪费时间,如果他能给一个基本可用的就行了,就这些人人去看东西也不是很傻的,他自己也会消化吸收的对,就是现在没必要做一个精品的工程出来,但是你这个出来之后,新手就可以先用了。然后在这个过程中再逐步的打磨擦就好,甚至我跟你说还给你一个方案,你把一个专题,一个专题,所有我给你的这些东西视频全部给到在。明白吗?你让 notebook 出一期培训视频和那里面就有 PPT 加上那个视频解说。老罗他这个东西的理解比我们快多了,偷偷多了,所以你很快就能出一期一期的视频,如果我觉得问题不大,可以用这个来做,就很像他们网上卖那种网课,一期一期出分专题,然后来讲,所以你先把一个专题的点看能不能。
线下人员: 就你想还有一个方案,就是我们给的这些培训材料网上一搜一大堆,有的时候你就是一个点上发散开。他自己你的那个集成了 deep research 到了你做个 deep research 之后,再根据这个内容再生成一个带 PPT 的演讲稿一个专辑基本上30分钟20分钟肯定讲透了一期一期一期下去就什么知识点都讲明白了。所以就包括那个 cloud 如何使用你就可以完全11个专题一个专题生成一个视频就你既有文字稿又有视频稿那学起来太容易了。所以你看现在我就跟你说学习是从未有过的简单网上资料一大堆从来没有过的简单就是关键是你们能不能快速的学习。这个事情争取一周搞定好的杨总我尽快因为我们可能会后面有人进来。
江争达: 这个其实不算丢,但是任务优先级或者说整体的一个项目的规划,现在就是可能还没有一个系统的。架构这块的话还没做到,这,我要把那个项目的流程再梳理吧,就什么时候该就是每个阶段优先级哪一个先做。
线下人员: 比如说。先用人工智能先学习,不要上来又干,学习完了之后经过三轮的学习之后生成一个方案。
线下人员: 这个方案最好跟大家讨论一下。
江争达: 明白。
线下人员: 不要闷着头,弄完之后什么都不行,然后又重新返工,没有意义。
江争达: 好。
线下人员: 好,我下了。
江争达: 我记得就是上次会上是稍微提了一下,但是这个具体还要不要继续。
线下人员: 对。要你现在做的是用什么来剪辑的是这样,那个就我,然后上周我其实重新调研了一下,然后这个的话我觉得是基于我过去,然后我汇报,然后可能连总,然后您就是让我来调研一下相关的一些就是关于视频数字人视频的生成的一。
线下人员: 写,然后我现在已经把过去的那些方案都已经推翻了,然后我又重新调研了,那就不管它,就这一件事情里面肯定就是包含在你那里面了。那最后你输的人生成视频,你现在用的是什么剪辑软件?
江争达: 我代码用代码的。
线下人员: 直接用 MP 做的?
江争达: 对。
线下人员: 知道了问题,现在出现什么问题,你你你清楚和列出来了吗?现在。
江争达: 你你现在和我说的?
线下人员: 对你现在 F fm pag 做剪辑的时候出现了哪些问题?你你保留下来了吗?或者你提炼出来了吗?
江争达: 没有。
线下人员: 你就说没有问题?
江争达: 目前来说没有没遇到太对,没遇到什么就是那个问题。
线下人员: 你就说没有问题?这就是够用了,现在按照你的剪辑要求是够了,有一些很好吃。
江争达: 对比如说按照我手工操作剪映的这个水平来说,目前它这个代码也可以实现就对。
线下人员: 后面可能再看,因为里面有剪影,里面有很多,但我觉得结合人工智能都能做,它里面有很多什么自动生成字幕,什么剪就剪裁剪,包括这个,因为它都是可视化的图形裁剪方便一些。
江争达: 对。
线下人员: 包括还有什么什么遮罩等等这些问题其实算法都能实现,从我的理解,你有了之后,他自己通过算法都能干掉,只不过普通人图形界面看起来简单。也容易直观的上手操作了。
线下人员: 所以看看,如果需要,我觉得还是很强大的这么一个编辑助手编辑那个程序这个库行吧,那就先。然后好像你就继续赶快把数字人视频做完那个需求文档写完,然后数字人视频到底怎么来做,快速生成一个可用的数字人,真正的商用的这个视频,或者说叫对外的视频。就是 PPT 演讲稿科普谁让他们再修改了,到时候这两个同时能够推出来,我觉得视频就可以基本告一段落。
线下人员: 就可以下面进入优优化阶段。把这工作流就可以,到时候看看怎么包装出来给他们用好,那您看我这是就是先不仅是工作流,然后还需要再出一个我从我用我的工作流跑出来的一个视频是你可以自己做,你也可以联合起来做好。他之前出过了,如果你调研的方案跟他里面原来的差不多,那你就没有必要重新按照再起一个了,就按照他那边修改好了,那你有一个新的方案出来,那你就按照你的新的方案来好的。但是最好你得如果你最好是要把你比如说比他这个方案优化的地方在哪,你要搞清楚,不然你没必要重新探索?目前来看,其实感觉跟江老师前期做的那个大差不差,我又探索了一些国内的一些平台,可以这些东西都可以试试,然后下午。那另外一个就是他前期也探索了这个国内品牌,你可以把你的方案先给你们先商量好,商量完之后确定一个哪一个说以后就这个方案就定了,或者你们给我两三个方案,我来拍都行。
线下人员: 对 vo three好像又前两天我给你发过一个视频vo three 又更新了。好像现在数字人做的更好了,所以但是数字人当时可能好像没有办法做定制化的,但是有一些专通用的数字人,其实我觉得到时候看有一些视频用通用数字人也够了,说不定。
线下人员: 开个会。
江争达: 下面就没了,下面就整理了。
线下人员: 行,那这件事情告诉你的是,你看你输下来差不多有十几项?以前我们才工作多久就扔了十几天,那其中可能有一些重复或者已经没有完全就扔掉,就我们就算实现好了,我们才工作多长时间,我们就扔了十项。这还是在会议纪要软件出来之后的那之前扔的更多。
线下人员: 所以我就说这里面暴露了几个问题,第一,我们的会议纪要整个生存的过程的问题,把以前那个都扔掉了,所以这个是急急需要修改的。怎么能保证前面的你现在只是跟上一期比你肯定全面的丢掉了。你可以把前面的工作要点未完成的全部提出来。对可以就保证你项目不能冲丢。第二个更重要的是靠这种管理方案是对于日常的管理来说,你看加拿大天天发日报。你也是只见树木不见森林,你全貌是没有的。那这种情况下,我们我就说这丁康如果愿意做让他更快把它做完,把这个图形管理化界面给它搞出来。就这些内容都得往里添。总得有负责人是谁,那现在我们可以从文字稿上查出来,你说另外一个话,以后我们他妈直接你想过没有,每次开会之前直接用这个图形化界面就完了。
江争达: 我想过不行就这样,那下周不行就按着弄。
线下人员: 然后把。你用 java 直接他们生成一个图形化界面就完了,做一个统计,每个人不同的统计对象到时候看看!
江争达: 好。
线下人员: 对这就生成这个,现在太容易了,动态渲染的东西太容易了,你可以把你甚至可以把这么长时间内,所有的都给他,让它生成几个,每一次你这样。我也觉得更野蛮的方法你就调出一个 prompt。But the skill? S. New Skill? S. 每次生成几个页面?
线下人员: 一个页面就是全量的一个页面就是个人的。然后一个页面那种有统计指标的不就完了吗?
江争达: 行我记一下。
线下人员: 你想我觉得这东西固定化的真的很快。现在我现在感觉就是文本,就是数据库,现在真的文本就是数据库,所以我说一定要把我们文本都留着这个道理,知道吧,你现在有文本,我这样往里一塞,很快就给我能处理出来了,甚至 excel 表格都能给我处理出来。excel 表格甚至数据库我都可以自动填进去了。没那么困难。
江争达: 好。
线下人员: 行吧,所以这个工程管理上现在是明显有漏洞的,而且漏洞是不小的,你这就是漏出来了吗?漏掉了吗?你漏洞就及时要去补补漏。这是工工程管理上一个非常重要的这个过程不断的优化,不断的完善,不断优化,不断完善,没有这个能力,你你就你就只能是就老兄掰玉米是吧?点丢。先往下吧!
江争达: 第二个是问答系统的前端,然后就现在其实也遇到一个问题,就是现在自测确实可能存在盲区,我。这周想汇报不行,你们就直接打开前端页面,然后你们以用户的角度来直接使用,看看看效果。
线下人员: 行,那你把那个链接发出来。你得把赶快我让你一直上部署到服务器上吧。
江争达: 我发群里了。
线下人员: 我不你这端口是这是端口吗?
江争达: 域名域名和账号密码。
线下人员: 我知道。行知道了回头我们错了。
江争达: 或者你不行会上就直接看一遍行。
线下人员: 那也行,打开我们看一眼。我这根本就连不上。登录。
江争达: 对你不行,就是从从一开始,然后先看。
线下人员: 第六题开始。
江争达: 从主页到对话都测就或者说是。
线下人员: 你好像基本上跟原来没什么大的区别?
江争达: 你可以点击,反正搜索什么我都做了。
线下人员: 不是意思,你跟原页面有区别吗?
江争达: 没跟原来的云大阁的那页面没有区别。
线下人员: 你等于完整的复制了一个过来?
江争达: 差不多。链接我都是点到他云云所原来的那个上去的。
线下人员: 你点完之后就直接跳过去了。
江争达: 我全部做好了链接。
线下人员: 我知道,我知道那。
江争达: 搜索也是一搜索也是搜到他们的链接去。
线下人员: 知道。行,那如果把后端的那个数据库给你对上,你就可以把它页面跳过去?
江争达: 差不多。
线下人员: 你的子页面还是要设计一下。
江争达: 对的。然后旭龙可以登,就是说你可以先测一下,旭龙可以先测一下问答,就点一下那个右下角的那个登录,就是说他会提示你先登录。
线下人员: 那登录能测吗?先等我先抽一下看看你那个图标感觉有点大,你可以再小一点点就。
江争达: 可能就是我的电脑有点大,感觉上来说,你可以先放到全屏模式。
线下人员: 老师。你不能同行,你图形是不能?不能根据你大小缩放的吗?根据?
江争达: 我的全屏是可以,这个是没有吗?我是我都是固定到右下角的电脑。我拿手机试了也可以。
线下人员: 不到几年去打官。对你看。
江争达: 你你拉小一点,可能这块要做一下,对适配了。我做一下那个流对,然后你点一下对就。
线下人员: 不,你先把删掉先关掉。它这个右下角,刚才你这是可以缩放的,你再放大一下。
江争达: 对,但是对但可能在不同分辨率上,我的要再做一下优化。
线下人员: 明白了没事我知道了那你说到正常情况好。给的是75%。
江争达: 你就点一个热门问题,先试一下就行。你可以放大右上角那些图标?
线下人员: 你还回到他分类So which are. 你你你的对电缆在这也能提供吗?
江争达: 对。
线下人员: 你有啥别的,我怎么看一个点一下。
江争达: 因为你你你小,它是你,你浏览不,你这个屏幕有点小。
线下人员: 那就是你的问题,不是我们的问题。
江争达: 明明白,我那我把这个分辨率的占比我要再优化一下,因为确实我这电脑有的时候测不出来。
线下人员: 你生成答案时间为什么这么长?
江争达: 是现在检索的时间。没有,他还没。
线下人员: 就解锁完了?生存是蛮长的。
江争达: 你可以放全屏看一下。
线下人员: 说明太。
江争达: 下载也弄好了。
线下人员: 你的引用都没有了?
江争达: 引用是因为后端答案没有回。
线下人员: 啥意思。
江争达: 就是后端没有,就是后端生成的答案里边没带这个引用?
线下人员: 不是都要给你实体什么那些东西吗?
江争达: 后端就是大模型最后生成的答案中他没给我回这个应用能理解这意思?
线下人员: 那什么意思,以后都不回了?
江争达: 不是他是有的问题回有的问题不回,所以这个后续还要优化那个 reg 的就是跟大模型之间的那个 prompt 就一定要让他带。
江争达: 你可以测试一下旭龙你你再创建一个聊天。
线下人员: 我可能没带上!
江争达: 你你创建一个聊天就是新聊天,你你先就全屏就完了,对,然后什么是数字化转型。然后这个时间你也可以切到别的是不影响它的,就你可以切到别的对话那个历史记录去。然后你再说一个问题就是展开说。
线下人员: 不等会司法转型就这么两句话就结束了?
线下人员: 二姐也没带,什么也没带。
江争达: 你再发一下,展开说。
线下人员: 为什么需要展开测试才能?
江争达: 现在是现在后端也是要优化的。
线下人员: 你现在是你现在是固定复杂模式吗?
江争达: 我没动后端的我没改。
线下人员: 不是就是你发你不是有个接口参数吗?你发的是零还是?
江争达: 这个是你,你看一下处理过程,它没有子问题分解就是简单模式。
线下人员: 这肯定就是那你打结束你把那6.4把它打开。
江争达: 对这个应该简单模式没有做子问题分解的。
线下人员: 向量检索检。那怎么是。
江争达: 这下面的这做了子问题分解了。
线下人员: 判断有个自动的判断,这个判断。你上面那个问题的?现在你下载的父或者说可链接的资源是什么?是一个文档?
江争达: 我已经都弄好了。
线下人员: 我绑架了。
江争达: 不是浏览器安全的问题,你你改一下浏览器安全就行了。
线下人员: 你已经链接了吗?
江争达: 链接了你是可以正常下载的了,你把稍微设置一下,你说下载就完了,就允许下载就行了。
线下人员: 看看看原文,这就可以了,这做的就蛮好的,他能插电就肯定能下载链接,找到了浏览器。然后再点一下下载。你给他设置一下浏览是我浏览器。
江争达: 你这是浏览器的问题,要把那个因为我现在是用用那个就是 IP 下载有不太安全的地方。然后下面是就是下面的那个文档来源是去过重了的就是只有不重复的来源在下面,然后具体的引用就是在正文里边,你可以点击。
线下人员: 我不知道是网络问题还是什么,你网你主页的加载还是挺慢的。
江争达: 还主页的加载你第一次会稍微慢一点的。
线下人员: 我知道了,知道了。
江争达: 有的时候有些功能自己测确实已经看不出来啥问题了,就了。然后你现在就是重新生成,还有那个对文字的重新编辑都是有的,但是确实有些是要后端也要加对应的接口了,你比如说你虚龙点一下那个输入问题那里。你在上面自己输入的对话框。对就展开说,对,你可以编辑文字或者复制了,就这个都是按 GDP 的格式走了。
线下人员: 那你你你弄一下你你你重新写一个重新写。
江争达: 你就打个问号就行了。
线下人员: 制作还展示它的核心价值。
江争达: 你按回车也能发,反正按那个也能发。
线下人员: 你编辑你实现后端接口?
江争达: 现在没有就是后端后续都要调整,我只是把这个功能先加上去。
线下人员: 这不是假的。他是要发给客户端了,只是他。
江争达: 对他是真的发给后端,但是理论上来说,后端是要对他之前的那些数据进行处理的就是比如说。
线下人员: 别听话对。
江争达: 对。
线下人员: 要实行计划。
江争达: 是要做替换的,现在就是全是新增。
线下人员: 我后台好像之前已经实现了。就是你发。
江争达: 有可能不是接口可能还没我还没做好。
线下人员: 接口你,我当时。
江争达: 这个时候你也可以切到别的聊天记录里边,他会。我现在是做了三三个会话可以并行,你可以发两个一起一起重试,两个会话试试。
线下人员: 另外一个现在有没有缓存的,没有缓存。
江争达: 你说的是什么缓存,对话的缓存?
线下人员: 问题的答案的缓存你比如说我前面也问过了。后面有个人又来问一遍,你这时候又重新检测一遍。
江争达: 我要这个缓存这块的话就是这个方案,我要再研究的,因为有的时候你如果是就你对话缓存是根据你这条的那个。问的问题来做缓存的,那他有的时候就加在加入不了多轮对话的里面去了。能大概理解我的意思吗?就是比如说你看数字化转型之后,你如果是缓存匹配到了它就不走那个,它就不走正常了。你如果说再输入一句展开说,那其实你的完整的一个输入是。数字化转型是什么,然后展开说,但是它就等于它只匹配到了你展开说它数字化转型那一块的那个内容,它就不加了。他回复的答案就只有展开说了,就是只根据你那个展开说那个答案来做那个问答了。
线下人员: 这个其实很简单。
江争达: 这个我因为我还没这块,我还没做优化后面的这个就是缓存机制什么的,就后端,我现在还没开始做优化,就现在就是前端的效果。
线下人员: 我点你下载根本就没有任何反应。
江争达: 你我手机都能下载。
线下人员: 我点下载是没有任何反应。肯定设置上有问题,不管他这个设置肯定要重新调。那你可以把中间加载的过程再把它加添加到上下文里不就行了吗?
江争达: 对的这个,但是后端就主要还是后端的那些问题,然后我要研究。
线下人员: 这样的话**你几个问答之后,你就上海文就会爆掉。
江争达: 这是我拿手机做的测试,然后就我发群里了,手机也可以,但是苹果的我就没试过,我得你要说不行我再研究。
线下人员: 不好。也没啥反应的饮用是不是?
江争达: 引用我做了一个处理事件的是橙色,然后段落的是蓝色。
线下人员: 不是它的顺序是不是有点乱?
江争达: 这个顺序是大模型回的。
江争达: 要在提示词跟大模型交互的时候,提示词要好好优化。
线下人员: 问题。不是这里面有个问题。我点了查看原文。他链接过去的好像不是那一段他。
江争达: 对它不是那一段,他全文。
线下人员: 对。对。
江争达: 你还要弄那一段,那还要再做一些特殊处理了。就是把那一段加量等于说。
线下人员: 这个挺难。你要在 html html 上是可以的,你在 PDF 文档里面很难因为要打开一个渲染器你还要找到那个东西我觉得。4.5。他这确实你我感觉不了你。确实有特点,但是确实不在那里面了。
线下人员: 我来搜一下,看看能不能搜到,我看看检索的正确性如何?
江争达: 现你尽量还是少搜一点内容,因为他毕竟是用做的,我给他们能下载的是 PDF 文件。我们的知识图谱和向量其实都是针对 PDF 先做成了。
线下人员: 那你啥说啥意思?
江争达: 没事。重新生成你也可以点的。
线下人员: 编辑我查找。我也是找找看你。你看。里面一个很重要的问题是关键问题,你别以为简单。我不知道是自己生。没有好,我来切到我自己上个会切过去没少不了。问题很大的技术,就是个致命的漏洞。
线下人员: 过来共享一下。我们看。这个41看到了我查看更多你看有个查看原文我先把我先搜一下这个我先把它保存下来你看查看原文出来了我在这里面能够找到这个字才对不是说你根本找不到。还是因为它 PDF 里面没有因为它这个不支持这个网页上速度 PDF 我把你下载下来看看。
江争达: 你这是不是因为不能在它 PDF 好像是 PPT 形式,它是图片。
线下人员: 里面下载。有可能我下载下来看一。我把它下载用打开。
江争达: 好。
线下人员: 有了前面网页里面搜索不了。跟这段是不是对的?产业发展特征推动其发展重点上移应用现代化不可能跟这里面讲的不一样。产业发展推发展特征,推动其对的。这句话还是都检索到了,就我最担心的边连那个都监督出了最底层的问题了,你这个现在数据库都建错了,那就完蛋了。
线下人员: 行,我知道了。接触四种。
江争达: 然后搜索聊天的话,现在就是支持就是对话的历史的那个叫标题搜索内容搜索的话这块就是后端,我现在后续还要再做一下。
线下人员: 啥意思,标题什么消息。
江争达: 现在只能搜标题就是你先点秀龙先点一下搜索聊天你可以对标题进行搜索内容搜索这一块现在还就是后端现在不支持我要做一下后端你可以打一下就2025。
线下人员: 你现在所有的对话都存起来了?
江争达: 现在所有的对话都是存到数据库里的对。
线下人员: 那就行,到时候就搜一下数据库就行?
江争达: 对的你可以点点进进对话或者啥?
线下人员: 你重新生成再发一遍,然后把之前的删掉,还是现在做新增 The other.
江争达: 接口要做,但是前端现在展示也都做好了。
线下人员: 你语音输入可用了吗?
江争达: 语音输入是不可用的,但是不能点击的,你要输入成了文字之后它才能发送,你要有文字它才能发送。
线下人员: 知道。知道了。我们可以考虑变成。
江争达: 对,然后也有,比如说敏感风险,你比如说旭龙打一下那个敏感风险四个字,就是也做了一些,就是限制,但是具体或需要做哪些限制,还要再说一下,再确认一下。
线下人员: 打打打这个?
江争达: 敏感测试好像是。敏感测试。
线下人员: 啥意思。
江争达: 有些字是不给你发的。
线下人员: 明白了行。
江争达: 然后就是你说的设置虚龙点一下设置,就现在我设置右上角那个设置按钮。
线下人员: 这是?
江争达: 就大概现在支持这些设置,后面可以再加。
江争达: 就回复默认就行。
江争达: 没有最最下面有一个恢复默认最下面那个应用旁边。
线下人员: 你拷贝出来?
江争达: 哪一个拷对的拷贝出来是 mark down
线下人员: 那你带这些链接吗?
江争达: 不带。
线下人员: first class.
江争达: 不带那些引用不带。
线下人员: 好的,它是那个事件堕落,有的我复制出来是这样的可以。
江争达: 有吗。那后面我要加一下,我最开始是不带的。
线下人员: 有的我复制出来是这样的,它有这个钥匙药的是我就是后端返回的成文本吧。
江争达: 你看。
线下人员: 对你还这个你还比较他们难去吧!
江争达: 我还得再想怎么给他。我现在前端已经做了多少好多个兼容了,已经它返回的太乱了,你知道吧?
线下人员: 因为我现在是大纯靠大模型去引去隐藏它肯定就是纯文本的。
江争达: 对。
线下人员: 不,你是把这个到时候根据那个 ID然后重新去映射数据库里的东西。不是你现在大模型引用了这个东西就它生成出来这些答案里面带这个事件什么的是我们后续自己添的吧不是大模型出来的吧不是就是我就问你这个包里面最小的引用3258这些是我们后天的大模型带回来这个12345是后天的。那里面的段落在哪里来的那等于我们回答是把它删除了。我们在输出答案的时候把这个删掉了对这是健身哪个是这意思吧现在
江争达: 喂,有点断你你能再说一下吗?刚才。
线下人员: 就刚才比如说你贴到微信里上面后面说在事件多少你都把它删掉了?
江争达: 理论上是的,现在没删掉,我后面要再研究一下怎么删。
线下人员: 你没删掉你,在那回答里面,你应该包括段老三这个字了,这三个字有吧?你这里面没有明显没有你这里面肯定是被你删掉了,同时你篮筐里那个数字是自己后。
江争达: 我删是删引用的,但是它纯文本我没有删,我是这个意思。
线下人员: 你那没啥,你怎么会没有了,那你回答里怎么会没有了?
江争达: 他这复制出来不是有吗?
线下人员: 你显示。那你显示的,你显示里面为什么没有了?
江争达: 有事件一段落一。我显示是因为我转了。我转成引用了吗?没有引用了吗?
线下人员: 你转完之后就把它删了?
江争达: 你要不拿一个旭龙先要不先放到就是第一段话对一下吧,我看一下你们说的到底我们没太理解啥意思?对交付速度事件一就是变成引用了。
线下人员: 你10.1变成引用了,是你自己转化之后又把这三个字删掉了?
江争达: 对的。
线下人员: 那就试了吧,你也是费劲给你转换完就把它删掉了?
江争达: 我直接把这个东西转了没有,也就没有删,就做了一个转换。
线下人员: 替换了,说不说替换了,等于用了个程序把它替换掉了,但是你的 mark down 你拷贝的时候你拷贝的仍然是大语言模型的那个对回答。
江争达: 对的。对我等于拷贝的仍然是文字,纯文字等于说。所以这块逻辑需要再优化一下。
线下人员: 引用源。非常不一样,对,就等于说他所见的和他拷贝的东西其实是不一样的,是经过处理的。
江争达: 对其实我也连那个事件一我都不想要,就是理论上来说就是那个文纯文本里面的那个事件一我复制出来,不太需要那个附件一的事件一的。
线下人员: 我就说你删了吧。
江争达: 我只是做了不把引用的标题复制出来,然后文本这块我好像做的时候没太注意,这个我要再优化一下。
线下人员: 我觉得对我们自己测一周之后就可以让他们找内部客户测。在这个之前得要把我们的知识图谱要加加厚和后端稍微重复一下。
江争达: 然后连总还有一个问题,就是我们比如说给市场部同事测的话,我给出去的那个测试文档是就是面,就等于是面向用户的测试文档,还是说我比如说内部有好多个功能要测的就是把。功能的测试文档给他们的。
线下人员: 是现在他们就能测就把测试文档给他,如果他没时间测,比如两周以后了,或者一周以后了,我们都测差不多了。直接就给他们面向客户的就完了,他们也不要测。之后他们抓紧时间测测出来,如果你跟他说,如果你们不测,那我们就直接给用户了,如果给用户出了什么问题就反应反馈不好,那他们负责任。
江争达: 明白。
线下人员: 目前看下来一些基本的点是都覆盖了的基本点都覆盖了,所以我就说你这个就是拿切的距离,这个模板让他去给你改的?
江争达: 对。没有吸收了几个有用的模块,就是左边栏和左边。
线下人员: 你是用语言表述跟他说我要左边栏怎么怎么地吗?还是说你?
江争达: 那不是,那我就是先让他 copy1份然后再根据 copy 的代码然后生成的,对的。
江争达: 主页可能还有一个问题,主页那个标签云大是云大阁上面写成云大图了,然后其他的没啥了,主页你看最上面那个它写成云大图了。
线下人员: 尤其。
线下人员: 没有。
江争达: 没有最上面标签页那个地方对我在我电脑上可能太大了,我看不出来标签最上面。
线下人员: 行知道了他识别错了。
江争达: 对。
线下人员: 行,那就基本上也就意味着如果我们把后端也对接一下,其实云大哥也可以迁过来了?
江争达: 对,但是看看具体要怎么切,就是难道我直接用我们的主页吗?
线下人员: 对。
江争达: 就直接就用我们这个主页了。
线下人员: 将来。将来。我们要重新设计这个页面也就意味着我们现在可以重新设计这个页面了?
江争达: 就设计主页面?
线下人员: 对。然后把整个林大格的页面重新设计一遍之后,我们再看看怎么要再把它切好不好。
江争达: 明白。
线下人员: 因为他们觉得原也觉得设计还没还是挺土的一个圆桃花。一派没有什么艺术素养的人。弄了点技术人员弄了点动画,基本上我能看出来就是没什么艺术素养。当然你也难,这边得找有一点艺术就是你网上找一些好看的页面,把它重新规划,或者说用你用什么。你先是用那个 front front 就前端设计那个 SKILL S 你重新改造一下,你就说我现我觉得这个不好看,得到什么不满意,然后你用那个 front 设计的重新让他说,你给我重新改一遍,但是我需要保持什么什么风格就行了。
线下人员: 明白吗?让他重新做一遍,然后你再加上那个 rough rough 这个一遍一遍改,我估计两小时就给你考完了,一个网站重构结束了。
江争达: 明白。
线下人员: 明白了吗。
江争达: 到时候我先选几个模板,然后让元元他们也看一看这样。
线下人员: 你不要先选模板,你就用 front 先让他跑。对你同步你同时让 front 你可以跑五个版本出来。
江争达: 就生成几个版本,我意思生成几个版本?
线下人员: 不就完了吗?你每个版本的风格不一样,然后你要求说你先跑一个出来之后你觉得差不多了,你再根据第一个基础上,你同时让它再生成四个。不就出来五个版本,你同时开五个终端就顶多 token 对这个时候你就可以用 GM 来做了。你不要用这个来做了 GM 生成那个前端也很好看。
江争达: 明白。明白。
线下人员: 不就行了吗?你这样你那个 GM 也不浪费了我们那是包季度的?
江争达: 对的包季度的。
线下人员: 不就行了吗?你看你同我估计说你顶多半小时就能把这五个版本跑出来,就你自己只要花半小时,他可能要花两小时,你配置一下那个 API。
江争达: 好。
线下人员: 容易跑一下就完了。
江争达: 好。
线下人员: 他也支持 skill 了现在。这个我就跟你说吧像你们只要学会怎么用你效率是很高的。这样的把主页的页面跑出四个版本跑出几个版本然后把这边的让他们测试的那个东西发出来发完之后如果他们不测下个礼拜就给他们直接可以给用户内测就完了。给用户那个小小小规模测试就完了但是这个测试的前提要结合旭龙那边把我们把知现在知识都几百篇了100篇两百一百零二。
江争达: 一百零二篇现在是?
线下人员: 那现在他总共有多少篇总共我不知道总共有多少那你跟媛媛说不行把先把这个最常用的500天下载最多的500天行先拿过来。理解吗但是要后端要改的一个就是可能响应时间会长会不会。
江争达: 有可能的。
线下人员: 但是你如果配置不会对配置算法,没有的话,还是会不会的,主要就是第一步向量检索能增加点对 ok 明白行吧!
江争达: 对。
线下人员: 这样,这个总体来说做的不错了,很不错了,所以你看你现在盯着一件事情还是能把它做相对的。但是第一,你现在所有文档工作有没有完善,比如说你现在有还继续有哪些问题?第一版本,然后测试解决哪些问题,然后现在还剩下哪些问题,接下来怎么做?
线下人员: 版本工作。
江争达: 明白,有的。
线下人员: 另外一个,接下来我们要学会用什么,你现在看看不行把那个 G 这个或者 G 工作把它用好之后,你直接在里面,它有 at cloud 的这个功能。你未来所有的测试问题可以在 github 上直接添加问题,添加完之后它自动修改,明白了,修改完了之后你测试完。
江争达: 当时我们就是我上次你之前好像让我做过一次,然后当时调研结果就是他那个艾特的那个 cloud 是走 API 的,你还记得不,我记得?
线下人员: 我那你现在?
江争达: 你在 get 上就是 at 考?
线下人员: 不,你现在这样,那你这样你你把这些问题全部拉取到本地拉到。
江争达: 行,我研究,我看看怎么弄,那不行就用我们的 get然后加那个拉到本地这样也可以。
线下人员: 你把这些。也可以,要么你这样用一个 cloud code 用 gr m44.7来解决这个问题。
江争达: 我记一下。
线下人员: All right. 这样的话你自动修改出来版本测试完了之后上线之前你看一遍不就行了吗?这就是一个自动化的管理流程了,不像过去**天天盯着用用户问题现在不需要你去不去管了用户问题提出来之后你自动就解决了,你看这效率。比你高多了吧,比人高多了吧?
江争达: 明白。
线下人员: 这就叫 AI 原生的懂了吗。全部打破了以前的软件管理规范了。那就这样,今就是你你这个礼拜到下个礼拜左右到周末,我们把这个前端的测试,你尤其是先以你为主测试,包括组织他们的测试。测起来,测完之后把问题暴露出来之后。不是我们有个系统吗?后来对了你的问题测试系统搞得怎么样了?
江争达: 没搞我这周搞一搞吧!
线下人员: 你这些问题就上来之后那些版本当然你可以用 get 来管理这些问题,也可以自己搞一个版本管理?
江争达: 我就先做一个前端系统再说之前是想做成就是不用前端就直接对话什么什么的那可能现在来说要求有点高,尽快弄一个能用的版本吧,我觉得。
江争达: 喂,又听不到了?
线下人员: 听到了。行吧那我这边是先找加500份报告对你们先把500份报告然后他那个 OCR 也需要有骨气吧?然后不行就让江南给你做好事的叫什么让他办理布置好,你用多长时间交多少钱行。
江争达: 不用布吧,直接调 API 接口就行了吧徐。
线下人员: K OCR 没有 API OCR 没有 K OCR 和这个就咱们用那两个都没有 API。这个可以布到他那个小服务器上。
江争达: 我随阿美。
线下人员: 我们那个服务器是可以补的,可以 KOR 不大,你把那个叫什么模型给它布上?
江争达: 谢谢。
线下人员: 在服务器上布一下,还有 new new markdown。他们说你现在有个最现在最新的叫那个 OC据说比识别效率都高到百分之有的能识表格什么识别到百分之百了对你这样你你你研究一下如果可行你就让他不这叫什么 M 就是欧洲有个开源的模型叫 M。Mistil. Mistro Ocr. 收一下。有吧。1211对吗对。有了现在已经有。行你可以部署它也很小也不大你研究一下这个好像是这个所以我就跟你说现在对工具的理解简直就是他妈的我觉得现在是完全是。就是工作效率的最底层的能力了你知道新的这东西就是完全就是怎么说能够一个好的工具可能节省或者提升你好多效率的。好。
线下人员: 然后我看销量数据库没什么要弄的,另外还有一个事情,今天下午到新管中心开会了。开会他们?尽管中心然后他们连知识图我都不会见,然后我说我们做了,他说什么时候过来学习,我说行,那个就那你后来用那个和那个 a schema。
线下人员: 你是不是也不需要我有点记不住了,是不是也不需要先定义实体类型?
江争达: 不需要的。
江争达: 对。
线下人员: 行,然后制度反正明天见的,这个自进化知识图谱这件事情回头我们再研究一下,这个肯定未来销售不上。尤其是在 cos boss那就这样把你拉出现在那个程序跑通了吗或者说跑。
江争达: 跑通了,然后也对跑通了。
线下人员: 你的知识图谱现在用下来的感觉怎么样?
江争达: 够用我不是做了一个医疗那块的问答吗?目前来说是够用,感觉是够用的。
线下人员: 到时候这两个到时候再看一看。因为因为后续好像这个后续有没有新的版本了,新的演化也没看。感觉他已经比较全了,以前那些发布了这样吧,你把之前把 auto schema 和拉拉的这个你不现在说测试吗?你把两篇论文对比。也做一下,之后把整个文档整合起来,发一份出来。
江争达: 需求没啥意思,论文的对比是啥意思?
线下人员: 听得到吗。先做这两篇论文的,就这两个代码不都有基基本的论文吗?我记得你让那个大模型帮你把两篇论文做个对比,详细对比完了之后。
江争达: 有的。
线下人员: 把你的测试的结果也整合在一起,做文档出来。
江争达: 那就是用 auto skill 原生的测试吗?还是用骁龙改过的测试?
线下人员: 改过了,改过了。
线下人员: 改过那不是有了我记得是对李姐说可能需要点时间了什么东西500篇报告。
江争达: 明白。
线下人员: 那数据库里不都有吗?我不知道你,你问他是不是都在数据库里吗?你把数据有个接口一开,我们来搜,我们来拿就完了,不要他不行就我们来。下载次数他就统计了,你问他数据库里有没有下载数据没有,就算没有我们家那个叫什么 Q word 来做就完了,行吧。你数据库打开就行。以后我们要实时从数据库里拿的。
线下人员: 所以你看没有技术人员对这个问题非技术人员的理解就很狭隘,总以为都是我自己一个过去。他就不理解技术上能做到什么程度,所以就没办法想这个指导,所以就得沟通。不沟通就问题解决不了。我感觉可能是我未来工作的一个侧重点,我觉得我需要一定,我告诉你是前期有一些东西,后期你就完全脱离了,你就自己开启,你就引导他们就完了,就可以根本就不知道提出什么时候你就自己摔给他们,这就够了。不要花太多时间在沟通上,他们有些人没法沟通他,因为学习不了,咱们给他用,他不愿意用或者用不了就算了,我们就做他的事情。因为你等不起的。不要在一个身上使劲叮叮叮,你有这个功夫,我做的新的项目都做好几个了。
线下人员: 行,那就现在听到了!
线下人员: 那这下下一个你可不。
江争达: 我共享一下。
线下人员: 不能怎么共享?
江争达: 你们看得到吗?
线下人员: 看到。
江争达: 就是做的文案到视频生成的工作流。
线下人员: 厉害。放大一点。你那个全屏就这么大了?
江争达: 我全屏你我看一下。我全屏得看一下。
线下人员: 行吧,就这样吧,能看就明白了,别折腾。
江争达: 这个已经是我大半瓶了这样能看清?然后阶段最开始的阶段就是一个风格的提取,就是现在是就针对那个风格,现在是选几种风格,然后先定。
线下人员: 行好好说话。
线下人员: 养好了。这件事情是干什么的?
江争达: 我刚才说了,从文案到视频,然后一个自动化的工作流。
线下人员: 那你文案到视频上来怎么会有个风格提取,我也听不懂。
线下人员: 那你上来是你看你的输入是文案,你上来一个风格提取。
江争达: 这就是等于出一最开始的阶段调研,等于说是。
线下人员: 你看这又是乱的。你到底是封图片输入还是文字输入问题?
江争达: 文字输入。
线下人员: 那你上个阶段零是啥玩意?
江争达: 阶段零就是它不在主流程内要做的一个类似于先定义是。
线下人员: 你们把它加在这里,是不是所有人都被你误导了?你为什么要加经文?
江争达: 视频你做不是也先得定个风格吗?
线下人员: 那你在那个地方做成一个就是说旁直的输入,你不能上来做一个是独孤零零的一个东西,他提取完了到哪去了不知道。到 style 的了?
江争达: 对。
线下人员: 你检讨。
江争达: 明白。
线下人员: 你以前没有箭头我看不懂你容易通灵灵上来说你干啥的,你想干啥不清楚,做完之后有什么用没有写。下一步数据流到哪没有你这图画的相当水平了,你自己不看的吗?图。
江争达: 我看没感觉出来问题。
线下人员: 对你是你都以为你,你想你那个箭头都没有,你都看不出来,那你不问你,你具体的风格到哪去了?这不是一个主流程,你这个主流程上来画这么大个,你不喧宾夺主吗?所以你是咋画的水平,所以你别我再说一遍不同的工具,同工具在不同人手里画出来东西就完全不一样,这是完全反映了你的思考能力。
线下人员: 那再说一遍,回到这件事情上来你不叫阶段零?
线下人员: 接着说,就是文案。那你 style 要不要输入,我问你要不要到主入口里面去?
江争达: 要的。
线下人员: 你接头。
线下人员: 对你啥玩意,你画?
江争达: 这三个。
线下人员: 所以你花完你自己看没看?
江争达: 我还改过了。
线下人员: 水平真可以。你箭头都没有,你看不出来你画的什么流程图问你流程图就是箭头,指向这么重要的东西没有你你我第一眼看出来这个问题了,你竟然能说我改过了,你这是什么水平?
线下人员: 那你 audio 要不要进去?我问你你同步的音频。跟文本是同时输入吗?
江争达: 是在这是有两种模式。可以不加,但是最好就是两种模式,一个是音频同步模式,还有一个就是纯的音频跟视频的拼接模式。
线下人员: 行了,你重新画这玩意谁也看不清你自己脑子理不清,所以我就说你现在流程都画成那样,你做出来东西也是乱的。你肯定不,你到底什么时候进音频,什么时候不进音频,你分支怎么选择的,什么条件下进什么条件下不进你的 style 要不要输入在哪一步输入作为主入口输入还是在后面输入是不是在那个?现在风格提示词里面加还是在图片里面加?这些流程你都没搞定你,你自己就开始干干啥?所以我跟你说,你这完全是自己没有描述清楚,所以你肯定它生成的就不准。
线下人员: 这么说难听点,你说难吗?不难,但是到你手里就变成了就无比艰难。那什么回头重新画这个图,我就其他我不看了,我就问你你那个首先风格提示我不是给了你那个监测数组你试了吗?
江争达: 我还没试。
线下人员: 那你怎么提取的现在?
江争达: 之前的用的 AI 直接生成的分割提示词提取的。
线下人员: 你这句话我也是听不懂的 AI 直接生成的风格提示词提取的来,你解释一下。
江争达: 提取风格的规则是由 AI 生成的,然后用规则让然后去图提取图片的风格。
线下人员: 你 AI 生成分割提取的提示词是什么?你拿过来我看看你自己研究过吗?提示词准不准?
江争达: 我看了一下,大概要的模板是够有了。我找一下。
线下人员: 你是批量是多少?一批多少?
江争达: 批量我测过的是一批最高现在是十张。
线下人员: 然后共同提取?
江争达: 不是你说批量是吧批量就是13张这测了一次。
线下人员: 继续来,你认为是准的?
江争达: 不认为。
线下人员: 我认为那你怎么你就不改了?
江争达: 提示词,我现在确实还没来得及优化。我现在把整体的一个就是我提取的提示词,主要是这些框架的东西先提出来,然后的。
线下人员: 冷调好了你把我说你以后你做的不好的东西你拿出来,不要给我结果。过你是用什么哪一句话来生成提示词的。果不其然你水平真高。那你十张怎么办?
江争达: 把十张都发给他。
线下人员: 你是在这边那里提取在哪提取的,也是通过那个?
江争达: 对自动上传图片,然后加一段提示词,然后提取。
线下人员: 你一下上传,比如说上传五张或者十张,然后那你要分析这张图片怎么分析,他总共五张或者十张。你分析?
江争达: 提取一个共性的。
线下人员: 共情的。你就不能多说两句话吗?简直是。
江争达: 这块我确实从每一个的工作流的我确实没优化,这我也确实。
线下人员: 干个活那操成这样?
江争达: 就确实干不过能力不行,干不过来,这也不是操吧!
线下人员: 我就干不过来,我跟你说,你多加两句话,顶多就是十秒的事情,不是干不过来,是脑子懒,知道吗?在每一步重要的地方,你是懒的,你不动脑子。你往上走你请分析这个专业这张图片。我问你这是你的真实目的吗?这是你的真实目的往上走。
江争达: 等一下,我先看一下下面的。
线下人员: 你那个提示词?
江争达: 稍等一下,稍等一下。然后下面就是还有一个风格那个吗?合并。
线下人员: 你为什么要用这种方式来做,那你就不是一次上传五张十张,你还是每次上传一张,然后一张生成完了,有个提示词一张生成完,然后把这十张提示词再合并是这意思吗?
江争达: 我是有两种模式,一个是能就一开始写的是上传一张,我发现不对,然后我就说,然后再帮我弄成一个上传批量的提取共性的。
线下人员: 你上面那个提示就是错的。
江争达: 有的他不是他是你是看的,我这一批的是按这种走的,如果是按各张的就是按发的。
线下人员: 行,那你就回到那张!我就问你你这个 prompt。你多加一段话你会死吗你是真的就这么简单吗专业分析这张图片就结束了是吗
江争达: 下面都是。
线下人员: 你是怎么生成的,我问你。
江争达: 哪下面这段话。
线下人员: 是怎么生成的?
江争达: 这段话就是我之前不是做了那个做过手工的视频生成吗?然后我根据那个视频风格的一个模板,我让他把这个模板先给我导出来。然后把这个模板给他,让他先根据我把模板给 AI。
线下人员: 你那个模板就是这样的?
江争达: 对。
线下人员: 跟你说,那你想过没有,你为什么不满意?
江争达: 我觉得。
线下人员: 再往下。我跟你说有的时候是这样的。从我现在使用界面上的情况来看。
江争达: 我感觉给他。限制住他了?
线下人员: 某种程度上。对不某种程度上你给他这么多这些东西。他是不是真的能够描述的清楚或者描述的全面不那么,因为你规定的是这些东西,它有很多东西,你没有规定,它就扔掉了。懂吗。
江争达: 对我知道,然后我也看了,你给我发的那个就是我还没来得及去测那一块就是你不是也给我发了一个用那个 JML 怎么生成那个?就提取文图片和图片的什么分析,就是有五个还是六个参考的 prompt我记得那个我还没来得及去弄。
线下人员: 那个也不完全就我。
江争达: 对还要调研感觉再看看别的。
线下人员: 我跟你说实话。不一定是图片,有的时候还有视频的风格。
江争达: 对我会想着就是后续还要加,就是也因为他也能读视频,后面感觉还要加,就是对视频的提取的这一块的内容。
线下人员: 你不如直接做视频,个别的图做一些图片上的风格,几种风格就完了?你你不行,你你重新解读视频,看看视频的风格有哪些,然后你跟之后让他提示就是你想生成一段什么样的视频,然后你让他给你一段提示词。
江争达: 妹妹。
线下人员: 然后再看看怎么做。
江争达: 明白。
线下人员: 行吧,就这个意思,因为再回到你那个。流程图吧。
江争达: 我这个流程图主入口就是文案加风格一起一起给就是一起。一起给他,然后他是根据文案加风格的提示词,然后来进行就是封禁生成的,但是就是周**不是跟我聊过吗?就是那个文案加。风格提示词可能不太好,其实是文案加剧本制作可能会更好一点,那这块就是还要再优化的步骤一。
江争达: 然后步骤二就是针对你文案提取的就是针对就是我现在是用那个 gma 或者 GDP然后针对文案生成的一就是每每一个分镜的那个关键帧然后。生成那个关键帧的那个画面描述然后那个现在那个画面描述你那个周日给我的那个我也还没参考就那个画面描述具体的这就是其实封禁一这块怎么优化其实后续我还得再做好好优化的。
江争达: 第二步就是你你说的不第二步就是图片生成你给的那个建议就是那个图片生成能生成四宫格或者生成几宫格,到时候先选这个,我反正都记下来了,但是还没。还没投入使用,就是要作为一个参考,看看后续怎么优化了。
线下人员: 行了,那基本上重点就是第一个了,第二个其实也都差不多,第二个顶多你这个带上一些镜头的指令给他,就是比如说指示它生成下一张图片的时候。首尾针的时候,就是你首针到尾针之间,它有个它有目标的导向,你如果没有目标导向,让它自己生成,不知道怎么样,所以都可以试试。你比如说加上运营脚本的。让它生成下一张和不加运行脚本,让它自己生成下一张到底是什么?
江争达: 照顾明白好。步骤三就是之前我做的后边你不是给推荐了工具,就现在先用那个节目去水印的工具。做的,然后视频生成这块其实也是那一样,就是视频生成的优化的点可能就在于现在都是用手尾针的,然后后续其实可以考虑就是。是不是用手针,它生成完了视频之后,再跟这个步骤二图片这块再做关联,这个其实也是一个优化的方向,但是要研究。
江争达: 就是这样的话,你的故事更有连贯性,这块都是优化的点。然后第五步是语音生成,这就是说普通模式,我暂时先就是基本上是不用的,主要是用这个音频同步就是先生成语音,然后对视频,比如说五秒的视频进行裁剪。
江争达: 我不叫裁剪,叫加速,比如说语音生成四秒,我就把视频加速到四秒,然后来,然后最后进进行一个语音音频匹配,然后视频拼接还有那个字幕生成最终的那个视频。
线下人员: 这种方式也不一定要加速了。中间可以抽掉几针也是可以的。或者说增加。
江争达: 对。明白。
线下人员: 到时候看我同步还有一个它就不能生成严格同步的文案吗?文案不可以改吗?
江争达: 你指的是文案改是改什么?
线下人员: 读的文字,比如说有长有短就配不上那个画面,你把文字改一改不就能增加上去了吗?
江争达: 对。要再研究,稍微再研究。
线下人员: 是不是最重要的你这个东西简单你比如说原来就是五秒钟大概多少字一分钟200十几20个字你你多一秒少一秒你就增加大概35个字不就行了吗这不简单吗
江争达: 二二十个字。你增加,那你等于又要再重,你等于每一每五秒的文案你要改?
线下人员: 简单。
江争达: 有的时候那会出现一个问题,你有可能文案不一定能匹配上画面。
线下人员: 怎么可能同样的意思,比如说多加个 D 去掉个 D。
江争达: 那我大概能理解。
线下人员: 各种18。那你怎么可能去重新改意思就保证意思不能给 prompt 就很简单帮我扩增10%的字数结束了帮我减少20%的字数结束了。
江争达: 明白。
线下人员: 它字数基本上每每一段的字数,每五秒钟的字数是固定的?
江争达: 差不多的。
线下人员: 所以你就按来按照画面给我每个每每每段都生成同样的这个字数就差不多了吧,不就行了吗?你很简单,你分成五就是五秒一段,然后把所有的文字都压缩成相同的字数不就好了,一次性处理完。
江争达: 不是你你比如说都压成五你就固定每每五秒就是20个字
江争达: 对我就说了你固定如果每五秒都是20个字你有些就比如说有五句五个字或者十个字就能体现出一张图片的那种关键帧那你。你那你在这个就是封禁生成的时候它会就是把那个比如说五到十个字它就能作为一个关键帧直接生成了这个意思。然后那你20个字你怎么去再去匹配它
线下人员: 那你开个方案?你你这个文案你可以给你,你比如说你每一段切好了这么多字给他,然后让它生成图片生成首尾针,你现在不是文案都是切开的吗?你文那我问你,你文案输入的时候你是按什么来划分这个段落和眉首尾针这个文字的?
江争达: 我让他自己划分的。
线下人员: 他自己做的你反正对你就能懒就懒到一定程度。你没。
江争达: 对。不是就是我试了就是隔这样的我是给了他一个规则,然后让他做文案划分,我没有做那个固定的那种限制他不能超过。
线下人员: 你就让它自动增减不就行了吗?你文案划分完了之后,你说可以根据这个考虑到时长的问题,请把每一段的文案扩增到同样的基本同样的字数不就行了吗?修改到同样的字数难吗。
江争达: 男生不能。
线下人员: 这样的话,你每一段的字数都差不多,你不生成的时间不就差不多了吗?
江争达: 行吧,我主要是!
线下人员: 想不到。
江争达: 不是的是那个方向就是说我比如说我五秒一个文案它虽然只能生成五秒的视频那我五秒的文案那比如说我五秒我就针对这个文案我生成了一个关键帧。那我关键帧我这个关键帧我可能只需要两秒我就跳到另外一个关键帧。你这样的话你的视频制作起来的那个画面感不是更多吗你如果是固定好了五秒就是我20个字就生成五秒。那我20个字生成五秒的我的关键帧不就少了吗我是这么想的就是我。
线下人员: 面前不就是手针和尾针吗?
江争达: 你是手针和尾针但是你比如说我手针和尾针是这样的我如果是就是纯五秒20个字我本来能就是说我如果按照语义或者什么的来划分我可能生成。你如果不按五秒来规划就是不按文文字语音的五秒来规划的话我20个字我可能生成两个收尾针。你如果按20个字来规划的话你只能生成一个收尾针。那我如果按两个。
线下人员: 你的脑子吧真是我刚才说的你是没明白。你先按它自动规划的切。你不是已经切好比如说有十个字是一个收尾针有15个字一个收尾针一个20个字一个收尾针。你就是这么做下去了我在你里面只加了一步我把十个字变成20个字把15个字也变成20个字你同样还是首尾针你根本不会有任何真图像的变化只是你文字拉长还是缩短问题。很简单你直接让它先生成收尾针之后你把那个十个字变成20个字跟图片生成没有关系。听不懂事。
江争达: 我会后我再听听那个录音,我就是没太听懂。
线下人员: 行吧。
江争达: 然后就展放一下自动化的视频吗?现在。
线下人员: 自动化视频什么意思?录屏?
江争达: 对录屏。
线下人员: 你就最终就是给富有视频就是最终的了?
江争达: 我自己就跑了一个,这你说测试的就是给你们展示的是吗?
线下人员: 不是你你富有的那个视频就是最终的了,你这个流程。
江争达: 没有付勇那边现在还我们还在沟通还不是最终的。
江争达: 这是先生成封禁的脚本?
线下人员: 专利算利。
江争达: 对算力风格,这是算力风格的。就先稍微快进一点了。
江争达: 然后这就生成生成结束了?
线下人员: 你是一个什么意思?脚脚本是一次性生成?
江争达: 对脚本是一次性生产。浏览器不是说只在一个浏览器里操作就浏览器是关闭了,重新打开。
线下人员: 我觉得。你可以新开标签页?
江争达: 反正他会先确认是不是 pro 模式,然后再在做。
线下人员: 无所谓,现在能够自他不知道你生成图片哪些能自动识别了,比以前好了。你分辨率不要求吗?
江争达: 它现在默认是我的提示词里面是4k 还是8k 要我晚点看一下。
线下人员: 什么叫请使用 imagine 生成我听不懂。你买是啥玩意?
江争达: 我看一下我之前是 nano banana pro 可能改的时候被它改掉了。
线下人员: 可以你看。当然效果不影响一看将来都会出歧义的。
江争达: 就是要交付的话,那这个所有流程还要自己再过一遍,因为这就是做汇报的时候。
线下人员: 也可以看出来了,关键问题是你看得出来吗?你你就老老把所有问题都留到后面去解决,最后他妈的一堆屎在后面,一来不及擦,你为什么不在做的时候就精益求精?
江争达: 现在临时跑了一个。没看出来。我做的时候我写的是那能不拿那 pro
线下人员: 什么毛病?或者你看不出来不是你的问题吗?不,你这是个人,他就眼睛一打就觉得自己不对了。你为什么不改?为什么就看不到,你就没有这种精益求精的精神知道吗?就什么东西我先我看结果,我只看结果,中间过程我都不看。你就这种心态,导致了你很多中间错误,明白了吗?你包括那个图也是个问题。你就没有精益求精的精神,对自己的要求太低了。
线下人员: 行吧往下走!思想状态给你提出来这个问题你自己理解去吧!你这个图片是每次生成都是一个新的对话还是说在所有对话里面?
江争达: 在现在是在一个对话里边。你看。现在是在一个对话里。
线下人员: 好,你看看你,你你这样你把这个停住。你把 prompt 就行,使用那个 prompt 打开给我看看。
江争达: 我看一下。
线下人员: 你自己不改吗?这个 prompt 他对于图片生成是最核心的步骤了,你我跟你说难听一点,你前面那些玩意都是扯淡的,这一步是最决定质量的关键步骤。
线下人员: 你这么抄。我能相信你生成好才怪太糙了你看第1imagine这就是错的第二。只生成静态图片不要生成视频我问**你用 banana 它会生成视频吗?
江争达: 会的。
线下人员: 拿到 banana 能生成视频?
江争达: 会的。这是我试过了,然后它生成了,然后我才加的提示词。我确定。
线下人员: 你确定。你试一个给我看看。
江争达: 这是在我批量测试的时候出现的,我生成过三次,我是生成过。
线下人员: 这是不可能的,知道吗?我觉得你不知道哪个地方?你把生成图片我看看或者视频我看看。
江争达: 我找一下,我看能不能找到我这。
线下人员: 你是不是弄成开?
江争达: 不是在正常的你给它生成了三次图片之后或者四次图片之后,它生成的视频,它不是上来就生成视频的。
线下人员: 你的他连续对话几次就会生成视频?
江争达: 对那不是就是不是每一次都会实现?
线下人员: 那你这个规划怎么你你找一下里面的对话!**这你水平高了,你找到他的,我跟你说,你把黑客黑进去了,这就是他绝对是黑就黑黑进去了,我的内容里有吗?
江争达: 我看看我记得是有一次是有三次生成了视频。我的内容里,我就是他生成视频,我就直接点取消了,我没让他继续生成。估计这里面估计没有。这张图有可能是视频的。那这。比如说我先描述一下我的状态,就是给它生成了三次图片之后。
线下人员: 你等会,你等会。
线下人员: 首先。你这是 number pro你现在是100斤
江争达: 对。
线下人员: 对那怎么回事?
江争达: 我可能在跑的时候最后给跑视录制视频的时候可能看弄错了,我研究一下。
线下人员: 可以我质量控制简单我都没好不好意思说啥所以你说的话我是不相信的。什么生成视频我不知道到底什么原因生成的可能性微乎其微。我用了那么多次我连续生成了10个 pp T 十几个 PPT。我从来都没发现过怎么到你就会出现这种情况。
线下人员: 另外一个你把 problem 打开我看看。不是 imagine 上面对我看看你到底都生成啥了。对你把它打开。
江争达: 不是。
线下人员: 你再说一句。
江争达: 这不是我自动测试的。
线下人员: 你自动测试的?
线下人员: 打开。等会。
线下人员: 你为什么要同时都要中英文双语的?
江争达: 他给我。
线下人员: 英文和中文它不是同样的?
江争达: 不是他给的,给说的是用英文的模板,我就先用,然后提示词主要是为了我自己看的。
线下人员: 你被卖了吧?你测试完了,你为什么要看你只要测试的时候。
江争达: 不是我要看。它生成的图片描述我要看。
线下人员: 你将来是意思要把它删掉?
江争达: 可以自己先看一下,然后如果要修改,我是这意思。
线下人员: 将来如果测试批量的时候你还用吗?还能保留吗?
江争达: 批量的时候就不保留了,只是显示,比如说要显示中文的时候,再让它用中文,剩下的都用英文就好了。
线下人员: 你再往下。
江争达: 风格的固定模板给他。
线下人员: 不是。所以我问你。这下面因为是风格,上面是内容?
江争达: 对。上面是内容描述。
线下人员: 以后最好只有同一种语言。
江争达: 明白。
线下人员: 往下我看看这个图。你的无人机,我看到没有生成无人机。这镜头。
江争达: 它是无人机视角?
线下人员: 行吗。大概这个意思再往下走!我就跟你说,你这个提示词核心的核心在这,我跟你说,你今天所有的工作里面最核心的就是这个知道吧,这段题诗词里花的功夫是少之又少。
江争达: 明白。
线下人员: 所以你的工作质量是低之又低,所以你不知道把时间放在哪里,我告诉你知道流程跑完了固定下来就固定下来了,没有什么太多的要。要纠缠的知道吧,核心的就是你要为了保证对别人对你的认可度,你要对自己的结果负责任,你要对这个东西提出懂吧!精细的修改,不然你的质量是没法保证的,结果你把所有的精力全花在一个固定的流程上了,这是不行的,固定流程比较好解决。什么难的是这些东西,它后面是保证你的质量的。太了。
江争达: 可能就是效率低,你能尽量保证一个就那前端就是比较花时间多,这个就做了一天多小两天的样子,然后就去做前端了,那前端干了三天像。
线下人员: 前端感觉上是比之前有进步换了。
江争达: 能测的也就都尽力测了。再回到这好。
线下人员: 接着看。赶快那视频是图片生成这块就拉过去了。
江争达: 好。然后。
江争达: 生成完了之后就是去水印,这有个去水印去完了。然后就开始?
线下人员: 你这是做的图片是声音,这个是?
江争达: 对图图片是去水印?
线下人员: 然后就到了文身。
江争达: 然后视频就是。他自己生产。确认是我来确认因为这点一下要花钱的。60秒后就再生成第二个视频。
线下人员: 60秒固定的
江争达: 固定60秒它生成第二个视频因为我考虑到它生成。如果是你批量做视频生成的话它有的时候它生成是。比如说生成第一个视频生成第二个视频如果你两个它是可以并行生成的但是并行生成出来一个结果就是它可能第二个视频生成的比第一个视频快。你到时候下载的时候你让它自动下载它就不太好下载了。
线下人员: 我知道你意思肯定不是这么个解决方案。
江争达: 可以再优化。
线下人员: 你工作效率太低了。你可以根据?到时候看我感觉可以根据浏览器的编号。
江争达: 你说的是上面的编号吗?
线下人员: 对或者这上面的编号看看。
江争达: 我方案我倒试过,因为他有他也不能确定,就是不知道他怎么确定,这个是第一个是第就你就是比如说你第视频和第二个视频,它是由它的生成速度决定的,不是说由它的就是你每就是你生成的时候的那个顺序决定的。
线下人员: 我告诉你,如果实在不行,你真的要加快速度就把手针拉出来就完了。守针和守针对比一下就结束了。
江争达: 也就是识别手针,这个我考虑过可以。
线下人员: 有什么难的手就拿出来一对比就结束了。
线下人员: 好。
江争达: 这就是生成音频,再做,那现在是用?
线下人员: 音频是用什么做的?
江争达: 阿里云的 API 做的?
线下人员: 巴黎语能做的好吗?
江争达: 要找后面找优化了,就是音,反正我听了几个就是感觉还行,我就先用了。
线下人员: 那后来富有自己播音原声的是在哪生成的?
江争达: 是在黑镜上生成的?
线下人员: 要什么意思?为什么不用它?
江争达: 我感觉好像不没他们说的就是什么黑镜生成的那个好像那个音调什么的没有,还没这个做 API 这个音频生成的那个语气什么的要好?只是像人生就是黑镜,只是像富有的声音,但是情感这一块感觉还是缺乏的。
线下人员: 反正我听下来你就是 AI。他听下来就不是 AI 跟情感不情感的是有关系,但是更重要的是你这个就是个 AI 我听下来就是 AI 他那个就不是 AI就知识度就高。
江争达: 行,那我不行,就先采用人生真人生的方式先试。
线下人员: 或者网上下载一段也行。
江争达: 然后这。
线下人员: 网上下载一段真人的声音下载。
江争达: 真人的,那到时候我要看看要不要做认证了,有的时候真人的,然后用真人的那个声音,然后做音频的话可能要做认证或者什么的。
线下人员: 阿里?
江争达: 阿里就用的自己的自带的运营库。
线下人员: 自己来。他合同的名库我觉得就是有 AI 的感觉。
线下人员: 行吧。然后配字幕是吧,字幕也让那个加进去?
江争达: 对字幕加视频加速啥的?
线下人员: 这一个做下来要多长时间现在?
江争达: 60秒视频的60秒视频大概333到40分钟左右吧30分钟左右。
线下人员: 30分钟左右基本上人是不用管它了
江争达: 对就是如果是全全部给他放开的话,就不用管,就现在我是生成视频之前我人确认一下,因为生成一段是一块钱,就是我现在是确认一下。
线下人员: 我知道你每一段都确认吗?
江争达: 目前是。
线下人员: 每五秒都确认一次。
江争达: 这我看一下就是在这儿的时候,这个地方的时候我确认一下就是它上传完了之后确就是点生成内部,我要确认前它才能生成。
线下人员: 你没听懂我说的话,你生成一段视频不是就五秒?
江争达: 对视频是五秒。
线下人员: 那你每五秒的视频生成都要确认一次说我一次性确认完了,你就每就给我生成了。
江争达: 我每五秒生成都要确认一次。
线下人员: 为什么。
江争达: 你我现在测试阶段我就怕他上传的图片或者什么的有问题。
线下人员: 就怕图片读错了?
江争达: 对。
线下人员: 行我懂你的,那完全是不必要的,后面只要你。
江争达: 如果设计成自动化的话,就后面。
线下人员: 这个后面对,或者你,你如果怕他图片读错了,你只要把图片这个位置和这个图片的内容确认一下,基本就问题不大了。
江争达: 是不是我不是还跟你说了,就是不是下下那个图片不是他还有那个下虫的就是我不是给你发过一个视频,就是那个下图片。
线下人员: 我说你在做视频之前把图片内容检查一遍就够了。
江争达: OK 可以好的。
线下人员: 这样的话你就不用在每次生成视频之前检查。
江争达: 明白了。
线下人员: 因为这样的你在那个时候图片的时候检查你能够检查出图片到底好不好,要不要重新生成这些问题,就一次性检查掉了。
江争达: 明白。
线下人员: 因为你你我跟你说你能产生控制的地方。基本上就只对你可怜生成视频的时候你有提示词吗?
江争达: 有的这款是运镜效果。
线下人员: 只有一定效果?
江争达: 对。
线下人员: 你有没有提示它生成的内容?
江争达: 也可以加,现在是只加了一个运镜效果。
线下人员: 对。你看你对那个五秒视频基本没有控制?
江争达: 对因为我没写好,你对他控制的那个 prompt 我写不好,所以就是试之前试过几次生成的,确实生成的那个东西不太好,所以我就先。用直直接用首尾针加晕镜效果了。你可以控制它具体的就是五秒生成的内容,但是我写的不好,暂时还没用。
线下人员: 所以你看你们听到了吧,就这么粗糙的一个控制生成的东西都已经很好了,就很粗糙了,控制你看 prompt 基本没有控制。图片的生成过程基本没有控制,然后视频升温的过程也基本没有控制,现在就全靠 AI 人几乎没有控制的情况下,它已经生成这样了。
线下人员: 你想看我们这里面对他这个内容控制做的很好的话,这个视频的质量是很高的,明白了。但是这样的工具放在谁的手里很重要。你放在加拿大他用不好,我也用不太好,但我比他用的肯定好,但是也不如人家那些专业人士用的好。明白。再往后回来吧!
江争达: 没了。
线下人员: 这里面后面要改的就是第一个,刚才说那些优化的部分是让内容制作者完成,一个是我们自己把这些可能的。最优的自动化的方案给他拿出来。知道什么意思吗?
江争达: 明白。
线下人员: 比如说你这个图片风格怎么精细化控制怎么精细化表达你专业人士是自己可以做的,但我们可以用人工智能的高级专家来帮助我们把。精确的控制来达成,这个过程可以自动化。比如说监测数组的提取,你完全可以自动化出来的风格控制比你这个好的多了。把图像生成的质量的控制要非常已经精细了。就这个意思,所以说要把整个流程里面这些能够用做控制的地方做尽可能的智能化的控制,高质量的控制,这是第一个。
线下人员: 第二个把检查的接口流出来,啥意思,你把每生成之后,你把每一段的 prompt 和后面要改的地方,把每一段的 prompt 和图片都对应起来。然后存下来也好。或者说你放到网站上展现出来也好。明白了。
江争达: 明白。
线下人员: 对这样的就后面的人可以根据 prompt 来修改他想要的图片。第一轮自动化生成之后。把修改的权利给那些内容创作者。然后同样的这些视频,这个图片生成之后到视频生成你也一样,你把那个 prompt 和生成的视频也给到他们。让他们去增加内容或者也一,我们自己找一个视频生成的比较好的。
线下人员: prompt 把它自动化,或者说我们自动针对一个视频的内容,比如说战争,我有个战争风格的 prompt 这个视频的生成器。或者视频的 prompt 生成器,有的是什么什么浪漫爱情的,那我找一个浪漫爱情的 prompt 的生成器,把这个都自动化生成之后微调部分留给人。你比如说浪漫的爱情,前面是一个男的手针,后面一个女的手针,那中间男的做什么?女的做什么,你不得都得添加动作吗?你现在完全不添加,就是靠可林自己演绎?是不。那这个空间有很大的空间,你像五秒视频的空间很大的。
线下人员: prompt 的视频生成 prompt 怎么写?好了吗。
江争达: 明白。
线下人员: 甚至我觉得都可以直接两秒的升两秒升成是不是更贵?
江争达: 没有两秒模式?
线下人员: 没有对你想的没有两秒对我知道了,那就五秒,所以你看最核心的部分知道了不一个是把图片的最核心的质量生成的控制部分先自动化掉,然后微调留给人,然后再把视频的自动化部分。
线下人员: 我们先做一个框架出来,做完之后 prompt 自动生成之后再让人去修改,如果他觉得要改,你就让他就可以改,如果尽可能视频不要让或者。你在视频生成之前让人改你知道吗?就 prompt 我们自动生成100给到人然后让人去改它然后再去生成视频因为视频生成贵。
江争达: 明白。好好。
线下人员: 不好就了,如果做完了,基本上我觉得就是一个可以商用的工具了?
江争达: 好明白了。
线下人员: 这样的话就接下来就换了一些风格就行了,你到时候我今天不是给你一个,昨天还今天给你发了一个 prompt 及时的生成网站你还看到了?
江争达: 没我还没提示词,生成网站我记得有那个不是我还没你周日给我发的那个,我还没来得及再去研究,我还想着周日的那个。
线下人员: 是今天给你发的?
江争达: 我知道就周日,我也要先看看吧,先看周日的。
线下人员: 你你把那你把那个打开。
江争达: 就这个?
线下人员: 叫提示词填空器知道吧。所以你去看人家这里面其实有很多模板了。
江争达: 好。我研究。
线下人员: 你完全可以把复刻出来以后,然后我们的视频要怎么做,但是你没太复杂,你完全可以复刻出来以后直接做视频就完了,直接做视频的那个提示词的这个填空。你去复刻这个网站不简单吗?就完全就改成视频的就好了。
江争达: 明白。
线下人员: 先是图片改完了之后改视频比他我们往前走一步。他这基本上是图片,我看。你看还有别的吗?除了图片还有别的吗?你点一下左边的三个点。左边来。
线下人员: 对你看基本上全是图片。你点一下后置层叠艺术往下走两个。
线下人员: 对你看它就是你可以让艺术品的主题为抽象圣诞树,你可以把这一改你就完全考过去,重新生成就完了。
江争达: 明白。
线下人员: 知道了吧。所以如果做成这样了,基本上我觉得是个**都能生成不错的视频了。
江争达: 那我后面想的就那就是自动化,做完了之后再做一个外部的外部接口。
线下人员: 对的。
江争达: 我想,服务器也得抓紧弄起来。
线下人员: 对。
线下人员: 所以你的服务器你想你的服务器后面要调那么多的这个网站的内容,你所以这个浏览器 VPN 什么都得通。
江争达: 好。
线下人员: 懂吧,但后面再往后我们可能就要做那个什么了。其实做那些小模型 API 这些东西了?
江争达: 明白。
线下人员: 那个 Z image 还有好像是非常好用的。就是生成图片后面也可以用它来做。
江争达: 知道了。
线下人员: 什么行,那这个工作就这样了,记下了这些工作后面的修完善,争取一周吧,一周的时间。做一个样板你网站不用做的这么复杂。但是你要先做一个设计,你网站最好先跑一个版本出来之后再做重新设计就好了。你先做一个小的原型,你你你没有原型,你做不了设计,我知道你脑子里根本想不出来。你可以先做一个版本设计,先做小。
江争达: 我下周的重点就是服务器先能支持后端的这个网页操作什么的,然后前端再做一个页面,然后让人家就是我下周这就等于这两个重点行不?
线下人员: 然后前端那个测试就让他们去测好了。
江争达: 好。前端就是我今天先把刚才会上提的那几点就是适配性什么的那些小问题先改掉,然后再放上去就行。
线下人员: 可以。
江争达: 那我这边就先这样到旭龙那边。
线下人员: 另外一个你总结一个你做成做,现在不是做前端做了几个,你把整个前端开发的经验总结,就是你这个流程可以写成个 skill就是你以后再做前端的时候你这个 skill 一进去就结束了。
江争达: 行,那就那好行知道了。
线下人员: 这样的话,你的工作效率提升,你们要学会泛化。你不要每次做一个网站都要从头来一遍。知道了吗。
江争达: 明白。
江争达: 好。
线下人员: 行吧,就这样把这个先回到原来吧。
江争达: 那旭龙那边看一下。
线下人员: 严总我跟袁姐说那个数据库接口的事,老师说可能要下周一他就接口需要改造一下。就是按下达量排序,他说之前有个接口需要改造一下,可能要等下周一那也行,那我们去提前先把那些后端这个优化做掉吧,行那行。或者这样好了,他那个数据库现在不在哪个云上了,我不知道后端代码不行,拿过来我们拿改一下就完了,我们把那个数据库重新拷一遍。那个数据库的服务器直接重新复制一个过来不就完了,你跟他说,我们把那个处理库重新复制一份复制到本地来,他会给这是我们的资产。你这么复制到本地来,这样的调的更快。我就他那个代码他是他的数据库我直接复制到本地来对你整个是。
江争达: 那对了,那我还有个问题,就是那用户的信息数据库是不是也要同步过来?
线下人员: 用户的先不用。
江争达: 那就先用我们测试用户?
线下人员: 是要测试的,你就跟他说我们把那个数据库拷贝一份到本地,你让他把那个数据库打一份包给我们就行。不就是一个关系数据库能电脑带动不有夫妻那张老师对你打包到时候给他就完了,让他们打包。到时候发过来,或者在我们到云盘上网盘上取一下,它不会太大的。
线下人员: 你是两 T 的,你硬盘?在哪。
江争达: 上了个厕所怎么了?
线下人员: 我说你那个硬盘服务器是两 T 的?
江争达: 我看一下。对的两 T 的。
线下人员: 您过来。不过我记得好像还有扩展。
江争达: 不够不行,到时候再加不行再接两个移动平台也行。
线下人员: 对加对就这意思行。行接着往下吧对你你怎么讨论一下帮我拿个水过来。这个77是他
线下人员: 那几个项目一共是56个项目。我仔细研究一下这六个项目然后各自详细研究一下各自取出一些亮点首先就是宏观的介绍分一下给这个项目分分一下类就是。你按这么分就是首先那个拉尔夫它是单窗口就是一旦一旦 stop stop 就被提出,那我问你一下他的整个上下文管理是不管的,他就是就到了。就开始压缩对拉夫是没有是不管的,拉夫是不管知道了,然后这个项目也是他是有外写的,这个对他是有外挂的文件系统的对。但是他并没有他没有循环,对他没有提那个跨窗口的问题。对所以我用了一下,我感觉到好像后面没就把那个写完之后。后续好像并没有太多的调用,但是因为 super power 融合在一起了,他俩是不是冲冲了我就不知道了,就 SKILL S 是不是就是我没感觉它有什么作用就 planning files 没事,待会可以详细讲。待会儿我详细讲一下这位老师,然后跨窗口接续的明确提出有这个跨窗口概念,就是我上次会议那个 continuous cloud 是一个,然后包括你就是你上次提到那个 cloud quick start 就那两个 agent。
线下人员: 其实也是跨过的,他是夸张口的,并且它的文件系统其实我感觉更复杂,也不算更复杂,就跟那个也差不多腐败,然后但是他们的文件系统设计也有一些,就比如说现在的地方,然后详细讲一下。
线下人员: 然后这个是您昨天对昨天发的,对这个今天对今天上午发,然后我也相信就是他也有一个外挂的文件系统对,然后这个也待会详细讲一下,然后方法论层就是这个 superpowers。对然后我就按项目先讲一下可以你想先听哪个先听那个什么方法论的那个 super 我看怎么,因为我这个比较熟悉了,但是我没想好的是从中间抽取哪些元素出来用。我也没想到确实不太想,我也没太讲它,尤其是它还有一个社区版的他那个社区版有很多 skill。虽然它就是它的核心流程是有一个流程来的 skill 和那个就是方法论的就是其他开发的方法论的对,然后主流程就是,所以我就在想。
线下人员: 你比如说我基本相对了解我们讨论就不见得非要按照这个流程来了,你比如说我大框架我用 rough vga大的框架循环我就让魏哥来做因为私有化它不循环他做完就完了但是他中间的循环是测试循环的好如果我为了追求一个项目的完整。我比如说加上 C 位号之后,我可以少循环几次,因为它的准确性高了,不像过去你 web coding 他们就完全是没有边际的跑,那么我这个测试什么方法都已经在里面了好。把 superpower 里面跑完之后,我假设我就按他一整套流程跑完之后了,我怎么判断我是第一需不需要再循环?第二,我需要循环哪些步骤?第三,循环几次,就算 and 这三个问题是我现在一直在要思考的问题,有一个项目就是这些项目都有涉及到这些细节。对就是你比如说如果以为例,那另外一个它的上下门窗口好像也没有上下门跨窗口。没有。所以那这样的话,他的上海湾窗口的管理怎么管理?这是想提出来的问题,你你有他这里面有什么启发借鉴都可以讲,可以待会详细讲那些的时候就那几个项目都有这些上下管理的,对包括文件系统什么那些东西。
线下人员: 它的主工作流程就是 super power 的工作流程就上来,先是对,然后到设计文档,然后它有一个 G 的对隔离工作区域我觉得蛮好的,它其实挺规范的是,所以我为什么说把这套流程走完,哪怕不循环,我们基本上。也有一套相对的方法论了是,然后我地我觉得就是。工程实现层面比较成熟的,可能是那个 quick source 那两个 agent 我知道你意思虽然实现简单,但是它其实挺规范的,对包括 gate 的仓库,然后甚至他。它有一个设计,就是在之前先把所有要用的环境都给它打包好,然后之后再用环境的时候就直接按那个流程固定启动,就是一个环境做的也挺好的。
线下人员: 大家好对待会再讲,到时候我们看如果你研究透了,你自己已经读了差不多了,现在最重要的就是。或者说最简单的方法就是你扔给 cloud你说我希望实现什么你把这些东西给我组合但是我有什么样的要求这个要求只有你能提出来因为你研究过了所以你应该用这种方式迅速搭一个这样的比如说这个 skill 的组合,其实我刚刚试了一个。我跟他说的是什么,我跟他干一下皮就死。我跟他说的是,我认为每个项目的亮点,尤其是个亮点。在这个地方我们看到了反复注入刷新的注意力,这句话大家看一下。你这是用 play 模式做的吗?不是你这样,你在这个时候你回头这样一个 plan 和 ultra你把它加一下你知道吧这样的话会出来的更准确是那个 plan 模式,我抄对。加上会让克拉的思考能力更强。
线下人员: 这个是我先让它生成的就是横向对比,一个对比文档对比就是让他总结一下这些项目,等于说给他准备了一个上下来对你上下班准备好了,你怎么做?结合。不这个地方这样不符合给他一个合适的什么,你还想做什么合适的融合方案吧,这样一个融合方案,对那其实你前面要加一个融合方案的要求。是因为因为我觉得就是要求可能不太好提,需要咱们讨论一下,所以我还没有给他细致的题,就是因为他亮点很多,然后可能要咱们讨论一下咱们需要哪些觉得哪些是不该有的。是简单让他设计的。行,然后现在像 brain。然后就都知道他们可能到时候看看就开始实验计划里面有几个主要的步骤部位做的挺好他是有个执行阶段还有一个审查阶段先他先是执行他执行的是。TBD 也就是测试驱动了。然后。你把 TDG 执行流程?这个是他设计有意思就是对他先是他写出来一个测试,先要看到他失败,然后再要看到它程度就是证明这个代码有效,对真的是有效的,对。所以这就是 TTP 开发的这个最重要的一个理念是你像不像你们传统人认为开发完了一定要测试,通过了就好,不是这样的,对它是基于测试的开发,而不是基于开发的测试,对所以这个是很有意思的是。
线下人员: 然后其实这个 TDD 在其他我记得有两个项目里也都有对,也是以 TDD 对贯穿的就是他那个看板就是那个文件系统都是以测试驱动,尤其是那个。那这个 TDP 是不是所有地方都这么用,我没想是跟你再讨论一下,就是它是适合哪些的?你们是前,比如说前端页面设计适不适合 TP 后端代码流程等等,对可能要思考一下,到时候问问吧,把这个问题到时候记录下。好像是有严格成功标准的,比如说前端测试那些之类的代码,包括代码实现什么功能,这些有具体测试任务。具体以任务为导向的可能是需要测试。再往前走,再往上走就把那个流程给裁掉。
线下人员: 然后 plan 实现计划,这个就相当于是咱们的开放党对设计就相当于是需求文档对需求文档开放档,然后两个它有两种执行方式。一个是就执行方式。它一个是同一对话的,另一个是新会话,对是对。这个我也做过一次对比,我专门问过他这两个有啥区别,他说的跟这不太一样,就是。
线下人员: 交互很多的对,就是你要不断的交互程序之间不断交互的,用这个好像不对,就是我理解的是他仨被人拽问。其实是用户很难介入的,因为它执行细则都在那些撒里面,不是这个地方不是这样的,就是理解太多,至少我的理解上就后来看看他的给我的是因为他是在同一个规划里面是知道,所以它的主控 agent 是很强的。他可以把这个一定的结果处理完了,交给下一个进他,这样他有这个利润,每个任务之间的交互很强,你知道吧,是这个意思。
线下人员: 他这个是啥意思,我就不管了,大型的,长期的项目你就去弄去吧,他就不需要我来控制了我一个,比如说就相当于一个无头模式。第一个乌头模式给你,你自己去做去吧,他是我理解是这个意思,不知道是因为我当时开发的时候我想这个那边我没看。他这个病新规划就是相当于把它一个 S 的就用一个主为主窗口来去开。然后还不是他是一个把你的任务直接给扔到一个主窗口里面,其实后面他就不管了,对后门是不管的,就是开头那一下是需要人工输入。到时候再测试一下,我觉得不管它怎样,它首先第一个适用场景任务独立信任度高,任务耦合需要人工接入,我觉得有点问题,这个地方到时候再确认一下,我看看我这里也查了一下,那天我特意问了一下,我觉得。我有点记不住,我是在哪个里面看的。
线下人员: 我们往下走,然后执行完毕就是审查阶段,他阶审查阶段是两设计两个阶段,一个是规格审查,一个是质量审查。就是做对了吗?另一个是做好了吗?所以整个项目就是这个流程肯定是就是。比较主流的流程,然后主要是他的这些方法论,包括各种 SKILL S 可能是咱们需要提取出来,对加到咱们最终对外。行,然后这个就是这个项目,然后您所以你比如说那个 brainstorming 其实和我们的需求呈现是差不多,对中间到底怎么融合,还是说单独用一个,还是说各自走一段时间看,所以这个就是我们要设计的。
线下人员: 然后。那你你再挑一个上面这五个吧。它是有一个三文件系统对也是相当于就和其他项目其实是差不多,就是用户提出复杂任务,就相当于提出需求,然后他根据这个需求拆解创建出三文件系统。一个是 test plan一个是 progress另一个是 findings然后也就是循环不断执行去更新这个三维系统的文件状态然后它的那个亮点就是刷新注意力它是有一个。每次使用这些工具 write 这些工具的时候,他认为是一个关键节点,然后执行这些时候触发这个,但是我问你随便的文件他都要触发,还是只 write 这几个文。是所有的他只要所有的遇到这种操作的都做对,这里面有点问题,我也觉得可能上下门窗口我感觉有点浪费了。
线下人员: 对你想你拜是对这个我感觉这个可能得测一下是不要太轻了,对你只要所有的工具都用之前你都要去更新一下这个文件,我知道这意思了,他刷新注意力,不是刷新注意力。他把你的操作过程全部记录,他并不一定记录你的操作结果不一定就是要把你过程中间的执行过程记录下来。他不管你 edit 是什么文件内容是什么,他只记录了 edit 的这个文件。不是这是两个事情就是它这个 pray to use cook 注入的是 plan就是把之前规划好的任务他在每次工具执行前都对比如说现在我这个状态12345678个任务是我现在执行到第三个了。执行到第三个就是我执行了一个 write 的或者的动作。对好,这个时候我一旦观察到你要 write 了,我就要把这个动作写到我的 task plan 里面。就告诉他我执行了这个动作。这个我还是这么跟这么理解这个我好像没看到我觉得是按照你这个逻辑只要你流程都没画错的话他这么做是有才有价值和意义的事。他这样的他6万米的所有的操作流程。
线下人员: 全部记录下来了,你这个主 a 进程的所有的操作流程我全给你记录下来。它,但是它后面是有一个专门的更新文件状态的就是它只在街道完成的时候,一个阶段完成的时候,它会去更新整个文件中。我理解它这个工具,尤其它是 pray to use它是在工具调用之前。反正我对话下来他课告诉我的都为了反复读取最开始的计划到上下文中刷新他的注意力。就是为了他不跑那你为什么要在之前调用这个你比如说我要 write1个文件对先写写之前先谁在干你看看你的流程不对你看你写之前触发的是什么这个触发的是 pass。
线下人员: 这个 task plan 的读取前30行对然后给了谁了给了执行任务操作意思就是你不要随便写对在执行在真正的写之前先读一下原本的计划。然后再去执行反正它这个系统是怎么设计的而且读的只是前30行。对我也挺这个我也挺费解的。你读取前三人行那我新的都没有了我也挺费解的。对前三行我确实挺费解的。包括其他另一个项目好像也有这种错误我也不知道具体是怎么回事。它是 k30。我理解它是车有30我都能理解对害了30我确实可以理解。
线下人员: 作为一个问题,他我们理解了就是 write 之前动作之前先保保证他 write 这些东西不要太偏 ok这就是这样然后就是一直执行操作了执行。一直执行操作然后执行一个阶段完成之后再回去更新文件状态我等会否是什么当前的没完成回去之后继续执行。就是当前阶段没完成就执行那个 task 对他就直接你看,所以这个,所以这里面的流程不太好,它画在里面没有持续的。他有个时序图就。你看。这是否回来了,你觉得奶茶当前现在不有个市当前就在不得去查询当前就在状态,这个是查询到新的阶段,状态是完了之后否回来之后干?那只有这条线就出来了。只有这两天出来了,是就执行任务操作吗?对就执行操作使用这个,那他任务操作就只有这个吗?不是我理解他,这可能也是个判断吧,判断就执行任务操作继续执行,如果有了对是操作。就回来补贴上去,然后再回来是的,回来继续执行操作,继续执行内部执行,然后如果内部执行不来,七号出的是否当天就能完成对。
线下人员: 这个时候可能他怎么判断,估计读一下这个文件,有的他文件系统,它这个 task 的结构里面,它是它的算结构是这个。有 goal 有 current face 就是它有一个的 face然后每个阶段有 check list 和 status所以就是他把一个大任务划分为了一个的 face。好待会。你最后有操作完的三个文件的。最终的成长的我看看那项目里有没有example 你觉得没 the example read B 里面的任何一个。后面又重。那可能这个项目是没有了。你们这个项目没有temples temples temples 是它的规钉钉是那些格式,对那就最后就是格式,对,就是按这个格式输出的。对必须是分为几个 face最好做一个执行出来的结果我们开发一个任务的时候让他执行一下对可能得测试我感觉就是这个文件系统因为它这几个项目都有文件系统然后可能咱们要融合一下对这几个文件系统看看怎么样是就是最好最全最精的。
线下人员: 行,然后那这个项目对它有一个 stop hook就是当对话停止之后他会去检查那个状态这就有点像对他如果是觉得你没有彻底完成对我让你继续做对然后这个项目是它简单归简单该有的都有对行现在看看。
线下人员: 可以就是商商系统就是 icloud 的对比较复杂一点?这个是它是写前端的,然后它的测试是以前端为主,他对他只是举个案例,对他案例是以前的案例之前的。其实不局限于前,对这个架构肯定是不行的,不执行情的就是想整天想做这个。首先对有对我看上来就是输入就是这么大,所以你看我开发文档。这不是需求文档了吗?是开发论坛。他应该它可能是兼容的吧,有可能是兼容的,然后它会上来这个就是两个初始这个初始 agent 是指在任务第一次输入之后,第一个他新开,他单独开一个 agent 来执行这个初始化。初始化它会创建这么初始化几个文件,一个是 feature list 这个就是主要的测试驱动的。
线下人员: list 然后还有一个是 cloud progress 它是一个初始化的,就相当于为之后的 coding 初始化一个对,然后它还有一个音的启动脚本,这个就是我刚刚说的那个打包所有环境就该项目需要环境直接给它打包好,直接用一个启动脚本给它写好,然后他还初始化了一个电子仓库对,然后是一的,跟那个里面有些东西还挺像。可以先看一下这个 EE 的执行细节,对它读,然后生成这些都说过。
线下人员: 然后 git 版本控制是它的,这个是它用于 skill 写的复杂吗skill 那个原始脚本拿过来看。我记得我好像有东西。
线下人员: prompt 对它是 agent 的架构是它可以用系统这个词了吗我直接翻译一下。太长了可以了。老婆他不长。它是以这种系统提示词来的它这个提示词我看写的其实很简单很开放对很简单很开放。这个就是他创建那个他是只写了包含200个这个得到的所以很多东西很就留给你自己发挥的是可能是。然后他是由于是前端的他测试就是前端自动化就是他把这些都写好那个前端他接了一个 MCP就相当于浏览器自动化的 MCP然后把这些输给他然后自己去测对。至少还至少200个沟通测试。它有一个优先级技术温度优先。关键指令。要防止 agent 的自己去作弊,对自己作弊,然后这个是创建启动脚本的,然后触发 G。
线下人员: 然后他把那个项目结构也搭建了一下,就是目录选择目录后面目录,然后是可选,它可以直接在当前窗口。要有时间要有窗口的话就实现一些是直接实现这个优先级最高的功能,就直接在初始化的一个里面,它有这么一个提示。
线下人员: 这个有点怪异的吧,他在初始化里面直接开始 coding 对,但是他虽然他写的可选了,就是如果本次规划还有什么叫时间,这个时间哪来的?时间我觉得他指的可能是上下文窗口。对,然后这个初始化的。他也没说的,就用不用三倍镜,什么都没说,这两个就是对两个,它里面没有再调用别的。真简单,他好像还不是撒贝真的理解的它好像是用脚本试的。他们是用 SDK好像对它是用一个 python 进行一个主循环,不断的去调用,就是第一次调用这个,然后之后喜欢不断调用这个。它是用一个 python 循环实现的,它 python 里面怎么调用Sek. 好的 AD SDK 是那这个完全脱离出克莱特克的运营的。他不需要在克洛德克的环境下,不需要在 COI 环境,对不需要在 CO 环境下,用 sdk python 主循环,它是一个一个的新新新 CLI 对像是做这个 agent。当然实现就看咱们的需求看咱们怎么相应的设计怎么说反正它的机制这样机制是这样对然后他在这个啥意思是创建新的它是不断循环创建新窗口的那个 SDK然后它之间会有一个 s3秒就相当于开新窗口之前先 s3秒新窗口就是一个震荡对。
线下人员: 不停的创建吗对不停的创建尤其是它不是设计了200个至少200个测试然后它的 coding。里边的提示词甚至要求他同时也不是同时这个 coding agent 的你直接说一下就是首先它获取上下文就是获取之前那些什么 feature feature list 那些,然后启动会服务器。然后他这个回归验证在第一次是没有的,就是可以先跳过回归,是在第二次之后开始有。就是他执行阶段,选择一个任务就是选择那个 feature list 里面的一个任务去实现,然后去浏览器验证它基本上就是一个 coding engine只实现一个任务。对一个 cod 就专注这一个任务,把它实现了,并把它验证好,然后更新对,然后就提交,然后提交更新,然后就退出,然后到第二次之后执行的时候,它会有一个回归验证。
线下人员: 那个 feature list 里面不是有一个算是 pass 还是未他会去找之前已经 pass 的去再验证一遍。之前已经 pass 了,他会去验证 pass 是否依然 pass然后如果回复验证通过了再去选一个新任务再去执行。它的提示词其实也可以看。他这个 APP 它是就是这他这个验证就是做了一个网页对就是网页而且做的还蛮好泰国的我感觉他这个项目执行起来好像。也挺长时间的200多个测试每一次因为他这个如果是顺序执行有点问题有些功能测试是可以并行测试的我觉得。他是每次开发测试。他就不知道他能不能有一些锁的问题。编码代理首先建立整体认知就是读那些 spec speck feature list然后之前还要记住提交历史。然后启动服务然后验证测试就是之前的会话可能引入了 bug 在新功能之前就是选一个 pass pass 通过的。且最核心的功能来测试,验证他们的安全工作,它的设计原则。然后他发现问题之后就先修复,然后修复通过之后实现选一个实现,然后验证浏览器自动化。
线下人员: 使用的自动化工具,它使用的是什么 P他们其实用的也挺多的它好像都是比较存的比较多的两种。让他写的就是禁止使用只使用就强制使用 UI 测试,然后之后更新提交更新记录进度记录。
线下人员: 测试去了至少完美一个功能,你拥有无限时间,对,就是让它保质,先保质,不就是速度,先不用管,不着急,对不着急,慢慢来,一个慢工出细活了,对!那他的文件就是这么一个 progress progress 和 feature list feature list 那个我们理解吧,那是一个测试用例。对测试用例,它实际上的整个的状态管理就是这么一个 progress。就是一个 progress。是它的结构规则它的提示词和 continuous D 是差不多的,都是这么几个开放问题。你本次会议完成工作,完成测试,然后发现要修复问题,下次会话的建议记录统计。对就这一些是。对所以然后什么什么时候去读它,每次你每次都会读取进度,实现工作,对其实在最开始就堵了。
线下人员: 对 task 这个 agent 就是 task plan他是他这个文件是写在哪里的写在他的就是 clock code 自己带 task 那个管 list to do list 是 to do list 它是管理在哪里,还有自己的文件吗?还是说我理解他没有用原生的那个 task 工具,它好像是它是用外挂的。对我知道他长时间就是他因为你想一压缩可能把那个 to 给压缩没了都。你比如说长任务比如说有50个任务要干他你看他有200个任务要干是他上下文一拖了他一压缩他可能给你压缩时就。到时候都起起义了所以他对于 to do list 的管理就是尤其长任务的 TO DO L 管理是一定要严格保证我的状态。cola cola 自己做的,它是维维护在哪里?
线下人员: 维护在他的 context 里面上下文窗口里面没有写出来,它就是一个 agent 的里面,它一个 agent 只执行一个工作。它的土就是内化,在执行过程中。会 cloud code 自己去维护的,对自己去维护的这么一个 to do list然后它一旦有完成一个任务之后它会自动也是会自动去检查那个 to do list。但是在上下文里面cloud code 的系统提示磁力完成,对可以这么理解,就是一个很小版本的对他这个图是窗口对跨窗口的了,是跨窗口的任务。
线下人员: 维系是单窗口的任务维系对是我理解也行,好先这个。关掉,那就这个了,肯定没开上次讲了,也可以再讲一下,对再对比一下行可以。这还不是这是 rough research 吗?这是有 rough 思想对它是 rough code 好像不是 rough research。他有对他有然后在外边又挂了一个东西对又扩展了许多内容就是相当于一个感觉他像就是向企业级应用就向真正应用去迈进了一步。它是可以支持项目目录输入的包括之后他也有一个准备阶段是专门针对这个项目目录。因为用户提的需求有可能不是从零到一的就是已经有了一个东西要在它上面又提出一些新的需求比如说优化工作然后他支持的就是把这个项目目录输入。然后还有就是任务描述然后这个选择 AS 代理是因为它支持 cloud cursor然后那些对那些然后对。
线下人员: 然后初始化阶段它会生成一个项目骨架,然后准备进来,他就会去研究当前的项目,这不就跟那个 CLOUD MD 做的事情一样。那个里面输入就是把整个是对其实就是看过程差不多,然后他会去研究现有项目,我看了一下这个和。就是我那个项目理解 skill 是差不多的它启动了50个4agent 研究并行启动了54个读出不同的代码读这他的速度很快是然后生成一个你没有这个魄力吧。你当时做研究的时候是吧你没这个魄力吧。50个有点夸张。
线下人员: 对,然后他研究了在充分研究之后去生成这么一个 PM D。然后我跟你说最难的是他分别读完之后他在不同的窗口里读的不同的 agent 去读的,那您是说理解项目对是每个人总结出来的东西是他怎么保证他能够不失把原文的信息传达出来,是这个,我还没细看。我觉得他可能还不如我相互理解的 skill 有逻辑性。对它有逻辑性,是有逻辑,它因为是生成 plan它只是生成它不要修改他读完一遍只生成个 plan它太浪费了万一面只生成个 plan 就扔掉了。剩下我就扔掉了,可能这些项目都是对我感觉有这种想法可能都是。因为不安全,要是一个 pro 用户,他可能也不会去想这些常识自动化的自主工作,他可能也不支持。但是这个项目它创建和的提示词很简单,对所以这个地方我觉得可能就是咱们要去融合,就是不管是那些就是 superpower 那些繁华的地方。就跟那 TASK MD 差不多的都是一不完全一样,和 task 不完美是夸张粉吧,为为整个。
线下人员: 可以先看一下它的提示词。这个是他的,对是他的意思,英文我翻译一下。你的 tt list 就可以直接一键翻译哪个这里我给你的输入法选择然后翻译成中文的翻译。500个更夸张每个人都独立500500个300行明天你跟人家差个数量级你知道吧你的认知基本就是被你的贫穷所限制。
线下人员: 太好了500个**不允许 cloud 能允许吗?我不知道我没事。我没试过。那你就不靠谱了,是,但是他机制还是有这个有点猛,然后走直线可能。咱再讨论。全面理解,对就是他创建的起。所以他这些词还是比较,就是简简单,其实有的时候他们已经很聪明了。很聪明。不需要去加太多限制,除非他完不成的,你可以加一些是。这个也就下了之后。对,然后它生成了 PLAN D还有然后大家进入一个正式工作循环它有一个叫看板他就叫看板应该加 HP。一开始中国人做看吧然后对这里有一个我觉得是另一个可取之处就是它允许人工介入它是你需要人工去编辑一个 user feedback D 然后他每次循环执行的时候会去读这个。用户的反馈,读之后就是它有一个提示词是以用户的反馈为最高指示,然后他会去选一个最高任务就之前创建的任务列表,他会去选择一个最重要的任务。执行更新看板,然后这些逻辑就基本上都是差不多的,所以他。
线下人员: 可取之处,我觉得就是他对于现有项目的生成,还有他的允许人工介入,这两个是它外部循环控制是也是用代码也正在对他都不是在的环境,对因为他还支持其他支持。不就工程化的方就移植那个是更容易对,然后他在对他在窗口里面是。
线下人员: 结合了它这个 rough所以你看这个 rough 是它内部执行的时候,我们会有这个 R 对。对是这个项目,他自己有代码吗?就整个里面它做这个的封装,它是不是有代码?看看还有没有代表,比如说的里面你朋友在?你看上那个?
线下人员: 比如说 CLOUD MD 那个都有的对都有的。And trust. 哪个。他基本上也是前端这种感觉。我还没看到势力是啥PS 它的控制循环就是 test test 它整个系统就是基于 T。那运行的是个什么状态是命令行对代码运行就是这终端的居终端的命令服务或者参数输入吧。但是它支持就是它支持多代理多 AI可能每个也不太一样就是它会有一个选择应该统一的话不知道他是这个 web 界面的形式还是他的就看这个命令行终端的形式在做这个。我觉得他的感觉应该谈了一下。他的选择也有可能就在我看一下杰森我看一下当初的。相互理解这个但是咋说已经完毕。Rvs.
线下人员: 对。那差不多了?那拍完这个你你你对于刚才那三个问题,你咋想?循环怎么循环?反正如果这个我觉得是肯定要用的,让这个播不同的这个方法其实它核心就是一个 stop hooks 对它的核心就是 stop 对那个魏哥那个他的提示词你看过吗Skill. 就是 R 的 skillA rough, regular skill. 好像看了这样看。那是安装的,它就是个 hooks hooks它个对它。他那个提示词你说对他提示词不就是把最开始的那个提示词重复给他。我有点记不住了他你你我记得就是他把等一下我。然后下一个也有。对。这个是他那两个 command 的启动的。照顾环节对它也有一个小的状态文件对它也有的这个小状态文件是记录给他的次数和他最开始提示词的。它就是状态文件,别的次数检测标记,然后阻止退出就是重新入,重新从哪来?状态文件就是最开始的 prompt 那这台文件它会更新的,会更新吗?对那状态文件肯定要更新的。我好像看到他是有相同的 prompt。那就是一开始的对一开始的可以往上走。一开始的可能。它就在初始化阶段就是初始好的状态文件。
线下人员: 这个我觉得可能也有的上地方。你比如说他这个也是一个脚本吗?我看是。说实话。要不然也是代码来调用 cloud agent sdk 吗?它不是个 plugin 吗?对它是个 plugin 我知道了,他给你上来先把脚本执行完对先生成一个状态文件,这些是可配置的就是他那个启动命令里允许。这里允许配置任务描述就是对,然后还允许配置最大的解答次数对,然后还要完成标记对,然后就读取就完了,对,然后他读取这个生成那个状态文件对。对,然后就一直之前一直未至死。这也是最简单的是,但是它最有效,对我觉得这个可能可以用于单窗口。我觉得咱们以咱们的工作量,咱们的目标的话,可能咱们也需要一个跨窗口的文件系统,可能在单窗口内。保证它单窗口内不断,就是持续执行,一直执行不好听是可以用这种方式扫 book 用了。
线下人员: 你如果跨窗口的状态维持怎么维持你 rough 这个 hooks 每次启动窗口的时候都带上它吗?每次启动窗口都带上的那个东西,他就无非就是个像目录下实现应该都好说吧。直线应该都好选,主要是机制。怎么设计我们要讨论?你比如说很简单,就现在我们按正常的我们的开发工作来说,你不管是上来先做需求分析也好,还是做那个也好,就一步步往下走,在走的过程当中。可以把这个状态文件作为一个辅助系统,把它设置起来是对那本来那个 system 里那个 super power 里面。他原来有的那些状态文件,它有一些有也有 task 什么这些东西我看都应该都有,那么就把,但是这两个怎么怎么怎么融合,到时候看他到底读取哪个。说我们干脆就也读取 task 的文件就完了,还是?
线下人员: 你是说的是哪个层面就是单窗口先说单窗口。如果单窗口不断循环能完成的,我们就肯定单窗口了,可以你单窗口能不断循环完成的,我就单窗口了。之所以要跨窗口,现在我们先要了解的是跨窗口的必要性,在什么时候?并行还是什么时候画成果一般也是顺序,这些项目都是跨上过去也是顺序,它只不过。可能就是不太信任自动反派肯定还会丢,但是那你这样的话,你单窗口在里面做不可以把状态记录到外部去。你不管你看不就是他的说我没到 compact 之前我就直接清掉了意思。
线下人员: 逻辑思想,当时我看过一个哲学逻辑,或者说底层的逻辑思想是什么?我每次看拍。无非就是个压缩完了,还转着上下文还压缩那么长时间,我不如把这个提前把这些步骤记录好之后,我就不压缩了,直接扔掉。重新再去读它的逻辑是就是维维护外部的这个知识库,那这个状态就是为了这个原因,那核心逻辑是这个也就意味着如果我们单窗口允许压缩。就没必要,所以不在不达到在没有达到,那我直接 clear 就完了。
线下人员: 对第二就相当于开了一个新通,对相当于开了一个新通过,但是这个好好像不能自动开,不知是送谁对他只能开启窗口。包括他用外部文件,包括自己设计的一些逻辑,他可能对整个对新窗口理解整个上下文的,那也就意味着他每次你说。咱开新窗口要去读取质检的上下文继续工作,可能现在看来是。人工设计一些规则,不管是提示词也好,还是模板也好,就是外部维护这么一个系统,可能要比自动的要效果更好,新窗口可能理解起来就是有价值。主要是这样。还耗时间对还耗时间是的。你无非都是重置一段提示词,对你也是重置一段提示词,自己设计也是重置对。之后他也自动就把全部都清掉了,对卡牌它压缩的挺多的,我感觉杨总挺经典的,包括一些大概压缩之后你想。他就我看这几行吧,所以可能不足以支撑他长期的这些项目的设计就是,所以你看底层理解了之后就知道了我们怎么去做上下文的交接和维护了对。
线下人员: 现在的都是我跟你说,今天我们看到都是非常简单的上下文交接未来上下文工程,我们这个叫上下文交接工单,对这是工单交接是它其实很难确定这个工单里面哪些是对下一个任务有价值的,对是确实。这是个交接系统,对交接就是交接。行,这走到这一步再说就先做这一步吧。那么。我们比如说我们用 super power 来做这样的事情的时候,如果我们做循环的话。他一定会面临。他一定会面临 compact 那这种情况下我们把扔掉,我们给什么上下文能够让继续执行下去。我干脆这样做。我每次在 compact 之前。我一旦启动 compact。我就自动兴起窗口。因为我前面的记录都记录下来了。是什么意思你看现在逻辑是这样的如果我用 super power 这个体系来做我的开发我执行到第55步的时候。上下文窗口到了这个时候我就之前那个问题就是来了一堆问题就来了这个时候我。不压缩了我用一个 hooks 我觉得 pray 之前我自动的重启一个窗口,读我在外面设置的这个状态文件。就把前面的所有的步骤全部记录下来,到时候我把这些需要的文件再重新喂给他,再重新开发。
线下人员: 你,那这就是就顶多可能有一段我在记录之前的我在记录之前之后的和我现在之前的这段会丢失掉。是可能会面临这个问题,或者还有一个方案是什么?我在 pray 之前我自动的把和那个之间的做个压缩记录进去。we come back we come back 之后还会知情,他还会知情,就之前,那就不让你再执行任何动作了,就不会执行。那我就先时刻刻要监测 context 的这个百分比了是对还有一个就是监测百分比我到了他妈六七十的时候对60的时候就固定好我就直接对。
线下人员: 这些项目也有预制设计可拍的刀扣了自动可拍的是不是也支持吧支持什么就支持设置自动可以有你有个2020分之到20%剩余它就自动给的那个20的阈值你可以把它设成零。那也可以那就不方便了。
线下人员: 单窗户那对就开自动压缩不就避免自动压缩。单窗口我就比如说我一直到他压缩前都在单窗口内这样的话最简单然后再开个新窗口对然后他到了阈值或者在之前我就再开个窗口继续工作这样的话我就是顶多可能损失一小段。或者我到预支之前我自己做个压缩我自己把这个上一段的压缩一下就是在我这段的在我记录之前和我压缩之前的记录之后和压缩之前的段。我把它植入进去记录之后就比如说我做到第14步了我马上要开始14步做完了我做了15步做到15步做了三分之一的时候我的阈值到了但是第14步其实我已经。记录进去了我做了什么了但是事务部开始和我要加速之前没有记录。
线下人员: 还有问题,就你说的那种方式是既执行一步进入一步,对力度是一步一步的不一定了,这个时候就要看有的用 write 什么那种工具的工具什么就看我们自己设计了,就是我们要对。最全的状态还是说就是最最最粗颗粒的状态,就看我们自己设计了这个颗粒度的设计是我们自己把握的对?是这个状态,颗粒度怎么来设计是我们自己把握的,也可以采用他们的也可以,我们自己设计一个是吧,你看核心思想就是这个对,然后在这个基础上我。
线下人员: 这种情况下,我用再用 rough rag rough 在你任务结束了,我再重新起一遍,写完了你从中间工作到一半的时候要压缩之前我。拆开新窗口继续工作,这样的就把拆成了两块,原来就在一个窗口里面不,现在我就把它拆成两块,对,就是你不行了,我就新开一个,对,就是逻辑上其实就这么简单,就把他们先。扰乱的就打开底层就这样对。就是单窗口那我就这样,我用 initial 就是他两代理的架构。我用两代理的架构。加上一个外部的方案。做这个其实就比较像了,就两代理其实已经有 progress 就是有的对,只不过我不知道他的那个文件系统的设计的工单的启动。对他是不是按照我们的,然后我们把 initial 的里面的还是把 coding coding 的或者把 super power 分成两块,一个是 in。一个是执行的执行里面再分成 test 或者什么这些就是把 super power 的这些功能拆分到两个里面去。拆分到两个 agent 里面去。到了一阶段我就重启到一阶段重启。对。那就是把这个双把双代理架构融合 super power 做个 rough。
线下人员: 理解就是这么理解,其他的就甭管他了是我觉得那些东西也都无非就是这么一个状态,这么一个过程,对逻辑都差不多。把流程上 agent 的流程上设计好,什么时候做个外部记录就完了,就颗粒度设计好就行了。对就颗粒度。
线下人员: 每个项目我看现在项目它有的主要是两种,一个就是比较主流的就是靠 AI 去。结合根据当年上下文去自己语义理解,写一个工单就更新工单,然后还有一个就是 continuous cloud 的。用代码去读 code 的历史记录提取关键信息核心就是我看到的就是这两种方式。对这个你细节上你再你你再细化一下行吧,看看这个机制里面还有一种不是那个 planning with files 吗?那个就是直接用动作触发。
线下人员: 它的状态更新或者对还不是状态更新是提取了 task 注意力的那个 task 的那个,还有一个是他边那边的状态更新,也是对你回到那个就是他后面不是有个状态更新的机制是什么,我不知道他的状态更新机制它怎么做。没事对更新文件状态,它是靠什么技术实现的高中都找不到。那也是用 a 对我感觉都是有除了有一个中于代码其他都是。A 的东西调的不对,执行方式他怎么不是你看它有触发的,对它触发,你看这就是颗粒度是,这就是颗粒度,对,所以我觉得我们可以把那个颗粒度。对你你做一下就好不好,我觉得这就够了,你你再去看看那个,到时候把什么就是双代理的那个,它的就是更新的 progress 的它的触发机制是什么?你把这些触发机制整合,对触发机制也有两个。两两个就是一个是按照阶段来更新,另一个是按照整个窗口结束,对很多了,都有,你看有完成阶段的。有遇到错误的,有做出决策的。然后这个 finding 的是做出搜索的,查看的,它还有很多,所以这里面我们要看一个就是会不会导致外面状态文件过大。最后。
线下人员: 对你的上下文窗口,对消耗太大,但现在我们先不考虑这个问题,现在我给你的你放开了干就是,但是你不能上来一下,把 cloud 的窗口站没了你就是对你没有意义了所以你肯定要限定它在一个范围内对比如说你百分之不能超过整个对话超过10%或者20你超过20没有意义了你后面代码编辑没有什么了太太对空间太小了。
线下人员: 这里面都是设计的要点是理解了,所以它的颗粒度和触发机制就在这里。这样的话你看 super 按照那个 super power 的11步一步走下来就完了。那走下来里面把这些颗粒度融合在这个碎泡泡里面。最后这个流程里面加入这些是换成这个流程就拆进来了然后在外部机制就记录下来了对好记录完了之后。项目执行完再用 rough 过一遍 rough fries 是不是在里边外面?外面就最后整个做完了个做完,整个做完了。他看最后的结果是不是真的已经全部都完成了?
线下人员: 这里还有一个问题,就是那淡光口那执行会不会突然停掉是什么原因导致他会停对他可能。遇到一些错误,或者尝试失败了,然后挺,那你就 stop hook。他你看 stop 对,这也是有一个不,他只要 stop 了你只要1stop他就开始检查你 stop hook 就是任何时候他都会。触发这个,但是这两个配有的 prompt 不相同,有可能是不一样,就你说的对,一个是中间过程的,一个是一个整个这个时候可能要判断一下。可能要判断一下,那这个钱很简单,就在外部机制里面看你是不是到最后一步了,你读一下就好了。对如果你检查到最后一步了,你就回头为初始的。
线下人员: 对。行那我下去对那现在给你一个更简化的过程是什么先不考虑。你看这里面有33个步骤三个阶段一层一层递进的第一阶段就是 super bowl 加上什么都不改,你做一次测。你做一次测试,看看效果如何,第二个状态是第二步是就第二个台阶是什么?是把这些处罚机制。加到 super power 里。就类似这种工单也好,就这些触发机制加到 SUPER P 那些 agent 里面去,或者 SKILL S 里面去,或者你用 agent 加 SKILL S 都行 SKILL S 不用动态。你可以 SKILL S 不动它,但是你 a 里面加入这样的控制机制,这是一种方案。那这第三个是什么?把 super power 切开。分到两个阶段里面去。一个是和 coding 里面去,那我认为这三个阶段是逐层递进,你一层一层测。你第一个词就是最容易测的两个你你弄个小项目测一下就完了。第二个需要设计一下,改一下做一下 a 进的要相当于把修改掉。对把这个 a 定的改掉之后,我们看看,或者还有一个什么不改,还能够在外面包一层也是可以的,你把整个 super 的 a 都包在里面。你包在里面之后,一步步去掉 cp 包里面的一点的也行,就把修复包里面的 AD 的全部当成紫 a 进的,那么这也是一个可能性。
线下人员: 第三个就是用双代理架构。明白了,这是我的理解,有可能测出来的效果,一步一步适合越来越大的项目,对一步一步适合越来越大的项目是。然后 brainstorming 这块人家到时候换不换成你的那个需求。SKILL S 你自己定,那个需要太太长,对有点冗长了,太费劲了,一个需求整半天,那到时候我们这已经做到这种程度了,但效果我们说。我们先延展再压缩,再精简,到时候看哪些保留最精华的现在那是这个逻辑整个方案就是这样的,争取能够尽快把它测一个出来。如果这个出来了,我觉得我们做一些到时候有一些特制化你比如说像前端的开发什么,这些东西在特制化的那些 skill 加进去。就可以形成一个一个的工种了,对工种,那从前端集团对定制化一个对。
线下人员: 理解了然后下一个知识图谱吧。ok 我精读那个 aircraft 我都没来得及精读,你讲讲我精读了两天,一天半吧,精读出来很好。还有那个吕楠老师对他发了那个发了之后,我到时候这样吧,明明天吧,我们找个时间把他那些需求我们碰一下 ok你先看一看。我感觉拿他那些需求把它理一理之后拆成需求之后跟大模型再做一轮交流它里面有又有一些调整我看它数据也有一些调整。是我看看行那明天再说一下这就是那个云南那个不是那个云南大学不是云南那个不是 aircraft 是那个 nature。那个对那是 medicine medicine 的对,就是它是用的小模型微调,然后去提取实体和关系,他没用大模型加 T 的那种方式 ok 然后这个他在论文中写到的是他是2023年做的吧他当时是 gp t3.5。那怎么会在2022年获第一名就是他这是比赛他先参加了这个比赛然后提出了一个基本算法然后去获得获奖了然后他又之后。写了论文就在今年发布了对今天发完没事明白了然后他是他也是处理摘要是3400万篇他卖的摘要。
线下人员: 然后数据输入层它除了这个论文摘要还有一些公共的基础的就是40个公共数据库加这个我的理解这个就是一些相当于是医学界的一些常识对就可对可能论文都太高深都太。专精然后它需要一些基础的不是它里面是这样的有些数据比如说叫什么药物分子数据库什么蛋白质什么结构数据库这些东西我感觉是这个玩意的。
线下人员: 他第一案是命名识别匿名识别他用他的整个策略是你看这有个30模型集成预测。他用了30个小模型是不同的就是随机种子不同的种子然后不同的可能就是训练的。轮次什么之类的配置不同然后他用这30个模型都预测做同一个任务就是命名实体识别都提取然后对然后都提取出来这么一个结果它有一个集成就是。得到最终结果的一个机制它给把这30个模型输出都综合一下得出最终的结果的实体命名的结果。它其实和 a 相比**比他简化多了,是就是靠大模型自己对。
线下人员: 那你说哪个更有价值**这个我还真不好判断这个我他用的是什么模型小模型对我就是作为什么模型这个微微调的叫什么。BERT 的不是对 BRT 我觉得有点他妈都过时了这些玩意对他当时写这篇论文的时候这3.5。没准现在大模型家其实死人也很好有可能因为我们是去年的论文有可能大模型发展。对他当时说他论文里个人感觉是这样没关系你先讲我个人感觉是他这个模他这个知识图谱有没有开源好像有好像对它是这样的是156是他自己配置它的 NER 是0.8926然后这个是其他的用大模型的。两个大模型是0.8652,那测出来是它这个小模型加金条策略是对于知识提取是更好。
线下人员: 回头我们琢磨,我不认为他现在是领先的,有可能,但是它这个小模型有别样的用处,对它有因为它是分类模型,对分类模型它有一个天然的自信度的输出。他这个自信度指的是你实体命名的准确性的执行度并不是逻辑的自信度吧,是编的执行度吗?有是实体的分类执行度还是编的执行度?两个是对实体,好像是没有边有对边有你看下面就是实体抽取完之后关系抽取就是单据关系模型对单据关系它有两个,因为它抽取先抽取出来所有的实体二里面的实体。然后他会去记录这个实体,比如说现在有实体 ab c3个实体 a 和 B 可能是在单据里面的,然后他就对这个单据。这两批体用单据关系模型进行抽关系的抽取,然后它这个抽取和抽取属于执行不同。
线下人员: 再假如说实体有三个实体,我跟你讲这个从我角度来说,他这个小模型再怎么训他对于关系的判断的能力可能不如大模型。我觉得是有点问题的。不能有可能,但是它肯定便宜,它肯定小模型肯定便宜,很方便,可以不断的去做对那得。就是你后面比如说不断的增量模型上去之后怎么办,你每次都用大模型去做这些实体之间的关联关系,我现在一直没想明白知识图谱,如果更新的话。你一次新增多少个实体进去之后?和原来的这些实体之间怎么做,重合度检验。对有一般制度都有一个全局去重就是相同的,就直接连上去,对一般都是这样,这个文章也是这样。
线下人员: 行再往下走,所以我觉得他这个方法需要我们不一定参考的是你先往下讲吧,然后他对于所有的实体就刚刚那个例子,比如说实体 ABC他会抽取出实体 AB 实体 BC 实体 AC 就是把所有的都两两。配对抽一个实体对,然后他去判断这里的实体对是位于单据内的还是多句内的,然后单据内的就用这个单据关系模型多句就用多句关系模型,然后多句关系模型是有一个上下文输入的。它都输出一个执行度,还有一个新引度判断,这个是意思就是这个关系是不是这篇论文。新发现的对,然后有一个方向预测是对边的有向边,它是有向边,谁指谁做一个预测。然后就做一个对,然后形成制度,然后制度用于下游应用。然后看一下他的。他的表现,他的数据来源和表现,先要不先看一下它的支出是结构,可以过程可以看一眼可以看。
线下人员: 努力下载去年集中投票。他这个全文模型训练对他这个是这样,它全文模型训练只出全文模型只出现在这里。因为它整体的目标是只对拍卖的论文摘要进行对,然后它有一个模型是为了以全文作为输入的这个模型的目的是辅助实体命名识别。辅助摘要里的一些实体的精准,就是比如说一些模型,一些实体的命名可能在摘要里是这样。可能在全文里又是另一种统一的叫法,然后他可能认为全文里的可能是比较通用的,然后就做了一个一致性的校验,所以它对这个摘要是进行一个辅助,明白了,对这个是全文它这个全文模型的。
线下人员: 对,然后这个是它的主体类型是就是刚刚说了它的数据来源是这三个,这刚刚那六个是只对他卖的论文摘要的实体类型固定的对固定的这六种。疾病表现疾病基因化学物质,动物分类它是这么分的,我们自己的势力。对。
线下人员: 关系程序对,然后刚刚说的一次性校验,对全文进行一样投票确定标签。关系抽取模型就是刚刚说的数据对,然后统一句内就用这个单据多多句,然后信息判断。然后光绿色,然后是论关于论文的固定的关系的类型的字段对字段关系类型的描述,对明白了,就这么几种,八种关系,对八种关系。
线下人员: construct 要说复杂其实也不复杂还行我感觉还行起码我是我跟你说其实我们很简单我们如果把这个模型结构调出来图谱结构调出来之后我直接用它这个关系和它的实体规则直接抽就完了。我完全不用他那种小模型那么费劲比来比去的但是另外一个就是如果他那个他的图谱的质量很高我其实就没有必要再做了。我以后再增加就用东西来就用它的规则来增加就完了对属性它关系属性懂吧包括实体它属性都做了有的这个仔细看一下最终的整个的先是先看实体的吧。ok 实体的实体比较重要的就是这个 type 类型。对就是刚刚说的那个类型 ok 然后其他的其实名还有别的人他接了一个这个就是相当于是标准的数据库吧。ok 本体库,医学本体库。我知道了,对我不知道你知道的事情,然后就是它有 type 吗?这个 type 就是刚刚说的那几种然后这个是刚刚说的六种对六种。对于数据库的来源它又有这几种我知道了差不多就是12种。对六加六加二明白了。然后边关系属性是这样的就它有相片这些人和目标该有的对然后这个 type 就是刚刚说的那种类型固定的。
线下人员: 然后 direction 是方向预测模型,这个地方你看它已经有 source 和对了,对是的圆和,然后有方向。预测模型判定三种取值是 source to target Target to source. 怎么会他给出 S英国你看是从起点到终点的。那你这样的话任何都是一个双边的双向的你都是因果要么从编到聊起点到终点还是从终点到起点他好像是有点乱。是我看的有点乱知道了是我看的对关于它这个方向的问题是论文里写的也有点乱可能还没太透明白了。
线下人员: probability 是指的综合知行度这个综合知行度的概率计算在这里,就是因为它单据模型和多据模型都是分类模型,天然会输出一个知心度。然后对它会有多篇论文,它会进行一个聚合,这个是聚合公式,你含义大体理解就是多篇论文支持统一关系时候,它的综合概率就会高。然后这个是它的综合执行度,然后它还有一个 correlation这个是标明正相关负相关它以正一负一是在将来就是在它那个应用里是有应用的就是可以看到对这个还是用的重要的。
线下人员: 然后就是新颖性判断出来的是 true 还是 false 对。然后这几个加速的就是我认为比较重要,对是挺重要的,对,然后后面就是那些该有的原数据 data source 之类的。然后那等会上面,比如说这个 sport count 这些东西,那是从全文里面来的,还是从数据库里面本身就有标记这个东西。或者说你怕卖的里面本身就有该关系的不是他抽取这个编码,他不这是个属性。该关系的论文总数对,那这个论文总数他怎么统计出来的计算出来吧,每次都加一吧,我只就是他去读所有的论文。是没有对他现在只读了他要读论文索引,所以是有一个数据库的。我觉得拍卖的有数据库就是引用这篇论文的和被他引用了谁和被引用了他这个是提及该关系的论文的。对,那每次提取一次就加一加一加一加一,我懂了。该关系的不是该论文的。
线下人员: 挺好对也挺重要的是我跟你说这个也挺重要把炸黑不要吃然后这个是他论文提取的就是论文会提取这八种类型核心关系类型。刚刚说的那个然后数据库的又有45种类型45兆对关系类型是分组有详细的数据库。就是知识图谱的结构然后它有它的应用就是基于上述那些的应用推理就是它怎么推理的我。就是这个是他的就是他代码里包括他论文里只给出了两种模式就是说它可以这么用一个是药物发现的意思对就是输入是疾病的。ID 要去找候选的药物列表。然后另一个是适应症,发现输入的是药物 ID 去找疾病的明白,然后我接下来我就以这个药物发现模式为例,我就讲一下。
线下人员: 首先第一个点,它不是在它不是以图算法为基础,它是以。便利为基础,就是便利是相当于是 for 循环的便利,就是他把所有的关系列表先提取出来,先以文字的形式提取出来。其实这个看着有点抽象,可以直接看这个具体的,这也是他论文里的一个应用,为这个新冠去找候选药物,就是有了疾病去找药物。然后先准备数据就不用说了,就是抽取只抽取实体和实体的所有的关系,这个三元组就是它不用那个图谱,它只抽取所有实体和实体的关系组。然后它进行了一个操作就是键,所以就是相当于针对应用,针对有目标疾病去找候选药物,这个应用它去构建两个筛选两个字典就是只筛选。
线下人员: 药物到基因的字典和基因到疾病的字典这两种你你看到这个是不是很像是他其实就是拿东西训的。但是它还有一套还有数据库的数据,我觉得这个基本上你看完这个之后,你就知道它底层的东西是什么了,他是要不到基因对要基因,他是做的基因到代谢通路。就如果你能把这里面他没有做那个代谢通,做整个通路的你如果从他们乘客里面去提取通路也是很有价值的,它是做的通路。
线下人员: 行对穷句法就是它以药物便利就当前的目标就是找药物它以药物便利。拿出第一个药物去找去索引里面找找这个药物直接相连的三元素的基因就。co s1的这些基因然后再逐个检查太傻的然后主观检查这个基因有没有到这个药物这个疾病目标疾病的通路然后找有的话就记录下来这个路径没有的话就下一个然后不断遍历这个不断遍历所有业务。ok 对这个是它的算法,然后。你觉得怎么做,我觉得可能应该用图算法,我感觉应该用什么大模型,先做一个收敛。收敛是让他去判断哪些有可能的药物你知道吧,然后再做一个便利,因为这些可能药物这个便利,如果里面有没有。再扩大的范围再便利,你不能上来这个顺序便利**这个没有意义,要是我肯定先用一个算法,我先用一个算法。
线下人员: 找到。这个病所这科大厅是第一个新的病,所以没有出现过,那他也找不出来,所以他弄反了吧,不是他这个逻辑。它这个应用的逻辑,你认为那就很简单。一个问题是药多还是病毒,你 covid nineteen 这个药病确定之后再去寻找它的相关的药对我觉得好找。对所有相关的基因对就是通路到达的所以不管他了再说然后它这个这里就用到那个知心度就是它找出来的是一条路径。然后就是每一条路径都有这你看这就是我们要建的东西然后它就会去乘相乘概率就是一条一条的相乘起来这个是做整个路径改造的。这里就是刚刚说的方向相关就是负10正一就是负一就是抑制正一就是促进正相关负相关。然后它会就是乘出来这条路径上所有的数字然后判断这个药物是会抑制这个疾病还是说促进这个疾病就是说它是正相关的还是负相关的。对然后说然后如果符号是正一的话就是这个药物会加重这个是对的对。然后它还有一个是聚合多条路径就是因为它这个药物可能和这个疾病之间有不同的基因通路都能到然后它会用这20就是很多这所有这些路径概率都聚合起来得到一个最终的是对然后得到这些之后它会视作这个药物的最终的。
线下人员: 得分概率,然后输出一个结果,对,然后就是包括计算细节的,这里就是直接概率聚合这个就是刚刚说的那个进度。然后间接关系推理这个就是相乘对,然后多路径的聚合,这个是这样,就是每条路径都贡献一定概率路径都要走的概率越高。他单要做多个路径,对,然后你别说他在那个时候能做出这个还是很不容易的。我觉得是一定有很多人参考了他思想是一定有很多人参考这个思想对,然后这个就是正一负一,比如说这个药是。抑制这个静音这个原因也抑制疾病了,就变成促进了对,然后这个整体的明白代码实现,不刚才你下面代码实现,我看一下。
线下人员: 这时间位置是吧,就是位置,我现在是就一起上手一个项目,我先用我那个项目接 skill 理解一遍,然后我写了一个就是根据这个报告去找那个代码去忠实回答,然后所有回答就是我问完我想问的,我觉得这个最后的。
线下人员: 论文成果有没有给出一些例证应用案例有只有吗不只有那他原来是怎么说我直接找一下我们的。这里有。还有一个比较有意思它叫断言它不叫普通的关系就是它加了很多的严谨性。断页对它叫回溯式验证。对他还真不错了。那用产出的标然后之后是不是后撤对他们说文中当前时间节点是2023年的3月展示了五个候选方向对其中有发表的。就是36个。那么剩余14个里面有提出的放在里面。有没有他发现了当时没人发现的最后被验证的。这一些。
线下人员: 进入临床实验。可以对文献积极。不对。有关系的。对就是进入临床试验了,或者被文献提及它有哪些,对你看这两个吧,它就这两个新冠还有这个纤维化,对脑性纤维。后来没。后来的文件里出现了对。等于它是一个药产生两个效果?看那啥,每个月用从这里面找,然后检查后面是否出现了,在最初的两个月后面有三分之一被支持的有效值得后来。不一定会变成后续的是有教育的,有价值,这个地方在着重的去评估一下,要评估一下它到底。把这个时间先理清楚,他提出了多少个假设,后面被验证的有多少没被验证了多少,然后到了什么状态?行好的。不要看你看。十款疾病的十个常用药显示能找回已知也会提出大量未验证的候选。预测出的事情,在他不在里面有形成。你我下来再看看吧,把这段再给他解释清楚,这个解析,我们就知道它大概率它的真实有效性是多大,另外一个就是它的这个文献。
线下人员: 到底有没有对这个数据库知识图谱有没有调查员对另外就是目前看,如果是这样的话,它因为里面的这个关系执行度提取。他是用他自己的算法做的模型做的那个模型也应该开源了,有好像有,但是我总觉得他这个模型。的数据。找到他,他训练数据不知道给不给有说几个?数据给出来了,我们完全用重新调。可以重新调,不能用他过去的模型都已经太落后了。叫什么百欧?因为。你可以搜一下。收百欧就完。
线下人员: 对。这个训练阶段8O RED 对包标注的数据训练组模型,这是第一阶段,对,所以我就说你看看这个有就完全可以我们自己去,或者是不是都已经有更先进的模型,你可以调研一下,就是有没有基于这个数据训练的更好的。做分类的模型,或者做这个执行度这个训练的模型,甚至你也可以问问他,现在至于一些你像好的医学模型或者是不是可以做更好的分类?谢谢。
线下人员: 第一个,你等会往下走走,我看看。的论文崔定解头痛,头孢紧头痛这样的全局去重的,我知道了,从这个角度第一找到,如果有这种开源,首先把这个真实的可用度,可信度调研一下,就这个东西,它到底成果怎么样,如果成果不错,我们先把它开源拿出来,我们做一些研究,就做一些验证。
线下人员: 对验证完之后如果可行我们先用就给他们先用对先用之后我们再自己看未来比如说新增的知识图谱怎么处理就至少这个格式是差不多的。我觉得这个格式基本跟我想的差不多够用好。另外一个中科院他们在做的也是基本上他们他这是3600万篇对3006万篇他们大概是5000万篇好像是做的。当然还有人家还有一些数据库那么这种情况下他一次数据知识更新也是花很多算力。你想它是知识库更新之后要用这些知识库的数据。再去训练模型明白。它其实底层就是这么做的。我跟你说实话把底层说清楚了现在让什么 icloud 重新重头。知道这个模式重新训一遍一点难度都不大,所以你想这个世界进展多快,你你可能前面十年他妈的积累的东西,我可能三个月就用大模型就把你成功复现出来了。太可怕了。
线下人员: 这个论文就这样了,那个 MM DK 这个我没读就再看。ok 就是上一个论文,就主要尽快的看看能不能实现。如果能先把可用的就先把它装起来,然后我们用一个他是他检索算法也是他自己的,哪个就是他这个基于知识度的检索算法,对是那不行,我们就看看他的检索算法,我们能不能再。
线下人员: 做一些优化,有点猛,但是有可能它是什么,就是医药这东西它比较严谨,简单有效,对它就是不对,不放过任何一个就是您过宁可这个错过错查了一一千。也不可放过一个有可能你知道吧,因为他找到一个就价值就很高,所以这能理解好,还有那个谁那个他们说数据库。
线下人员: 数据量比较大,没办法一下给到多少,不知道他没说对,你就告诉我多少数据量吧,要不我直接让他下周一他之前问我说下周一行不行?那也行,这是一个方法,你就下周一把 API 开通,调整好第二个未来这个整个的知识图谱,你肯定要做本地的备份的。不是就是这个论文的数据库行,我们的文章数据库你肯定要做本地备份,万一他们的云上的给你弄没了你就完蛋了。好,那我就先让他下下,下周一先给我一天,然后那个数据量对他正好再打包给我们对好。那你知道了,你知道你们现在做的东西多简单了吧?就是还倒饬半天导出来东西导出不明白,连个需求都说不清楚。吃过就我感觉您刚刚说的是对的,以后有了那个需求之后,就我就是把有可能的我都展示给他们,然后让他们来选,然后咱们直接就可以执行了,我觉得就可以选去大量的中间反复对,然后来回回,然后还会有很多不明确的东西。因为我感觉他们肯定想不清楚,那就直接做选择题,这样对简单直接就是现在反正就是这个所领导那个是没问题的,然后这块我正在就是出几版那个对最后生成那个方案,你还是我上次跟你们说的流程。
线下人员: 你自己先做一个调研,先学习一份这种咨询性的,给领导做政策做决策支持的和信息支持的报告怎么写?应该包含哪些内容?我们这个行业是哪个什么什么行业,目前可能信息源是多少?你先自己去调调研一遍,你听他们的。
线下人员: 现在人工智能我就再说一遍人工智能比我们80%人都聪明。每个月都搞不出,所以你就我们最重要的就判断这个需求是否合理,然后合理之后我们自己弄,你等他弄他提不清楚的。那为什么安定医院就走的感觉就会其实我在提是对,是的,他们也一样,全是我在带着往前走,是我是需求的提出者。知道吧,我只是让他们验证,你告诉我你是不是有这些数据就是我不需要他告诉我怎么做,明白吧,但是你现在水平还没到,你带不动它对是?明白了不,现在处在这个问题,所以你要用人工智能帮助你带他们走,我现在也是用人工智能帮助我带他们走吧,就这个道理,你看这个东西多复杂,但是只是我们的一个 a 技能的一个模块,我整个大框架巨大无比。你知道吧。所以你得有框架能力找了吗。你们带好框架,他们可能思路也会稍微清晰,当然了,然后接下来就是市场部的数据库。然后刚刚跟你说的就是最新跟陆主任沟通的结果就是他说因为感觉他也回答不了,我就是您问我的那个问题,就是说是到底为什么要做这个东西,他有什么必要性,然后我感觉窦主任也没有想太,然后他就说那就换一个,那就不做整个部门的了,或者说现阶段就不做就为。
线下人员: 每个人量身定做一个人的那就问题又来了个人的需求是什么每个人都不一样他就说是能够快速检索提高工作效率检索什么。检索医疗论文吗检测什么就感觉说的有点太宽泛了对检测什么听他的意思明白了吗所以他没有设计能力。方向对他没有设计能力他没有提问题的能力。那什么张媛媛他们自己做你拿个什么Cherry Studio. 搭一个玩意,那不就是一个了吗?那他们要的是这个吗?我感觉他要的差不多吧,反正他是快速检索,然后不用你这样我给你推荐一个东西你所以你看他们都根本不懂,他也提不出来,你去 cloud code 刚发布了一个叫 obsidient skill skill s。
线下人员: O silence skill so silence 是本地的知识库是可以用 cloud code 来处理的,所以基本上他们以后所有的东西你可以以往 O city 里面导完之后直接加上 SKILL S 就可以调用了。就行了,按这个来设计就完了,其他的不用扯淡了,检索啥也提不出来,我问你他图片要不要检索视频要不要检索,他要检索啥?那 CR 什么 CRP 要不要检索 ERP要不要检索这都是问题他反正就主要就说的是比方说像一些他那些对接就是对外对接的那些他们想每天比方说他们最近跟踪的一些大客户可以每天给他们自动推送一些最新的一些消息他们能及时获取。不叫个人知识库那叫信息推送对所以你看文方向都错了就是反正你个人知识库跟这没有关系就是他好像是想对所以你说你。
线下人员: 你所以你看也面临你也面临这个问题。到底想要什么,就是很简单,你往下问你,你不是你做这个的目的是什么?是为了个人工作效率提高,还是为了增加客户粘性,还是为了推广产品?你把这些问题往底层问。就您刚说那三点,他们应该现在想要签两点。那这两点有没有联系,哪个在前,哪个在后?融合在一起做,为什么要融合在一起做,这都是问题。感觉他们想先搞出来一个什么?推送还是搞出来本地知识库,他们都想要第一优先级是什么?我们先有了知识库,然后再从知识库里面,然后比方说打一些重点的一些客户的标签。然后那不又回到了通用知识库了吗?你看这还是没提明白,那刚才说我不做了,现在又回头做了。
线下人员: 那好了,做指哪些内容给用户推送哪些内容,所以你到底是要提高自己的工作效率还是用户这两个是不完全统一的相同的?你个人是个人的效率提升,比如说 Prompt. Good. 对我有 prompt 那我能把这个 prompt 图给用户吗没有记忆的。所以你的知识你比如说我怎么思考芒格的思维的一百一百种模型我可以用户吗所以他不同的目的。你的知识库到底和我你自己都没提清楚。想清楚。到底要什么这两个是不同的。那你说我都要先要什么先要那个。那好这周海总你要是你的知识库是什么是芒格140维模型你告诉我你怎么定义的你如果连自己对知识库的定义都没有你凭什么要个知识库出来你的知识定义是什么是员工操作手册是不是支付是法律法规是不是制度是那个维基网站是不是请问你要什么我可以把它都给你我理解的知识库就是我不知道他们反正我理解的知识并不是一个沉淀到本机的一的知识垃圾而是说可被复用成结构体系化然后可以在需要用到它的时候可以随时提取。
线下人员: 引用的这样的一个东西,你定义清楚都有哪些东西?你不定义去做,我怎么给你做,每个人都不一样,我根本不要那些东西,所以感觉他的意思因人而异。可能得市场部每个人的需求,给他们各自定做一个他们自己的本地处理。那你就把那个什么飞书表格给他们的飞书就给他们,要不你自己听就好了可以你去建一个飞书,然后我们把这个 API 打通帮你调用就好了。你自己想往里填什么,你填什么知识,我不负责建设,因为我不知道你想要什么,我只把给你,你自己往里填完之后我给你一个调用的接口。你自己能把随时的检索调用就其实飞书里面都有,如果你要用这种方式,那你就飞书好。
线下人员: 可以聊,因为说实话,我觉得众口难调,而且个性化太强了,感觉也不科学化墙可以自己得会定制你自己知识,你我怎么知道你要什么知识对不对?什么对你来说是知识,我是不清楚的,我没法去给你做的,因为你认为这对你是支持,对我就不是支持,我不需要对,那我怎么去定制,没法定,所以知识的内容完全无法定,那这样的话我们就不做知识内容了。我们只给你知识框架,你自己去填去,要么是飞书,要么是苏刚才你说 opposite让他们先学会用用完之后再说怎么检索先把知识库先填进去连数据都没有还想要智能不扯淡你连数字化都没有还想智能化是你让他先把整个的知识数字化了你看的书也好什么也好你往里填你放进去。其实 notebook 不开 M 就是最好的。不行就把能不给他们做,用了就完了。或者好像有一个开源的叫 open。Notebook. 你去查一下,没问题。或者江振达在吗?
江争达: 改的。
线下人员: 你这样我不是你跟曹建宇把这个事情就是第一那个 open 的 notebook。你把那个开源的研究一下好吗
江争达: 下下周吧。
线下人员: 啥意思,这东西你只要把开源库找出来给郝建玉就好了。
江争达: 下雨。好那好。
江争达: 还有那个 notebook 的 skill 给他就行了,这两个。
线下人员: 也可以对我这样跟你说,第二个就是你把那个 cloud skill 和那个的东西整合在一起,可以给他看看,但是这两个是不完全一样的,一个是基于谷歌那个东西,一个是完全开源的。
江争达: 好。
线下人员: 这三个加上我刚才跟你说的 obs skill S 这三个足以满足他们的需求,但是这个需要你去判断用什么,他不是这三个。这个底层架构是不一样的。反正感觉他们目前的话。没办法,连外网。我说要开源的。
线下人员: 还有一个就是74的就让他们自己把文文章装进去还有一个方案是什么让他们自己把知识文档全部整合好然后我们用知识图把它处理完之后。给 cheer studio 弄个知识图谱或者向量数据库连上让他来 API 查也行,这是第四种方案,帮他们建一个向量数据库支持的向量数据库,然后就直接来查就完了。把我们的知识问答这个明白,做成一个直播间,但知识我不提供知识,有他提供,我们把它加工处理就完了。
线下人员: 其实我还侧面问了一下,感觉大家如果要是做一个部门的,大家好像都不知道该提供什么,所以可能我也跟窦主任说了一下,可能大家意愿没那么强,可能只是窦主任他想见,但是大家也没那么想见,那就先给他弄就完了,其他人先不管。他自己能不能提出来就知道了,他让他把自己认为的是知识的这些文章 PPT 那 PDF 这些全部扔进来。我们用知识图帮他跑一圈,然后把知识问答给他一对接就行了。
线下人员: 小李娜你听到了吗?
江争达: 听到了。
线下人员: 这样的话,你就把知识问答那个东西直接做成一个可以面向个人的就完了。就是个人的数据库,做一个权限,分分分离分隔就行了。就他登录就是他的数据库。理解吗。
江争达: 具体是看是按照这个方案走了,还是咋说,先调研,过了之后再确定这个方案?
线下人员: 你按照我的思路先调研,你不要先到满天去吊唁,你就按照我这个思路去调研就行了,你比如说你用 notebook im 再去调研一圈,不必要了。
江争达: 好。
线下人员: 就因为那些东西都是比较简单的,你就让郝建玉才看看,也就明白了这个需要等于把智能知识问答助手变成个人的助手,就这个目的吧。接下来就我们第一开始都不一定做知识图谱了,直接做向量数据库就完了。
江争达: 明白。
线下人员: 理解了,就你把向量数据库分人给他就建就完了,然后我们就把前端那个页面做一个分类的登录的管理就行了。你登录之后你的数据库包括你的问答数据库,你的历史记录都在里面就完了。
江争达: 我大概懂了,那就千运那边是去看看那几种开源,还有那然后我就去看一下怎么构建以问答系统为。
线下人员: 咱们继续看就完了。
江争达: 分权就完了。
线下人员: 就是一个分钱系统是现在的都跟你现在的逻辑架构都不变,就是个分权管理,你就等于用用户数据库,一边是对于外部用户的一个是对内部用户的内部用户不一样的,就是数据库的分权。
江争达: 明白。明白了。
线下人员: 你外部用户将来也会数据库分权的。
江争达: 对行,我知道了。
线下人员: 你这两个系统可以分开?
江争达: 行就是给自己。
线下人员: 你的数据库可以独立,不要放在一个数据库里面。
江争达: 前端用一个前端是这意思?
线下人员: 对前端可以有一个前端就完了。
江争达: 好知道了。
线下人员: 这样的话你的改动是最少的了。
江争达: 对。
线下人员: 加一个健全系统就没了,就健全和前端的逻辑改一改就完了。这是最简单的。
江争达: 对就最好我到时候看看后端可能你要说就是只用给他们向量的话,后端就是到时候再分一个后端出来就不用不跟我们的就是。
线下人员: 对。不跟我们的分不跟我们的合同,你对知识图谱还没他们说知识图谱,到时候再说吧,先看他们,我跟你说不好,你这包装完了给他们又不用了,都有可能的,那你对你来说就是一个很简单的事情。
江争达: 对对不跟我们的和?好知道了。
线下人员: 就完了,因为前端也不用动了,后端大部分逻辑也不用动了,只是一个健全逻辑改一改就完了。
江争达: 明白了。
线下人员: 有让他们有一个自己上传那个上传文件的接口,你要开放给他。
江争达: 好知道了。
线下人员: 我你把文件开放给他之后自动处理成向量数据库存到数据库里面就结束了。你的检索流程就比原来简单多了,但是可以稍微简单写一个就完了,就是 rank 就完了。
江争达: 明白。
线下人员: 都有开源的你开源的向量数据库检索那个都有。
江争达: 行,我就用那个什么的还挺快的,那个也很快。到时候就直接给他们用就完。
线下人员: 那也行,那也行。拉出没有,他不也要知识图谱吗?
江争达: 它也可以不见纯向量检索给它们。
线下人员: 也可以不见那也行,那就完了,这更简单。这样的话你后端也有了前端一直接就完了。
江争达: 好。行知道了。
线下人员: 这个简单,剩下那个你就是其他几种方式让郝宇自己去那个,因为那个基本上都是图形化的和 SKILL S 相关的,没有代码的。行吧。还有啥刚才的报告撰写袁姐一年回来了,我到时候你改一下,他说改完给客户。改完就行,改完就他就给客户看,然后客户再去。主要对那些我再调一调就行。
线下人员: 对田总,他那个数据库就是云大哥那个数据库要不要,就是咱们要是要下过来,要咱们要备份一份。就在江老师那个服务器在服务器上备份,要给他一个时间节点,就是说他不是说数据量比较大,没办法一下给到的。
江争达: 不是等一下我也没太理解,就是我们要拿它的数据库做备份,还是说我们把自己的数据库里边的那些文档拿出来之后做完的知识图谱什么的备份就行了,我们要备份它的数据库干的。
线下人员: 因为以后第一,首先他说他那个 API 改造很慢。懂了。你这样的话,你想他以后每一次他每一次要给你更新的时候,他是 a 都很麻烦的,不如我们自己。
江争达: 那我大概懂你意思,那其实我就是把他那数据库里面的数据什么的,到时候他给我们了,我们就把那数据库拿出来数据拿出来,然后看看我们怎么用,用什么数据库重建等于说?
线下人员: 把它导出来就完了。这是一个第二个就是每一次更新,我们怎么怎么能够同步更新。
江争达: 行。
线下人员: 不然的话你每次都是这叫找他半天的,所以把这个 API 搞好之后,我们可以实时更新就完了,然后更新完了把它本地做一个备份,万一云端没了就完蛋了。
江争达: 他们难道没有备份吗?他们肯定也有吧?
线下人员: 我不知道他要有备份,他不就应该给我们吗?
江争达: 也是这么夸张吗?商用平台数据库没备份的。
线下人员: 你这一看。谁知道,所以跟你差不多的人比比皆是,我跟你说。
江争达: 那我商用的还没没那么夸张。
线下人员: 那比你夸张的人还是有的,那我给他一个时间节点吧,你给他越快越好了,越快越好行,因为我们要处理本地的你每次都到云端去取多麻烦。
江争达: 那就它等于两个需求,一个数据库给我们,第二个就是尽快把那个对尽快把文档也给我们。
线下人员: 把这个 API 也做好。
线下人员: 我现在就期待着有一天什么我们今天会议上的活。部署下去之后。agent 就开始干,第二天早晨过来我们就验验收就完了,现在人家都是这么干的,现在全球顶尖那些 AI 开发公司都是这么干的,但我跟你说 cloud1周更新五次你以为他自己写的明白了他只是提出个要求。他说自己就去更新去了。明白了吗。像我们这种做法落后。明白这就是这个时代的速度所以我一个人说普通人跟他们差了1000倍的都不相信的说出来都可能没人相信真的这样你可能半年干一个项目。人家一个星期干几百个项目。行吧。那你就这个数字人那个你你你我怎么说我就不看了到时候你自己做一款出来然后生成一个数字人视频然后跟那个之前那个加拿大那个做一些对比之后看看怎么用。
线下人员: 其实我这周就是我用你上周跟我说的就是用那个 CBT 和张,然后我用它那个 deep seek 我都研究了一下,然后研究完之后我都到各个的那个网站上,因为它不是有些是他大部分都是要付费。对的,然后我也不可能全都复一遍,然后但是我都研究了一下,我每个我都研究了一下,然后我大概之前江南有个研究报告,你们看一眼江南你把那个之前那个测试报告给他好不好?那就行了吧,然后反正目前对比下来的话,还是国外的是国内的是性价比高,然后操作会比国外的会更傻瓜化一点,但是他最大的 bug 就是他那个动作有点太僵化了。对,然后如果要是看多的话,就是如果我们每个视频都按就是都用国内来做的话,可能就会出现那种恐怖谷的那种现象,就感觉就是这个人感觉就是有点太假了,对你把他的先看完那些是纸上得来的。
线下人员: 最终还得要去,就是测测了,他已经有过一些测试视频了,把这些测试视频你自己看一遍,好好把他那个测试流程看一遍,所以你就知道了,他说的对不对在哪。然后在这个基础上,你自己再最后生成一个你认为最优的看看效果,再慢慢调一调就完了,要把这流程做下来,加拿大之前已经做完了。
江争达: 千玉之前也拿到过了,上个月就给他过了。
江争达: 是数字调研的视频?
线下人员: 那个视频你看了吗?我找找。
江争达: 12月13号。
线下人员: 我完了回去看一下对你现在的任务就是他之前大量都是用手生成的,那么包括有一些还没有那么完善的地方,你根据你的调研。怎么能够形成一个自动化的,就像他现在做的这个科普视频一样的,这个科普视频,它逐步要开始自动化流程已经差不多了,然后在刚才说了几个界面在。再露出一下用户修改的地方就行了,然后在这个地方就逐的逐步精调了,它就基本上这条流水线你也一,你接下来就是生成一个基本可用的同时。
线下人员: 给出一个自动化的流程,我现阶段就是我这个调研的还是一个需要人来介入的一个算是半自动化的一个对那下面就是。它怎么实现从半自动化到自动化的,你就可以借鉴。用浏览器操作你都是人手按的,有时候。明白鼠标操作就完了,那浏览器操作就这么回事,那我不就是把我那个浏览器操作方案给了他,在我那改改完之后就自动生成了。要多久,你要不明天,其实就相当于有了一个。转接的一个这个代理的浏览器操作代理,就他带领你来操作这个浏览器,原来你人动不动点这个点那就浪费时间了,它自动帮你操作了。
线下人员: PPT 生成不就是这样吗?那我是光把这个流程列出来,还是说我要工程上也要实现光列出来干什么用,就我还以为只要做出来实现你自己实现不了你做完做不出来了。去找徐龙或者找嘉文达去学好的!明白。反正首先第一半自动流程已经有了你在这个地方去做一些优化好,然后第二个就是,如果他们有生成这个数字人视频的需求,你就拿这个半自动化流程帮他们生成就完了,然后在这生成的同时开始优化自动化的流程。现在已经保证有一个基本可用的了,明白吗?明白,比如果他们要比如说生成数字人视频了,那你就跟他说,那我就拿这个给你手搓一个,基本上已经好多都已经是自动化的。上次加拿大已经把自动化,半自动化流程已经跑的差不多了,你在这个基础上你你知道这个流程吗?是都看过的对,就是咱们之前都演示过,对你把这个流程自己过一遍,然后再结合你的调研。结合你自己的操作,编码能不能把它变成自动化的和优化的明白!
线下人员: 两天总说能像你那样直接他们给一个需求我就能判断他们到底做多了就行了你做个十个八个项目就有感觉了做100个项目基本不用他说了。今天晚上第一个地方梳理过了。你们叫未完成啥意思对 AI 生腾不是未完成的 P 零,这不梳理最近月纪要不是说完完成了吗?是他。
江争达: 这不是还有后续优化 skill 还没还要大家确认。只是梳理。
线下人员: 后面要把它变成你的会议纪要里面的处理的方案?
江争达: 对。
线下人员: 好我知道了。对这个也是那今天也提到了就是头部相关调研也说了那就做这个好像又改了。前端我们前端测试这个提到了流程协作就我改一下我那个会议。你测了吗还没来得及对上次那个你基于的做那个套壳的那个叫什么来着CK 是你你外外面那个应该叫 electron 还是什么来着,它的开源是叫 electron 的那个架构做的就是刀刀子。A Claude Cloud. 我觉得你现在要做需求,你是必须要用?哪个你的需求 SKILL S 你不得拿这个套的往上套吗?是对你不是任务,对,然后那个 A UI 对 A UI 就这两个加在一起吧,行。
线下人员: 这个已经出到了包括把是不是要把这个老的已经的 SDK 融入到这个里面来,要不要融入进来。现在我们生成都是基于自己文档的,你看别的 deep research 基本都是外部引进来了?要不要把它加进来,这个意思,这个对你再往前优化的话,就是往这个方向优化。一个是量的增加,一个是本身代码的健壮性和便捷性或者清晰结构。第二个就是把这个文档的。就是量增加,第三个就是利用把智能增加,利用 CLOUD B 包装一个或者 cloud sdk 包装一个外部的。
线下人员: 叫什么研究助手进来好,那要不你你能帮我把就是我的任务排个序吗?这是我还没干的活儿。
线下人员: 急要比较急的是不是首先明天那个安宁医院的对,然后明为什么是明天他写了明天了吗?您不是有对,就咱们明天我听说明天要交了我就不对了,对。我以为明天要交,那今天就得搞了,但是他没说这个是第一个行这个第然后第二个杆那报告转写那个不着急,没那么着急,这个,而且我觉得这个花的时间也少。简单调一下风格就好了,基本说那重要的,我再看看这个后端你你先干干净净,给排到第二。行,因为这是属于基础性的工作就是越早越对整个效率提升有巨大的好处的。磨刀的工作,对磨刀的工作,第三个我看看。可以去要不一样,因为这是保证接下来的紧急的需要。
线下人员: 后端在最底下很快要测了代码先整理一下,对整理了。然后再排的话。需求 SKILL S 对。然后把织土挑下来。对。好差不多了,差不多对后端重构调到转写说明不能赚钱,其实你的后端服务代码整理差不多了,就是跟合并了可以。后端重构是只是加上那个对,然后再可以稍微放一放。可以差不多就这样 OK 行。所以你其实你自己也迫切需要一样一个这样的就是整个的框架成了之后,你这些任务也有好多就可以扔给他,就是。
线下人员: 你你每天只要对话需求完了啪扔出去,对话需求完了扔出去,然后回来验收,你需要有几个 AI 实习生买房子?你的?
江争达: 什么下周计划的排序?
线下人员: 服务器你服务器肯定不能再往后排了。
江争达: 现在就是下周可能只能完成两个,一个是服务器加一个科普视频,自动化的那个前端的就是调用这两个是 p0然后那个对问答系统今天我就不收尾吧就是刚才会上说的那几个小点今天改掉之后直接上线然后出一个那个报告让他们测吧就是测试报测试手册让他们测吧就。
线下人员: 夫妻现在马上都紧急。对的。对是。
线下人员: 行了可以的。
江争达: 好。
线下人员: 我先去了我共享一下您也看一下。我七点多钟还有个会你们抓紧时间。这是我的原则。我刚列了一下。就下周的。反正这三个基本上都下周得出来就是所领导必须下周得把那个报告模板确认好了反正这前面两个你都是下周的活前面两个你把任务都给我一个结果出来就行。前面两个数字人也得对就是你调研完了你不是你手手搓一个视频然后或者说自动化一个视频你拿一个视频出来好你可以做一个比如说一分钟的或者是30秒的都行好那个其实难度不高但是这个基础上你。如果能做一个自动化的那最好做不出来你把那个整个的调研的情况自己手搓的这个视频拿出来如果你能自动化成那个视频就更好明白。
线下人员: 提吧。
江争达: 还有就是丁康也在刚才说的日报的 skill 是不是要跟他再提一下?
线下人员: 啥意思就刚刚。
江争达: 就丁刚刚才不是走了吗?现在还在会上,刚才不是我们有一个遗漏的是那个日报的那个 skill 吗?
线下人员: 日报的 skill 就我们自己改了。
江争达: 丁康他说他还想自己做试试。
线下人员: 我知道,那就让他做,但是很清楚时间点确定好!
丁康: 我这两天能做完。
线下人员: 行吧。
丁康: 然后这。
线下人员: 你看没有这项目管理,我们自己的手动整理,然后就已经漏了好几个项目了,你项目管理这东西你简单得就这几个星期连个影都没有这个东西问题大了。你不能一个项目,我们那三天你你一个月没完成。没法理解了。这不是一般的效率的低下问题了。这里面肯定有其他问题了。什么。那你自己先决策,至少下周必须把这东西拿出来,如果拿不出来,我们就没法再指望你做这事!那就这样吧,其他的没了,这周其他的我也不知道不说什么,这周进展 AI 进展也很快,另外一个下面可能。有些项目可能外面的项目还会陆陆续续进来一些跟医疗药企业跟医院的项目慢慢慢都会进来,可能我们得先把安定医院的框架先打打好,反正。最重要就是没有那么紧急,但是最重要就是那个框架的 web 的 engineering 的框架,那是最重要的一件事情,这个取决于我们底层的工作效率提升多少倍的问题。行吧。