Files
n8n/2.会议纪要.md
2025-09-01 23:48:02 +08:00

186 lines
37 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"nodes": [
{
"parameters": {
"httpMethod": "POST",
"path": "956024f9-4f0b-4617-b241-ea92127c0f8d",
"options": {}
},
"type": "n8n-nodes-base.webhook",
"typeVersion": 2.1,
"position": [
-528,
-16
],
"id": "119ccf17-6b55-4acc-8298-1e8118ab8710",
"name": "Webhook",
"webhookId": "956024f9-4f0b-4617-b241-ea92127c0f8d"
},
{
"parameters": {
"promptType": "define",
"text": "=#### 你的任务:\n请根据身份、场景、会议信息说明、项目信息、上周待办事项、输出模板、录音文本有时间戳和我记录的要点、录音软件总结的要点、录音内容以及提炼以下内容按照模板生成会议纪要\n1. 每位成员本周完成情况(对比上周任务,标注✅或❌)\n2. 总结各成员、全员本周待办任务、需协同解决的问题(跨人、跨模块)\n3. 其他有价值的讨论内容,归类至以下方向:\n- 未来工作方向\n- RAG数据库搭建闫旭隆负责\n- HippoDeep检索连总+闫旭隆+江争达)\n- 测评体系搭建(李振负责)\n- n8n工作流相关刘嘉宇\n- 前端工作(江争达)\n- 个人能力提升\n{{ $json['会议议程'] }}\n{{ $json['录音软件总结的要点'] }}\n{{ $json['录音'] }}\n{{ $json['上周待办事项'] }}\n{{ $json['会议模板'] }}",
"options": {
"systemMessage": "##### 1.你的身份:你是一名经验丰富的会议记录与技术分析专家,你遵循原则:\n- 严格按照录音内容进行摘要提取。\n- 摘要中不允许有任何杜撰或推测性的内容,确保所有信息准确来源于录音材料。\n##### 2.场景:你正在为一场**智能问答系统项目开发组周会**进行摘要提炼。\n本次会议的目标\n- 总结上周每个人、全员任务完成情况\n- 明确本周每个人、全员待办任务\n- 讨论解决会议中发现的问题、模块进展交流、总结要点\n##### 3.会议信息说明:\n- 录音内容中,每段发言均标注了发言人姓名和时间戳,注意未明确更换发言人时,后续内容属于同一人。\n##### 4.项目信息:\n\n### 1. 项目基本概述\n\n#### 1.1 项目名称\n\n- 智能知识助手与自动化报告生成系统\n#### 1.2 项目类型\n\n- 是产品开发\n\n#### 1.3 项目目标\n\n- 智能知识助手 将企业知识库转化为对话工具,支持自然语言查询、追 问及来源追溯,减少文档搜索时间。 \n- 自动化报告生成 AI 生成结构化报告初稿,顾问提供大纲/数据,系统整 合知识、遵循模板并支持人机协作审阅。\n- 短期节省审计/会计 50%、专业写作 44%时间;长期构建 知识资产闭环,开辟 AI 咨询新业务。\n\n#### 1.4 项目背景 / 背景故事\n\n- 行业痛点 知识获取滞后、信息孤岛化、文档撰写耗时、资源利用 不均。 2转型契机 大语言模型技术突破(如 ChatGPT\n- AI 可节省专业写 作 44%、审计/会计任务 50%时间。\n\n#### 1.5 项目生命周期\n\n需求分析→原型设计→知识库构建→MVP 开发→集成测试→试点优化→全面推广→持续运维。\n当前属于集成测试阶段\n#### 1.6开发组人员与组织结构\n\n- 项目负责人、系统架构师:连云波\n- AI卓越中心主任窦佳丽\n- 管理工作负责人:张媛媛\n- 开发者名单\n\t- 李振:测评系统搭建\n\t- 闫旭隆:知识库构建、知识库检索与生成逻辑\n\t- 刘嘉宇n8n工作流模块、后端开发、测试\n\t- 江争达核心rag推理模块、前端负责人、技术支持远程开发人员\n\t- 张旖旎:前端开发(远程开发人员)\n\n"
}
},
"type": "@n8n/n8n-nodes-langchain.agent",
"typeVersion": 2.2,
"position": [
192,
-16
],
"id": "cca18415-a50c-4934-87fb-fca5eed4a024",
"name": "AI Agent"
},
{
"parameters": {
"assignments": {
"assignments": [
{
"id": "d4e5bccd-eda1-4ad0-be10-373e6e5b21d1",
"name": "会议议程",
"value": "={{ $json.body[\"会议议程\"] }}",
"type": "string"
},
{
"id": "5ec943ac-eb05-40c0-ae8c-7ad54f73be84",
"name": "录音软件总结的要点",
"value": "={{ $json.body['录音软件总结的要点'] }}",
"type": "string"
},
{
"id": "a8e1d8d2-b99e-4d00-afd9-9fa20d74e600",
"name": "录音",
"value": "={{ $json.body['录音'] }}",
"type": "string"
},
{
"id": "6d439604-c9ca-4442-b241-ab8eea2420f7",
"name": "上周待办事项",
"value": "#### 一、上周待办事项 ##### 1. 闫旭隆 - ⏳ 部署Hippodeep服务到服务器暴露端口供前端调用 - ⏳ 实施概念探索模块实体→概念→评分循环仅限1次迭代 - ⏳ 与江争达确认部署路径和概念节点评分机制 - ⏳ OCR与图像功能汇报展示 ##### 2. 江争达 - ⏳ 完成域名配置(国外亚马逊云备用) - ⏳ 前端集成:调用闫旭隆/Hippodeep端口确保基础聊天/记录保存功能可用,前端优化 - ⏳ 与闫旭隆确认部署路径和概念节点评分机制 - ⏳ 准备演示方案 ##### 3. 李振 - ⏳ 重新生成多跳问题测试集确保文档与问题匹配并进行更大文档范围的测试30-100 - ⏳ 跑通多跳问题全流程测试(含端到端评估) - ⏳ 输出测试报告(含错误定位分析) - ⏳ 保证下周可以给相关同事进行测试 ##### 4. 刘嘉宇 - ⏳ 完成n8n自动化流程的部署包括任务生成、邮件通知等 - ⏳ 为下周展示准备基础数据流和模板文档 - ⏳ 在李振的安排下进行测评工作 - ⏳ 后端聊天部分接口对接到hippo-deep ##### 5. 全员 - ⏳ 周四前完成各模块集成,周五冻结演示版本 - [问题1]:前端部署协调(江争达+刘嘉宇+闫旭隆) - 需统一服务器部署及端口暴露机制;域名未配置【需周五前解决】 - [问题2]:测试集数据不匹配(李振+闫旭隆) - 测试问题与文档关联性低,需重生成数据集【李振负责协调】 - [问题3]:概念探索模块集成冲突(闫旭隆+江争达) - 避免社区/分层逻辑混入,保持工程可测性【连总强调简化为单层概念探索】",
"type": "string"
},
{
"id": "c59f1ab2-0078-48f1-ab9d-f9edaa0d892d",
"name": "会议模板",
"value": "### <center>AI卓越中心开发组会议纪要</center> 时间2025.08.11 地点学院国际大厦2105 参会人员:连云波、张媛媛、李振、江争达、闫旭隆、刘嘉宇、张旖旎 #### 一、上周待办事项 ##### 1. 闫旭隆 - ⏳ 部署Hippodeep服务到服务器暴露端口供前端调用 - ⏳ 实施概念探索模块实体→概念→评分循环仅限1次迭代 - ⏳ 与江争达确认部署路径和概念节点评分机制 - ⏳ OCR与图像功能汇报展示 ##### 2. 江争达 - ⏳ 完成域名配置(国外亚马逊云备用) - ⏳ 前端集成:调用闫旭隆/Hippodeep端口确保基础聊天/记录保存功能可用,前端优化 - ⏳ 与闫旭隆确认部署路径和概念节点评分机制 - ⏳ 准备演示方案 ##### 3. 李振 - ⏳ 重新生成多跳问题测试集确保文档与问题匹配并进行更大文档范围的测试30-100 - ⏳ 跑通多跳问题全流程测试(含端到端评估) - ⏳ 输出测试报告(含错误定位分析) - ⏳ 保证下周可以给相关同事进行测试 ##### 4. 刘嘉宇 - ⏳ 完成n8n自动化流程的部署包括任务生成、邮件通知等 - ⏳ 为下周展示准备基础数据流和模板文档 - ⏳ 在李振的安排下进行测评工作 - ⏳ 后端聊天部分接口对接到hippo-deep ##### 5. 全员 - ⏳ 周四前完成各模块集成,周五冻结演示版本 - [问题1]:前端部署协调(江争达+刘嘉宇+闫旭隆) - 需统一服务器部署及端口暴露机制;域名未配置【需周五前解决】 - [问题2]:测试集数据不匹配(李振+闫旭隆) - 测试问题与文档关联性低,需重生成数据集【李振负责协调】 - [问题3]:概念探索模块集成冲突(闫旭隆+江争达) - 避免社区/分层逻辑混入,保持工程可测性【连总强调简化为单层概念探索】 #### 二、本周工作完成情况 | 成员 | 上周任务 | 完成情况 | 关键补充说明 | | ------- | ------------------------------------------------------------------------ | ----------------- | ------------------------------------------------------------------------- | | **闫旭隆** | 1. 实施概念探索模块1次迭代<br>2. 与江争达确认部署路径/评分机制<br>3. OCR与图像功能汇报 | ❌<br><br>✅ | • 概念探索模块未实施<br>• ES库权重字段/概念节点向量化完成<br>• NuMarkdown-8b工具评估完成支持PPT标题/表格解析) | | **江争达** | 1. 域名配置(亚马逊云备用)<br>2. 前端集成Hippodeep端口/聊天功能<br>3. 与闫旭隆确认评分机制<br>4. 准备演示方案 | ⌛️<br><br><br>❌ | • Standard模式优化完成响应缩短30秒<br>• Events节点利用不足待优化 | | **李振** | 1. 重生成多跳测试集30-100文档<br>2. 跑通多跳全流程测试<br>3. 输出测试报告<br>4. 保证同事可测试 | ✅<br><br><br>🕒 | • 生成10文档交叉问题测试集横跳逻辑<br>• 发现置信度0却评分0.8的异常 | | **刘嘉宇** | 1. n8n自动化流程部署邮件/任务)<br>2. n8n展示材料准备<br>3. 后端接口对接hippo-deep<br>4. 参与李振测评 | ✅<br><br><br>❌ | • 邮件工作流部署完成<br>• 标准化开发流程应用(需求→设计→部署) | | **全员** | 周四模块集成/周五冻结演示版本 | ✅ | 模块集成完成 | --- #### 三、本周待办任务与协同问题 ##### **1. 闫旭隆** 工程方向 - 探讨并实现文搜文+图功能,包括图片引用保留和图片描述的整合。 - 部署并测试NuMarkdown-8b-thinking模型8B版本验证其连图带文生成能力。 - 联系江争达开通阿里云API接口。 - 优化Hippo-Deep全流程Prompt以提升生成文档的逻辑性。 研究方向 - 规划技术框架并总结现有问题评估GPU资源需求进行实验测试。 - 与李振协同对三种检索方式直接Chunk文本搜索、直接QueryToTriple、概念搜几层进行评测。 - LangChain框架和LangGraph框架选取。 ##### **2. 江争达** 工程方向 - 继续优化前端界面。 - 设计用户模式切换逻辑Standard/Deeper并加入判断机制。与旭隆和连总一起 - 部署生产环境服务器,进行分级管理和多备份,确保代码同步。 - 阿里云租用GPU服务器。 - 测试one-api调用qwen-vl-plus功能备用方案直接对接阿里云qwen-vl-plus 接口。 - 完成概念感知流程图的代码实现,完成端到端整体流程测试。 研究方向 - 深化对图谱中Events节点作用的理解与应用。与旭隆和连总一起 - 与大模型探讨Events功能如何发挥作用并将其纳入Prompts设计中。与旭隆和连总一起 ##### **3. 李振** 工程方向 - 从基准测试指标中,选取指标。设计并实现精确质量评估体系,作为开发仪表盘,提供端到端指标反馈。 研究方向 - 研究标准数据集如wiki等进行基准测试并评估其适用性。 - 提供数据集标准格式。项目组成员各自尝试用大模型生成测试集合。 - 研究学习个人知识库搭建(参考开源项目)。 - 研究学习项目管理系统搭建(参考开源项目)。 - 研究学习Coze和n8n多租户问题解决方案。 - 研究学习前端技术。 ##### **4. 刘嘉宇** 工程方向 - 邮件工作流第二版 \t - n8n测试工作搭建一个框架 \t - n8n课程交流详细方案 \t - 自动化系统mvp \t - 继续N8N工作流第二版的设计并进行测试。 \t 研究方向 - 研究N8N商用多租户方案如采购企业版、本地改造、转为Python代码。 - 评估Spring AI框架与LangChain重构RAG接口的可行性。 - 学习并掌握录音模型微调技术,利用会议录音文本数据训练个性化语音识别模型,提升识别准确率(尤其针对专有名词和个人习惯)。 - 学习并掌握评估框架的部署和使用。 ##### **5. 全员任务** - 思考并提出个人知识库搭建方案。 - 讨论工具开发的商用框架问题。 - 讨论前端问题解决方案。 - 根据李振提供的Prompt和格式或自己设计Prompt生成测试数据集。 - 思考AI Agent开发框架问题。 - 学习并熟练运用评估框架的部署和使用。 - 每次开发工作结束后利用AI如Case进行自动化总结并自动存储到项目文档中。 - 在进行技术选择和探索新事物前,需深入研究相关理论知识,并建立系统化的思考方法。 **协同解决问题** - **问题1前端人力资源不足** - **方案**团队成员需共同学习Figma等前端设计工具探索AI生成前端页面的可行性下周会议进行专题讨论共同攻克前端难题。 - **问题2n8n商用部署冲突**(刘嘉宇+李振) - **方案**评估n8n企业版成本或将N8N工作流转换为Python代码的可行性并优先进行本地测试。 - **问题3测试集数据不匹配**(李振+闫旭隆) - **方案**优先采用标准数据集如Vicky跑通评测流程通过大模型生成具备逻辑递进关系的问题集并进行人工校验以确保测试数据的准确性和完备性。 - **问题4生产环境隔离**(江争达协调、连总把关) - **方案**:新增生产服务器,并进行严格的分级管理和代码多备份,确保环境安全和稳定。 --- #### 四、重要问题讨论与要点 | 讨论点 | 结论 | | ---------- | --------------------------------------------------------------------------------------------------------------------------------------------------------- | | 何总对项目方向的认可 | **【高度认可团队工作成果,并提出更多需求与期待】**,认为现有工具显著提升工作效率,特别希望借助工具处理紧急且易出错的人工任务。 | | 知识库赋能路径 | 目标是构建全所乃至全员的统一知识中心,**【计划整合所内、院内知识库,并逐步接入外部资源】**同时建设自动化工具生成系统支持员工自主使用并提供AI辅助调试调整。 | | 长期目标1-2年 | 连总提出核心方向为**【Agent自演进和学习的底层框架构建】**这需要协调硬件、数据、工作流接口规划等多领域资源并改造现有信息系统为API接口最终目标是培育能不断演化出新产品和工具的环境预计1年内形成转型框架理论、方法和落地实施能力2年左右实现对外输出端到端解决方案但其实现需慎重研究和协调。 | | 资源保障 | 计划逐步将外部采购转化为院所预算并预计在10月启动2026年规划以确保资源需求得到满足。 | | 加速工具部署 | 尽快将开发工具部署给内部使用,以实际效益体现转型中心的影响力,并获取更多用户反馈。 | - **进度** - ES数据库已进行改造**【增加了权重字段,并已将概念节点及其现代化添加到相关库中】**。 - **存储优化** - 目前存在实体节点重复存储相同文本块导致的冗余问题,**【建议优化为映射表或标记属性,以减少存储体量】**。 - 提到了苹果开源的向量聚类工具,可用于可视化文档间的关系,供研究借鉴。 - **OCR工具** - 对NuMarkdown-8b-thinking工具进行了评估其支持连线格式输入能对多模态图片生成描述且PPT处理效果较好可识别标题、三级标题等。**【建议重点考虑将其作为图片和PPT处理方案的候选】**。 - 目前面临对跨页文档和PPT纯图片识别能力有限的挑战导致部分文档无法有效利用。 - **【计划规划一系列实验利用GPU资源测试不同文档类型的处理效果明确技术框架最终确定最优方案并一次性处理现有文档集约100+篇)】**。 - **API问题** - 智能识别系统API目前使用的是免费额度且调用存在限制**【需联系江争达开通阿里云平台API服务】**。 | | | |---|---| |关键行动|说明| |概念探索逻辑调整|**【连总澄清概念探索应在Triple生成候选节点后进行】**,作为回答不足时的补充保护机制,而非直接从概念探索开始。| |检索模式测试|**【建议对三种不同检索方式进行评测】**包括直接Chunk文本搜索最快但效果可能非最佳、直接QueryToTriple、以及概念分层探索先探索一层若效果不佳再加深需尽快搭建框架并进行测试。| |概念探索深度评估|**【需通过参数设计,探索概念到底走几层才能达到最佳相关性】**,测评工具应提供增加探索层数带来的提升结果和响应时间。| |答案生成优化|目前生成的要点虽有,但文档逻辑不够,**【需优化大模型Prompt以提升答案的逻辑性和质量】**。| |证据回显优化|应实现类似OpenAI的引用跳转功能**【点击证据直接定位到原文段落】**。| |事件实体利用|**【图谱中的事件实体Events节点的逻辑关系优势未充分发挥】**目前仅作为普通节点处理应重新思考如何利用Event节点在答案组织和推理中的作用优化Prompt设计使其发挥重要梳理作用。| |模型选择与Prompt|**【模型选择和Prompt优化至关重要可能推理模型更合适且Prompt需针对性修改】**。| - **问题** - 当前生成的多跳测试为“横跳”(并行),而非“纵跳”(串行,需要逻辑递进); - 测试报告存在逻辑矛盾例如文档未找到但Overall Quality评分仍高且评测函数过于形式化。 - **解决方案** - **【需构建纵向逻辑链数据集】**,可利用大模型生成具备逻辑递进关系的问题。 - **【评测工具需提供精确的“仪表盘”反馈】**,量化每次代码修改对系统性能(包括端到端和各跳)的影响,作为开发调试的指导工具,而非仅提供形式化的质量评估。 - 需深入检查测试代码逻辑解决异常情况如文档返回为0但质量分高的问题并**【重新定义评估标准,使其能准确评估内容质量,关注查询实体数量、相关性、逻辑正确性等核心指标】**。 - 建议优先使用Vicky等标准数据集进行基准测试但强调最终仍需针对项目自身数据进行定制化调优。 - 目前测试工具Adopter通过“买点”方式深入源代码导致与被测系统耦合度较高**【未来可考虑解耦或通过更灵活的适配器函数降低耦合性】**。 - 已开发通用评测脚本支持Standard和Deeper模式可配置地址、数据集等参数输出JSON数据和分析报告**【该工具将成为开发调试的重要辅助】**。 - 李振对比了两个版本的测试体系(带装饰器和不带装饰器),发现功能相似但底层实现不同,**【需团队试用并反馈差异性,以决定未来采用哪种发展方向】**。 - **自动化流程标准化** - 刘嘉宇分享了其标准化工作流程先酝酿需求再通过AI辅助生成需求清单、思维导图和方案设计最终转化为具体工作流。**【连总建议所有功能开发都遵循此流程,以确保需求明确】**。 - **商用瓶颈** - N8N开源版仅支持单租户商用化存在限制。**【讨论解决方案包括采购企业版成本高、本地改造多租户技术难度大、或将N8N工作流转为Python代码】**。 - 短期内,建议邮件工作流上线前,统一测试环境管理规则(禁止未经审批操作)。 - **N8N工具流库利用** - 提到GitHub上有大量N8N工具流2053个可与N8N MCP结合极大提升工作流设计效率和复用性。**【刘嘉宇需研究整合,探索其商业价值】**。 - **项目管理选型** - 调研后推荐San Dan作为项目管理工具**【因其与N8N有官方节点集成易用性高】**。 - **前端开发挑战** - 团队成员对Figma等前端工具体系不熟悉上手成本高且AI生成前端代码目前定制化能力不足。**【成为项目推进的“坎儿”,缺乏专业人士】**。 - **解决方案讨论** - 讨论了借鉴他人网页设计但难以精准控制、团队成员共同学习Figma与MCP结合自动生成代码学习成本高、或完全依靠商业AI前端服务定制性差成本高等方案。 - **【连总建议团队共同攻克前端难题,并简化动态效果(如聊天界面背景静态化)以降低消耗】**。 - **前端人力问题** - 前端人力短缺,非前端成员上手困难,导致效率和进展不理想。**【建议下周前端相关成员(江争达、李振、张旖旎)共同讨论并解决】**。 - **生产环境部署** - 域名已进入管局审核阶段,需【新增生产环境服务器,并进行严格的分级管理和代码多备份】**。 - **系统化思维与理论指导** - **【强调开发前需有理论指导如RAG检索、PageRank算法避免盲目枚举试错】**。 - **【建议团队成员建立系统化思考方法,并掌握评估框架部署与使用】**。 - **个人知识库搭建** - 连总分享了个人知识库搭建的思考,包括信息收集(去重、相关性判断)、分类总结和知识融合(新知识对旧知识的影响)。**【鼓励利用知识图谱或向量数据库管理个人知识并提及开源项目Revornix作为参考建议李振研究】**。 - **API化思维** - 未来能力的最大化发挥应建立在全API接口环境上将现有流程逐步改造为API实现纵向打通。**【鼓励在工具开发中延伸自动化流程将各阶段输出转变为API接口】**。 - **会议纪要管理** - 会议纪要的撰写和管理是重要学问,通过设计和使用标记(如“很重要”)能提升效率,甚至实现自动化。**【建议利用AI辅助自动总结会议要点并存储】**。 - **工具使用与改造原则** - **【强调选择工具要追求极致,不满足需求则应自行改造】**。 - **AI辅助自我总结** - **【建议每次开发工作后利用AI如Case自动总结代码工作和项目进展生成工作报告】**。 - **录音模型微调** - 对刘嘉宇提出录音模型进行微调,利用历史会议纪要的录音文本转录数据进行训练,以提升专有名词和个人说法习惯的识别准确率。**【连总鼓励此为重要挑战可利用开源模型和江争达协调GPU资源】**。 - **自我驱动与问题定位** - 刘嘉宇的自我驱动能力待提升,但有改进意愿。**【强调清晰定位问题的重要性,避免盲目工作】**。 - **设定时间目标** - **【每个人应为任务设定明确的截止日期,以提高效率和自我管理,避免拖延】**。 - **持续学习与团队协作** - 团队成员应在各自领域深入研究,并相互学习、协作,共同解决技术难题。**【鼓励放开谈论,允许犯错,及时调整,共同成长】**。 - 在选工具、做功能前,学习相关理论指导。 - 下周会议需分享个人工作进展。 #### 五、思维导图 ![[第8次会议纪要.png]]",
"type": "string"
}
]
},
"options": {}
},
"type": "n8n-nodes-base.set",
"typeVersion": 3.4,
"position": [
-176,
-16
],
"id": "77b9442f-c000-4dc6-9ae4-160e9de13fc1",
"name": "Edit Fields"
},
{
"parameters": {
"model": {
"__rl": true,
"value": "qwen-plus",
"mode": "list",
"cachedResultName": "qwen-plus"
},
"options": {}
},
"type": "@n8n/n8n-nodes-langchain.lmChatOpenAi",
"typeVersion": 1.2,
"position": [
192,
192
],
"id": "05d19078-7299-426e-bfc1-e6bbebb29e90",
"name": "OpenAI Chat Model1",
"credentials": {
"openAiApi": {
"id": "rg9eI0cqMkaxv3AK",
"name": "江oneapi"
}
}
},
{
"parameters": {
"operation": "toText",
"sourceProperty": "output",
"options": {}
},
"type": "n8n-nodes-base.convertToFile",
"typeVersion": 1.1,
"position": [
544,
-16
],
"id": "20f180f7-87f8-4e0b-aa33-7b5a947e7820",
"name": "Convert to File"
}
],
"connections": {
"Webhook": {
"main": [
[
{
"node": "Edit Fields",
"type": "main",
"index": 0
}
]
]
},
"AI Agent": {
"main": [
[
{
"node": "Convert to File",
"type": "main",
"index": 0
}
]
]
},
"Edit Fields": {
"main": [
[
{
"node": "AI Agent",
"type": "main",
"index": 0
}
]
]
},
"OpenAI Chat Model1": {
"ai_languageModel": [
[
{
"node": "AI Agent",
"type": "ai_languageModel",
"index": 0
}
]
]
},
"Convert to File": {
"main": [
[]
]
}
},
"pinData": {
"AI Agent": [
{
"output": "### AI卓越中心开发组会议纪要 \n\n**时间**2025.08.11 \n**地点**学院国际大厦2105 \n**参会人员**:连云波、张媛媛、李振、江争达、闫旭隆、刘嘉宇、张旖旎 \n\n---\n\n### 一、上周待办事项 \n\n#### 1. 闫旭隆 \n- ⏳ 部署Hippodeep服务到服务器暴露端口供前端调用 \n- ⏳ 实施概念探索模块实体→概念→评分循环仅限1次迭代 \n- ⏳ 与江争达确认部署路径和概念节点评分机制 \n- ⏳ OCR与图像功能汇报展示 \n\n#### 2. 江争达 \n- ⏳ 完成域名配置(国外亚马逊云备用) \n- ⏳ 前端集成:调用闫旭隆/Hippodeep端口确保基础聊天/记录保存功能可用,前端优化 \n- ⏳ 与闫旭隆确认部署路径和概念节点评分机制 \n- ⏳ 准备演示方案 \n\n#### 3. 李振 \n- ⏳ 重新生成多跳问题测试集确保文档与问题匹配并进行更大文档范围的测试30-100 \n- ⏳ 跑通多跳问题全流程测试(含端到端评估) \n- ⏳ 输出测试报告(含错误定位分析) \n- ⏳ 保证下周可以给相关同事进行测试 \n\n#### 4. 刘嘉宇 \n- ⏳ 完成n8n自动化流程的部署包括任务生成、邮件通知等 \n- ⏳ 为下周展示准备基础数据流和模板文档 \n- ⏳ 在李振的安排下进行测评工作 \n- ⏳ 后端聊天部分接口对接到hippo-deep \n\n#### 5. 全员 \n- ⏳ 周四前完成各模块集成,周五冻结演示版本 \n\n**问题汇总** \n- **[问题1] 前端部署协调**(江争达+刘嘉宇+闫旭隆) \n - 需统一服务器部署及端口暴露机制;域名未配置【需周五前解决】 \n- **[问题2] 测试集数据不匹配**(李振+闫旭隆) \n - 测试问题与文档关联性低,需重生成数据集【李振负责协调】 \n- **[问题3] 概念探索模块集成冲突**(闫旭隆+江争达) \n - 避免社区/分层逻辑混入,保持工程可测性【连总强调简化为单层概念探索】 \n\n---\n\n### 二、本周工作完成情况 \n\n| 成员 | 上周任务 | 完成情况 | 关键补充说明 |\n|-----------|--------------------------------------------------------------------------|---------------------|---------------------------------------------------------------------------------|\n| **闫旭隆** | 1. 实施概念探索模块1次迭代<br>2. 与江争达确认部署路径/评分机制<br>3. OCR与图像功能汇报 | ❌<br><br>✅ | • 概念探索模块未实施<br>• ES库权重字段/概念节点向量化完成<br>• NuMarkdown-8b工具评估完成支持PPT标题/表格解析) |\n| **江争达** | 1. 域名配置(亚马逊云备用)<br>2. 前端集成Hippodeep端口/聊天功能<br>3. 与闫旭隆确认评分机制<br>4. 准备演示方案 | ⌛️<br><br><br>❌ | • Standard模式优化完成响应缩短30秒<br>• Events节点利用不足待优化 |\n| **李振** | 1. 重生成多跳测试集30-100文档<br>2. 跑通多跳全流程测试<br>3. 输出测试报告<br>4. 保证同事可测试 | ✅<br><br><br>🕒 | • 生成10文档交叉问题测试集横跳逻辑<br>• 发现置信度0却评分0.8的异常 |\n| **刘嘉宇** | 1. n8n自动化流程部署邮件/任务)<br>2. n8n展示材料准备<br>3. 后端接口对接hippo-deep<br>4. 参与李振测评 | ✅<br><br><br>❌ | • 邮件工作流部署完成<br>• 标准化开发流程应用(需求→设计→部署) |\n| **全员** | 周四模块集成/周五冻结演示版本 | ✅ | 模块集成完成 |\n\n---\n\n### 三、本周待办任务与协同问题 \n\n#### **1. 闫旭隆** \n**工程方向** \n- 探讨并实现文搜文+图功能,包括图片引用保留和图片描述的整合。 \n- 部署并测试NuMarkdown-8b-thinking模型8B版本验证其连图带文生成能力。 \n- 联系江争达开通阿里云API接口。 \n- 优化Hippo-Deep全流程Prompt以提升生成文档的逻辑性。 \n\n**研究方向** \n- 规划技术框架并总结现有问题评估GPU资源需求进行实验测试。 \n- 与李振协同对三种检索方式直接Chunk文本搜索、直接QueryToTriple、概念搜几层进行评测。 \n- LangChain框架和LangGraph框架选取。 \n\n#### **2. 江争达** \n**工程方向** \n- 继续优化前端界面。 \n- 设计用户模式切换逻辑Standard/Deeper并加入判断机制。与旭隆和连总一起 \n- 部署生产环境服务器,进行分级管理和多备份,确保代码同步。 \n- 阿里云租用GPU服务器。 \n- 测试one-api调用qwen-vl-plus功能备用方案直接对接阿里云qwen-vl-plus 接口。 \n- 完成概念感知流程图的代码实现,完成端到端整体流程测试。 \n\n**研究方向** \n- 深化对图谱中Events节点作用的理解与应用。与旭隆和连总一起 \n- 与大模型探讨Events功能如何发挥作用并将其纳入Prompts设计中。与旭隆和连总一起 \n\n#### **3. 李振** \n**工程方向** \n- 从基准测试指标中,选取指标。设计并实现精确质量评估体系,作为开发仪表盘,提供端到端指标反馈。 \n\n**研究方向** \n- 研究标准数据集如wiki等进行基准测试并评估其适用性。 \n- 提供数据集标准格式。项目组成员各自尝试用大模型生成测试集合。 \n- 研究学习个人知识库搭建(参考开源项目)。 \n- 研究学习项目管理系统搭建(参考开源项目)。 \n- 研究学习Coze和n8n多租户问题解决方案。 \n- 研究学习前端技术。 \n\n#### **4. 刘嘉宇** \n**工程方向** \n- 邮件工作流第二版 \n- n8n测试工作搭建一个框架 \n- n8n课程交流详细方案 \n- 自动化系统mvp \n- 继续N8N工作流第二版的设计并进行测试。 \n\n**研究方向** \n- 研究N8N商用多租户方案如采购企业版、本地改造、转为Python代码。 \n- 评估Spring AI框架与LangChain重构RAG接口的可行性。 \n- 学习并掌握录音模型微调技术,利用会议录音文本数据训练个性化语音识别模型,提升识别准确率(尤其针对专有名词和个人习惯)。 \n- 学习并掌握评估框架的部署和使用。 \n\n#### **5. 全员任务** \n- 思考并提出个人知识库搭建方案。 \n- 讨论工具开发的商用框架问题。 \n- 讨论前端问题解决方案。 \n- 根据李振提供的Prompt和格式或自己设计Prompt生成测试数据集。 \n- 思考AI Agent开发框架问题。 \n- 学习并熟练运用评估框架的部署和使用。 \n- 每次开发工作结束后利用AI如Case进行自动化总结并自动存储到项目文档中。 \n- 在进行技术选择和探索新事物前,需深入研究相关理论知识,并建立系统化的思考方法。 \n\n---\n\n### 四、重要问题讨论与要点 \n\n| 讨论点 | 结论 |\n|---------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|\n| **何总对项目方向的认可** | **【高度认可团队工作成果,并提出更多需求与期待】**,认为现有工具显著提升工作效率,特别希望借助工具处理紧急且易出错的人工任务。 |\n| **知识库赋能路径** | 目标是构建全所乃至全员的统一知识中心,**【计划整合所内、院内知识库,并逐步接入外部资源】**同时建设自动化工具生成系统支持员工自主使用并提供AI辅助调试调整。 |\n| **长期目标1-2年** | 连总提出核心方向为**【Agent自演进和学习的底层框架构建】**这需要协调硬件、数据、工作流接口规划等多领域资源并改造现有信息系统为API接口最终目标是培育能不断演化出新产品和工具的环境预计1年内形成转型框架理论、方法和落地实施能力2年左右实现对外输出端到端解决方案但其实现需慎重研究和协调。 |\n| **资源保障** | 计划逐步将外部采购转化为院所预算并预计在10月启动2026年规划以确保资源需求得到满足。 |\n| **加速工具部署** | 尽快将开发工具部署给内部使用,以实际效益体现转型中心的影响力,并获取更多用户反馈。 |\n\n---\n\n### 五、思维导图 \n\n![[第8次会议纪要.png]]"
}
]
},
"meta": {
"templateCredsSetupCompleted": true,
"instanceId": "d4bc54c4750443ddb7fb9e6b4c7e38c46f3d96e6d4cbfdf57a74efbc3218b7c8"
}
}