Files
AIEC-RAG/retriver/langsmith/json_langsmith/langsmith_full_20250912_155134.json
2025-09-24 09:29:12 +08:00

522 lines
77 KiB
JSON
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"query": "数据研发运营一体化DataOps是数据开发的哪种范式",
"answer": "【检索结果汇总】\n\n查询问题数据研发运营一体化DataOps是数据开发的哪种范式\n\n检索到 25 个相关段落:\n\n【事件信息】\n\n事件1将敏捷、精益等理念融入数据开发过程打破协作壁垒构建集开发、治理、运营于一体的自动化数据流水线。\n\n事件2数据研发运营一体化DataOps是数据开发的新范式将敏捷、精益等理念融入数据开发过程打破协作壁垒构建集开发、治理、运营于一体的自动化数据流水线不断提高数据产品交付效率与质量实现高质量数字化发展。\n\n事件3DataOps 实践快速发展\n\n事件4随着数据需求种类日益丰富服务交付时效性重要性逐渐凸显提升数据服务开发效率是关键。\n\n事件5提出DataOps服务能力要求\n\n事件6进行意见征集\n\n事件7发起意见征集活动\n\n事件8构建六个平台包括数据汇聚平台、存储计算平台、数据处理平台、数据治理平台、数据分析平台和数据共享开发平台\n\n事件9数据开发持续将数据转化为满足业务需求的内容\n\n事件10车联网TSP湖仓一体平台的数据治理平台涉及数据资产管理、机构/用户信息系统、数据组织/数据地图、参考数据/生数据管理、流程管理、供需分析、元数据管理、数据建模、技术元数据、问题跟踪、血缘关系/关联分析、流程管理、数据开发、数据服务建模、数据流程、部署、调度、测试及验证、服务接入控制、数据安全与共享、数据分析、数据主题、数据实验、数据共享、共享管理、共享服务\n\n事件11多家企业参与了标准的评测\n\n事件12《数据开发平台技术要求与测试方法》等标准已完成或在研\n\n事件13数据中台功能\n\n事件14DataOps 的数据流水线以数据工程化能力为核心,构建出数据研发管理、数据交付管理、数据运维和价值运营四个环节。\n\n事件15DataOps能力框架引领企业构建集开发、治理、运营于一体的自动化数据流水线\n\n事件16标准引领建设 DataOps 体系\n\n事件17数据研发管理\n\n事件18数据研发管理环节包括需求管理、设计管理、数据开发和自助分析。\n\n\n\n【段落信息】\n\n段落1## (三)参与数据要素市场,获取数据竞争优势 加强数据生态系统的建设,鼓励实现数据开放共享。数据生态系统是一个以数 据为核心,由各种数据参与方(企业、组织、个人等)构成的复杂网络,涵盖数据的 生产、流通、利用等环节。通过构建数据生态系统,企业能够更好地进行数据合作与 共享,并参与生态系统的协同治理,推动数据的价值最大化。 加大数据内外部推广,丰富数据生态体系,积极参与数据要素市场建设。“数据 二十条”的提出旨在健全数据产权制度,建立数据流通交易制度,鼓励数据的共享和 交易,有效推动数据资源的高效利用和流动,为数字经济的发展创造良好的环境。随 着数据要素流通政策的不断完善,要素市场的健康有序发展,为企业开展数据流通服 务创造了良好的环境,越来越多的企业利用自身数据积累优势和服务能力优势,深入 调研数据需求方的核心业务痛点,形成可流通交易的数据产品,提供针对性的数据产 品与解决方案,推进形成各类数据产品的权责范围、供求关系、使用场景、定价策略 等,完善数据产品全流程合规管理,充分实现数据赋能发展。 ## (四)加深新型技术使用,提高数据运营效率 随着数据需求种类日益丰富,服务交付时效性重要性逐渐凸显,提升数据服务 开发效率是关键。数据研发运营一体化DataOps是数据开发的新范式将敏 捷、精益等理念融入数据开发过程,通过对数据相关人员、工具和流程的重新组织, 打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线,不断提高数据 产品交付效率与质量实现高质量数字化发展。DataOps作为一种新兴的数据管理 方法,强调数据管理自动化,既能为数据工作者提供敏捷的数据开发支持,同时也简 化了数据交付的周期,提升数据成产者与数据消费者的协同效率,成为企业数字化转 型快速释放数据生产力的最佳方案。 充分利用AI和大模型技术优化数据策略。\n\n段落2# DataOps 能力框架——核心环节\\n\\n## 2024DataOPS发展大会\\n\\n智驱新程·数驱万务\\n\\n为了不断提高数据产品交付效率与质量实现高质量数字化发展的目标。DataOps 的数据流水线以数据工程化能力为核心,构建出数据研发管理、数据交付管理、数据运维和价值运营四个环节。\\n\\n### 数据研发管理\\n\\n#### 需求管理\\n\\n采集 → 分析 → 确认 → 实施 → 变更\\n\\n数据需求全流程管理\\n\\n#### 设计管理\\n\\n制度 + 技术\\n\\n管理\\n\\n模型设计\\n\\n加工设计\\n\\n标准设计\\n\\n质量设计\\n\\n安全设计\\n\\n#### 数据开发\\n\\n集成存储、实施、部署、维护数据解决方案\\n\\n数据处理、加工、管理、使用\\n\\n提升数据资源价值\\n\\n#### 自助分析\\n\\n自助式的数据二次处理\\n\\n### 数据交付管理\\n\\n#### 配置管理\\n\\n版本控制\\n\\n环境管理\\n\\n代码版本管理\\n\\n数据版本管理\\n\\n保证\\n\\n各阶段数据随时可用性、可验证性\\n\\n#### 测试管理\\n\\n自动化测试流水线\\n\\n管理\\n\\n单元测试\\n\\n集成测试\\n\\n提前发现问题处理问题\\n\\n保证\\n\\n#### 部署与发布管理\\n\\n自动化部署发布流水线\\n\\n聚焦\\n\\n工具的自动化和标准化\\n\\n保证\\n\\n加快数据部署效率降低人为操作风险\\n\\n### 数据运维\\n\\n#### 监控管理\\n\\n监控体系\\n\\n监控预警\\n\\n开发流水线运行情况质量情况\\n\\n#### 资源管理\\n\\n调度优化合理分\\n\\n数据资源\\n\\n计算资源\\n\\n存储资源\\n\\n优化\\n\\n运维成本\\n\\n#### 变更管理\\n\\n标准化、敏捷化的变更流程\\n\\n应对\\n\\n开发流水线各类变更场景\\n\\n#### 异常管理\\n\\n构建\\n\\n异常管理知识库\\n\\n自动化运维能力\\n\\n提升\\n\\n运维效率\\n\\n#### 持续优化\\n\\n调优\\n\\n流水线任务编排\\n\\n平台配置\\n\\n提升\\n\\n开发流水线性能\\n\\n### 价值运营\\n\\n#### 成本管理\\n\\n细化数据产品交付\\n\\n维护成本核算\\n\\n精细控制资源投入\\n\\n识别、减少浪费\\n\\n#### 持续变革\\n\\n打造反馈机制\\n\\n收集各环节堵点问题\\n\\n持续改进\\n\\n#### 量化驱动\\n\\n数据开发流水线\\n\\n评估\\n\\n交付效率\\n\\n需求响应速度\\n\\n优化\\n\\n工作流程资源分配策略\n\n段落3# DataOps 实践典型误区\\n\\nDataOps 作为一种新的数据开发范式正在越来越多的行业和企业中落地,然而,能力建设并非一朝一夕,其实施过程中亦面临重重困难。\\n\\n为帮助即将或正在建设 DataOps 体系的企业进行“避雷”,我们将当前产业在实践过程中走过的弯路和遇到的问题进行了提炼。\\n\\n## 误区 1盲目跟风没有“量体裁衣”\\n\\n* **DataOps 理念过热期**\\n\\n+ 领头企业成功案例催化\\n\\n+ 忽略不同企业实施复杂性和差异性\\n\\n## 误区 2决策机制模糊导致资源浪费或投入不足\\n\\n* **投入不足**\\n\\n* DataOps 被视为 IT/ 数据部门专项工作\\n\\n* 高层的参与度不足\\n\\n* 业务部门缺乏主动性和创新性\\n\\n* 企业缺少战略耐心\\n\\n* **浪费**\\n\\n* 在立项或采购阶段好大求全,导致项目实施周期增加、成本提高、实施复杂度提升,后续利用度低\\n\\n## 误区 3过度依赖技术解决所有问题\\n\\n* **高估技术的影响力,忽略业技融合**\\n\\n+ 忽视企业流程、管理、协作和数据文化上的不足\\n\\n## 误区 4追求短期收益\\n\\n* **市场竞争和业务压力,更关注短期收益和业绩目标的实现**\\n\\n+ 缺乏长远的眼光和战略决心,变革初期的数据质量、交付效率提升只是管中窥豹\\n\\n## 解决思路:急用先行,把握节奏\\n\\n* 考虑自身需求、痛点和技术架构\\n\\n* 综合考量自身与领先企业的差异性\\n\\n* 分阶段、分步骤地推进\\n\\n## 解决思路:定权责、常沟通、重反馈、建流程、勤宣贯\\n\\n* 明确 DataOps 建设目标,定义各部门和个人的责任和角色\\n\\n* 建立定期的沟通反馈机制\\n\\n* 构建规范和流程,减少决策混乱\\n\\n* 培养数据文化,提高员工对 DataOps 的认知和参与度\\n\\n## 解决思路:业务导向,“组织、流程、技术”三位一体共同推进\\n\\n* 围绕业务目标,借助组织变革建立跨部门的团队\\n\\n* 建立标准化的工作流\\n\\n* 选择合适的系统工具\\n\\n## 解决思路:长短结合,久久为功,控制预期,革新认知\\n\\n* 前期拉齐团队和领导层认知\\n\\n* 辅助以可见收益的短期项目,增强信心\\n\\n* 不断加深认知,厘清阶段重点,主动关注行业中的新方向\n\n段落4# 汽车数据典型实践分享\\n\\n## 2023数据资产管理大会\\n\\n中国·北京 12.20-12.21 回归数据本质 应用驱动治理\\n\\n### 数据底座架构蓝图(构建六个平台、四个中心、三个保障体系,一个统一门户)\\n\\n#### 1. 六个平台\\n\\n* 数据汇聚平台\\n\\n* 存储计算平台\\n\\n* 数据处理平台\\n\\n* 数据治理平台\\n\\n* 数据分析平台\\n\\n* 数据共享开发平台\\n\\n#### 2. 四个中心\\n\\n* 数据资源中心\\n\\n* 数据服务中心\\n\\n* AI中心\\n\\n* 数据运营中心\\n\\n#### 3. 三个保障\\n\\n* 标准规范体系\\n\\n* 运维保障体系\\n\\n* 安全保障体系\\n\\n#### 4. 一个统一门户\\n\\n#### 5. 多个应用\\n\\n### 数据资产管理:车企数据专业能力模型及课程体系\\n\\n| 能力类 | 能力组 | 能力 | 课程 | 方式 | 交付物 |\\n\\n| :----- | :----- | :--- | :--- | :--- | :----- |\\n\\n| 数据治理 | 数据基础 | 数据驱动数字化转型 | 《华为数据之道》《数据基本法》数据治理基础培训 | 自学+授课 | 考试通过 |\\n\\n| 数据工作规划 | 数据分类 | 数据工作3年规划数据工作目标/计划 | - | 指导 | 数据工作3年规划数据工作目标/计划 |\\n\\n| 数据组织架构 | 数据管理组织 | 数据管理角色 | 《数据基本法》数据治理案例分享 | 自学+分享 | 考试通过优秀案例 |\\n\\n| 数据运作机制 | 3A协同机制 | 数据治理基础培训 | 数据治理方法培训数据治理案例分享PowerDesigner操作指导数据资产平台操作指导 | 授课 | 考试通过实操案例 |\\n\\n| 信息架构 | 信息架构治理 | 信息架构设计 | - | 授课+指导 | - |\\n\\n| 信息架构评审 | 信息架构评审流程 | 信息架构评审标准 | - | - | - |\\n\\n| 数据工具使用 | PowerDesigner | 数据资产平台 | - | - | - |\\n\\n### 行业数据应用:车联网 TSP 湖仓一体平台\\n\\n#### 数据源\\n\\n* 车端TBOX\\n\\n* 用户日志\\n\\n* ERP\\n\\n* CRM\\n\\n#### 数据开发治理\\n\\n* 数据开发\\n\\n* 数据管理\\n\\n* 任务调度\\n\\n* 数据质量\\n\\n#### 数据集成\\n\\n* 实时集成\\n\\n* 多源支持\\n\\n* 自动解析\\n\\n#### 数据计算分析\\n\\n* 驾驶行为分析\\n\\n* 电池健康分析\\n\\n#### 数据存储\\n\\n### 数据平台建设:车企数据开发管理平台\\n\\n#### 指标设计发布\\n\\n* 穷尽核心业务指标\\n\\n* 形成原子指标库\\n\\n#### 指标数据设计\\n\\n* 原子指标库\\n\\n* 检索引擎\\n\\n* 向量储存\\n\\n#### 数据探源认证\\n\\n* 一汽业务规则\\n\\n* 数据建模规则\\n\\n* 集团BI规范\\n\\n* NL2SQL\\n\\n#### 模型服务设计\\n\\n* SFT Workflow\\n\\n* PPG Workflow\\n\\n* Reword Model Workflow\\n\\n#### 指标数据应用\\n\\n* 一汽数据大模型的核心能力\\n\\n* L1行业大模型\\n\\n### 行业数据应用:车企汽车大模型 GPT-BI\\n\\n### 数据流转运营:汽车大数据区块链平台\\n\\n#### 区块链层\\n\\n* 区块链+隐私计算\\n\\n#### 车企数据中心\\n\\n* 节点\\n\\n#### 网联汽车\\n\\n* 节点\\n\\n#### 原始数据交互\\n\\n#### 数据索引交互\\n\\n### 行业数据应用:车联网 TSP 湖仓一体平台\\n\\n#### 数据治理平台\\n\\n* 数据资产管理\\n\\n* 机构/用户信息系统\\n\\n* 数据组织/数据地图\\n\\n* 参考数据/生数据管理\\n\\n* 流程管理\\n\\n* 供需分析\\n\\n* 元数据管理\\n\\n* 数据建模\\n\\n* 技术元数据\\n\\n* 问题跟踪\\n\\n* 血缘关系/关联分析\\n\\n* 流程管理\\n\\n* 数据开发\\n\\n* 数据服务建模\\n\\n* 数据流程\\n\\n* 部署、调度\\n\\n* 测试及验证\\n\\n* 流程管理\\n\\n* 数据质量管理\\n\\n* 数据授权\\n\\n* 数据脱敏\\n\\n* 数据访问安全\\n\\n* 数据服务发布/申请/审核/授权等管理\\n\\n* 服务接入控制\\n\\n* 数据安全与共享\\n\\n* 数据分析\\n\\n* 数据主题\\n\\n* 数据实验\\n\\n* 数据共享\\n\\n* 共享管理\\n\\n* 共享服务\\n\\n#### 数据源\\n\\n* 互联网\\n\\n* 物联网\\n\\n* 业务系统\\n\\n* 结构化数据\\n\\n* 半结构化数据\\n\\n* 非结构化数据\\n\\n#### 数据交换\\n\\n* 内部交换\\n\\n* 互联网采集\\n\\n* 物联网采集\\n\\n* 加工采集\\n\\n* 结构同步\\n\\n* 数据同步\\n\\n* 文件同步\\n\\n* 外部交换\\n\\n* 互联网采集\\n\\n* 物联网采集\\n\\n* 加工采集\\n\\n* 结构同步\\n\\n* 数据同步\\n\\n* 文件同步\\n\\n#### 数据加工处理\\n\\n* 转换逻辑\\n\\n* 质量检查\\n\\n* 异常处理\\n\\n* 智能处理\\n\\n* 对比验证\\n\\n#### 数据存储\\n\\n* 缓存库\\n\\n#### 数据能力\\n\\n* 数据分析\\n\\n* 数据主题\\n\\n* 数据实验\\n\\n#### 数据应用\\n\\n* 经营管理\\n\\n* 生产运营\\n\\n* 客户服务\\n\\n### 数据流转运营:汽车数据流通服务平台\n\n段落5# 重点工作一:数据开发与服务板块\\n\\n中国·北京 12.20-12.21 回归数据本质 应用驱动治理\\n\\n2023数据资产管理大会\\n\\n## 1 供给侧技术工具\\n\\n### 已完成及在研标准:\\n\\n* 《数据开发平台技术要求与测试方法》\\n\\n* 《数据科学平台技术要求与测试方法》\\n\\n* 《知识图谱工具技术要求与测试方法》\\n\\n* 《用户行为分析工具技术要求》\\n\\n* 《指标平台技术要求》\\n\\n* 《标签平台技术要求》\\n\\n* 《A/B测试工具技术要求》\\n\\n### 参与评测企业:\\n\\n![阿里云](image_1.png)\\n\\n![天翼云](image_2.png)\\n\\n![科大讯飞](image_3.png)\\n\\n![iFLYTEK](image_4.png)\\n\\n![GRIDSUM](image_5.png)\\n\\n![PERCENT](image_6.png)\\n\\n![中国电子](image_7.png)\\n\\n![INSPUR](image_8.png)\\n\\n![亚信科技](image_9.png)\\n\\n![星环科技](image_10.png)\\n\\n![百度](image_11.png)\\n\\n![腾讯云](image_12.png)\\n\\n![中国工商银行](image_13.png)\\n\\n![HUAWEI](image_14.png)\\n\\n![易知微](image_15.png)\\n\\n![中国移动](image_16.png)\\n\\n![ZTE中兴](image_17.png)\\n\\n![数澜科技](image_18.png)\\n\\n![ahua](image_19.png)\\n\\n![浦发银行](image_20.png)\\n\\n![品高云](image_21.png)\\n\\n![BingoCloud](image_22.png)\\n\\n![XI云徙](image_23.png)\\n\\n## 2 应用侧体系建设\\n\\n### 体系架构\\n\\n#### 数据服务体系\\n\\n* 数据获取\\n\\n* 数据分析\\n\\n* 服务管理\\n\\n#### 数据开发体系\\n\\n* 开发能力\\n\\n* 流程管理\\n\\n* 环境管理\\n\\n### 已完成及在研标准:\\n\\n* 《数据开发能力成熟度模型》\\n\\n* 《数据服务能力成熟度模型》\\n\\n### 参与评测企业:\\n\\n![中国移动](image_16.png)\\n\\n![中国工商银行](image_13.png)\\n\\n进行中\\n\\n![中国南方电网](image_24.png)\\n\\n![中国平安](image_25.png)\n\n段落6# 信通院数据应用整体工作框架\\n\\n## 助力数据价值的发现、释放和认可\\n\\n### 数据对外赋能\\n\\n* 数据产品对外变现需求对接\\n\\n* 对外数据API能力评测\\n\\n* 外部数据资源接入对接\\n\\n### 数据对内赋能\\n\\n#### 数字营销\\n\\n* 企业数字营销成熟度评估\\n\\n* 数字营销外部数据源对接\\n\\n* 数字营销解决方案能力评测\\n\\n* 数字营销体系建设提升咨询\\n\\n#### 智能风控\\n\\n* 企业智能风控成熟度评估\\n\\n* 智能风控外部数据源对接\\n\\n* 智能风控解决方案能力评测\\n\\n* 智能风控体系建设提升咨询\\n\\n#### 数据驱动的企业管理\\n\\n* 企业数字化管理成熟度评估\\n\\n* 企业数字化管理体系建设咨询\\n\\n* 企业数字化管理解决方案能力评测\\n\\n#### 企业“业数融合”成熟度评估\\n\\n#### 企业数据伦理治理成熟度评估\\n\\n### 数据分析应用\\n\\n#### 技术平台评测\\n\\n* 数据可视化工具\\n\\n* 数字孪生技术平台\\n\\n* 商务智能(BI)工具\\n\\n* 用户行为分析平台\\n\\n* 基于大模型的BI工具\\n\\n* .....\\n\\n#### 体系建设评估\\n\\n* 可视化服务能力\\n\\n* 数据分析服务能力\\n\\n#### 外部供应商评测\\n\\n* 数据分析应用服务商能力评测\\n\\n#### 能力提升咨询\\n\\n* 技术工具及供应商选型咨询\\n\\n* 内部体系建设咨询\\n\\n### 数据开发与服务\\n\\n#### 技术平台评测\\n\\n* 数据开发平台\\n\\n* 数据科学平台\\n\\n* 知识图谱工具\\n\\n* 指标平台\\n\\n* 标签平台\\n\\n* .....\\n\\n#### 体系建设评估\\n\\n* 数据服务体系评估\\n\\n* 数据开发体系评估\\n\\n#### 能力提升咨询\\n\\n* 技术工具及供应商选型咨询\\n\\n* 内部体系建设咨询\\n\\n中国·北京 12.20-12.21 回归数据本质 应用驱动治理\\n\\n2023数据资产管理大会\n\n段落7# DataOps 能力框架——实践保障\\n\\n## 2024DataOPS发展大会\\n\\n智驱新程·数驱万务\\n\\n为了保证 DataOps 研发流水线能够持续高效运转和迭代完善,企业需要有力的保障措施。本指南提出了组织、工具和安全三个维度的保障要求。这些要求的目标是引导企业以全局最优为目标,保障数据研发流水线的平滑运作。\\n\\n### 系统工具\\n\\n#### 数据需求管理\\n\\n| 手段 | 构建数据需求全生命周期的管理能力 |\\n\\n| :--- | :--------------------------------- |\\n\\n| 目标 | 支持流程的设计和共享 |\\n\\n| 进一步要求 | 数据需求方主动通过自助分析平台进行数据探查 |\\n\\n#### 数据研发治理一体化\\n\\n| 原则 | 先设计、后开发、先标准、后建模 |\\n\\n| :--- | :------------------------------- |\\n\\n| 手段 | 设计管理、开发管理、数据应用 |\\n\\n| 目的 | 规范即设计,设计即开发,开发即治理 |\\n\\n#### 数据自动化交付部署\\n\\n![数据自动化交付部署流程图](image_1.png)\\n\\n#### 数据一体化运维\\n\\n| 对象 | 数据研发全链路的监测、运维监控、运维告警、运维操作 |\\n\\n| :--- | :---------------------------------------------------- |\\n\\n| 手段 | 可视化方式 |\\n\\n| 目的 | 实时展现研发效能、数据质量 |\\n\\n### 组织管理\\n\\n#### 组织架构\\n\\n合理配置\\n\\n{ | 数据技术架构 |\\n\\n| 数据人员架构 |\\n\\n#### 岗位角色\\n\\n| | 设置相应的岗位角色 |\\n\\n| :--- | :------------------ |\\n\\n| | 明确晋升路线与考核方式 |\\n\\n#### 协作协同\\n\\n依托\\n\\n| 敏捷方法 |\\n\\n| :-------- |\\n\\n| 关注团队、工具间的协同问题持续进行优化 |\\n\\n解决\\n\\n### 安全管控\\n\\n#### 安全风险策略\\n\\n加强\\n\\n{ | 数据研发全生命周期 |\\n\\n| 风险识别 |\\n\\n| 风险预测 |\\n\\n#### 风险管理\\n\\n外部法律法规\\n\\n+ 监管要求\\n\\n+ 企业内部安全需求\\n\\n健全\\n\\n风险管理策略\\n\\n#### 安全测试\\n\\n数据研发过程的各环节进行安全测试\\n\\n保证\\n\\n提前发现问题处理问题\n\n\n相关子查询\n什么是数据研发运营一体化DataOps、数据开发的常见范式有哪些\n\n检索统计\n- 查询复杂度:{'is_complex': True, 'complexity_level': 'complex', 'confidence': 0.95, 'reason': '这是一个复杂查询因为用户询问的是数据研发运营一体化DataOps在数据开发领域的特定范式这可能涉及到数据开发的不同实践、流程和理论。这种问题通常需要对数据开发领域的深入理解可能需要从多个角度和来源获取信息来形成全面的答案。'}\n- 是否复杂查询True\n- 迭代次数0\n- 信息充分性True\n",
"query_complexity": {
"is_complex": true,
"complexity_level": "complex",
"confidence": 0.95,
"reason": "这是一个复杂查询因为用户询问的是数据研发运营一体化DataOps在数据开发领域的特定范式这可能涉及到数据开发的不同实践、流程和理论。这种问题通常需要对数据开发领域的深入理解可能需要从多个角度和来源获取信息来形成全面的答案。"
},
"is_complex_query": true,
"retrieval_path": "complex_hipporag",
"iterations": 0,
"total_passages": 25,
"sub_queries": [
"什么是数据研发运营一体化DataOps",
"数据开发的常见范式有哪些"
],
"decomposed_sub_queries": [
"什么是数据研发运营一体化DataOps",
"数据开发的常见范式有哪些"
],
"initial_retrieval_details": {},
"sufficiency_check": {
"is_sufficient": true,
"confidence": 0.9,
"reason": "事件信息和段落信息包含了回答查询所需的关键内容...",
"iteration": 0
},
"current_sub_queries": [],
"is_sufficient": true,
"all_documents": [
{
"page_content": "将敏捷、精益等理念融入数据开发过程,打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线。",
"metadata": {
"node_id": "f81ab568ce6cfce72175a1087db911f899752c622460211efdc350d6c3167149",
"node_type": "event",
"ppr_score": 0.008693108592232877,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 1,
"source": "hipporag2_langchain_event",
"query": "数据研发运营一体化DataOps是数据开发的哪种范式",
"pagerank_available": true
}
},
{
"page_content": "数据研发运营一体化DataOps是数据开发的新范式将敏捷、精益等理念融入数据开发过程打破协作壁垒构建集开发、治理、运营于一体的自动化数据流水线不断提高数据产品交付效率与质量实现高质量数字化发展。",
"metadata": {
"node_id": "774a6133f9a25821d10ebab0d1745ac30d14a4016da4d3548b102f265e633a22",
"node_type": "event",
"ppr_score": 0.00865474544740319,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"query": "数据研发运营一体化DataOps是数据开发的哪种范式",
"pagerank_available": true
}
},
{
"page_content": "DataOps 实践快速发展",
"metadata": {
"node_id": "20707ee6c13b5870e58f4eb4853f2bd6ddc6b0dff31966717b5f434d0a6dcc20",
"node_type": "event",
"ppr_score": 0.0030544467217862624,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 3,
"source": "hipporag2_langchain_event",
"query": "数据研发运营一体化DataOps是数据开发的哪种范式",
"pagerank_available": true
}
},
{
"page_content": "随着数据需求种类日益丰富,服务交付时效性重要性逐渐凸显,提升数据服务开发效率是关键。",
"metadata": {
"node_id": "5be46591a0a7ccd7266c2f0961280fd5df89d16e316f123585ebe001f09c5fe1",
"node_type": "event",
"ppr_score": 0.002924616874612496,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 4,
"source": "hipporag2_langchain_event",
"query": "数据研发运营一体化DataOps是数据开发的哪种范式",
"pagerank_available": true
}
},
{
"page_content": "提出DataOps服务能力要求",
"metadata": {
"node_id": "3a068edb1c5649880334a21e741217e2e5a225be789b4a64ef9da94da431b048",
"node_type": "event",
"ppr_score": 0.0026976390389457394,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"query": "数据研发运营一体化DataOps是数据开发的哪种范式",
"pagerank_available": true
}
},
{
"page_content": "进行意见征集",
"metadata": {
"node_id": "d358a1d1a1a9400e149274fa124d0cf06d243184939c2dd1db82536e1236b239",
"node_type": "event",
"ppr_score": 0.0026976390389457394,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"query": "数据研发运营一体化DataOps是数据开发的哪种范式",
"pagerank_available": true
}
},
{
"page_content": "发起意见征集活动",
"metadata": {
"node_id": "4c54213b0c0b8e6bb6f65cfe84516373d0704c5149fa11ad2a03fcd785590763",
"node_type": "event",
"ppr_score": 0.0026976390389457394,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"query": "数据研发运营一体化DataOps是数据开发的哪种范式",
"pagerank_available": true
}
},
{
"page_content": "## (三)参与数据要素市场,获取数据竞争优势 加强数据生态系统的建设,鼓励实现数据开放共享。数据生态系统是一个以数 据为核心,由各种数据参与方(企业、组织、个人等)构成的复杂网络,涵盖数据的 生产、流通、利用等环节。通过构建数据生态系统,企业能够更好地进行数据合作与 共享,并参与生态系统的协同治理,推动数据的价值最大化。 加大数据内外部推广,丰富数据生态体系,积极参与数据要素市场建设。“数据 二十条”的提出旨在健全数据产权制度,建立数据流通交易制度,鼓励数据的共享和 交易,有效推动数据资源的高效利用和流动,为数字经济的发展创造良好的环境。随 着数据要素流通政策的不断完善,要素市场的健康有序发展,为企业开展数据流通服 务创造了良好的环境,越来越多的企业利用自身数据积累优势和服务能力优势,深入 调研数据需求方的核心业务痛点,形成可流通交易的数据产品,提供针对性的数据产 品与解决方案,推进形成各类数据产品的权责范围、供求关系、使用场景、定价策略 等,完善数据产品全流程合规管理,充分实现数据赋能发展。 ## (四)加深新型技术使用,提高数据运营效率 随着数据需求种类日益丰富,服务交付时效性重要性逐渐凸显,提升数据服务 开发效率是关键。数据研发运营一体化DataOps是数据开发的新范式将敏 捷、精益等理念融入数据开发过程,通过对数据相关人员、工具和流程的重新组织, 打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线,不断提高数据 产品交付效率与质量实现高质量数字化发展。DataOps作为一种新兴的数据管理 方法,强调数据管理自动化,既能为数据工作者提供敏捷的数据开发支持,同时也简 化了数据交付的周期,提升数据成产者与数据消费者的协同效率,成为企业数字化转 型快速释放数据生产力的最佳方案。 充分利用AI和大模型技术优化数据策略。",
"metadata": {
"node_id": "da7aaabf868de83a9fc286404d784e30982b7ba7a5e56c5c1707922e5e39dcf1",
"node_type": "text",
"ppr_score": 0.053318873473361054,
"edge_score": 0.0,
"passage_score": 0.5533888273455351,
"rank": 8,
"source": "hipporag2_langchain_text",
"query": "数据研发运营一体化DataOps是数据开发的哪种范式",
"pagerank_available": true
}
},
{
"page_content": "# DataOps 能力框架——核心环节\\n\\n## 2024DataOPS发展大会\\n\\n智驱新程·数驱万务\\n\\n为了不断提高数据产品交付效率与质量实现高质量数字化发展的目标。DataOps 的数据流水线以数据工程化能力为核心,构建出数据研发管理、数据交付管理、数据运维和价值运营四个环节。\\n\\n### 数据研发管理\\n\\n#### 需求管理\\n\\n采集 → 分析 → 确认 → 实施 → 变更\\n\\n数据需求全流程管理\\n\\n#### 设计管理\\n\\n制度 + 技术\\n\\n管理\\n\\n模型设计\\n\\n加工设计\\n\\n标准设计\\n\\n质量设计\\n\\n安全设计\\n\\n#### 数据开发\\n\\n集成存储、实施、部署、维护数据解决方案\\n\\n数据处理、加工、管理、使用\\n\\n提升数据资源价值\\n\\n#### 自助分析\\n\\n自助式的数据二次处理\\n\\n### 数据交付管理\\n\\n#### 配置管理\\n\\n版本控制\\n\\n环境管理\\n\\n代码版本管理\\n\\n数据版本管理\\n\\n保证\\n\\n各阶段数据随时可用性、可验证性\\n\\n#### 测试管理\\n\\n自动化测试流水线\\n\\n管理\\n\\n单元测试\\n\\n集成测试\\n\\n提前发现问题处理问题\\n\\n保证\\n\\n#### 部署与发布管理\\n\\n自动化部署发布流水线\\n\\n聚焦\\n\\n工具的自动化和标准化\\n\\n保证\\n\\n加快数据部署效率降低人为操作风险\\n\\n### 数据运维\\n\\n#### 监控管理\\n\\n监控体系\\n\\n监控预警\\n\\n开发流水线运行情况质量情况\\n\\n#### 资源管理\\n\\n调度优化合理分\\n\\n数据资源\\n\\n计算资源\\n\\n存储资源\\n\\n优化\\n\\n运维成本\\n\\n#### 变更管理\\n\\n标准化、敏捷化的变更流程\\n\\n应对\\n\\n开发流水线各类变更场景\\n\\n#### 异常管理\\n\\n构建\\n\\n异常管理知识库\\n\\n自动化运维能力\\n\\n提升\\n\\n运维效率\\n\\n#### 持续优化\\n\\n调优\\n\\n流水线任务编排\\n\\n平台配置\\n\\n提升\\n\\n开发流水线性能\\n\\n### 价值运营\\n\\n#### 成本管理\\n\\n细化数据产品交付\\n\\n维护成本核算\\n\\n精细控制资源投入\\n\\n识别、减少浪费\\n\\n#### 持续变革\\n\\n打造反馈机制\\n\\n收集各环节堵点问题\\n\\n持续改进\\n\\n#### 量化驱动\\n\\n数据开发流水线\\n\\n评估\\n\\n交付效率\\n\\n需求响应速度\\n\\n优化\\n\\n工作流程资源分配策略",
"metadata": {
"node_id": "b406044bae110b82a0e2675cbde336748e6f77bb6b6c43a3455c3fd3a3515acd",
"node_type": "text",
"ppr_score": 0.011952418126668555,
"edge_score": 0.0,
"passage_score": 0.5914477550375189,
"rank": 9,
"source": "hipporag2_langchain_text",
"query": "数据研发运营一体化DataOps是数据开发的哪种范式",
"pagerank_available": true
}
},
{
"page_content": "# DataOps 实践典型误区\\n\\nDataOps 作为一种新的数据开发范式正在越来越多的行业和企业中落地,然而,能力建设并非一朝一夕,其实施过程中亦面临重重困难。\\n\\n为帮助即将或正在建设 DataOps 体系的企业进行“避雷”,我们将当前产业在实践过程中走过的弯路和遇到的问题进行了提炼。\\n\\n## 误区 1盲目跟风没有“量体裁衣”\\n\\n* **DataOps 理念过热期**\\n\\n+ 领头企业成功案例催化\\n\\n+ 忽略不同企业实施复杂性和差异性\\n\\n## 误区 2决策机制模糊导致资源浪费或投入不足\\n\\n* **投入不足**\\n\\n* DataOps 被视为 IT/ 数据部门专项工作\\n\\n* 高层的参与度不足\\n\\n* 业务部门缺乏主动性和创新性\\n\\n* 企业缺少战略耐心\\n\\n* **浪费**\\n\\n* 在立项或采购阶段好大求全,导致项目实施周期增加、成本提高、实施复杂度提升,后续利用度低\\n\\n## 误区 3过度依赖技术解决所有问题\\n\\n* **高估技术的影响力,忽略业技融合**\\n\\n+ 忽视企业流程、管理、协作和数据文化上的不足\\n\\n## 误区 4追求短期收益\\n\\n* **市场竞争和业务压力,更关注短期收益和业绩目标的实现**\\n\\n+ 缺乏长远的眼光和战略决心,变革初期的数据质量、交付效率提升只是管中窥豹\\n\\n## 解决思路:急用先行,把握节奏\\n\\n* 考虑自身需求、痛点和技术架构\\n\\n* 综合考量自身与领先企业的差异性\\n\\n* 分阶段、分步骤地推进\\n\\n## 解决思路:定权责、常沟通、重反馈、建流程、勤宣贯\\n\\n* 明确 DataOps 建设目标,定义各部门和个人的责任和角色\\n\\n* 建立定期的沟通反馈机制\\n\\n* 构建规范和流程,减少决策混乱\\n\\n* 培养数据文化,提高员工对 DataOps 的认知和参与度\\n\\n## 解决思路:业务导向,“组织、流程、技术”三位一体共同推进\\n\\n* 围绕业务目标,借助组织变革建立跨部门的团队\\n\\n* 建立标准化的工作流\\n\\n* 选择合适的系统工具\\n\\n## 解决思路:长短结合,久久为功,控制预期,革新认知\\n\\n* 前期拉齐团队和领导层认知\\n\\n* 辅助以可见收益的短期项目,增强信心\\n\\n* 不断加深认知,厘清阶段重点,主动关注行业中的新方向",
"metadata": {
"node_id": "9c60e1d67a9be847f2b2e95f859a18bf9940b7854a020b276d921f9caa0bc7a6",
"node_type": "text",
"ppr_score": 0.011777887245362433,
"edge_score": 0.0,
"passage_score": 0.5853425915178536,
"rank": 10,
"source": "hipporag2_langchain_text",
"query": "数据研发运营一体化DataOps是数据开发的哪种范式",
"pagerank_available": true
}
},
{
"page_content": "构建六个平台包括数据汇聚平台、存储计算平台、数据处理平台、数据治理平台、数据分析平台和数据共享开发平台",
"metadata": {
"node_id": "5e59301cc2e7068341d114bf7bbbbadfe12c364f508d6994e88b6062d563d172",
"node_type": "event",
"ppr_score": 0.013001468079193407,
"edge_score": 1.6736541,
"passage_score": 0.0,
"rank": 1,
"source": "hipporag2_langchain_event",
"query": "数据开发的常见范式有哪些",
"pagerank_available": true
}
},
{
"page_content": "数据开发持续将数据转化为满足业务需求的内容",
"metadata": {
"node_id": "eac424e27127852d6d3143ccc74114e48274c42e671d3792a6806881167722c6",
"node_type": "event",
"ppr_score": 0.007616752906893931,
"edge_score": 1.7091889,
"passage_score": 0.0,
"rank": 3,
"source": "hipporag2_langchain_event",
"query": "数据开发的常见范式有哪些",
"pagerank_available": true
}
},
{
"page_content": "车联网TSP湖仓一体平台的数据治理平台涉及数据资产管理、机构/用户信息系统、数据组织/数据地图、参考数据/生数据管理、流程管理、供需分析、元数据管理、数据建模、技术元数据、问题跟踪、血缘关系/关联分析、流程管理、数据开发、数据服务建模、数据流程、部署、调度、测试及验证、服务接入控制、数据安全与共享、数据分析、数据主题、数据实验、数据共享、共享管理、共享服务",
"metadata": {
"node_id": "b2aaa9a459c53453f580cd43db7d9f95949dfeea20f6ba22f02833df4d9e780e",
"node_type": "event",
"ppr_score": 0.0066919919658708134,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 4,
"source": "hipporag2_langchain_event",
"query": "数据开发的常见范式有哪些",
"pagerank_available": true
}
},
{
"page_content": "多家企业参与了标准的评测",
"metadata": {
"node_id": "b64d3498bfd0df3cec9972f33303b0f5bd62d7381923be351f799658ac82738d",
"node_type": "event",
"ppr_score": 0.004045179236770538,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"query": "数据开发的常见范式有哪些",
"pagerank_available": true
}
},
{
"page_content": "《数据开发平台技术要求与测试方法》等标准已完成或在研",
"metadata": {
"node_id": "914d415479b8d019ab1049d49ec7493142afaa6187d97dc20e188dc3220ca1c5",
"node_type": "event",
"ppr_score": 0.002412162198850136,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"query": "数据开发的常见范式有哪些",
"pagerank_available": true
}
},
{
"page_content": "数据中台功能",
"metadata": {
"node_id": "4de51586600d31b97aa032ecfb161b95106276ef302db2083ef51cca668dd676",
"node_type": "event",
"ppr_score": 0.002391355190136066,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"query": "数据开发的常见范式有哪些",
"pagerank_available": true
}
},
{
"page_content": "# 汽车数据典型实践分享\\n\\n## 2023数据资产管理大会\\n\\n中国·北京 12.20-12.21 回归数据本质 应用驱动治理\\n\\n### 数据底座架构蓝图(构建六个平台、四个中心、三个保障体系,一个统一门户)\\n\\n#### 1. 六个平台\\n\\n* 数据汇聚平台\\n\\n* 存储计算平台\\n\\n* 数据处理平台\\n\\n* 数据治理平台\\n\\n* 数据分析平台\\n\\n* 数据共享开发平台\\n\\n#### 2. 四个中心\\n\\n* 数据资源中心\\n\\n* 数据服务中心\\n\\n* AI中心\\n\\n* 数据运营中心\\n\\n#### 3. 三个保障\\n\\n* 标准规范体系\\n\\n* 运维保障体系\\n\\n* 安全保障体系\\n\\n#### 4. 一个统一门户\\n\\n#### 5. 多个应用\\n\\n### 数据资产管理:车企数据专业能力模型及课程体系\\n\\n| 能力类 | 能力组 | 能力 | 课程 | 方式 | 交付物 |\\n\\n| :----- | :----- | :--- | :--- | :--- | :----- |\\n\\n| 数据治理 | 数据基础 | 数据驱动数字化转型 | 《华为数据之道》《数据基本法》数据治理基础培训 | 自学+授课 | 考试通过 |\\n\\n| 数据工作规划 | 数据分类 | 数据工作3年规划数据工作目标/计划 | - | 指导 | 数据工作3年规划数据工作目标/计划 |\\n\\n| 数据组织架构 | 数据管理组织 | 数据管理角色 | 《数据基本法》数据治理案例分享 | 自学+分享 | 考试通过优秀案例 |\\n\\n| 数据运作机制 | 3A协同机制 | 数据治理基础培训 | 数据治理方法培训数据治理案例分享PowerDesigner操作指导数据资产平台操作指导 | 授课 | 考试通过实操案例 |\\n\\n| 信息架构 | 信息架构治理 | 信息架构设计 | - | 授课+指导 | - |\\n\\n| 信息架构评审 | 信息架构评审流程 | 信息架构评审标准 | - | - | - |\\n\\n| 数据工具使用 | PowerDesigner | 数据资产平台 | - | - | - |\\n\\n### 行业数据应用:车联网 TSP 湖仓一体平台\\n\\n#### 数据源\\n\\n* 车端TBOX\\n\\n* 用户日志\\n\\n* ERP\\n\\n* CRM\\n\\n#### 数据开发治理\\n\\n* 数据开发\\n\\n* 数据管理\\n\\n* 任务调度\\n\\n* 数据质量\\n\\n#### 数据集成\\n\\n* 实时集成\\n\\n* 多源支持\\n\\n* 自动解析\\n\\n#### 数据计算分析\\n\\n* 驾驶行为分析\\n\\n* 电池健康分析\\n\\n#### 数据存储\\n\\n### 数据平台建设:车企数据开发管理平台\\n\\n#### 指标设计发布\\n\\n* 穷尽核心业务指标\\n\\n* 形成原子指标库\\n\\n#### 指标数据设计\\n\\n* 原子指标库\\n\\n* 检索引擎\\n\\n* 向量储存\\n\\n#### 数据探源认证\\n\\n* 一汽业务规则\\n\\n* 数据建模规则\\n\\n* 集团BI规范\\n\\n* NL2SQL\\n\\n#### 模型服务设计\\n\\n* SFT Workflow\\n\\n* PPG Workflow\\n\\n* Reword Model Workflow\\n\\n#### 指标数据应用\\n\\n* 一汽数据大模型的核心能力\\n\\n* L1行业大模型\\n\\n### 行业数据应用:车企汽车大模型 GPT-BI\\n\\n### 数据流转运营:汽车大数据区块链平台\\n\\n#### 区块链层\\n\\n* 区块链+隐私计算\\n\\n#### 车企数据中心\\n\\n* 节点\\n\\n#### 网联汽车\\n\\n* 节点\\n\\n#### 原始数据交互\\n\\n#### 数据索引交互\\n\\n### 行业数据应用:车联网 TSP 湖仓一体平台\\n\\n#### 数据治理平台\\n\\n* 数据资产管理\\n\\n* 机构/用户信息系统\\n\\n* 数据组织/数据地图\\n\\n* 参考数据/生数据管理\\n\\n* 流程管理\\n\\n* 供需分析\\n\\n* 元数据管理\\n\\n* 数据建模\\n\\n* 技术元数据\\n\\n* 问题跟踪\\n\\n* 血缘关系/关联分析\\n\\n* 流程管理\\n\\n* 数据开发\\n\\n* 数据服务建模\\n\\n* 数据流程\\n\\n* 部署、调度\\n\\n* 测试及验证\\n\\n* 流程管理\\n\\n* 数据质量管理\\n\\n* 数据授权\\n\\n* 数据脱敏\\n\\n* 数据访问安全\\n\\n* 数据服务发布/申请/审核/授权等管理\\n\\n* 服务接入控制\\n\\n* 数据安全与共享\\n\\n* 数据分析\\n\\n* 数据主题\\n\\n* 数据实验\\n\\n* 数据共享\\n\\n* 共享管理\\n\\n* 共享服务\\n\\n#### 数据源\\n\\n* 互联网\\n\\n* 物联网\\n\\n* 业务系统\\n\\n* 结构化数据\\n\\n* 半结构化数据\\n\\n* 非结构化数据\\n\\n#### 数据交换\\n\\n* 内部交换\\n\\n* 互联网采集\\n\\n* 物联网采集\\n\\n* 加工采集\\n\\n* 结构同步\\n\\n* 数据同步\\n\\n* 文件同步\\n\\n* 外部交换\\n\\n* 互联网采集\\n\\n* 物联网采集\\n\\n* 加工采集\\n\\n* 结构同步\\n\\n* 数据同步\\n\\n* 文件同步\\n\\n#### 数据加工处理\\n\\n* 转换逻辑\\n\\n* 质量检查\\n\\n* 异常处理\\n\\n* 智能处理\\n\\n* 对比验证\\n\\n#### 数据存储\\n\\n* 缓存库\\n\\n#### 数据能力\\n\\n* 数据分析\\n\\n* 数据主题\\n\\n* 数据实验\\n\\n#### 数据应用\\n\\n* 经营管理\\n\\n* 生产运营\\n\\n* 客户服务\\n\\n### 数据流转运营:汽车数据流通服务平台",
"metadata": {
"node_id": "ad063c60fa2af82ebee374c18dcb85df882ce89bd65dad15c4d049610c29fb22",
"node_type": "text",
"ppr_score": 0.027124170383751343,
"edge_score": 0.0,
"passage_score": 0.5270269509362253,
"rank": 8,
"source": "hipporag2_langchain_text",
"query": "数据开发的常见范式有哪些",
"pagerank_available": true
}
},
{
"page_content": "# 重点工作一:数据开发与服务板块\\n\\n中国·北京 12.20-12.21 回归数据本质 应用驱动治理\\n\\n2023数据资产管理大会\\n\\n## 1 供给侧技术工具\\n\\n### 已完成及在研标准:\\n\\n* 《数据开发平台技术要求与测试方法》\\n\\n* 《数据科学平台技术要求与测试方法》\\n\\n* 《知识图谱工具技术要求与测试方法》\\n\\n* 《用户行为分析工具技术要求》\\n\\n* 《指标平台技术要求》\\n\\n* 《标签平台技术要求》\\n\\n* 《A/B测试工具技术要求》\\n\\n### 参与评测企业:\\n\\n![阿里云](image_1.png)\\n\\n![天翼云](image_2.png)\\n\\n![科大讯飞](image_3.png)\\n\\n![iFLYTEK](image_4.png)\\n\\n![GRIDSUM](image_5.png)\\n\\n![PERCENT](image_6.png)\\n\\n![中国电子](image_7.png)\\n\\n![INSPUR](image_8.png)\\n\\n![亚信科技](image_9.png)\\n\\n![星环科技](image_10.png)\\n\\n![百度](image_11.png)\\n\\n![腾讯云](image_12.png)\\n\\n![中国工商银行](image_13.png)\\n\\n![HUAWEI](image_14.png)\\n\\n![易知微](image_15.png)\\n\\n![中国移动](image_16.png)\\n\\n![ZTE中兴](image_17.png)\\n\\n![数澜科技](image_18.png)\\n\\n![ahua](image_19.png)\\n\\n![浦发银行](image_20.png)\\n\\n![品高云](image_21.png)\\n\\n![BingoCloud](image_22.png)\\n\\n![XI云徙](image_23.png)\\n\\n## 2 应用侧体系建设\\n\\n### 体系架构\\n\\n#### 数据服务体系\\n\\n* 数据获取\\n\\n* 数据分析\\n\\n* 服务管理\\n\\n#### 数据开发体系\\n\\n* 开发能力\\n\\n* 流程管理\\n\\n* 环境管理\\n\\n### 已完成及在研标准:\\n\\n* 《数据开发能力成熟度模型》\\n\\n* 《数据服务能力成熟度模型》\\n\\n### 参与评测企业:\\n\\n![中国移动](image_16.png)\\n\\n![中国工商银行](image_13.png)\\n\\n进行中\\n\\n![中国南方电网](image_24.png)\\n\\n![中国平安](image_25.png)",
"metadata": {
"node_id": "ec0aff6672edd992c681993faef8fb3b4bcfc466158c873ca32b7f969ce51c3e",
"node_type": "text",
"ppr_score": 0.02405051833437121,
"edge_score": 0.0,
"passage_score": 0.521261354554395,
"rank": 9,
"source": "hipporag2_langchain_text",
"query": "数据开发的常见范式有哪些",
"pagerank_available": true
}
},
{
"page_content": "# 信通院数据应用整体工作框架\\n\\n## 助力数据价值的发现、释放和认可\\n\\n### 数据对外赋能\\n\\n* 数据产品对外变现需求对接\\n\\n* 对外数据API能力评测\\n\\n* 外部数据资源接入对接\\n\\n### 数据对内赋能\\n\\n#### 数字营销\\n\\n* 企业数字营销成熟度评估\\n\\n* 数字营销外部数据源对接\\n\\n* 数字营销解决方案能力评测\\n\\n* 数字营销体系建设提升咨询\\n\\n#### 智能风控\\n\\n* 企业智能风控成熟度评估\\n\\n* 智能风控外部数据源对接\\n\\n* 智能风控解决方案能力评测\\n\\n* 智能风控体系建设提升咨询\\n\\n#### 数据驱动的企业管理\\n\\n* 企业数字化管理成熟度评估\\n\\n* 企业数字化管理体系建设咨询\\n\\n* 企业数字化管理解决方案能力评测\\n\\n#### 企业“业数融合”成熟度评估\\n\\n#### 企业数据伦理治理成熟度评估\\n\\n### 数据分析应用\\n\\n#### 技术平台评测\\n\\n* 数据可视化工具\\n\\n* 数字孪生技术平台\\n\\n* 商务智能(BI)工具\\n\\n* 用户行为分析平台\\n\\n* 基于大模型的BI工具\\n\\n* .....\\n\\n#### 体系建设评估\\n\\n* 可视化服务能力\\n\\n* 数据分析服务能力\\n\\n#### 外部供应商评测\\n\\n* 数据分析应用服务商能力评测\\n\\n#### 能力提升咨询\\n\\n* 技术工具及供应商选型咨询\\n\\n* 内部体系建设咨询\\n\\n### 数据开发与服务\\n\\n#### 技术平台评测\\n\\n* 数据开发平台\\n\\n* 数据科学平台\\n\\n* 知识图谱工具\\n\\n* 指标平台\\n\\n* 标签平台\\n\\n* .....\\n\\n#### 体系建设评估\\n\\n* 数据服务体系评估\\n\\n* 数据开发体系评估\\n\\n#### 能力提升咨询\\n\\n* 技术工具及供应商选型咨询\\n\\n* 内部体系建设咨询\\n\\n中国·北京 12.20-12.21 回归数据本质 应用驱动治理\\n\\n2023数据资产管理大会",
"metadata": {
"node_id": "3d78dc4b2f00a08592efdb0765121c4c5045d71a80845f44ff381716368c232d",
"node_type": "text",
"ppr_score": 0.01973173360637538,
"edge_score": 0.0,
"passage_score": 0.513284109967772,
"rank": 10,
"source": "hipporag2_langchain_text",
"query": "数据开发的常见范式有哪些",
"pagerank_available": true
}
},
{
"page_content": "DataOps 的数据流水线以数据工程化能力为核心,构建出数据研发管理、数据交付管理、数据运维和价值运营四个环节。",
"metadata": {
"node_id": "fa19992ada61ad05720dab20271cecae03b371638867632a55a9e60447d63a9b",
"node_type": "event",
"ppr_score": 0.00854474754901524,
"edge_score": 1.7696012,
"passage_score": 0.0,
"rank": 1,
"source": "hipporag2_langchain_event",
"query": "什么是数据研发运营一体化DataOps",
"pagerank_available": true
}
},
{
"page_content": "DataOps能力框架引领企业构建集开发、治理、运营于一体的自动化数据流水线",
"metadata": {
"node_id": "aba765ebba60737c35e6ab187b4188a23a275ae9e6a3232f38dd84a4a58b4878",
"node_type": "event",
"ppr_score": 0.007030721115544663,
"edge_score": 1.8087096,
"passage_score": 0.0,
"rank": 4,
"source": "hipporag2_langchain_event",
"query": "什么是数据研发运营一体化DataOps",
"pagerank_available": true
}
},
{
"page_content": "标准引领,建设 DataOps 体系",
"metadata": {
"node_id": "adb5a19d4a48b43fa7b2e7f76331d30736f624cd5df909e3aad6683390c175f9",
"node_type": "event",
"ppr_score": 0.006822805787531584,
"edge_score": 1.7816694,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"query": "什么是数据研发运营一体化DataOps",
"pagerank_available": true
}
},
{
"page_content": "数据研发管理",
"metadata": {
"node_id": "d9972ebdea4e9d9d8a9ba8b2200ac3772dcbd4fee37be649d3a6b0433249b9ab",
"node_type": "event",
"ppr_score": 0.0068104755080747575,
"edge_score": 1.7696012,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"query": "什么是数据研发运营一体化DataOps",
"pagerank_available": true
}
},
{
"page_content": "数据研发管理环节包括需求管理、设计管理、数据开发和自助分析。",
"metadata": {
"node_id": "e13c374b2e0d28363535b948b82692adf29763d5a43df19b0b7ea4f4c15d016d",
"node_type": "event",
"ppr_score": 0.005411200106389106,
"edge_score": 1.76836,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"query": "什么是数据研发运营一体化DataOps",
"pagerank_available": true
}
},
{
"page_content": "# DataOps 能力框架——实践保障\\n\\n## 2024DataOPS发展大会\\n\\n智驱新程·数驱万务\\n\\n为了保证 DataOps 研发流水线能够持续高效运转和迭代完善,企业需要有力的保障措施。本指南提出了组织、工具和安全三个维度的保障要求。这些要求的目标是引导企业以全局最优为目标,保障数据研发流水线的平滑运作。\\n\\n### 系统工具\\n\\n#### 数据需求管理\\n\\n| 手段 | 构建数据需求全生命周期的管理能力 |\\n\\n| :--- | :--------------------------------- |\\n\\n| 目标 | 支持流程的设计和共享 |\\n\\n| 进一步要求 | 数据需求方主动通过自助分析平台进行数据探查 |\\n\\n#### 数据研发治理一体化\\n\\n| 原则 | 先设计、后开发、先标准、后建模 |\\n\\n| :--- | :------------------------------- |\\n\\n| 手段 | 设计管理、开发管理、数据应用 |\\n\\n| 目的 | 规范即设计,设计即开发,开发即治理 |\\n\\n#### 数据自动化交付部署\\n\\n![数据自动化交付部署流程图](image_1.png)\\n\\n#### 数据一体化运维\\n\\n| 对象 | 数据研发全链路的监测、运维监控、运维告警、运维操作 |\\n\\n| :--- | :---------------------------------------------------- |\\n\\n| 手段 | 可视化方式 |\\n\\n| 目的 | 实时展现研发效能、数据质量 |\\n\\n### 组织管理\\n\\n#### 组织架构\\n\\n合理配置\\n\\n{ | 数据技术架构 |\\n\\n| 数据人员架构 |\\n\\n#### 岗位角色\\n\\n| | 设置相应的岗位角色 |\\n\\n| :--- | :------------------ |\\n\\n| | 明确晋升路线与考核方式 |\\n\\n#### 协作协同\\n\\n依托\\n\\n| 敏捷方法 |\\n\\n| :-------- |\\n\\n| 关注团队、工具间的协同问题持续进行优化 |\\n\\n解决\\n\\n### 安全管控\\n\\n#### 安全风险策略\\n\\n加强\\n\\n{ | 数据研发全生命周期 |\\n\\n| 风险识别 |\\n\\n| 风险预测 |\\n\\n#### 风险管理\\n\\n外部法律法规\\n\\n+ 监管要求\\n\\n+ 企业内部安全需求\\n\\n健全\\n\\n风险管理策略\\n\\n#### 安全测试\\n\\n数据研发过程的各环节进行安全测试\\n\\n保证\\n\\n提前发现问题处理问题",
"metadata": {
"node_id": "21cecc0bf37f351e693eaf71192ada4887caa03f90c22fe314b582966d6ccc79",
"node_type": "text",
"ppr_score": 0.020464668110135933,
"edge_score": 0.0,
"passage_score": 0.5878605948997568,
"rank": 9,
"source": "hipporag2_langchain_text",
"query": "什么是数据研发运营一体化DataOps",
"pagerank_available": true
}
}
],
"all_passages": [
"将敏捷、精益等理念融入数据开发过程,打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线。",
"数据研发运营一体化DataOps是数据开发的新范式将敏捷、精益等理念融入数据开发过程打破协作壁垒构建集开发、治理、运营于一体的自动化数据流水线不断提高数据产品交付效率与质量实现高质量数字化发展。",
"DataOps 实践快速发展",
"随着数据需求种类日益丰富,服务交付时效性重要性逐渐凸显,提升数据服务开发效率是关键。",
"提出DataOps服务能力要求",
"进行意见征集",
"发起意见征集活动",
"## (三)参与数据要素市场,获取数据竞争优势 加强数据生态系统的建设,鼓励实现数据开放共享。数据生态系统是一个以数 据为核心,由各种数据参与方(企业、组织、个人等)构成的复杂网络,涵盖数据的 生产、流通、利用等环节。通过构建数据生态系统,企业能够更好地进行数据合作与 共享,并参与生态系统的协同治理,推动数据的价值最大化。 加大数据内外部推广,丰富数据生态体系,积极参与数据要素市场建设。“数据 二十条”的提出旨在健全数据产权制度,建立数据流通交易制度,鼓励数据的共享和 交易,有效推动数据资源的高效利用和流动,为数字经济的发展创造良好的环境。随 着数据要素流通政策的不断完善,要素市场的健康有序发展,为企业开展数据流通服 务创造了良好的环境,越来越多的企业利用自身数据积累优势和服务能力优势,深入 调研数据需求方的核心业务痛点,形成可流通交易的数据产品,提供针对性的数据产 品与解决方案,推进形成各类数据产品的权责范围、供求关系、使用场景、定价策略 等,完善数据产品全流程合规管理,充分实现数据赋能发展。 ## (四)加深新型技术使用,提高数据运营效率 随着数据需求种类日益丰富,服务交付时效性重要性逐渐凸显,提升数据服务 开发效率是关键。数据研发运营一体化DataOps是数据开发的新范式将敏 捷、精益等理念融入数据开发过程,通过对数据相关人员、工具和流程的重新组织, 打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线,不断提高数据 产品交付效率与质量实现高质量数字化发展。DataOps作为一种新兴的数据管理 方法,强调数据管理自动化,既能为数据工作者提供敏捷的数据开发支持,同时也简 化了数据交付的周期,提升数据成产者与数据消费者的协同效率,成为企业数字化转 型快速释放数据生产力的最佳方案。 充分利用AI和大模型技术优化数据策略。",
"# DataOps 能力框架——核心环节\\n\\n## 2024DataOPS发展大会\\n\\n智驱新程·数驱万务\\n\\n为了不断提高数据产品交付效率与质量实现高质量数字化发展的目标。DataOps 的数据流水线以数据工程化能力为核心,构建出数据研发管理、数据交付管理、数据运维和价值运营四个环节。\\n\\n### 数据研发管理\\n\\n#### 需求管理\\n\\n采集 → 分析 → 确认 → 实施 → 变更\\n\\n数据需求全流程管理\\n\\n#### 设计管理\\n\\n制度 + 技术\\n\\n管理\\n\\n模型设计\\n\\n加工设计\\n\\n标准设计\\n\\n质量设计\\n\\n安全设计\\n\\n#### 数据开发\\n\\n集成存储、实施、部署、维护数据解决方案\\n\\n数据处理、加工、管理、使用\\n\\n提升数据资源价值\\n\\n#### 自助分析\\n\\n自助式的数据二次处理\\n\\n### 数据交付管理\\n\\n#### 配置管理\\n\\n版本控制\\n\\n环境管理\\n\\n代码版本管理\\n\\n数据版本管理\\n\\n保证\\n\\n各阶段数据随时可用性、可验证性\\n\\n#### 测试管理\\n\\n自动化测试流水线\\n\\n管理\\n\\n单元测试\\n\\n集成测试\\n\\n提前发现问题处理问题\\n\\n保证\\n\\n#### 部署与发布管理\\n\\n自动化部署发布流水线\\n\\n聚焦\\n\\n工具的自动化和标准化\\n\\n保证\\n\\n加快数据部署效率降低人为操作风险\\n\\n### 数据运维\\n\\n#### 监控管理\\n\\n监控体系\\n\\n监控预警\\n\\n开发流水线运行情况质量情况\\n\\n#### 资源管理\\n\\n调度优化合理分\\n\\n数据资源\\n\\n计算资源\\n\\n存储资源\\n\\n优化\\n\\n运维成本\\n\\n#### 变更管理\\n\\n标准化、敏捷化的变更流程\\n\\n应对\\n\\n开发流水线各类变更场景\\n\\n#### 异常管理\\n\\n构建\\n\\n异常管理知识库\\n\\n自动化运维能力\\n\\n提升\\n\\n运维效率\\n\\n#### 持续优化\\n\\n调优\\n\\n流水线任务编排\\n\\n平台配置\\n\\n提升\\n\\n开发流水线性能\\n\\n### 价值运营\\n\\n#### 成本管理\\n\\n细化数据产品交付\\n\\n维护成本核算\\n\\n精细控制资源投入\\n\\n识别、减少浪费\\n\\n#### 持续变革\\n\\n打造反馈机制\\n\\n收集各环节堵点问题\\n\\n持续改进\\n\\n#### 量化驱动\\n\\n数据开发流水线\\n\\n评估\\n\\n交付效率\\n\\n需求响应速度\\n\\n优化\\n\\n工作流程资源分配策略",
"# DataOps 实践典型误区\\n\\nDataOps 作为一种新的数据开发范式正在越来越多的行业和企业中落地,然而,能力建设并非一朝一夕,其实施过程中亦面临重重困难。\\n\\n为帮助即将或正在建设 DataOps 体系的企业进行“避雷”,我们将当前产业在实践过程中走过的弯路和遇到的问题进行了提炼。\\n\\n## 误区 1盲目跟风没有“量体裁衣”\\n\\n* **DataOps 理念过热期**\\n\\n+ 领头企业成功案例催化\\n\\n+ 忽略不同企业实施复杂性和差异性\\n\\n## 误区 2决策机制模糊导致资源浪费或投入不足\\n\\n* **投入不足**\\n\\n* DataOps 被视为 IT/ 数据部门专项工作\\n\\n* 高层的参与度不足\\n\\n* 业务部门缺乏主动性和创新性\\n\\n* 企业缺少战略耐心\\n\\n* **浪费**\\n\\n* 在立项或采购阶段好大求全,导致项目实施周期增加、成本提高、实施复杂度提升,后续利用度低\\n\\n## 误区 3过度依赖技术解决所有问题\\n\\n* **高估技术的影响力,忽略业技融合**\\n\\n+ 忽视企业流程、管理、协作和数据文化上的不足\\n\\n## 误区 4追求短期收益\\n\\n* **市场竞争和业务压力,更关注短期收益和业绩目标的实现**\\n\\n+ 缺乏长远的眼光和战略决心,变革初期的数据质量、交付效率提升只是管中窥豹\\n\\n## 解决思路:急用先行,把握节奏\\n\\n* 考虑自身需求、痛点和技术架构\\n\\n* 综合考量自身与领先企业的差异性\\n\\n* 分阶段、分步骤地推进\\n\\n## 解决思路:定权责、常沟通、重反馈、建流程、勤宣贯\\n\\n* 明确 DataOps 建设目标,定义各部门和个人的责任和角色\\n\\n* 建立定期的沟通反馈机制\\n\\n* 构建规范和流程,减少决策混乱\\n\\n* 培养数据文化,提高员工对 DataOps 的认知和参与度\\n\\n## 解决思路:业务导向,“组织、流程、技术”三位一体共同推进\\n\\n* 围绕业务目标,借助组织变革建立跨部门的团队\\n\\n* 建立标准化的工作流\\n\\n* 选择合适的系统工具\\n\\n## 解决思路:长短结合,久久为功,控制预期,革新认知\\n\\n* 前期拉齐团队和领导层认知\\n\\n* 辅助以可见收益的短期项目,增强信心\\n\\n* 不断加深认知,厘清阶段重点,主动关注行业中的新方向",
"构建六个平台包括数据汇聚平台、存储计算平台、数据处理平台、数据治理平台、数据分析平台和数据共享开发平台",
"数据开发持续将数据转化为满足业务需求的内容",
"车联网TSP湖仓一体平台的数据治理平台涉及数据资产管理、机构/用户信息系统、数据组织/数据地图、参考数据/生数据管理、流程管理、供需分析、元数据管理、数据建模、技术元数据、问题跟踪、血缘关系/关联分析、流程管理、数据开发、数据服务建模、数据流程、部署、调度、测试及验证、服务接入控制、数据安全与共享、数据分析、数据主题、数据实验、数据共享、共享管理、共享服务",
"多家企业参与了标准的评测",
"《数据开发平台技术要求与测试方法》等标准已完成或在研",
"数据中台功能",
"# 汽车数据典型实践分享\\n\\n## 2023数据资产管理大会\\n\\n中国·北京 12.20-12.21 回归数据本质 应用驱动治理\\n\\n### 数据底座架构蓝图(构建六个平台、四个中心、三个保障体系,一个统一门户)\\n\\n#### 1. 六个平台\\n\\n* 数据汇聚平台\\n\\n* 存储计算平台\\n\\n* 数据处理平台\\n\\n* 数据治理平台\\n\\n* 数据分析平台\\n\\n* 数据共享开发平台\\n\\n#### 2. 四个中心\\n\\n* 数据资源中心\\n\\n* 数据服务中心\\n\\n* AI中心\\n\\n* 数据运营中心\\n\\n#### 3. 三个保障\\n\\n* 标准规范体系\\n\\n* 运维保障体系\\n\\n* 安全保障体系\\n\\n#### 4. 一个统一门户\\n\\n#### 5. 多个应用\\n\\n### 数据资产管理:车企数据专业能力模型及课程体系\\n\\n| 能力类 | 能力组 | 能力 | 课程 | 方式 | 交付物 |\\n\\n| :----- | :----- | :--- | :--- | :--- | :----- |\\n\\n| 数据治理 | 数据基础 | 数据驱动数字化转型 | 《华为数据之道》《数据基本法》数据治理基础培训 | 自学+授课 | 考试通过 |\\n\\n| 数据工作规划 | 数据分类 | 数据工作3年规划数据工作目标/计划 | - | 指导 | 数据工作3年规划数据工作目标/计划 |\\n\\n| 数据组织架构 | 数据管理组织 | 数据管理角色 | 《数据基本法》数据治理案例分享 | 自学+分享 | 考试通过优秀案例 |\\n\\n| 数据运作机制 | 3A协同机制 | 数据治理基础培训 | 数据治理方法培训数据治理案例分享PowerDesigner操作指导数据资产平台操作指导 | 授课 | 考试通过实操案例 |\\n\\n| 信息架构 | 信息架构治理 | 信息架构设计 | - | 授课+指导 | - |\\n\\n| 信息架构评审 | 信息架构评审流程 | 信息架构评审标准 | - | - | - |\\n\\n| 数据工具使用 | PowerDesigner | 数据资产平台 | - | - | - |\\n\\n### 行业数据应用:车联网 TSP 湖仓一体平台\\n\\n#### 数据源\\n\\n* 车端TBOX\\n\\n* 用户日志\\n\\n* ERP\\n\\n* CRM\\n\\n#### 数据开发治理\\n\\n* 数据开发\\n\\n* 数据管理\\n\\n* 任务调度\\n\\n* 数据质量\\n\\n#### 数据集成\\n\\n* 实时集成\\n\\n* 多源支持\\n\\n* 自动解析\\n\\n#### 数据计算分析\\n\\n* 驾驶行为分析\\n\\n* 电池健康分析\\n\\n#### 数据存储\\n\\n### 数据平台建设:车企数据开发管理平台\\n\\n#### 指标设计发布\\n\\n* 穷尽核心业务指标\\n\\n* 形成原子指标库\\n\\n#### 指标数据设计\\n\\n* 原子指标库\\n\\n* 检索引擎\\n\\n* 向量储存\\n\\n#### 数据探源认证\\n\\n* 一汽业务规则\\n\\n* 数据建模规则\\n\\n* 集团BI规范\\n\\n* NL2SQL\\n\\n#### 模型服务设计\\n\\n* SFT Workflow\\n\\n* PPG Workflow\\n\\n* Reword Model Workflow\\n\\n#### 指标数据应用\\n\\n* 一汽数据大模型的核心能力\\n\\n* L1行业大模型\\n\\n### 行业数据应用:车企汽车大模型 GPT-BI\\n\\n### 数据流转运营:汽车大数据区块链平台\\n\\n#### 区块链层\\n\\n* 区块链+隐私计算\\n\\n#### 车企数据中心\\n\\n* 节点\\n\\n#### 网联汽车\\n\\n* 节点\\n\\n#### 原始数据交互\\n\\n#### 数据索引交互\\n\\n### 行业数据应用:车联网 TSP 湖仓一体平台\\n\\n#### 数据治理平台\\n\\n* 数据资产管理\\n\\n* 机构/用户信息系统\\n\\n* 数据组织/数据地图\\n\\n* 参考数据/生数据管理\\n\\n* 流程管理\\n\\n* 供需分析\\n\\n* 元数据管理\\n\\n* 数据建模\\n\\n* 技术元数据\\n\\n* 问题跟踪\\n\\n* 血缘关系/关联分析\\n\\n* 流程管理\\n\\n* 数据开发\\n\\n* 数据服务建模\\n\\n* 数据流程\\n\\n* 部署、调度\\n\\n* 测试及验证\\n\\n* 流程管理\\n\\n* 数据质量管理\\n\\n* 数据授权\\n\\n* 数据脱敏\\n\\n* 数据访问安全\\n\\n* 数据服务发布/申请/审核/授权等管理\\n\\n* 服务接入控制\\n\\n* 数据安全与共享\\n\\n* 数据分析\\n\\n* 数据主题\\n\\n* 数据实验\\n\\n* 数据共享\\n\\n* 共享管理\\n\\n* 共享服务\\n\\n#### 数据源\\n\\n* 互联网\\n\\n* 物联网\\n\\n* 业务系统\\n\\n* 结构化数据\\n\\n* 半结构化数据\\n\\n* 非结构化数据\\n\\n#### 数据交换\\n\\n* 内部交换\\n\\n* 互联网采集\\n\\n* 物联网采集\\n\\n* 加工采集\\n\\n* 结构同步\\n\\n* 数据同步\\n\\n* 文件同步\\n\\n* 外部交换\\n\\n* 互联网采集\\n\\n* 物联网采集\\n\\n* 加工采集\\n\\n* 结构同步\\n\\n* 数据同步\\n\\n* 文件同步\\n\\n#### 数据加工处理\\n\\n* 转换逻辑\\n\\n* 质量检查\\n\\n* 异常处理\\n\\n* 智能处理\\n\\n* 对比验证\\n\\n#### 数据存储\\n\\n* 缓存库\\n\\n#### 数据能力\\n\\n* 数据分析\\n\\n* 数据主题\\n\\n* 数据实验\\n\\n#### 数据应用\\n\\n* 经营管理\\n\\n* 生产运营\\n\\n* 客户服务\\n\\n### 数据流转运营:汽车数据流通服务平台",
"# 重点工作一:数据开发与服务板块\\n\\n中国·北京 12.20-12.21 回归数据本质 应用驱动治理\\n\\n2023数据资产管理大会\\n\\n## 1 供给侧技术工具\\n\\n### 已完成及在研标准:\\n\\n* 《数据开发平台技术要求与测试方法》\\n\\n* 《数据科学平台技术要求与测试方法》\\n\\n* 《知识图谱工具技术要求与测试方法》\\n\\n* 《用户行为分析工具技术要求》\\n\\n* 《指标平台技术要求》\\n\\n* 《标签平台技术要求》\\n\\n* 《A/B测试工具技术要求》\\n\\n### 参与评测企业:\\n\\n![阿里云](image_1.png)\\n\\n![天翼云](image_2.png)\\n\\n![科大讯飞](image_3.png)\\n\\n![iFLYTEK](image_4.png)\\n\\n![GRIDSUM](image_5.png)\\n\\n![PERCENT](image_6.png)\\n\\n![中国电子](image_7.png)\\n\\n![INSPUR](image_8.png)\\n\\n![亚信科技](image_9.png)\\n\\n![星环科技](image_10.png)\\n\\n![百度](image_11.png)\\n\\n![腾讯云](image_12.png)\\n\\n![中国工商银行](image_13.png)\\n\\n![HUAWEI](image_14.png)\\n\\n![易知微](image_15.png)\\n\\n![中国移动](image_16.png)\\n\\n![ZTE中兴](image_17.png)\\n\\n![数澜科技](image_18.png)\\n\\n![ahua](image_19.png)\\n\\n![浦发银行](image_20.png)\\n\\n![品高云](image_21.png)\\n\\n![BingoCloud](image_22.png)\\n\\n![XI云徙](image_23.png)\\n\\n## 2 应用侧体系建设\\n\\n### 体系架构\\n\\n#### 数据服务体系\\n\\n* 数据获取\\n\\n* 数据分析\\n\\n* 服务管理\\n\\n#### 数据开发体系\\n\\n* 开发能力\\n\\n* 流程管理\\n\\n* 环境管理\\n\\n### 已完成及在研标准:\\n\\n* 《数据开发能力成熟度模型》\\n\\n* 《数据服务能力成熟度模型》\\n\\n### 参与评测企业:\\n\\n![中国移动](image_16.png)\\n\\n![中国工商银行](image_13.png)\\n\\n进行中\\n\\n![中国南方电网](image_24.png)\\n\\n![中国平安](image_25.png)",
"# 信通院数据应用整体工作框架\\n\\n## 助力数据价值的发现、释放和认可\\n\\n### 数据对外赋能\\n\\n* 数据产品对外变现需求对接\\n\\n* 对外数据API能力评测\\n\\n* 外部数据资源接入对接\\n\\n### 数据对内赋能\\n\\n#### 数字营销\\n\\n* 企业数字营销成熟度评估\\n\\n* 数字营销外部数据源对接\\n\\n* 数字营销解决方案能力评测\\n\\n* 数字营销体系建设提升咨询\\n\\n#### 智能风控\\n\\n* 企业智能风控成熟度评估\\n\\n* 智能风控外部数据源对接\\n\\n* 智能风控解决方案能力评测\\n\\n* 智能风控体系建设提升咨询\\n\\n#### 数据驱动的企业管理\\n\\n* 企业数字化管理成熟度评估\\n\\n* 企业数字化管理体系建设咨询\\n\\n* 企业数字化管理解决方案能力评测\\n\\n#### 企业“业数融合”成熟度评估\\n\\n#### 企业数据伦理治理成熟度评估\\n\\n### 数据分析应用\\n\\n#### 技术平台评测\\n\\n* 数据可视化工具\\n\\n* 数字孪生技术平台\\n\\n* 商务智能(BI)工具\\n\\n* 用户行为分析平台\\n\\n* 基于大模型的BI工具\\n\\n* .....\\n\\n#### 体系建设评估\\n\\n* 可视化服务能力\\n\\n* 数据分析服务能力\\n\\n#### 外部供应商评测\\n\\n* 数据分析应用服务商能力评测\\n\\n#### 能力提升咨询\\n\\n* 技术工具及供应商选型咨询\\n\\n* 内部体系建设咨询\\n\\n### 数据开发与服务\\n\\n#### 技术平台评测\\n\\n* 数据开发平台\\n\\n* 数据科学平台\\n\\n* 知识图谱工具\\n\\n* 指标平台\\n\\n* 标签平台\\n\\n* .....\\n\\n#### 体系建设评估\\n\\n* 数据服务体系评估\\n\\n* 数据开发体系评估\\n\\n#### 能力提升咨询\\n\\n* 技术工具及供应商选型咨询\\n\\n* 内部体系建设咨询\\n\\n中国·北京 12.20-12.21 回归数据本质 应用驱动治理\\n\\n2023数据资产管理大会",
"DataOps 的数据流水线以数据工程化能力为核心,构建出数据研发管理、数据交付管理、数据运维和价值运营四个环节。",
"DataOps能力框架引领企业构建集开发、治理、运营于一体的自动化数据流水线",
"标准引领,建设 DataOps 体系",
"数据研发管理",
"数据研发管理环节包括需求管理、设计管理、数据开发和自助分析。",
"# DataOps 能力框架——实践保障\\n\\n## 2024DataOPS发展大会\\n\\n智驱新程·数驱万务\\n\\n为了保证 DataOps 研发流水线能够持续高效运转和迭代完善,企业需要有力的保障措施。本指南提出了组织、工具和安全三个维度的保障要求。这些要求的目标是引导企业以全局最优为目标,保障数据研发流水线的平滑运作。\\n\\n### 系统工具\\n\\n#### 数据需求管理\\n\\n| 手段 | 构建数据需求全生命周期的管理能力 |\\n\\n| :--- | :--------------------------------- |\\n\\n| 目标 | 支持流程的设计和共享 |\\n\\n| 进一步要求 | 数据需求方主动通过自助分析平台进行数据探查 |\\n\\n#### 数据研发治理一体化\\n\\n| 原则 | 先设计、后开发、先标准、后建模 |\\n\\n| :--- | :------------------------------- |\\n\\n| 手段 | 设计管理、开发管理、数据应用 |\\n\\n| 目的 | 规范即设计,设计即开发,开发即治理 |\\n\\n#### 数据自动化交付部署\\n\\n![数据自动化交付部署流程图](image_1.png)\\n\\n#### 数据一体化运维\\n\\n| 对象 | 数据研发全链路的监测、运维监控、运维告警、运维操作 |\\n\\n| :--- | :---------------------------------------------------- |\\n\\n| 手段 | 可视化方式 |\\n\\n| 目的 | 实时展现研发效能、数据质量 |\\n\\n### 组织管理\\n\\n#### 组织架构\\n\\n合理配置\\n\\n{ | 数据技术架构 |\\n\\n| 数据人员架构 |\\n\\n#### 岗位角色\\n\\n| | 设置相应的岗位角色 |\\n\\n| :--- | :------------------ |\\n\\n| | 明确晋升路线与考核方式 |\\n\\n#### 协作协同\\n\\n依托\\n\\n| 敏捷方法 |\\n\\n| :-------- |\\n\\n| 关注团队、工具间的协同问题持续进行优化 |\\n\\n解决\\n\\n### 安全管控\\n\\n#### 安全风险策略\\n\\n加强\\n\\n{ | 数据研发全生命周期 |\\n\\n| 风险识别 |\\n\\n| 风险预测 |\\n\\n#### 风险管理\\n\\n外部法律法规\\n\\n+ 监管要求\\n\\n+ 企业内部安全需求\\n\\n健全\\n\\n风险管理策略\\n\\n#### 安全测试\\n\\n数据研发过程的各环节进行安全测试\\n\\n保证\\n\\n提前发现问题处理问题"
],
"passage_sources": [
"原始查询-event-f81ab568ce6cfce72175a1087db911f899752c622460211efdc350d6c3167149",
"原始查询-event-774a6133f9a25821d10ebab0d1745ac30d14a4016da4d3548b102f265e633a22",
"原始查询-event-20707ee6c13b5870e58f4eb4853f2bd6ddc6b0dff31966717b5f434d0a6dcc20",
"原始查询-event-5be46591a0a7ccd7266c2f0961280fd5df89d16e316f123585ebe001f09c5fe1",
"原始查询-event-3a068edb1c5649880334a21e741217e2e5a225be789b4a64ef9da94da431b048",
"原始查询-event-d358a1d1a1a9400e149274fa124d0cf06d243184939c2dd1db82536e1236b239",
"原始查询-event-4c54213b0c0b8e6bb6f65cfe84516373d0704c5149fa11ad2a03fcd785590763",
"原始查询-text-da7aaabf868de83a9fc286404d784e30982b7ba7a5e56c5c1707922e5e39dcf1",
"原始查询-text-b406044bae110b82a0e2675cbde336748e6f77bb6b6c43a3455c3fd3a3515acd",
"原始查询-text-9c60e1d67a9be847f2b2e95f859a18bf9940b7854a020b276d921f9caa0bc7a6",
"子查询2-event-5e59301cc2e7068341d114bf7bbbbadfe12c364f508d6994e88b6062d563d172",
"子查询2-event-eac424e27127852d6d3143ccc74114e48274c42e671d3792a6806881167722c6",
"子查询2-event-b2aaa9a459c53453f580cd43db7d9f95949dfeea20f6ba22f02833df4d9e780e",
"子查询2-event-b64d3498bfd0df3cec9972f33303b0f5bd62d7381923be351f799658ac82738d",
"子查询2-event-914d415479b8d019ab1049d49ec7493142afaa6187d97dc20e188dc3220ca1c5",
"子查询2-event-4de51586600d31b97aa032ecfb161b95106276ef302db2083ef51cca668dd676",
"子查询2-text-ad063c60fa2af82ebee374c18dcb85df882ce89bd65dad15c4d049610c29fb22",
"子查询2-text-ec0aff6672edd992c681993faef8fb3b4bcfc466158c873ca32b7f969ce51c3e",
"子查询2-text-3d78dc4b2f00a08592efdb0765121c4c5045d71a80845f44ff381716368c232d",
"子查询1-event-fa19992ada61ad05720dab20271cecae03b371638867632a55a9e60447d63a9b",
"子查询1-event-aba765ebba60737c35e6ab187b4188a23a275ae9e6a3232f38dd84a4a58b4878",
"子查询1-event-adb5a19d4a48b43fa7b2e7f76331d30736f624cd5df909e3aad6683390c175f9",
"子查询1-event-d9972ebdea4e9d9d8a9ba8b2200ac3772dcbd4fee37be649d3a6b0433249b9ab",
"子查询1-event-e13c374b2e0d28363535b948b82692adf29763d5a43df19b0b7ea4f4c15d016d",
"子查询1-text-21cecc0bf37f351e693eaf71192ada4887caa03f90c22fe314b582966d6ccc79"
],
"pagerank_data_available": true,
"pagerank_summary": {},
"concept_exploration_results": {},
"exploration_round": 0,
"debug_info": {
"total_time": 23.213276863098145,
"retrieval_calls": 1,
"llm_calls": 4,
"langsmith_project": "rag-api-service",
"token_usage_summary": {
"has_llm": true,
"has_generator": true,
"last_call": {
"prompt_tokens": 5416,
"completion_tokens": 37,
"total_tokens": 5453
},
"total_usage": {
"prompt_tokens": 6425,
"completion_tokens": 222,
"total_tokens": 6647,
"call_count": 3
},
"model_name": "qwen2-7b-instruct",
"has_last_usage": true,
"has_total_usage": true
},
"complexity_analysis": {
"is_complex": true,
"complexity_level": "complex",
"confidence": 0.95,
"reason": "这是一个复杂查询因为用户询问的是数据研发运营一体化DataOps在数据开发领域的特定范式这可能涉及到数据开发的不同实践、流程和理论。这种问题通常需要对数据开发领域的深入理解可能需要从多个角度和来源获取信息来形成全面的答案。"
},
"debug_mode_analysis": {
"debug_mode": "0",
"debug_override": {},
"path_override_applied": false
},
"sufficiency_analysis": {
"final_sufficiency": true,
"sufficiency_check_details": {
"is_sufficient": true,
"confidence": 0.9,
"reason": "事件信息和段落信息包含了回答查询所需的关键内容...",
"iteration": 0
},
"iteration_sufficiency_history": [],
"sufficiency_progression": {
"status": "no_sufficiency_checks"
}
},
"routing_analysis": {
"total_routing_decisions": 1,
"sub_query_generation_count": 0,
"parallel_retrieval_count": 0,
"pagerank_collection_count": 0
},
"concept_exploration_analysis": {
"exploration_enabled": false,
"exploration_rounds": 0,
"pagerank_nodes_analyzed": 0,
"successful_branches_total": 0,
"total_branches_attempted": 0
}
},
"iteration_history": [
{
"iteration": 0,
"query": "并行检索: 原始查询 + 2 个子查询",
"passages_count": 25,
"action": "retrieval"
},
{
"iteration": 0,
"action": "sufficiency_check",
"is_sufficient": true,
"confidence": 0.9,
"sub_queries_count": 0
},
{
"iteration": 0,
"action": "final_answer_generation",
"answer_length": 9636
}
]
}