698 lines
56 KiB
JSON
698 lines
56 KiB
JSON
|
|
{
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"answer": "混沌工程的定义是:混沌工程是一种通过引入各种不确定性和故障来测试和改进系统的方法和理念。它以进行实验的方式对系统注入故障或其他扰动,从而测试系统的稳定性和可靠性,并提升系统的韧性和可靠性。混沌工程不仅是一种技术工具或手段,更是一种综合体系,包含了工具、人、流程的战略顶层设计与实际底层实践的结合。例如,Netflix 和社区于2015年提出了混沌工程的基本原则,其核心目标是通过实验来探索系统未知的信息,提升系统的稳定性和可靠性。\n\nDataOps的定义是:数据研发运营一体化(DataOps)是数据开发的新范式,将敏捷、精益等理念融入数据开发过程,通过对数据相关人员、工具和流程的重新组织,打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线。它强调数据管理自动化,为数据工作者提供敏捷的数据开发支持,同时简化数据交付的周期,提升数据生产者",
|
|||
|
|
"query_complexity": {
|
|||
|
|
"is_complex": true,
|
|||
|
|
"complexity_level": "complex",
|
|||
|
|
"confidence": 0.95,
|
|||
|
|
"reason": "这是一个复杂查询,因为它包含了两个不同的主题:混沌工程的定义和DataOps的定义。这两个主题分别属于不同的领域,需要分别查找和理解,因此需要生成多个子查询来回答。"
|
|||
|
|
},
|
|||
|
|
"is_complex_query": true,
|
|||
|
|
"retrieval_path": "complex_hipporag",
|
|||
|
|
"iterations": 0,
|
|||
|
|
"total_passages": 36,
|
|||
|
|
"sub_queries": [
|
|||
|
|
"混沌工程的定义是什么",
|
|||
|
|
"DataOps是什么"
|
|||
|
|
],
|
|||
|
|
"decomposed_sub_queries": [
|
|||
|
|
"混沌工程的定义是什么",
|
|||
|
|
"DataOps是什么"
|
|||
|
|
],
|
|||
|
|
"initial_retrieval_details": {},
|
|||
|
|
"sufficiency_check": {
|
|||
|
|
"is_sufficient": true,
|
|||
|
|
"confidence": 0.9,
|
|||
|
|
"reason": "事件信息和段落信息包含了回答查询所需的关键内容,包括混沌工程的定义、基本原则、发展历程以及DataOps的概念、目标、应用场景和实施挑战等。",
|
|||
|
|
"iteration": 0
|
|||
|
|
},
|
|||
|
|
"current_sub_queries": [],
|
|||
|
|
"is_sufficient": true,
|
|||
|
|
"all_documents": [
|
|||
|
|
{
|
|||
|
|
"page_content": "混沌工程战略",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "1fcfb2ae6aa51a9217aaea6f5873a779b1afc251f0ead95e4519ad85f0a26b77",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.02201009802467942,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 1,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "将混沌工程应用的战略顶层设计与实际底层实践相结合,制定混沌工程发展战略、落地规划与评价机制",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "b0dc1eae19908943e4bb922ce0d235ea94ec109fd3325fd368fe93b1606c3eba",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.0038376845731720264,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 2,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "基于前期调研情况及金融业特点,农行提出八大落地原则",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "8a6fbcff5b6c559ad9da3b4bc0813cfa3af63a94bfa40e7e0ecc98b9b0cb0172",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.0032284961101799042,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 3,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "农行归纳技术风险管理的三有诉求,并推导出混沌工程落地的三有模型",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "6596cc879a7a5c4a9421c7a5ce83a7343c95c7f95822993d83893262d0e63cc8",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.0028266183719344237,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 4,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "提出混沌工程落地模型以提升行内稳定性保障技术和IT运营能力",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "b49135d8c6481172812d533f3d6981f36b3b7d94123428328eb3592a60b7301c",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.002595881718047509,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 5,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "前言撰写",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "ec3b4bff0184984b0518a016093fa923ccc5cd03aca0e118b37e30aa1cb0f633",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.0024026633307044545,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 6,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "混沌工程落地的‘三有模型’",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "dad8d62af3556e6c33005a189b89fc1f7d3d0355a09dc91bf7f5a3e1b17dac0f",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.0019933535662360405,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 7,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "理论联系实际,提出混沌工程落地模型",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "48b60d67ee3df0fbf8c7eafc88daa7baa7c67e0c8bbe41485b45daec9c6bc2d0",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.001868984344248674,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 8,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "用于体系地提升行内稳定性保障技术和IT运营能力",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "fcf1af5246b18ad329e0c6dfd7fdfa10f076c2aeb55b7c856e41f4e9fe526175",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.001868984344248674,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 9,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "Netflix 和社区于2015年提出了混沌工程的基本原则",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "4b7a8e934d8d09224e8c27eecb90442516760c8f94c9dfde39dd97d631112a7f",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.001868984344248674,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 10,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "同时,理论联系实际,提出包含支撑能力、评价体系、团 队文化的混沌工程落地模型,用于体系地提升行内稳定性保障技术能 力和IT运营能力。 ## (一)实践原则 Netflix 和社区于2015 年提出了混沌工程的基本原则,也即我们 常讨论的5 大原则:生产环境运行实验、真实事件、建立稳态假说、 自动化运营实验、最小化爆炸半径。该原则通用性很强,但落地门槛 较高。在遵从“5 大原则”的基础上,农行基于前期调研情况以及我 国金融业业务连续性高、监管要求高、资金敏感度高、声誉风险大的 特点,从研发管理流程、实验成本和风险控制等因素,扩展为“8 大 原则”,供金融企业落地实践参考。  ## (二)战略规划 混沌工程并不是简单地工具和手段的应用,而是包含了工具、人、 流程的综合体系。这需要将混沌工程应用的战略顶层设计与实际底层 实践相结合,有组织、有规划地制定混沌工程发展战略、落地规划与 评价机制。农行将技术风险管理的诉求归纳为三有诉求:有能力、有 评价、有文化,基于这3 点核心诉求,推导出混沌工程落地的“三有 模型”,以混沌工程这一工具为抓手,体系性提升技术风险管理水平。  ## (三)能力体系 ### 1.",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "da431fcfc058ce10697b2ccc8eb898f51b3dbeba1466496878efc64cde12a1aa",
|
|||
|
|
"node_type": "text",
|
|||
|
|
"ppr_score": 0.05441384763980257,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.084378535,
|
|||
|
|
"rank": 11,
|
|||
|
|
"source": "hipporag2_langchain_text",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "混沌工程提供了同一个认知体系内的方法论,将架构、开发、测 试、运维等团队之间工作推动盘活起来。比如通过开展故障演练、 GameDay 等活动,将各个团队介入进来,根据历史发生过的或可能发 生的故障场景,对业务进行注入故障、故障排查、复盘,提升对故障 事件的应急处理能力,增强对系统抵御故障场景的信息,通过混沌工 程来加深各部门之间的沟通合作。 混沌工程提升了工程师的响应能力。工程师也是系统的一部分,混沌工程通过混沌实验为工程师构建了一个非确定性、非周期性的故障环境, 剥离工程师对初始条件的敏感依赖, 进而提升了工程师对故障防御的设计能力、故障事件的构建能力、故障问题的描述能力以及故障应对的组织协调能力。其实是通过混沌工程的能力, 让工程师更多认识故障及其对业务的影响, 从以前的 “被动响应” 到 “主动防御”。 混沌工程对于架构团队而言,最大的价值是在系统设计之初就将 可能发生的、尽量全的故障场景考虑进去,不至于在系统架构非常臃 肿时再想去提升稳定性,在一个业务复杂的系统中考虑稳定性设计是 异常难的,难分析、难改动、难优化。 混沌工程对于开发团队而言,可以通过混沌工程能力从开发之初 或开发时就可以将由于开发或引入的组件导致的故障场景考虑进去, 从故障场景分析如何增强问题的快速定位、防护、跟踪等能力。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "eaebc2c5bb1aed205038d18eeeee4dd33ab7318e1cbda9d54c2f8a9795e73d28",
|
|||
|
|
"node_type": "text",
|
|||
|
|
"ppr_score": 0.01295643858384829,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.08577338000000001,
|
|||
|
|
"rank": 12,
|
|||
|
|
"source": "hipporag2_langchain_text",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "| 差异性 | 混沌工程 | 传统测试 | 理念 | 对系统未知的信息进行探索 | 基于特定条件的验证 | 目标 | 提升系统的韧性和可靠性 | 验证代码逻辑的正确性 | 范围 | 技术架构、运维流程 | 代码 | 环境 | 离生产越近的地方进行实验越好 | 寻找软件缺陷要离生产越远越好 | 执行人员 | 任何关注系统韧性和可靠性的人员,如测试人员、运维人员、开发人员、项目经理等 | 测试人员 | 结果 | 特定的断言,测试会产生二元的结果,非真即假 | 系统架构不同,实验千变万化,结果不同 ### 3.混淆工程与故障演练:故障演练是混沌工程的具体 实践 故障演练是较为正式的,低频的一种演练活动,通过机房断电、 断网等手段模拟不可预期的自然灾害或重大故障,来测试系统的恢复 能力和故障转移能力。故障演练的整体计划性较强,演练前会先制定 整体的演练方案和应急方案;演练时,往往需要协调业务、IT 等多方 参与,并在每次演练时需要组织相关的会议,按照预先设置的应急方 案执行。灾备演练是最常见的一种故障演练的方式。 对比故障演练,混沌工程的组织方式更加灵活,可以按照组织架 构以租户的方式进行,是一种非正式的活动。混沌工程以进行实验的 方式来对系统注入故障或其他的扰动,由于其进行过程成本较低,涉 及相关方较少,因此可以高频进行。 故障演练是混沌工程的一种具体实践, 它是混沌工程中用于模拟和测试系统故障情况的手段之一。混沌工程更广泛地涵盖了通过引入各种不确定性和故障来测试和改进系统的方法和理念, 而故障演练则是其中的一种具体操作手段。 ## (二)混沌工程发展历程 混沌工程的起源可追溯到1970年,硬件工程师将设备暴露在各种有害条件下并观察设备,以确定它们继续运行的情况。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "731fddc36b520d361923cb5c3ecfa7dffdc396ef5ce67e35b1c3598744056a52",
|
|||
|
|
"node_type": "text",
|
|||
|
|
"ppr_score": 0.009287035814774077,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.08413920000000001,
|
|||
|
|
"rank": 13,
|
|||
|
|
"source": "hipporag2_langchain_text",
|
|||
|
|
"query": "混沌工程的定义是什么?DataOps是什么?",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "混沌工程以进行实验的方式来对系统注入故障或其他的扰动",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "8a14d83ce8b04835fa8d1218cfaf88891b9efdc531c67eb1dcec60b730a30702",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.051817528102654706,
|
|||
|
|
"edge_score": 1.8373339,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 1,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "混沌工程通过引入各种不确定性和故障来测试和改进系统",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "716b631cfc54dd6bb9eb129f91a74f95691624a323b7f5769cea6ea11810f492",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.05111898859217512,
|
|||
|
|
"edge_score": 1.8301196,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 2,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "故障演练通过机房断电、断网等手段模拟不可预期的自然灾害或重大故障",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "043c762ea5dec1b35d55a8080c179bf816e47cd937884dc6776ff8c541b2819d",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.003380027511833625,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 3,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "混沌工程更广泛地涵盖了通过引入各种不确定性和故障来测试和改进系统的方法和理念",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "334a48d07c0914a27ecc426a089ed73fcb5f465f60c9c57db080158c5b5dc1e5",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.003135466353648542,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 4,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "故障演练是混沌工程中用于模拟和测试系统故障情况的手段之一",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "577ea3562f0d62b2094e74fb1760debef6c73592e736dbd3da46f8d2a398eaa9",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.00306660375626552,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 5,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "硬件工程师将设备暴露在各种有害条件下并观察设备以确定它们继续运行的情况",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "3b9d7ac31f5173e8a26e3d7e7bf7a6180999f5822fd26e3a54343e541e63036b",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.002387111138716541,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 6,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "更加灵活",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "322054373e5901d51ebfad46070ae00310cecce19de3e78a97a1e5e6a811dc4f",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.0016785303727417109,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 8,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "通过实验注入故障或其他扰动",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "d0957ead1b9500d90439fadf53ca6d5d58b72becd642111d1a4d0755b7904b7a",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.0016785303727417109,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 9,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "测试和改进系统",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "0cf85d9b8c37bed23b06ce5a4829a0764cd5bae9e497791a3705256db90f1a10",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.0016785303727417109,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 10,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "混沌工程的定义是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "混沌工程更广泛地涵盖了通过引入各种不确定性和故障来测试和改进系统的方法和理念, 而故障演练则是其中的一种具体操作手段。 ## (二)混沌工程发展历程 混沌工程的起源可追溯到1970年,硬件工程师将设备暴露在各种有害条件下并观察设备,以确定它们继续运行的情况。这些测试涉及短路引脚之间的连接、产生电磁干扰、中断电源,甚至用辐射轰击 电路等方法实施故障注入。目标是了解此类压力源如何影响设备的运行,确定设备在什么时候会出现故障,并重新设计硬件以使其更具弹性。随着时间的推移,软件故障注入逐步发展,软件工程师可以在他们的应用程序中模拟故障,测试错误和异常处理功能,修改源代码以注入模拟故障(称为编译时注入),并在活跃运行的系统上触发故障(称为运行时注入)。运行时故障注入在管理大型、复杂、分布式系统的公司中变得特别流行。 在 2008 年 8 月 Netflix 遭遇严重的数据库损坏事件, 从那时起 Netflix 决定向云端迁移, 为了能应对云端分布式系统故障, 在架构中贯彻冗余和柔性降级原则的同时, 在 2011 年通过 Chaos Monkey 工具定期“杀死”软件服务的随机实例, 可以测试冗余架构以验证服务器故障不会明显影响客户。随后 Netflix 公司推出了更多的工具、平台和解决方案, 用于在更大规模和跨多个团队中编排实施故障注入。这些工具为我们今天所知的混沌工程奠定了基础。 模式摸索阶段。2010 年 Netflix 提出混沌工程概念,并开发 Chaos Monkey 程序,其主要功能是随机对生产环境的虚拟机实例和容器进行终止操作,从而模拟系统基础设施异常情况,让工程师能够观察服务是否健壮、有弹性,能否容忍计划外的故障。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "c7cd68334f44bbedbe19e9dac291514f61aff4e90858ef2901d8c3459fc94219",
|
|||
|
|
"node_type": "text",
|
|||
|
|
"ppr_score": 0.041035925626815226,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.08899171500000001,
|
|||
|
|
"rank": 11,
|
|||
|
|
"source": "hipporag2_langchain_text",
|
|||
|
|
"query": "混沌工程的定义是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "将敏捷、精益等理念融入数据开发过程,打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "f81ab568ce6cfce72175a1087db911f899752c622460211efdc350d6c3167149",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.059835775476112976,
|
|||
|
|
"edge_score": 1.8119739,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 1,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "数据研发运营一体化(DataOps)是数据开发的新范式,将敏捷、精益等理念融入数据开发过程,打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线,不断提高数据产品交付效率与质量,实现高质量数字化发展。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "774a6133f9a25821d10ebab0d1745ac30d14a4016da4d3548b102f265e633a22",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.009913339430214678,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 2,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "随着数据需求种类日益丰富,服务交付时效性重要性逐渐凸显,提升数据服务开发效率是关键。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "5be46591a0a7ccd7266c2f0961280fd5df89d16e316f123585ebe001f09c5fe1",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.0035166186426121328,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 3,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "DataOps成为企业数字化转型快速释放数据生产力的最佳方案。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "0b602ca1699621754c4663ee33fbd14c65e56f98f892a180bf49d5c5d4bb45c3",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.003415085391966603,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 4,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "通用人工智能的发展为 DataOps 注入了智能化的血液",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "c9742cba92598eed28ba36b049ac0e5f07c662764f5466218959605695b8a530",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.0031013599031647935,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 5,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "中国工商银行 DataOps 精心打磨大数据测试服务,为全行用户提供全方位赋能支撑。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "3cdd327d19e8912738212fb94992b711185abb92bb53dcdaf0fbd9d55553a3c3",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.003091351848447381,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 6,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "DataOps作为一种新兴的数据管理方法,强调数据管理自动化。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "1578f029da85aa8bf25b11ce5f36f1ce67b9ae446cddd2266825a5881685226a",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.002935217296989444,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 7,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "加强数据生态系统的建设,鼓励实现数据开放共享。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "cdc6337c8984c01a1379d9afa19eeb4ba81660be38053a846e0f250baf04ee62",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.002833844482404579,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 8,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "“数据二十条”的提出旨在健全数据产权制度,建立数据流通交易制度,鼓励数据的共享和交易,有效推动数据资源的高效利用和流动。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "90d9024251e5a8cdeca241f0c6166214b4243126f3384975deec9474b31cf45a",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.0027508727972451338,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 9,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "随着数据要素流通政策的不断完善,要素市场的健康有序发展,为企业开展数据流通服务创造了良好的环境。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "f8d46e99bb67396a63859ea3eafb0dd619b62f57c9337d2e223051e0d4f9a200",
|
|||
|
|
"node_type": "event",
|
|||
|
|
"ppr_score": 0.002705859830550944,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.0,
|
|||
|
|
"rank": 10,
|
|||
|
|
"source": "hipporag2_langchain_event",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "## (三)参与数据要素市场,获取数据竞争优势 加强数据生态系统的建设,鼓励实现数据开放共享。数据生态系统是一个以数 据为核心,由各种数据参与方(企业、组织、个人等)构成的复杂网络,涵盖数据的 生产、流通、利用等环节。通过构建数据生态系统,企业能够更好地进行数据合作与 共享,并参与生态系统的协同治理,推动数据的价值最大化。 加大数据内外部推广,丰富数据生态体系,积极参与数据要素市场建设。“数据 二十条”的提出旨在健全数据产权制度,建立数据流通交易制度,鼓励数据的共享和 交易,有效推动数据资源的高效利用和流动,为数字经济的发展创造良好的环境。随 着数据要素流通政策的不断完善,要素市场的健康有序发展,为企业开展数据流通服 务创造了良好的环境,越来越多的企业利用自身数据积累优势和服务能力优势,深入 调研数据需求方的核心业务痛点,形成可流通交易的数据产品,提供针对性的数据产 品与解决方案,推进形成各类数据产品的权责范围、供求关系、使用场景、定价策略 等,完善数据产品全流程合规管理,充分实现数据赋能发展。 ## (四)加深新型技术使用,提高数据运营效率 随着数据需求种类日益丰富,服务交付时效性重要性逐渐凸显,提升数据服务 开发效率是关键。数据研发运营一体化(DataOps)是数据开发的新范式,将敏 捷、精益等理念融入数据开发过程,通过对数据相关人员、工具和流程的重新组织, 打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线,不断提高数据 产品交付效率与质量,实现高质量数字化发展。DataOps作为一种新兴的数据管理 方法,强调数据管理自动化,既能为数据工作者提供敏捷的数据开发支持,同时也简 化了数据交付的周期,提升数据成产者与数据消费者的协同效率,成为企业数字化转 型快速释放数据生产力的最佳方案。 充分利用AI和大模型技术优化数据策略。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "da7aaabf868de83a9fc286404d784e30982b7ba7a5e56c5c1707922e5e39dcf1",
|
|||
|
|
"node_type": "text",
|
|||
|
|
"ppr_score": 0.08803509931020824,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.076804175,
|
|||
|
|
"rank": 11,
|
|||
|
|
"source": "hipporag2_langchain_text",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "DataOps作为一种新兴的数据管理 方法,强调数据管理自动化,既能为数据工作者提供敏捷的数据开发支持,同时也简 化了数据交付的周期,提升数据成产者与数据消费者的协同效率,成为企业数字化转 型快速释放数据生产力的最佳方案。 充分利用AI和大模型技术优化数据策略。AI技术可以通过机器学习和深度学习算 法,自动化地处理和分析大规模的数据,发现数据中的隐藏模式和趋势,为企业提供 更准确、实时的决策支持。数据分析技术也将不断发展,包括数据挖掘、预测分析、 文本分析等,通过对数据的深入分析,帮助企业更好地理解和利用数据。 ## (五)以数据入表为抓手,探索数据核算机制 2023年8月,财政部正式发文《企业数据资源相关会计处理暂行规定》(下称 “暂行规定”),标志着我国数据资源入表正式落地,探索数据资源入表的基础制度和 会计制度,对于释放数据要素价值、推动市场建设、优化资源配置具有重要意义。数 据资源入表是指将企业数据资源在财务报表层面真实反应其价值和成本投入,向企业 董事会、管理层和投资方充分披露公司对于数据的重视程度和数据带来的实际价值。 《暂行规定》根据企业使用数据目的的不同,区分为无形资产类数据资产和存 货类数据资产,并分别要求企业参照《企业会计准则第6号——无形资产》和《企业 会计准则第1号——存货》进行处理,同时也要求企业按照规定强制和自愿披露相关 数据资源信息。在《暂行规定》的指导要求下,企业过往在数据建设领域的部分投资 费用可以得到资本化处理,进而改善企业资产负债结构、经营利润等财务数据,同 时,也会进一步激发、促进企业加速完善数据管理体系的建设意愿与进程。",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "114fe591e33e8bff142be610475d8035339e334932dc35fd2e89ff078d10fe52",
|
|||
|
|
"node_type": "text",
|
|||
|
|
"ppr_score": 0.03593622982194038,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.08325262,
|
|||
|
|
"rank": 12,
|
|||
|
|
"source": "hipporag2_langchain_text",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"page_content": "# DataOps 实践典型误区\\n\\nDataOps 作为一种新的数据开发范式正在越来越多的行业和企业中落地,然而,能力建设并非一朝一夕,其实施过程中亦面临重重困难。\\n\\n为帮助即将或正在建设 DataOps 体系的企业进行“避雷”,我们将当前产业在实践过程中走过的弯路和遇到的问题进行了提炼。\\n\\n## 误区 1:盲目跟风,没有“量体裁衣”\\n\\n* **DataOps 理念过热期**\\n\\n+ 领头企业成功案例催化\\n\\n+ 忽略不同企业实施复杂性和差异性\\n\\n## 误区 2:决策机制模糊,导致资源浪费或投入不足\\n\\n* **投入不足**\\n\\n* DataOps 被视为 IT/ 数据部门专项工作\\n\\n* 高层的参与度不足\\n\\n* 业务部门缺乏主动性和创新性\\n\\n* 企业缺少战略耐心\\n\\n* **浪费**\\n\\n* 在立项或采购阶段好大求全,导致项目实施周期增加、成本提高、实施复杂度提升,后续利用度低\\n\\n## 误区 3:过度依赖技术解决所有问题\\n\\n* **高估技术的影响力,忽略业技融合**\\n\\n+ 忽视企业流程、管理、协作和数据文化上的不足\\n\\n## 误区 4:追求短期收益\\n\\n* **市场竞争和业务压力,更关注短期收益和业绩目标的实现**\\n\\n+ 缺乏长远的眼光和战略决心,变革初期的数据质量、交付效率提升只是管中窥豹\\n\\n## 解决思路:急用先行,把握节奏\\n\\n* 考虑自身需求、痛点和技术架构\\n\\n* 综合考量自身与领先企业的差异性\\n\\n* 分阶段、分步骤地推进\\n\\n## 解决思路:定权责、常沟通、重反馈、建流程、勤宣贯\\n\\n* 明确 DataOps 建设目标,定义各部门和个人的责任和角色\\n\\n* 建立定期的沟通反馈机制\\n\\n* 构建规范和流程,减少决策混乱\\n\\n* 培养数据文化,提高员工对 DataOps 的认知和参与度\\n\\n## 解决思路:业务导向,“组织、流程、技术”三位一体共同推进\\n\\n* 围绕业务目标,借助组织变革建立跨部门的团队\\n\\n* 建立标准化的工作流\\n\\n* 选择合适的系统工具\\n\\n## 解决思路:长短结合,久久为功,控制预期,革新认知\\n\\n* 前期拉齐团队和领导层认知\\n\\n* 辅助以可见收益的短期项目,增强信心\\n\\n* 不断加深认知,厘清阶段重点,主动关注行业中的新方向",
|
|||
|
|
"metadata": {
|
|||
|
|
"node_id": "9c60e1d67a9be847f2b2e95f859a18bf9940b7854a020b276d921f9caa0bc7a6",
|
|||
|
|
"node_type": "text",
|
|||
|
|
"ppr_score": 0.01642227394363851,
|
|||
|
|
"edge_score": 0.0,
|
|||
|
|
"passage_score": 0.08761666000000001,
|
|||
|
|
"rank": 13,
|
|||
|
|
"source": "hipporag2_langchain_text",
|
|||
|
|
"query": "DataOps是什么",
|
|||
|
|
"pagerank_available": true
|
|||
|
|
}
|
|||
|
|
}
|
|||
|
|
],
|
|||
|
|
"all_passages": [
|
|||
|
|
"混沌工程战略",
|
|||
|
|
"将混沌工程应用的战略顶层设计与实际底层实践相结合,制定混沌工程发展战略、落地规划与评价机制",
|
|||
|
|
"基于前期调研情况及金融业特点,农行提出八大落地原则",
|
|||
|
|
"农行归纳技术风险管理的三有诉求,并推导出混沌工程落地的三有模型",
|
|||
|
|
"提出混沌工程落地模型以提升行内稳定性保障技术和IT运营能力",
|
|||
|
|
"前言撰写",
|
|||
|
|
"混沌工程落地的‘三有模型’",
|
|||
|
|
"理论联系实际,提出混沌工程落地模型",
|
|||
|
|
"用于体系地提升行内稳定性保障技术和IT运营能力",
|
|||
|
|
"Netflix 和社区于2015年提出了混沌工程的基本原则",
|
|||
|
|
"同时,理论联系实际,提出包含支撑能力、评价体系、团 队文化的混沌工程落地模型,用于体系地提升行内稳定性保障技术能 力和IT运营能力。 ## (一)实践原则 Netflix 和社区于2015 年提出了混沌工程的基本原则,也即我们 常讨论的5 大原则:生产环境运行实验、真实事件、建立稳态假说、 自动化运营实验、最小化爆炸半径。该原则通用性很强,但落地门槛 较高。在遵从“5 大原则”的基础上,农行基于前期调研情况以及我 国金融业业务连续性高、监管要求高、资金敏感度高、声誉风险大的 特点,从研发管理流程、实验成本和风险控制等因素,扩展为“8 大 原则”,供金融企业落地实践参考。  ## (二)战略规划 混沌工程并不是简单地工具和手段的应用,而是包含了工具、人、 流程的综合体系。这需要将混沌工程应用的战略顶层设计与实际底层 实践相结合,有组织、有规划地制定混沌工程发展战略、落地规划与 评价机制。农行将技术风险管理的诉求归纳为三有诉求:有能力、有 评价、有文化,基于这3 点核心诉求,推导出混沌工程落地的“三有 模型”,以混沌工程这一工具为抓手,体系性提升技术风险管理水平。  ## (三)能力体系 ### 1.",
|
|||
|
|
"混沌工程提供了同一个认知体系内的方法论,将架构、开发、测 试、运维等团队之间工作推动盘活起来。比如通过开展故障演练、 GameDay 等活动,将各个团队介入进来,根据历史发生过的或可能发 生的故障场景,对业务进行注入故障、故障排查、复盘,提升对故障 事件的应急处理能力,增强对系统抵御故障场景的信息,通过混沌工 程来加深各部门之间的沟通合作。 混沌工程提升了工程师的响应能力。工程师也是系统的一部分,混沌工程通过混沌实验为工程师构建了一个非确定性、非周期性的故障环境, 剥离工程师对初始条件的敏感依赖, 进而提升了工程师对故障防御的设计能力、故障事件的构建能力、故障问题的描述能力以及故障应对的组织协调能力。其实是通过混沌工程的能力, 让工程师更多认识故障及其对业务的影响, 从以前的 “被动响应” 到 “主动防御”。 混沌工程对于架构团队而言,最大的价值是在系统设计之初就将 可能发生的、尽量全的故障场景考虑进去,不至于在系统架构非常臃 肿时再想去提升稳定性,在一个业务复杂的系统中考虑稳定性设计是 异常难的,难分析、难改动、难优化。 混沌工程对于开发团队而言,可以通过混沌工程能力从开发之初 或开发时就可以将由于开发或引入的组件导致的故障场景考虑进去, 从故障场景分析如何增强问题的快速定位、防护、跟踪等能力。",
|
|||
|
|
"| 差异性 | 混沌工程 | 传统测试 | 理念 | 对系统未知的信息进行探索 | 基于特定条件的验证 | 目标 | 提升系统的韧性和可靠性 | 验证代码逻辑的正确性 | 范围 | 技术架构、运维流程 | 代码 | 环境 | 离生产越近的地方进行实验越好 | 寻找软件缺陷要离生产越远越好 | 执行人员 | 任何关注系统韧性和可靠性的人员,如测试人员、运维人员、开发人员、项目经理等 | 测试人员 | 结果 | 特定的断言,测试会产生二元的结果,非真即假 | 系统架构不同,实验千变万化,结果不同 ### 3.混淆工程与故障演练:故障演练是混沌工程的具体 实践 故障演练是较为正式的,低频的一种演练活动,通过机房断电、 断网等手段模拟不可预期的自然灾害或重大故障,来测试系统的恢复 能力和故障转移能力。故障演练的整体计划性较强,演练前会先制定 整体的演练方案和应急方案;演练时,往往需要协调业务、IT 等多方 参与,并在每次演练时需要组织相关的会议,按照预先设置的应急方 案执行。灾备演练是最常见的一种故障演练的方式。 对比故障演练,混沌工程的组织方式更加灵活,可以按照组织架 构以租户的方式进行,是一种非正式的活动。混沌工程以进行实验的 方式来对系统注入故障或其他的扰动,由于其进行过程成本较低,涉 及相关方较少,因此可以高频进行。 故障演练是混沌工程的一种具体实践, 它是混沌工程中用于模拟和测试系统故障情况的手段之一。混沌工程更广泛地涵盖了通过引入各种不确定性和故障来测试和改进系统的方法和理念, 而故障演练则是其中的一种具体操作手段。 ## (二)混沌工程发展历程 混沌工程的起源可追溯到1970年,硬件工程师将设备暴露在各种有害条件下并观察设备,以确定它们继续运行的情况。",
|
|||
|
|
"混沌工程以进行实验的方式来对系统注入故障或其他的扰动",
|
|||
|
|
"混沌工程通过引入各种不确定性和故障来测试和改进系统",
|
|||
|
|
"故障演练通过机房断电、断网等手段模拟不可预期的自然灾害或重大故障",
|
|||
|
|
"混沌工程更广泛地涵盖了通过引入各种不确定性和故障来测试和改进系统的方法和理念",
|
|||
|
|
"故障演练是混沌工程中用于模拟和测试系统故障情况的手段之一",
|
|||
|
|
"硬件工程师将设备暴露在各种有害条件下并观察设备以确定它们继续运行的情况",
|
|||
|
|
"更加灵活",
|
|||
|
|
"通过实验注入故障或其他扰动",
|
|||
|
|
"测试和改进系统",
|
|||
|
|
"混沌工程更广泛地涵盖了通过引入各种不确定性和故障来测试和改进系统的方法和理念, 而故障演练则是其中的一种具体操作手段。 ## (二)混沌工程发展历程 混沌工程的起源可追溯到1970年,硬件工程师将设备暴露在各种有害条件下并观察设备,以确定它们继续运行的情况。这些测试涉及短路引脚之间的连接、产生电磁干扰、中断电源,甚至用辐射轰击 电路等方法实施故障注入。目标是了解此类压力源如何影响设备的运行,确定设备在什么时候会出现故障,并重新设计硬件以使其更具弹性。随着时间的推移,软件故障注入逐步发展,软件工程师可以在他们的应用程序中模拟故障,测试错误和异常处理功能,修改源代码以注入模拟故障(称为编译时注入),并在活跃运行的系统上触发故障(称为运行时注入)。运行时故障注入在管理大型、复杂、分布式系统的公司中变得特别流行。 在 2008 年 8 月 Netflix 遭遇严重的数据库损坏事件, 从那时起 Netflix 决定向云端迁移, 为了能应对云端分布式系统故障, 在架构中贯彻冗余和柔性降级原则的同时, 在 2011 年通过 Chaos Monkey 工具定期“杀死”软件服务的随机实例, 可以测试冗余架构以验证服务器故障不会明显影响客户。随后 Netflix 公司推出了更多的工具、平台和解决方案, 用于在更大规模和跨多个团队中编排实施故障注入。这些工具为我们今天所知的混沌工程奠定了基础。 模式摸索阶段。2010 年 Netflix 提出混沌工程概念,并开发 Chaos Monkey 程序,其主要功能是随机对生产环境的虚拟机实例和容器进行终止操作,从而模拟系统基础设施异常情况,让工程师能够观察服务是否健壮、有弹性,能否容忍计划外的故障。",
|
|||
|
|
"将敏捷、精益等理念融入数据开发过程,打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线。",
|
|||
|
|
"数据研发运营一体化(DataOps)是数据开发的新范式,将敏捷、精益等理念融入数据开发过程,打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线,不断提高数据产品交付效率与质量,实现高质量数字化发展。",
|
|||
|
|
"随着数据需求种类日益丰富,服务交付时效性重要性逐渐凸显,提升数据服务开发效率是关键。",
|
|||
|
|
"DataOps成为企业数字化转型快速释放数据生产力的最佳方案。",
|
|||
|
|
"通用人工智能的发展为 DataOps 注入了智能化的血液",
|
|||
|
|
"中国工商银行 DataOps 精心打磨大数据测试服务,为全行用户提供全方位赋能支撑。",
|
|||
|
|
"DataOps作为一种新兴的数据管理方法,强调数据管理自动化。",
|
|||
|
|
"加强数据生态系统的建设,鼓励实现数据开放共享。",
|
|||
|
|
"“数据二十条”的提出旨在健全数据产权制度,建立数据流通交易制度,鼓励数据的共享和交易,有效推动数据资源的高效利用和流动。",
|
|||
|
|
"随着数据要素流通政策的不断完善,要素市场的健康有序发展,为企业开展数据流通服务创造了良好的环境。",
|
|||
|
|
"## (三)参与数据要素市场,获取数据竞争优势 加强数据生态系统的建设,鼓励实现数据开放共享。数据生态系统是一个以数 据为核心,由各种数据参与方(企业、组织、个人等)构成的复杂网络,涵盖数据的 生产、流通、利用等环节。通过构建数据生态系统,企业能够更好地进行数据合作与 共享,并参与生态系统的协同治理,推动数据的价值最大化。 加大数据内外部推广,丰富数据生态体系,积极参与数据要素市场建设。“数据 二十条”的提出旨在健全数据产权制度,建立数据流通交易制度,鼓励数据的共享和 交易,有效推动数据资源的高效利用和流动,为数字经济的发展创造良好的环境。随 着数据要素流通政策的不断完善,要素市场的健康有序发展,为企业开展数据流通服 务创造了良好的环境,越来越多的企业利用自身数据积累优势和服务能力优势,深入 调研数据需求方的核心业务痛点,形成可流通交易的数据产品,提供针对性的数据产 品与解决方案,推进形成各类数据产品的权责范围、供求关系、使用场景、定价策略 等,完善数据产品全流程合规管理,充分实现数据赋能发展。 ## (四)加深新型技术使用,提高数据运营效率 随着数据需求种类日益丰富,服务交付时效性重要性逐渐凸显,提升数据服务 开发效率是关键。数据研发运营一体化(DataOps)是数据开发的新范式,将敏 捷、精益等理念融入数据开发过程,通过对数据相关人员、工具和流程的重新组织, 打破协作壁垒,构建集开发、治理、运营于一体的自动化数据流水线,不断提高数据 产品交付效率与质量,实现高质量数字化发展。DataOps作为一种新兴的数据管理 方法,强调数据管理自动化,既能为数据工作者提供敏捷的数据开发支持,同时也简 化了数据交付的周期,提升数据成产者与数据消费者的协同效率,成为企业数字化转 型快速释放数据生产力的最佳方案。 充分利用AI和大模型技术优化数据策略。",
|
|||
|
|
"DataOps作为一种新兴的数据管理 方法,强调数据管理自动化,既能为数据工作者提供敏捷的数据开发支持,同时也简 化了数据交付的周期,提升数据成产者与数据消费者的协同效率,成为企业数字化转 型快速释放数据生产力的最佳方案。 充分利用AI和大模型技术优化数据策略。AI技术可以通过机器学习和深度学习算 法,自动化地处理和分析大规模的数据,发现数据中的隐藏模式和趋势,为企业提供 更准确、实时的决策支持。数据分析技术也将不断发展,包括数据挖掘、预测分析、 文本分析等,通过对数据的深入分析,帮助企业更好地理解和利用数据。 ## (五)以数据入表为抓手,探索数据核算机制 2023年8月,财政部正式发文《企业数据资源相关会计处理暂行规定》(下称 “暂行规定”),标志着我国数据资源入表正式落地,探索数据资源入表的基础制度和 会计制度,对于释放数据要素价值、推动市场建设、优化资源配置具有重要意义。数 据资源入表是指将企业数据资源在财务报表层面真实反应其价值和成本投入,向企业 董事会、管理层和投资方充分披露公司对于数据的重视程度和数据带来的实际价值。 《暂行规定》根据企业使用数据目的的不同,区分为无形资产类数据资产和存 货类数据资产,并分别要求企业参照《企业会计准则第6号——无形资产》和《企业 会计准则第1号——存货》进行处理,同时也要求企业按照规定强制和自愿披露相关 数据资源信息。在《暂行规定》的指导要求下,企业过往在数据建设领域的部分投资 费用可以得到资本化处理,进而改善企业资产负债结构、经营利润等财务数据,同 时,也会进一步激发、促进企业加速完善数据管理体系的建设意愿与进程。",
|
|||
|
|
"# DataOps 实践典型误区\\n\\nDataOps 作为一种新的数据开发范式正在越来越多的行业和企业中落地,然而,能力建设并非一朝一夕,其实施过程中亦面临重重困难。\\n\\n为帮助即将或正在建设 DataOps 体系的企业进行“避雷”,我们将当前产业在实践过程中走过的弯路和遇到的问题进行了提炼。\\n\\n## 误区 1:盲目跟风,没有“量体裁衣”\\n\\n* **DataOps 理念过热期**\\n\\n+ 领头企业成功案例催化\\n\\n+ 忽略不同企业实施复杂性和差异性\\n\\n## 误区 2:决策机制模糊,导致资源浪费或投入不足\\n\\n* **投入不足**\\n\\n* DataOps 被视为 IT/ 数据部门专项工作\\n\\n* 高层的参与度不足\\n\\n* 业务部门缺乏主动性和创新性\\n\\n* 企业缺少战略耐心\\n\\n* **浪费**\\n\\n* 在立项或采购阶段好大求全,导致项目实施周期增加、成本提高、实施复杂度提升,后续利用度低\\n\\n## 误区 3:过度依赖技术解决所有问题\\n\\n* **高估技术的影响力,忽略业技融合**\\n\\n+ 忽视企业流程、管理、协作和数据文化上的不足\\n\\n## 误区 4:追求短期收益\\n\\n* **市场竞争和业务压力,更关注短期收益和业绩目标的实现**\\n\\n+ 缺乏长远的眼光和战略决心,变革初期的数据质量、交付效率提升只是管中窥豹\\n\\n## 解决思路:急用先行,把握节奏\\n\\n* 考虑自身需求、痛点和技术架构\\n\\n* 综合考量自身与领先企业的差异性\\n\\n* 分阶段、分步骤地推进\\n\\n## 解决思路:定权责、常沟通、重反馈、建流程、勤宣贯\\n\\n* 明确 DataOps 建设目标,定义各部门和个人的责任和角色\\n\\n* 建立定期的沟通反馈机制\\n\\n* 构建规范和流程,减少决策混乱\\n\\n* 培养数据文化,提高员工对 DataOps 的认知和参与度\\n\\n## 解决思路:业务导向,“组织、流程、技术”三位一体共同推进\\n\\n* 围绕业务目标,借助组织变革建立跨部门的团队\\n\\n* 建立标准化的工作流\\n\\n* 选择合适的系统工具\\n\\n## 解决思路:长短结合,久久为功,控制预期,革新认知\\n\\n* 前期拉齐团队和领导层认知\\n\\n* 辅助以可见收益的短期项目,增强信心\\n\\n* 不断加深认知,厘清阶段重点,主动关注行业中的新方向"
|
|||
|
|
],
|
|||
|
|
"passage_sources": [
|
|||
|
|
"原始查询-event-1fcfb2ae6aa51a9217aaea6f5873a779b1afc251f0ead95e4519ad85f0a26b77",
|
|||
|
|
"原始查询-event-b0dc1eae19908943e4bb922ce0d235ea94ec109fd3325fd368fe93b1606c3eba",
|
|||
|
|
"原始查询-event-8a6fbcff5b6c559ad9da3b4bc0813cfa3af63a94bfa40e7e0ecc98b9b0cb0172",
|
|||
|
|
"原始查询-event-6596cc879a7a5c4a9421c7a5ce83a7343c95c7f95822993d83893262d0e63cc8",
|
|||
|
|
"原始查询-event-b49135d8c6481172812d533f3d6981f36b3b7d94123428328eb3592a60b7301c",
|
|||
|
|
"原始查询-event-ec3b4bff0184984b0518a016093fa923ccc5cd03aca0e118b37e30aa1cb0f633",
|
|||
|
|
"原始查询-event-dad8d62af3556e6c33005a189b89fc1f7d3d0355a09dc91bf7f5a3e1b17dac0f",
|
|||
|
|
"原始查询-event-48b60d67ee3df0fbf8c7eafc88daa7baa7c67e0c8bbe41485b45daec9c6bc2d0",
|
|||
|
|
"原始查询-event-fcf1af5246b18ad329e0c6dfd7fdfa10f076c2aeb55b7c856e41f4e9fe526175",
|
|||
|
|
"原始查询-event-4b7a8e934d8d09224e8c27eecb90442516760c8f94c9dfde39dd97d631112a7f",
|
|||
|
|
"原始查询-text-da431fcfc058ce10697b2ccc8eb898f51b3dbeba1466496878efc64cde12a1aa",
|
|||
|
|
"原始查询-text-eaebc2c5bb1aed205038d18eeeee4dd33ab7318e1cbda9d54c2f8a9795e73d28",
|
|||
|
|
"原始查询-text-731fddc36b520d361923cb5c3ecfa7dffdc396ef5ce67e35b1c3598744056a52",
|
|||
|
|
"子查询1-event-8a14d83ce8b04835fa8d1218cfaf88891b9efdc531c67eb1dcec60b730a30702",
|
|||
|
|
"子查询1-event-716b631cfc54dd6bb9eb129f91a74f95691624a323b7f5769cea6ea11810f492",
|
|||
|
|
"子查询1-event-043c762ea5dec1b35d55a8080c179bf816e47cd937884dc6776ff8c541b2819d",
|
|||
|
|
"子查询1-event-334a48d07c0914a27ecc426a089ed73fcb5f465f60c9c57db080158c5b5dc1e5",
|
|||
|
|
"子查询1-event-577ea3562f0d62b2094e74fb1760debef6c73592e736dbd3da46f8d2a398eaa9",
|
|||
|
|
"子查询1-event-3b9d7ac31f5173e8a26e3d7e7bf7a6180999f5822fd26e3a54343e541e63036b",
|
|||
|
|
"子查询1-event-322054373e5901d51ebfad46070ae00310cecce19de3e78a97a1e5e6a811dc4f",
|
|||
|
|
"子查询1-event-d0957ead1b9500d90439fadf53ca6d5d58b72becd642111d1a4d0755b7904b7a",
|
|||
|
|
"子查询1-event-0cf85d9b8c37bed23b06ce5a4829a0764cd5bae9e497791a3705256db90f1a10",
|
|||
|
|
"子查询1-text-c7cd68334f44bbedbe19e9dac291514f61aff4e90858ef2901d8c3459fc94219",
|
|||
|
|
"子查询2-event-f81ab568ce6cfce72175a1087db911f899752c622460211efdc350d6c3167149",
|
|||
|
|
"子查询2-event-774a6133f9a25821d10ebab0d1745ac30d14a4016da4d3548b102f265e633a22",
|
|||
|
|
"子查询2-event-5be46591a0a7ccd7266c2f0961280fd5df89d16e316f123585ebe001f09c5fe1",
|
|||
|
|
"子查询2-event-0b602ca1699621754c4663ee33fbd14c65e56f98f892a180bf49d5c5d4bb45c3",
|
|||
|
|
"子查询2-event-c9742cba92598eed28ba36b049ac0e5f07c662764f5466218959605695b8a530",
|
|||
|
|
"子查询2-event-3cdd327d19e8912738212fb94992b711185abb92bb53dcdaf0fbd9d55553a3c3",
|
|||
|
|
"子查询2-event-1578f029da85aa8bf25b11ce5f36f1ce67b9ae446cddd2266825a5881685226a",
|
|||
|
|
"子查询2-event-cdc6337c8984c01a1379d9afa19eeb4ba81660be38053a846e0f250baf04ee62",
|
|||
|
|
"子查询2-event-90d9024251e5a8cdeca241f0c6166214b4243126f3384975deec9474b31cf45a",
|
|||
|
|
"子查询2-event-f8d46e99bb67396a63859ea3eafb0dd619b62f57c9337d2e223051e0d4f9a200",
|
|||
|
|
"子查询2-text-da7aaabf868de83a9fc286404d784e30982b7ba7a5e56c5c1707922e5e39dcf1",
|
|||
|
|
"子查询2-text-114fe591e33e8bff142be610475d8035339e334932dc35fd2e89ff078d10fe52",
|
|||
|
|
"子查询2-text-9c60e1d67a9be847f2b2e95f859a18bf9940b7854a020b276d921f9caa0bc7a6"
|
|||
|
|
],
|
|||
|
|
"pagerank_data_available": true,
|
|||
|
|
"pagerank_summary": {},
|
|||
|
|
"concept_exploration_results": {},
|
|||
|
|
"exploration_round": 0,
|
|||
|
|
"debug_info": {
|
|||
|
|
"total_time": 17.56701159477234,
|
|||
|
|
"retrieval_calls": 1,
|
|||
|
|
"llm_calls": 4,
|
|||
|
|
"langsmith_project": "api-20250912_002816",
|
|||
|
|
"token_usage_summary": {
|
|||
|
|
"has_llm": true,
|
|||
|
|
"has_generator": true,
|
|||
|
|
"last_call": {
|
|||
|
|
"prompt_tokens": 3943,
|
|||
|
|
"completion_tokens": 200,
|
|||
|
|
"total_tokens": 4143
|
|||
|
|
},
|
|||
|
|
"total_usage": {
|
|||
|
|
"prompt_tokens": 4531,
|
|||
|
|
"completion_tokens": 223,
|
|||
|
|
"total_tokens": 4754,
|
|||
|
|
"call_count": 2
|
|||
|
|
},
|
|||
|
|
"model_name": "qwen-plus",
|
|||
|
|
"has_last_usage": true,
|
|||
|
|
"has_total_usage": true
|
|||
|
|
},
|
|||
|
|
"complexity_analysis": {
|
|||
|
|
"is_complex": true,
|
|||
|
|
"complexity_level": "complex",
|
|||
|
|
"confidence": 0.95,
|
|||
|
|
"reason": "这是一个复杂查询,因为它包含了两个不同的主题:混沌工程的定义和DataOps的定义。这两个主题分别属于不同的领域,需要分别查找和理解,因此需要生成多个子查询来回答。"
|
|||
|
|
},
|
|||
|
|
"debug_mode_analysis": {
|
|||
|
|
"debug_mode": "0",
|
|||
|
|
"debug_override": {},
|
|||
|
|
"path_override_applied": false
|
|||
|
|
},
|
|||
|
|
"sufficiency_analysis": {
|
|||
|
|
"final_sufficiency": true,
|
|||
|
|
"sufficiency_check_details": {
|
|||
|
|
"is_sufficient": true,
|
|||
|
|
"confidence": 0.9,
|
|||
|
|
"reason": "事件信息和段落信息包含了回答查询所需的关键内容,包括混沌工程的定义、基本原则、发展历程以及DataOps的概念、目标、应用场景和实施挑战等。",
|
|||
|
|
"iteration": 0
|
|||
|
|
},
|
|||
|
|
"iteration_sufficiency_history": [],
|
|||
|
|
"sufficiency_progression": {
|
|||
|
|
"status": "no_sufficiency_checks"
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
"routing_analysis": {
|
|||
|
|
"total_routing_decisions": 1,
|
|||
|
|
"sub_query_generation_count": 0,
|
|||
|
|
"parallel_retrieval_count": 0,
|
|||
|
|
"pagerank_collection_count": 0
|
|||
|
|
},
|
|||
|
|
"concept_exploration_analysis": {
|
|||
|
|
"exploration_enabled": false,
|
|||
|
|
"exploration_rounds": 0,
|
|||
|
|
"pagerank_nodes_analyzed": 0,
|
|||
|
|
"successful_branches_total": 0,
|
|||
|
|
"total_branches_attempted": 0
|
|||
|
|
}
|
|||
|
|
},
|
|||
|
|
"iteration_history": [
|
|||
|
|
{
|
|||
|
|
"iteration": 0,
|
|||
|
|
"query": "并行检索: 原始查询 + 2 个子查询",
|
|||
|
|
"passages_count": 36,
|
|||
|
|
"action": "retrieval"
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"iteration": 0,
|
|||
|
|
"action": "sufficiency_check",
|
|||
|
|
"is_sufficient": true,
|
|||
|
|
"confidence": 0.9,
|
|||
|
|
"sub_queries_count": 0
|
|||
|
|
},
|
|||
|
|
{
|
|||
|
|
"iteration": 0,
|
|||
|
|
"action": "final_answer_generation",
|
|||
|
|
"answer_length": 375
|
|||
|
|
}
|
|||
|
|
]
|
|||
|
|
}
|