first commit

This commit is contained in:
闫旭隆
2025-10-17 09:31:28 +08:00
commit 4698145045
589 changed files with 196795 additions and 0 deletions

View File

@ -0,0 +1,978 @@
{
"query": "什么是rag系统",
"answer": "RAG系统全称为Rag System通常指的是在IT运维和故障管理领域中用来评估和提升系统在特定故障场景下的随机能力和成熟度的一种方法论。以下是对RAG系统工作原理、应用场景以及其在故障场景随机能力和双随机成熟度评估中的角色的综合解答\n\n### RAG系统的工作原理\n\nRAG系统的核心在于对应用系统进行双随机成熟度的评估以确保系统在面对未知或不可预见的故障时能保持稳定运行。双随机成熟度主要包含两个方面\n\n1. **场景随机**:系统能够随机触发任何预定义的故障场景,且在触发故障后能够保证业务无损或快速恢复。\n2. **时间随机**:系统能够在特定的时间范围内随机触发故障,同样保证业务的无损或快速恢复。\n\n评估过程通常涉及以下步骤\n - **故障场景矩阵构建**:基于业务特性与系统架构,定义一系列可能的故障场景。\n - **时间随机能力定级**:将时间随机能力划分为四个等级,如任意时间随机、交易日特定时间随机、非交易日随机、不支持随机等。\n - **评估与检验**:组织业务角色评估每个故障场景下的时间随机能力等级,通过故障演练验证评估结果,确保一致性。\n - **例行检验**:设定定期的例行检验任务,持续监控和确认双随机能力的有效性。\n\n### 应用场景\n\nRAG系统广泛应用于云原生时代的企业级IT运维中特别是金融、互联网、电信等行业以提升系统韧性、降低故障影响、优化灾难恢复流程。具体应用包括但不限于\n\n- **云原生可观测性平台**如蚂蚁集团推出的HoloInsight、云杉网络的DeepFlow、滴滴的夜莺Nightingale等这些平台整合了数据采集、洞察分析、智能告警等功能旨在帮助用户全面监控和管理复杂的软件堆栈和业务状态。\n- **任务调度系统**如Analysys发布的DolphinScheduler提供复杂任务调度和依赖管理功能同时也包含监控和告警功能帮助用户确保任务可靠执行。\n- **数据管理与运营政策**东营市、青岛市等地政府发布的数据运营管理办法体现了在公共数据管理和运营中引入RAG系统以提升数据治理和业务连续性的重要性。\n\n### 故障场景随机能力和双随机成熟度评估的角色\n\n在故障场景随机能力和双随机成熟度评估中RAG系统扮演着关键角色\n- **风险防控**:通过评估双随机能力,企业可以识别和量化潜在风险,为系统设计和维护提供依据,确保在面对故障时能够快速恢复,减少业务中断。\n- **混沌工程实践**在混沌工程中RAG系统帮助企业在可控环境下模拟各种故障场景测试系统的抗压能力提前发现和修复潜在问题提高系统的稳健性和弹性。\n- **业务连续性管理**通过RA风险评估方法企业可以对资源和业务系统进行全面风险分析识别关键风险场景制定针对性的管控措施增强业务连续性。\n\n综上所述RAG系统是现代IT运维体系中的重要组成部分它通过系统化的方法评估和提升系统在故障场景下的随机能力和成熟度从而增强系统的稳定性、可靠性和业务连续性为企业提供更加安全、高效、灵活的IT基础设施和服务。",
"query_complexity": {
"is_complex": true,
"complexity_level": "complex",
"confidence": 0.95,
"reason": "这是一个复杂查询因为用户询问的是关于RAG系统的整体概念。RAG系统可能涉及到多个领域的知识包括但不限于人工智能、自然语言处理、知识管理等。为了全面解答可能需要生成多个子查询来覆盖不同方面例如系统的工作原理、应用场景、技术实现等。"
},
"is_complex_query": true,
"iterations": 1,
"total_passages": 47,
"sub_queries": [
"什么是RAG系统",
"RAG系统的工作原理是什么",
"RAG系统是什么它在哪些领域中有应用",
"RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色"
],
"decomposed_sub_queries": [
"什么是RAG系统",
"RAG系统的工作原理是什么"
],
"sufficiency_check": {
"is_sufficient": true,
"confidence": 0.9,
"reason": "事件信息和段落信息包含了回答查询所需的关键内容包括RAG系统的定义、工作原理、应用场景以及相关的评估方法和实践案例。",
"iteration": 1
},
"is_sufficient": true,
"supporting_facts": [
[
"Fact_1",
"蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态"
],
[
"Fact_2",
"进行测试评估模型验证。"
],
[
"Fact_3",
"云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取"
],
[
"Fact_4",
"滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用"
],
[
"Fact_5",
"Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查"
],
[
"Fact_6",
"东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。"
],
[
"Fact_7",
"进行模型训练。"
],
[
"Fact_8",
"平台运维功能需求。"
],
[
"Fact_9",
"完善测试评估方法与规则。"
],
[
"Fact_10",
"制定分布实施计划"
]
],
"supporting_events": [],
"debug_info": {
"total_time": 0,
"retrieval_calls": 2,
"llm_calls": 7,
"token_usage": {
"has_llm": true,
"has_generator": true,
"last_call": {
"prompt_tokens": 5548,
"completion_tokens": 711,
"total_tokens": 6259
},
"total_usage": {
"prompt_tokens": 133159,
"completion_tokens": 7497,
"total_tokens": 140656,
"call_count": 48
},
"model_name": "qwen2-7b-instruct",
"has_last_usage": true,
"has_total_usage": true
}
},
"all_documents": [
{
"page_content": "蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"metadata": {
"node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"graph_node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"node_type": "event",
"ppr_score": 1.078856637985766e-06,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 1,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "进行测试评估模型验证。",
"metadata": {
"node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"graph_node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"node_type": "event",
"ppr_score": 6.400781511681461e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"metadata": {
"node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"graph_node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"node_type": "event",
"ppr_score": 4.3418035922489897e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 3,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"metadata": {
"node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"graph_node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"node_type": "event",
"ppr_score": 4.1870812039794013e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 4,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查",
"metadata": {
"node_id": "ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"graph_node_id": "ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"node_type": "event",
"ppr_score": 3.7074606527733825e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"metadata": {
"node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"graph_node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"node_type": "event",
"ppr_score": 3.694064809279057e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "进行模型训练。",
"metadata": {
"node_id": "df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"graph_node_id": "df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "平台运维功能需求。",
"metadata": {
"node_id": "3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"graph_node_id": "3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 8,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "完善测试评估方法与规则。",
"metadata": {
"node_id": "4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"graph_node_id": "4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 9,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "制定分布实施计划",
"metadata": {
"node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"graph_node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"node_type": "event",
"ppr_score": 2.887736961847779e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 10,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"metadata": {
"node_id": "dd5197f51f6021ef9044b96b2fa07a0729111c6e048f0c24449cbf6be6369ec5",
"node_type": "text",
"ppr_score": 0.051251718658492394,
"edge_score": 0.0,
"passage_score": 0.076101035,
"rank": 11,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "数字越大, 表明风险越大越值得优先重视和积极改善。RPN 的数值由三个参数 相乘得到,分别是严重度(Severity)、发生频率/可能性(Occurrence/ Probability )、识别难易程度(Detection)。在评估后,要综合考虑,严 重度和发生度矩阵,严重度和可识别度矩阵,发生频率和可识别度矩 阵。还需评估风险和故障对系统的可用性、数据丢失、财务成本和业 务中断有什么影响。 确定应用程序响应和恢复程序。对于每种故障模式,确定应用程 序将如何响应和恢复。考虑在成本与应用程序复杂程度之间作出折衷。 评估后,企业应优先考虑高等级故障并定义缓解措施,并不断更新和 审查。 ### 2.BCM RA 风险评估是业务连续性管理工作中的重要环节,是对各方面风险 进行辨识和分析的过程,是对威胁、资源、脆弱性及三者相互作用的 结果进行评估。评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。",
"metadata": {
"node_id": "7ddb41a16d2c78b1aa5d3524ba9b717ee8a0f32b54947624fa1785987747b161",
"node_type": "text",
"ppr_score": 0.05099583892777976,
"edge_score": 0.0,
"passage_score": 0.075718905,
"rank": 12,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。混沌工程前利用BCM 中的RA 方法进行自检的价值:建立对业 务运行环境的整体认识,了解业务连续运行所面临的各类潜在风险因 素,识别影响业务大范围中断的关键风险场景;分析各业务系统运行 所面临的首要风险场景,识别风险发生的可能性,并定性描述可能造 成的损失;根据风险评估结果,对关键风险场景提出风险管控措施, 对于处置后仍在不可接受范围内的残余风险提出进一步处置策略,可 围绕评估出的关键风险场景,在专项预案编制过程中有针对性的进行 应急处置流程设计,同时可以作为混沌工程实验的重点。 ### 3.FTA 故障树是一种特殊的倒立树状的逻辑因果关系图。故障树分析Fault Tree Analysis, FTA是以一个不希望发生的产品故障事件或灾害性危险事件即顶事件作为分析的对象通过由上向下的严格按层次 的故障因果逻辑分析,逐层找出故障事件的必要而充分的直接原因,画出故障树,最终找出导致顶事件发生的所有可能原因和原因组合,在有基础数据时可计算出顶事件发生的概率和底事件重要度。 ![](images/a9b5af5b974c4d25d0358df03bf4db87886abf29c36d52b0abe72300649ded7d.jpg) 1961 年, FTA 由美国贝尔电话研究室的华特先生首先提出的。",
"metadata": {
"node_id": "28bc0692b60ed668688fd58d9c5163a6e923a177125a5782164888844e061a2e",
"node_type": "text",
"ppr_score": 0.05063678893756968,
"edge_score": 0.0,
"passage_score": 0.07518748,
"rank": 13,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"metadata": {
"node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"graph_node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"node_type": "event",
"ppr_score": 1.0564743243185571e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "按计划部署",
"metadata": {
"node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"graph_node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"node_type": "event",
"ppr_score": 5.833311202196603e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "1998年组建信产部。",
"metadata": {
"node_id": "006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"graph_node_id": "006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"node_type": "event",
"ppr_score": 5.813227407106867e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "贵州省人民政府办公厅于2023年6月发布《贵州省政务数据资源管理办法》。",
"metadata": {
"node_id": "71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"graph_node_id": "71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"node_type": "event",
"ppr_score": 5.355534664475652e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "1994年邮电部实行邮电分营。",
"metadata": {
"node_id": "a4bfec0430a945b451f4d2a4d56638ad0d75304d4f47c9441f745cf3b1a268b1",
"graph_node_id": "a4bfec0430a945b451f4d2a4d56638ad0d75304d4f47c9441f745cf3b1a268b1",
"node_type": "event",
"ppr_score": 4.82914480107628e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 8,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "2022年5月黑龙江省人大常委会发布《黑龙江省促进大数据发展应用条例》。",
"metadata": {
"node_id": "0f5d8bb9a91217c45c257bc473f63cb729fe03b41c4573d523459fa2af6dc7bd",
"graph_node_id": "0f5d8bb9a91217c45c257bc473f63cb729fe03b41c4573d523459fa2af6dc7bd",
"node_type": "event",
"ppr_score": 4.714749078577141e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 9,
"source": "hipporag2_langchain_event",
"source_text_id": "['fa5dd0b6f3b57d07d08ba0730a4540c59b6d99d05153b35f1f3cd5227ea07907']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "2008年组建工信部。",
"metadata": {
"node_id": "4c975a923b633c445c92b3b66acf1719602314d1ef6cf8dedd1aab5f28c3ce04",
"graph_node_id": "4c975a923b633c445c92b3b66acf1719602314d1ef6cf8dedd1aab5f28c3ce04",
"node_type": "event",
"ppr_score": 4.668835571500824e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 10,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "jpg) 包括DNS服务器、负载均衡器、交换机等 该平台具有以下几个特点: 1适配全栈式异构金融云基础设施 完成了跨平台及“一体多芯”式的混编架构中故障注入体系的建 设,提供云上资源自助、自动构建、自动发布、自动运维、快速扩容、 多环境一致等场景,实现流程自动化,使开发人员能够更多地专注在 业务功能的实现和创新上,大幅提高了应用的交付效率,提升了业务 产品推出效率和竞争力。2引入“一隔离两最小化”实现权限隔离和管控 通过 RBAC 实现不同应用系统间沙箱容器的混沌故障隔离;引入 k8s Operator 机制,根据演练需求为沙箱容器进行权限控制,实现 权限最小化,同时通过集群调度限制混沌环境的范围,实现爆炸半径 最小化。分布式系统及微服务架构下,实现更细粒度的权限控制,有 效避免了不同应用系统同时实施混沌工程造成“环境污染”的风险, 同时也保障了不同应用系统间故障注入的原子能力。 (3) 混淆工具链与异构环境相融合 将四类主流混沌工具引入到异构金融云环境中,全栈式适配底层 复杂基础设施,解决了工具集合的离线部署、内核及版本不兼容、混 淀工具与多种操作系统及容器云运行时适配等疑难问题。同时将混沌 工具链融合在异构环境中,提供更多样化的故障类型,能够针对不同 的故障类型,推荐使用适配的注入工具,使故障注入更加精准化。",
"metadata": {
"node_id": "5f593c4a4c8b89a95644375ee4952d1a4acc08146262cb3a56d5376db5ee1713",
"node_type": "text",
"ppr_score": 0.04462080921944727,
"edge_score": 0.0,
"passage_score": 0.07549548,
"rank": 11,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"metadata": {
"node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"graph_node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"node_type": "event",
"ppr_score": 1.078856637985766e-06,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 1,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "进行测试评估模型验证。",
"metadata": {
"node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"graph_node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"node_type": "event",
"ppr_score": 6.400781511681461e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"metadata": {
"node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"graph_node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"node_type": "event",
"ppr_score": 4.3418035922489897e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 3,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"metadata": {
"node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"graph_node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"node_type": "event",
"ppr_score": 4.1870812039794013e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 4,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查",
"metadata": {
"node_id": "ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"graph_node_id": "ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"node_type": "event",
"ppr_score": 3.7074606527733825e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"metadata": {
"node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"graph_node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"node_type": "event",
"ppr_score": 3.694064809279057e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "进行模型训练。",
"metadata": {
"node_id": "df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"graph_node_id": "df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "平台运维功能需求。",
"metadata": {
"node_id": "3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"graph_node_id": "3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 8,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "完善测试评估方法与规则。",
"metadata": {
"node_id": "4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"graph_node_id": "4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 9,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "制定分布实施计划",
"metadata": {
"node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"graph_node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"node_type": "event",
"ppr_score": 2.887736961847779e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 10,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"metadata": {
"node_id": "dd5197f51f6021ef9044b96b2fa07a0729111c6e048f0c24449cbf6be6369ec5",
"node_type": "text",
"ppr_score": 0.050599412663736854,
"edge_score": 0.0,
"passage_score": 0.077549435,
"rank": 11,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。混沌工程前利用BCM 中的RA 方法进行自检的价值:建立对业 务运行环境的整体认识,了解业务连续运行所面临的各类潜在风险因 素,识别影响业务大范围中断的关键风险场景;分析各业务系统运行 所面临的首要风险场景,识别风险发生的可能性,并定性描述可能造 成的损失;根据风险评估结果,对关键风险场景提出风险管控措施, 对于处置后仍在不可接受范围内的残余风险提出进一步处置策略,可 围绕评估出的关键风险场景,在专项预案编制过程中有针对性的进行 应急处置流程设计,同时可以作为混沌工程实验的重点。 ### 3.FTA 故障树是一种特殊的倒立树状的逻辑因果关系图。故障树分析Fault Tree Analysis, FTA是以一个不希望发生的产品故障事件或灾害性危险事件即顶事件作为分析的对象通过由上向下的严格按层次 的故障因果逻辑分析,逐层找出故障事件的必要而充分的直接原因,画出故障树,最终找出导致顶事件发生的所有可能原因和原因组合,在有基础数据时可计算出顶事件发生的概率和底事件重要度。 ![](images/a9b5af5b974c4d25d0358df03bf4db87886abf29c36d52b0abe72300649ded7d.jpg) 1961 年, FTA 由美国贝尔电话研究室的华特先生首先提出的。",
"metadata": {
"node_id": "28bc0692b60ed668688fd58d9c5163a6e923a177125a5782164888844e061a2e",
"node_type": "text",
"ppr_score": 0.05038587315500791,
"edge_score": 0.0,
"passage_score": 0.07722167,
"rank": 12,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "数字越大, 表明风险越大越值得优先重视和积极改善。RPN 的数值由三个参数 相乘得到,分别是严重度(Severity)、发生频率/可能性(Occurrence/ Probability )、识别难易程度(Detection)。在评估后,要综合考虑,严 重度和发生度矩阵,严重度和可识别度矩阵,发生频率和可识别度矩 阵。还需评估风险和故障对系统的可用性、数据丢失、财务成本和业 务中断有什么影响。 确定应用程序响应和恢复程序。对于每种故障模式,确定应用程 序将如何响应和恢复。考虑在成本与应用程序复杂程度之间作出折衷。 评估后,企业应优先考虑高等级故障并定义缓解措施,并不断更新和 审查。 ### 2.BCM RA 风险评估是业务连续性管理工作中的重要环节,是对各方面风险 进行辨识和分析的过程,是对威胁、资源、脆弱性及三者相互作用的 结果进行评估。评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。",
"metadata": {
"node_id": "7ddb41a16d2c78b1aa5d3524ba9b717ee8a0f32b54947624fa1785987747b161",
"node_type": "text",
"ppr_score": 0.0503132403334232,
"edge_score": 0.0,
"passage_score": 0.07710858500000001,
"rank": 13,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统是什么它在哪些领域中有应用",
"pagerank_available": true
}
},
{
"page_content": "蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"metadata": {
"node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"graph_node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"node_type": "event",
"ppr_score": 9.677533661185788e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 1,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
},
{
"page_content": "组织为顺利完成零信任战略实施需提供保障措施",
"metadata": {
"node_id": "a8025588f491624f93a05f3d00e9d8bc6bfabe27849d93c0a7e6d4af56a193b5",
"graph_node_id": "a8025588f491624f93a05f3d00e9d8bc6bfabe27849d93c0a7e6d4af56a193b5",
"node_type": "event",
"ppr_score": 8.530278580732463e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
},
{
"page_content": "云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"metadata": {
"node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"graph_node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"node_type": "event",
"ppr_score": 6.074736821040184e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 3,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
},
{
"page_content": "滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"metadata": {
"node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"graph_node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"node_type": "event",
"ppr_score": 5.657475274005974e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 4,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
},
{
"page_content": "青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"metadata": {
"node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"graph_node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"node_type": "event",
"ppr_score": 5.4951594498737656e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
},
{
"page_content": "东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"metadata": {
"node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"graph_node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"node_type": "event",
"ppr_score": 4.5099239279794966e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
},
{
"page_content": "贵州省人民政府办公厅于2023年6月发布《贵州省政务数据资源管理办法》。",
"metadata": {
"node_id": "71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"graph_node_id": "71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"node_type": "event",
"ppr_score": 4.38670196101888e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
},
{
"page_content": "制定分布实施计划",
"metadata": {
"node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"graph_node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"node_type": "event",
"ppr_score": 4.298229306881708e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 8,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
},
{
"page_content": "按计划部署",
"metadata": {
"node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"graph_node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"node_type": "event",
"ppr_score": 3.919071591079128e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 9,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
},
{
"page_content": "进行测试评估模型验证。",
"metadata": {
"node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"graph_node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"node_type": "event",
"ppr_score": 3.644673178069653e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 10,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
},
{
"page_content": "### 2.定级时间随机能力 为了便于衡量应用系统对不同业务场景的时间随机水平,需要进 行时间随机能力定级,我们结合证券类应用的运行特点,将时间随机 能力定为如下4 个等级。 任意时间随机。指系统具有非常强的双随机能力,可以在任意时 间注入故障,业务可以确保无损或及时恢复; 交易日特定时间随机。指系统具有较强的双随机能力,考虑到故障的影响等因素,可以在交易日的特定时间段注入故障,业务可以确保无损或及时恢复。 非交易日随机。指系统具备双随机能力,考虑到故障的影响等因素,可以在非交易日注入故障,业务可以确保无损或及时恢复。 不支持随机。指系统不具备随机能力,一旦故障出现,会导致业 务异常或者无法快速恢复。 ### 3.构建成熟度模型 管理学大师德鲁克曾经说过,如果你无法度量它,就无法管理它, 进而无法进行有效的改进。双随机成熟度模型可以客观检验和评价业 务系统在时间、场景不固定情况下的风险防控能力。 故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。",
"metadata": {
"node_id": "48315127d15ebfb940f8e9eb02efb44a8b024d1721c6f7c87a771f47d9471754",
"node_type": "text",
"ppr_score": 0.04878275873127676,
"edge_score": 0.0,
"passage_score": 0.08207336500000001,
"rank": 11,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
},
{
"page_content": "故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"metadata": {
"node_id": "dd5197f51f6021ef9044b96b2fa07a0729111c6e048f0c24449cbf6be6369ec5",
"node_type": "text",
"ppr_score": 0.0390059242364369,
"edge_score": 0.0,
"passage_score": 0.08630073,
"rank": 12,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
},
{
"page_content": "附件:案例 # 一、华泰证券混沌工程实践案例 ## (一)背景介绍 应用系统在生产环境长期运行过程中,会受到各种不可预知的事 件的影响,例如配置参数修改、软件代码缺陷、负载流量增加、硬件 网络故障,异常数据引入等,有些业务场景会随着影响的引入而逐渐 失效。考虑到分布式系统的复杂性和业务场景的多样性,要想完全评 估清楚对业务场景的全部影响是很困难的。如何实现业务场景影响从 主观评估到客观测量的转换?华泰证券结合证券行业生产系统运维 经验和混沌工程相关理念提出了混沌工程双随机成熟度模型。 ## (二)概念定义 混沌工程双随机成熟度模型中的双随机指的是“场景随机”和“时 间随机”,如果某系统具备双随机能力,用户可以在故障场景定义的 范围内的任意时间注入任意故障,业务应当无损或者快速执行恢复动 作。 场景随机。随着分布式成为主流的系统架构设计方案,业务系统的 迭代速度越来越快,后端系统架构变得越来越复杂,需要根据业务 特性和应用系统建设的阶段,构建故障场景矩阵,并基于故障场景矩 阵评估业务对故障场景的应对能力。所谓场景随机,就是说对于故障 场景矩阵中的任一故障场景,如果系统支持随机能力,则该系统的任 何一个部署单元或集群节点触发该故障,业务都应当无损或者能够快 速执行恢复动作。 时间随机。根据业务系统提供的功能不同,系统的服务周期以及在不同周期的重要程度也会有所不同。所谓时间随机,就是说如果系统对某故障场景支持特定时间随机,则在特定时间范围内触发该故障,业务应当无损或者能够快速执行恢复动作。",
"metadata": {
"node_id": "0649fee117452299bdc7901418fcad61a5573641a7dc95150299b55e42021dcd",
"node_type": "text",
"ppr_score": 0.0101533076750192,
"edge_score": 0.0,
"passage_score": 0.08205899500000001,
"rank": 13,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统的工作原理是如何实现的它在故障场景随机能力和双随机成熟度评估中扮演什么角色",
"pagerank_available": true
}
}
],
"all_passages": [
"蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"进行测试评估模型验证。",
"云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查",
"东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"进行模型训练。",
"平台运维功能需求。",
"完善测试评估方法与规则。",
"制定分布实施计划",
"故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"数字越大, 表明风险越大越值得优先重视和积极改善。RPN 的数值由三个参数 相乘得到,分别是严重度(Severity)、发生频率/可能性(Occurrence/ Probability )、识别难易程度(Detection)。在评估后,要综合考虑,严 重度和发生度矩阵,严重度和可识别度矩阵,发生频率和可识别度矩 阵。还需评估风险和故障对系统的可用性、数据丢失、财务成本和业 务中断有什么影响。 确定应用程序响应和恢复程序。对于每种故障模式,确定应用程 序将如何响应和恢复。考虑在成本与应用程序复杂程度之间作出折衷。 评估后,企业应优先考虑高等级故障并定义缓解措施,并不断更新和 审查。 ### 2.BCM RA 风险评估是业务连续性管理工作中的重要环节,是对各方面风险 进行辨识和分析的过程,是对威胁、资源、脆弱性及三者相互作用的 结果进行评估。评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。",
"评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。混沌工程前利用BCM 中的RA 方法进行自检的价值:建立对业 务运行环境的整体认识,了解业务连续运行所面临的各类潜在风险因 素,识别影响业务大范围中断的关键风险场景;分析各业务系统运行 所面临的首要风险场景,识别风险发生的可能性,并定性描述可能造 成的损失;根据风险评估结果,对关键风险场景提出风险管控措施, 对于处置后仍在不可接受范围内的残余风险提出进一步处置策略,可 围绕评估出的关键风险场景,在专项预案编制过程中有针对性的进行 应急处置流程设计,同时可以作为混沌工程实验的重点。 ### 3.FTA 故障树是一种特殊的倒立树状的逻辑因果关系图。故障树分析Fault Tree Analysis, FTA是以一个不希望发生的产品故障事件或灾害性危险事件即顶事件作为分析的对象通过由上向下的严格按层次 的故障因果逻辑分析,逐层找出故障事件的必要而充分的直接原因,画出故障树,最终找出导致顶事件发生的所有可能原因和原因组合,在有基础数据时可计算出顶事件发生的概率和底事件重要度。 ![](images/a9b5af5b974c4d25d0358df03bf4db87886abf29c36d52b0abe72300649ded7d.jpg) 1961 年, FTA 由美国贝尔电话研究室的华特先生首先提出的。",
"青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"按计划部署",
"1998年组建信产部。",
"贵州省人民政府办公厅于2023年6月发布《贵州省政务数据资源管理办法》。",
"1994年邮电部实行邮电分营。",
"2022年5月黑龙江省人大常委会发布《黑龙江省促进大数据发展应用条例》。",
"2008年组建工信部。",
"jpg) 包括DNS服务器、负载均衡器、交换机等 该平台具有以下几个特点: 1适配全栈式异构金融云基础设施 完成了跨平台及“一体多芯”式的混编架构中故障注入体系的建 设,提供云上资源自助、自动构建、自动发布、自动运维、快速扩容、 多环境一致等场景,实现流程自动化,使开发人员能够更多地专注在 业务功能的实现和创新上,大幅提高了应用的交付效率,提升了业务 产品推出效率和竞争力。2引入“一隔离两最小化”实现权限隔离和管控 通过 RBAC 实现不同应用系统间沙箱容器的混沌故障隔离;引入 k8s Operator 机制,根据演练需求为沙箱容器进行权限控制,实现 权限最小化,同时通过集群调度限制混沌环境的范围,实现爆炸半径 最小化。分布式系统及微服务架构下,实现更细粒度的权限控制,有 效避免了不同应用系统同时实施混沌工程造成“环境污染”的风险, 同时也保障了不同应用系统间故障注入的原子能力。 (3) 混淆工具链与异构环境相融合 将四类主流混沌工具引入到异构金融云环境中,全栈式适配底层 复杂基础设施,解决了工具集合的离线部署、内核及版本不兼容、混 淀工具与多种操作系统及容器云运行时适配等疑难问题。同时将混沌 工具链融合在异构环境中,提供更多样化的故障类型,能够针对不同 的故障类型,推荐使用适配的注入工具,使故障注入更加精准化。",
"蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"进行测试评估模型验证。",
"云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查",
"东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"进行模型训练。",
"平台运维功能需求。",
"完善测试评估方法与规则。",
"制定分布实施计划",
"故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。混沌工程前利用BCM 中的RA 方法进行自检的价值:建立对业 务运行环境的整体认识,了解业务连续运行所面临的各类潜在风险因 素,识别影响业务大范围中断的关键风险场景;分析各业务系统运行 所面临的首要风险场景,识别风险发生的可能性,并定性描述可能造 成的损失;根据风险评估结果,对关键风险场景提出风险管控措施, 对于处置后仍在不可接受范围内的残余风险提出进一步处置策略,可 围绕评估出的关键风险场景,在专项预案编制过程中有针对性的进行 应急处置流程设计,同时可以作为混沌工程实验的重点。 ### 3.FTA 故障树是一种特殊的倒立树状的逻辑因果关系图。故障树分析Fault Tree Analysis, FTA是以一个不希望发生的产品故障事件或灾害性危险事件即顶事件作为分析的对象通过由上向下的严格按层次 的故障因果逻辑分析,逐层找出故障事件的必要而充分的直接原因,画出故障树,最终找出导致顶事件发生的所有可能原因和原因组合,在有基础数据时可计算出顶事件发生的概率和底事件重要度。 ![](images/a9b5af5b974c4d25d0358df03bf4db87886abf29c36d52b0abe72300649ded7d.jpg) 1961 年, FTA 由美国贝尔电话研究室的华特先生首先提出的。",
"数字越大, 表明风险越大越值得优先重视和积极改善。RPN 的数值由三个参数 相乘得到,分别是严重度(Severity)、发生频率/可能性(Occurrence/ Probability )、识别难易程度(Detection)。在评估后,要综合考虑,严 重度和发生度矩阵,严重度和可识别度矩阵,发生频率和可识别度矩 阵。还需评估风险和故障对系统的可用性、数据丢失、财务成本和业 务中断有什么影响。 确定应用程序响应和恢复程序。对于每种故障模式,确定应用程 序将如何响应和恢复。考虑在成本与应用程序复杂程度之间作出折衷。 评估后,企业应优先考虑高等级故障并定义缓解措施,并不断更新和 审查。 ### 2.BCM RA 风险评估是业务连续性管理工作中的重要环节,是对各方面风险 进行辨识和分析的过程,是对威胁、资源、脆弱性及三者相互作用的 结果进行评估。评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。",
"蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"组织为顺利完成零信任战略实施需提供保障措施",
"云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"贵州省人民政府办公厅于2023年6月发布《贵州省政务数据资源管理办法》。",
"制定分布实施计划",
"按计划部署",
"进行测试评估模型验证。",
"### 2.定级时间随机能力 为了便于衡量应用系统对不同业务场景的时间随机水平,需要进 行时间随机能力定级,我们结合证券类应用的运行特点,将时间随机 能力定为如下4 个等级。 任意时间随机。指系统具有非常强的双随机能力,可以在任意时 间注入故障,业务可以确保无损或及时恢复; 交易日特定时间随机。指系统具有较强的双随机能力,考虑到故障的影响等因素,可以在交易日的特定时间段注入故障,业务可以确保无损或及时恢复。 非交易日随机。指系统具备双随机能力,考虑到故障的影响等因素,可以在非交易日注入故障,业务可以确保无损或及时恢复。 不支持随机。指系统不具备随机能力,一旦故障出现,会导致业 务异常或者无法快速恢复。 ### 3.构建成熟度模型 管理学大师德鲁克曾经说过,如果你无法度量它,就无法管理它, 进而无法进行有效的改进。双随机成熟度模型可以客观检验和评价业 务系统在时间、场景不固定情况下的风险防控能力。 故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。",
"故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"附件:案例 # 一、华泰证券混沌工程实践案例 ## (一)背景介绍 应用系统在生产环境长期运行过程中,会受到各种不可预知的事 件的影响,例如配置参数修改、软件代码缺陷、负载流量增加、硬件 网络故障,异常数据引入等,有些业务场景会随着影响的引入而逐渐 失效。考虑到分布式系统的复杂性和业务场景的多样性,要想完全评 估清楚对业务场景的全部影响是很困难的。如何实现业务场景影响从 主观评估到客观测量的转换?华泰证券结合证券行业生产系统运维 经验和混沌工程相关理念提出了混沌工程双随机成熟度模型。 ## (二)概念定义 混沌工程双随机成熟度模型中的双随机指的是“场景随机”和“时 间随机”,如果某系统具备双随机能力,用户可以在故障场景定义的 范围内的任意时间注入任意故障,业务应当无损或者快速执行恢复动 作。 场景随机。随着分布式成为主流的系统架构设计方案,业务系统的 迭代速度越来越快,后端系统架构变得越来越复杂,需要根据业务 特性和应用系统建设的阶段,构建故障场景矩阵,并基于故障场景矩 阵评估业务对故障场景的应对能力。所谓场景随机,就是说对于故障 场景矩阵中的任一故障场景,如果系统支持随机能力,则该系统的任 何一个部署单元或集群节点触发该故障,业务都应当无损或者能够快 速执行恢复动作。 时间随机。根据业务系统提供的功能不同,系统的服务周期以及在不同周期的重要程度也会有所不同。所谓时间随机,就是说如果系统对某故障场景支持特定时间随机,则在特定时间范围内触发该故障,业务应当无损或者能够快速执行恢复动作。"
],
"passage_sources": [
"子查询1-event-837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"子查询1-event-fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"子查询1-event-52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"子查询1-event-8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"子查询1-event-ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"子查询1-event-71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"子查询1-event-df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"子查询1-event-3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"子查询1-event-4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"子查询1-event-e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"子查询1-text-dd5197f51f6021ef9044b96b2fa07a0729111c6e048f0c24449cbf6be6369ec5",
"子查询1-text-7ddb41a16d2c78b1aa5d3524ba9b717ee8a0f32b54947624fa1785987747b161",
"子查询1-text-28bc0692b60ed668688fd58d9c5163a6e923a177125a5782164888844e061a2e",
"子查询2-event-0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"子查询2-event-597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"子查询2-event-006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"子查询2-event-71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"子查询2-event-a4bfec0430a945b451f4d2a4d56638ad0d75304d4f47c9441f745cf3b1a268b1",
"子查询2-event-0f5d8bb9a91217c45c257bc473f63cb729fe03b41c4573d523459fa2af6dc7bd",
"子查询2-event-4c975a923b633c445c92b3b66acf1719602314d1ef6cf8dedd1aab5f28c3ce04",
"子查询2-text-5f593c4a4c8b89a95644375ee4952d1a4acc08146262cb3a56d5376db5ee1713",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown"
],
"retrieval_path": "unknown",
"initial_retrieval_details": {},
"current_sub_queries": []
}