Files
AIEC-new/AIEC-RAG/retriver/langsmith/json_langsmith/langsmith_full_20250925_140600.json
2025-10-17 09:31:28 +08:00

978 lines
87 KiB
JSON
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"query": "什么是rag系统",
"answer": "RAG系统全称为双随机成熟度模型Dual Random Maturity Model是一个用于评估和提高业务系统在时间和场景不确定情况下风险防控能力的框架。以下是关于RAG系统的详细解答\n\n### 什么是RAG系统\nRAG系统主要由以下几个关键概念组成\n- **故障场景随机能力RA_FS**:衡量应用对特定故障场景的时间随机能力的支持程度。具体分为四个等级:\n - **任意时间随机**:系统能在任意时间注入故障,业务确保无损或及时恢复。\n - **交易日特定时间随机**:系统在交易日的特定时间段注入故障,业务仍确保无损或及时恢复。\n - **非交易日随机**:系统在非交易日注入故障,业务同样确保无损或及时恢复。\n - **不支持随机**:系统不支持随机注入故障,一旦故障出现可能导致业务异常或无法快速恢复。\n- **部署单元双随机成熟度DRD_DU**:衡量系统下特定部署单元的双随机能力,涉及故障场景矩阵、权重和特定故障场景的评估。\n- **系统双随机成熟度DRD_AS**:衡量应用系统整体的双随机能力,评估应用系统的整体风险防控能力。\n\n### RAG系统的工作原理及其实现\nRAG系统通过以下步骤实现故障场景随机能力和部署单元双随机成熟度的计算\n1. **故障场景矩阵构建**:根据业务特性与系统建设阶段构建故障场景矩阵,涵盖各种可能的故障类型与场景。\n2. **时间随机能力定级**:对故障场景进行时间随机能力的定级,分为任意时间随机、交易日特定时间随机、非交易日随机和不支持随机四个等级。\n3. **部署单元评估**:针对每个部署单元,评估其在故障场景矩阵中的双随机能力,计算部署单元双随机成熟度。\n4. **系统整体评估**:汇总所有部署单元的双随机成熟度,计算系统双随机成熟度,以评估应用系统的整体风险防控能力。\n\n### 实际应用场景\nRAG系统在多个领域有着广泛的应用包括但不限于\n- **金融行业**如华泰证券采用RAG系统评估其混沌工程双随机成熟度模型以提高系统稳定性与故障应对能力。\n- **云计算与数据中心**:通过引入混沌工程,实现对基础设施的深入测试,提高系统的可靠性和稳定性。\n- **软件开发与运维**在开发和运维过程中利用RAG系统来评估和优化系统的故障应对能力确保在不确定条件下业务的连续性。\n\n### 提升系统稳定性和故障应对能力\n通过实施RAG系统组织能够\n- **量化风险**:通过时间随机能力的定级,量化不同故障场景对系统的影响程度。\n- **优化部署**:通过部署单元双随机成熟度的评估,优化系统的部署策略,提高系统的整体稳定性。\n- **持续改进**:定期进行双随机能力的检验与例行检验,确保系统在面对未知故障时能够保持稳定运行。\n- **增强业务连续性**:通过模拟各种故障场景,提前识别和准备相应的应急策略,减少业务中断的可能性。\n\n综上所述RAG系统提供了一套全面的框架帮助企业或组织在复杂多变的环境中通过定量评估和持续优化显著提升系统的稳定性和对故障的应对能力。",
"query_complexity": {
"is_complex": true,
"complexity_level": "complex",
"confidence": 0.95,
"reason": "这是一个复杂查询因为用户询问的是关于RAG系统的概念。RAG系统可能涉及到多个方面例如其在信息检索、知识图谱构建、自然语言处理等领域的作用和应用。为了全面回答这个问题可能需要生成多个子查询来覆盖RAG系统的不同维度包括其工作原理、应用场景、技术实现等方面。"
},
"is_complex_query": true,
"iterations": 1,
"total_passages": 47,
"sub_queries": [
"什么是RAG系统",
"RAG系统的工作原理是什么",
"RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力"
],
"decomposed_sub_queries": [
"什么是RAG系统",
"RAG系统的工作原理是什么"
],
"sufficiency_check": {
"is_sufficient": true,
"confidence": 0.9,
"reason": "事件信息和段落信息包含了回答查询所需的关键内容包括RAG系统的工作原理、RAG系统在不同场景下的应用和评估方法等。",
"iteration": 1
},
"is_sufficient": true,
"supporting_facts": [
[
"Fact_1",
"蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态"
],
[
"Fact_2",
"进行测试评估模型验证。"
],
[
"Fact_3",
"云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取"
],
[
"Fact_4",
"滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用"
],
[
"Fact_5",
"Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查"
],
[
"Fact_6",
"东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。"
],
[
"Fact_7",
"进行模型训练。"
],
[
"Fact_8",
"平台运维功能需求。"
],
[
"Fact_9",
"完善测试评估方法与规则。"
],
[
"Fact_10",
"制定分布实施计划"
]
],
"supporting_events": [],
"debug_info": {
"total_time": 0,
"retrieval_calls": 2,
"llm_calls": 7,
"token_usage": {
"has_llm": true,
"has_generator": true,
"last_call": {
"prompt_tokens": 5576,
"completion_tokens": 711,
"total_tokens": 6287
},
"total_usage": {
"prompt_tokens": 116430,
"completion_tokens": 6488,
"total_tokens": 122918,
"call_count": 42
},
"model_name": "qwen2-7b-instruct",
"has_last_usage": true,
"has_total_usage": true
}
},
"all_documents": [
{
"page_content": "蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"metadata": {
"node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"graph_node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"node_type": "event",
"ppr_score": 1.078856637985766e-06,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 1,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "进行测试评估模型验证。",
"metadata": {
"node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"graph_node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"node_type": "event",
"ppr_score": 6.400781511681461e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"metadata": {
"node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"graph_node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"node_type": "event",
"ppr_score": 4.3418035922489897e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 3,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"metadata": {
"node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"graph_node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"node_type": "event",
"ppr_score": 4.1870812039794013e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 4,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查",
"metadata": {
"node_id": "ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"graph_node_id": "ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"node_type": "event",
"ppr_score": 3.7074606527733825e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"metadata": {
"node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"graph_node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"node_type": "event",
"ppr_score": 3.694064809279057e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "进行模型训练。",
"metadata": {
"node_id": "df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"graph_node_id": "df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "平台运维功能需求。",
"metadata": {
"node_id": "3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"graph_node_id": "3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 8,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "完善测试评估方法与规则。",
"metadata": {
"node_id": "4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"graph_node_id": "4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 9,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "制定分布实施计划",
"metadata": {
"node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"graph_node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"node_type": "event",
"ppr_score": 2.887736961847779e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 10,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"metadata": {
"node_id": "dd5197f51f6021ef9044b96b2fa07a0729111c6e048f0c24449cbf6be6369ec5",
"node_type": "text",
"ppr_score": 0.051251718658492394,
"edge_score": 0.0,
"passage_score": 0.076101035,
"rank": 11,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "数字越大, 表明风险越大越值得优先重视和积极改善。RPN 的数值由三个参数 相乘得到,分别是严重度(Severity)、发生频率/可能性(Occurrence/ Probability )、识别难易程度(Detection)。在评估后,要综合考虑,严 重度和发生度矩阵,严重度和可识别度矩阵,发生频率和可识别度矩 阵。还需评估风险和故障对系统的可用性、数据丢失、财务成本和业 务中断有什么影响。 确定应用程序响应和恢复程序。对于每种故障模式,确定应用程 序将如何响应和恢复。考虑在成本与应用程序复杂程度之间作出折衷。 评估后,企业应优先考虑高等级故障并定义缓解措施,并不断更新和 审查。 ### 2.BCM RA 风险评估是业务连续性管理工作中的重要环节,是对各方面风险 进行辨识和分析的过程,是对威胁、资源、脆弱性及三者相互作用的 结果进行评估。评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。",
"metadata": {
"node_id": "7ddb41a16d2c78b1aa5d3524ba9b717ee8a0f32b54947624fa1785987747b161",
"node_type": "text",
"ppr_score": 0.05099583892777976,
"edge_score": 0.0,
"passage_score": 0.075718905,
"rank": 12,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。混沌工程前利用BCM 中的RA 方法进行自检的价值:建立对业 务运行环境的整体认识,了解业务连续运行所面临的各类潜在风险因 素,识别影响业务大范围中断的关键风险场景;分析各业务系统运行 所面临的首要风险场景,识别风险发生的可能性,并定性描述可能造 成的损失;根据风险评估结果,对关键风险场景提出风险管控措施, 对于处置后仍在不可接受范围内的残余风险提出进一步处置策略,可 围绕评估出的关键风险场景,在专项预案编制过程中有针对性的进行 应急处置流程设计,同时可以作为混沌工程实验的重点。 ### 3.FTA 故障树是一种特殊的倒立树状的逻辑因果关系图。故障树分析Fault Tree Analysis, FTA是以一个不希望发生的产品故障事件或灾害性危险事件即顶事件作为分析的对象通过由上向下的严格按层次 的故障因果逻辑分析,逐层找出故障事件的必要而充分的直接原因,画出故障树,最终找出导致顶事件发生的所有可能原因和原因组合,在有基础数据时可计算出顶事件发生的概率和底事件重要度。 ![](images/a9b5af5b974c4d25d0358df03bf4db87886abf29c36d52b0abe72300649ded7d.jpg) 1961 年, FTA 由美国贝尔电话研究室的华特先生首先提出的。",
"metadata": {
"node_id": "28bc0692b60ed668688fd58d9c5163a6e923a177125a5782164888844e061a2e",
"node_type": "text",
"ppr_score": 0.05063678893756968,
"edge_score": 0.0,
"passage_score": 0.07518748,
"rank": 13,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"metadata": {
"node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"graph_node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"node_type": "event",
"ppr_score": 1.0564743243185571e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "按计划部署",
"metadata": {
"node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"graph_node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"node_type": "event",
"ppr_score": 5.833311202196603e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "1998年组建信产部。",
"metadata": {
"node_id": "006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"graph_node_id": "006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"node_type": "event",
"ppr_score": 5.813227407106867e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "贵州省人民政府办公厅于2023年6月发布《贵州省政务数据资源管理办法》。",
"metadata": {
"node_id": "71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"graph_node_id": "71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"node_type": "event",
"ppr_score": 5.355534664475652e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "1994年邮电部实行邮电分营。",
"metadata": {
"node_id": "a4bfec0430a945b451f4d2a4d56638ad0d75304d4f47c9441f745cf3b1a268b1",
"graph_node_id": "a4bfec0430a945b451f4d2a4d56638ad0d75304d4f47c9441f745cf3b1a268b1",
"node_type": "event",
"ppr_score": 4.82914480107628e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 8,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "2022年5月黑龙江省人大常委会发布《黑龙江省促进大数据发展应用条例》。",
"metadata": {
"node_id": "0f5d8bb9a91217c45c257bc473f63cb729fe03b41c4573d523459fa2af6dc7bd",
"graph_node_id": "0f5d8bb9a91217c45c257bc473f63cb729fe03b41c4573d523459fa2af6dc7bd",
"node_type": "event",
"ppr_score": 4.714749078577141e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 9,
"source": "hipporag2_langchain_event",
"source_text_id": "['fa5dd0b6f3b57d07d08ba0730a4540c59b6d99d05153b35f1f3cd5227ea07907']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "2008年组建工信部。",
"metadata": {
"node_id": "4c975a923b633c445c92b3b66acf1719602314d1ef6cf8dedd1aab5f28c3ce04",
"graph_node_id": "4c975a923b633c445c92b3b66acf1719602314d1ef6cf8dedd1aab5f28c3ce04",
"node_type": "event",
"ppr_score": 4.668835571500824e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 10,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "jpg) 包括DNS服务器、负载均衡器、交换机等 该平台具有以下几个特点: 1适配全栈式异构金融云基础设施 完成了跨平台及“一体多芯”式的混编架构中故障注入体系的建 设,提供云上资源自助、自动构建、自动发布、自动运维、快速扩容、 多环境一致等场景,实现流程自动化,使开发人员能够更多地专注在 业务功能的实现和创新上,大幅提高了应用的交付效率,提升了业务 产品推出效率和竞争力。2引入“一隔离两最小化”实现权限隔离和管控 通过 RBAC 实现不同应用系统间沙箱容器的混沌故障隔离;引入 k8s Operator 机制,根据演练需求为沙箱容器进行权限控制,实现 权限最小化,同时通过集群调度限制混沌环境的范围,实现爆炸半径 最小化。分布式系统及微服务架构下,实现更细粒度的权限控制,有 效避免了不同应用系统同时实施混沌工程造成“环境污染”的风险, 同时也保障了不同应用系统间故障注入的原子能力。 (3) 混淆工具链与异构环境相融合 将四类主流混沌工具引入到异构金融云环境中,全栈式适配底层 复杂基础设施,解决了工具集合的离线部署、内核及版本不兼容、混 淀工具与多种操作系统及容器云运行时适配等疑难问题。同时将混沌 工具链融合在异构环境中,提供更多样化的故障类型,能够针对不同 的故障类型,推荐使用适配的注入工具,使故障注入更加精准化。",
"metadata": {
"node_id": "5f593c4a4c8b89a95644375ee4952d1a4acc08146262cb3a56d5376db5ee1713",
"node_type": "text",
"ppr_score": 0.04462080921944727,
"edge_score": 0.0,
"passage_score": 0.07549548,
"rank": 11,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"metadata": {
"node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"graph_node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"node_type": "event",
"ppr_score": 9.677533661185788e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 1,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "组织为顺利完成零信任战略实施需提供保障措施",
"metadata": {
"node_id": "a8025588f491624f93a05f3d00e9d8bc6bfabe27849d93c0a7e6d4af56a193b5",
"graph_node_id": "a8025588f491624f93a05f3d00e9d8bc6bfabe27849d93c0a7e6d4af56a193b5",
"node_type": "event",
"ppr_score": 8.530278580732463e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"metadata": {
"node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"graph_node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"node_type": "event",
"ppr_score": 6.074736821040184e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 3,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"metadata": {
"node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"graph_node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"node_type": "event",
"ppr_score": 5.657475274005974e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 4,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"metadata": {
"node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"graph_node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"node_type": "event",
"ppr_score": 5.4951594498737656e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"metadata": {
"node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"graph_node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"node_type": "event",
"ppr_score": 4.5099239279794966e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "贵州省人民政府办公厅于2023年6月发布《贵州省政务数据资源管理办法》。",
"metadata": {
"node_id": "71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"graph_node_id": "71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"node_type": "event",
"ppr_score": 4.38670196101888e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "制定分布实施计划",
"metadata": {
"node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"graph_node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"node_type": "event",
"ppr_score": 4.298229306881708e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 8,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "按计划部署",
"metadata": {
"node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"graph_node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"node_type": "event",
"ppr_score": 3.919071591079128e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 9,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "进行测试评估模型验证。",
"metadata": {
"node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"graph_node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"node_type": "event",
"ppr_score": 3.644673178069653e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 10,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "### 2.定级时间随机能力 为了便于衡量应用系统对不同业务场景的时间随机水平,需要进 行时间随机能力定级,我们结合证券类应用的运行特点,将时间随机 能力定为如下4 个等级。 任意时间随机。指系统具有非常强的双随机能力,可以在任意时 间注入故障,业务可以确保无损或及时恢复; 交易日特定时间随机。指系统具有较强的双随机能力,考虑到故障的影响等因素,可以在交易日的特定时间段注入故障,业务可以确保无损或及时恢复。 非交易日随机。指系统具备双随机能力,考虑到故障的影响等因素,可以在非交易日注入故障,业务可以确保无损或及时恢复。 不支持随机。指系统不具备随机能力,一旦故障出现,会导致业 务异常或者无法快速恢复。 ### 3.构建成熟度模型 管理学大师德鲁克曾经说过,如果你无法度量它,就无法管理它, 进而无法进行有效的改进。双随机成熟度模型可以客观检验和评价业 务系统在时间、场景不固定情况下的风险防控能力。 故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。",
"metadata": {
"node_id": "48315127d15ebfb940f8e9eb02efb44a8b024d1721c6f7c87a771f47d9471754",
"node_type": "text",
"ppr_score": 0.04831388365197983,
"edge_score": 0.0,
"passage_score": 0.07718155,
"rank": 11,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"metadata": {
"node_id": "dd5197f51f6021ef9044b96b2fa07a0729111c6e048f0c24449cbf6be6369ec5",
"node_type": "text",
"ppr_score": 0.038412040044995564,
"edge_score": 0.0,
"passage_score": 0.08028323500000001,
"rank": 12,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "要将实验后果最小化并加以控制会使用到根因分析算法包含时间、注入IP、调用链等同时混沌工程可作为一种主动制造故障的方式还可以验证与提升根因分析算法的准确率与召回率。 ### 2.混沌工程组织价值 通常企业的 IT 部门中架构、开发、测试、运维团队都是各司其 职,完成指定的相关领域工作。架构团队从各种不同架构角度设计审 视核心系统,包括组件、技术选型等,也会关注少部分的系统稳定性 相关能力;而开发主要是则一般是单纯按照技术文档实现相应功能, 一般很少主动关注所开发组件的稳定性,除非需要开发相关特性或有 成熟的能力;测试团队以功能测试和性能测试为主,可靠性测试还是 以系统中的可靠性特性做有针对性的测试,不会进行故障场景的深挖; 运维团队往往是对系统稳定性了解最清楚的,因为他们遇到的软硬件 问题是最多的,他们最大的问题就是不知道系统中都会存在哪些故障? 如何快速处理?只能堆人力解决问题,是最不高效的一种方式。 我们需要将业务系统的稳定性问题分解出来,各个团队需要认识 到各种故障场景对业务的影响是什么?是否有监控恢复手段?应急 预案是否完备?那么就需要有改变。 混沌工程改变了企业 IT 团队的思考方式,促使各团队在设计、 开发、测试等过程中增加了对故障的考虑:在架构设计的时候考虑一 类故障的监控、恢复、业务的 HA开发过程中审视出现故障时故障 的快速跟踪定位;测试需要覆盖的故障场景更加全面;运维清楚在出 现某种故障时业务的表现是什么,应该如何进行恢复,应急预案是否 完备。 混沌工程提供了同一个认知体系内的方法论,将架构、开发、测 试、运维等团队之间工作推动盘活起来。",
"metadata": {
"node_id": "e0030c5183f95b1b207ff609e1c7f2a9c8486bf190eae5d9937f5324b9ed0584",
"node_type": "text",
"ppr_score": 0.009948217661734012,
"edge_score": 0.0,
"passage_score": 0.07902341000000002,
"rank": 13,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统在哪些实际应用场景中被应用能举几个例子说明RAG系统如何帮助提高系统稳定性和故障应对能力",
"pagerank_available": true
}
},
{
"page_content": "东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"metadata": {
"node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"graph_node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"node_type": "event",
"ppr_score": 1.3924205044200936e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 1,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
},
{
"page_content": "青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"metadata": {
"node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"graph_node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"node_type": "event",
"ppr_score": 1.0564743243185571e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
},
{
"page_content": "蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"metadata": {
"node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"graph_node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"node_type": "event",
"ppr_score": 9.10248791126777e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 3,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
},
{
"page_content": "云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"metadata": {
"node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"graph_node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"node_type": "event",
"ppr_score": 7.678002157579536e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 4,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
},
{
"page_content": "按计划部署",
"metadata": {
"node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"graph_node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"node_type": "event",
"ppr_score": 5.833311202196603e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
},
{
"page_content": "1998年组建信产部。",
"metadata": {
"node_id": "006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"graph_node_id": "006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"node_type": "event",
"ppr_score": 5.813227407106867e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
},
{
"page_content": "贵州省人民政府办公厅于2023年6月发布《贵州省政务数据资源管理办法》。",
"metadata": {
"node_id": "71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"graph_node_id": "71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"node_type": "event",
"ppr_score": 5.355534664475652e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
},
{
"page_content": "1994年邮电部实行邮电分营。",
"metadata": {
"node_id": "a4bfec0430a945b451f4d2a4d56638ad0d75304d4f47c9441f745cf3b1a268b1",
"graph_node_id": "a4bfec0430a945b451f4d2a4d56638ad0d75304d4f47c9441f745cf3b1a268b1",
"node_type": "event",
"ppr_score": 4.82914480107628e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 8,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
},
{
"page_content": "2022年5月黑龙江省人大常委会发布《黑龙江省促进大数据发展应用条例》。",
"metadata": {
"node_id": "0f5d8bb9a91217c45c257bc473f63cb729fe03b41c4573d523459fa2af6dc7bd",
"graph_node_id": "0f5d8bb9a91217c45c257bc473f63cb729fe03b41c4573d523459fa2af6dc7bd",
"node_type": "event",
"ppr_score": 4.714749078577141e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 9,
"source": "hipporag2_langchain_event",
"source_text_id": "['fa5dd0b6f3b57d07d08ba0730a4540c59b6d99d05153b35f1f3cd5227ea07907']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
},
{
"page_content": "2008年组建工信部。",
"metadata": {
"node_id": "4c975a923b633c445c92b3b66acf1719602314d1ef6cf8dedd1aab5f28c3ce04",
"graph_node_id": "4c975a923b633c445c92b3b66acf1719602314d1ef6cf8dedd1aab5f28c3ce04",
"node_type": "event",
"ppr_score": 4.668835571500824e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 10,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
},
{
"page_content": "故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"metadata": {
"node_id": "dd5197f51f6021ef9044b96b2fa07a0729111c6e048f0c24449cbf6be6369ec5",
"node_type": "text",
"ppr_score": 0.08095179780040924,
"edge_score": 0.0,
"passage_score": 0.087121485,
"rank": 11,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
},
{
"page_content": "### 2.定级时间随机能力 为了便于衡量应用系统对不同业务场景的时间随机水平,需要进 行时间随机能力定级,我们结合证券类应用的运行特点,将时间随机 能力定为如下4 个等级。 任意时间随机。指系统具有非常强的双随机能力,可以在任意时 间注入故障,业务可以确保无损或及时恢复; 交易日特定时间随机。指系统具有较强的双随机能力,考虑到故障的影响等因素,可以在交易日的特定时间段注入故障,业务可以确保无损或及时恢复。 非交易日随机。指系统具备双随机能力,考虑到故障的影响等因素,可以在非交易日注入故障,业务可以确保无损或及时恢复。 不支持随机。指系统不具备随机能力,一旦故障出现,会导致业 务异常或者无法快速恢复。 ### 3.构建成熟度模型 管理学大师德鲁克曾经说过,如果你无法度量它,就无法管理它, 进而无法进行有效的改进。双随机成熟度模型可以客观检验和评价业 务系统在时间、场景不固定情况下的风险防控能力。 故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。",
"metadata": {
"node_id": "48315127d15ebfb940f8e9eb02efb44a8b024d1721c6f7c87a771f47d9471754",
"node_type": "text",
"ppr_score": 0.021244042181050558,
"edge_score": 0.0,
"passage_score": 0.08243748000000001,
"rank": 12,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
},
{
"page_content": "附件:案例 # 一、华泰证券混沌工程实践案例 ## (一)背景介绍 应用系统在生产环境长期运行过程中,会受到各种不可预知的事 件的影响,例如配置参数修改、软件代码缺陷、负载流量增加、硬件 网络故障,异常数据引入等,有些业务场景会随着影响的引入而逐渐 失效。考虑到分布式系统的复杂性和业务场景的多样性,要想完全评 估清楚对业务场景的全部影响是很困难的。如何实现业务场景影响从 主观评估到客观测量的转换?华泰证券结合证券行业生产系统运维 经验和混沌工程相关理念提出了混沌工程双随机成熟度模型。 ## (二)概念定义 混沌工程双随机成熟度模型中的双随机指的是“场景随机”和“时 间随机”,如果某系统具备双随机能力,用户可以在故障场景定义的 范围内的任意时间注入任意故障,业务应当无损或者快速执行恢复动 作。 场景随机。随着分布式成为主流的系统架构设计方案,业务系统的 迭代速度越来越快,后端系统架构变得越来越复杂,需要根据业务 特性和应用系统建设的阶段,构建故障场景矩阵,并基于故障场景矩 阵评估业务对故障场景的应对能力。所谓场景随机,就是说对于故障 场景矩阵中的任一故障场景,如果系统支持随机能力,则该系统的任 何一个部署单元或集群节点触发该故障,业务都应当无损或者能够快 速执行恢复动作。 时间随机。根据业务系统提供的功能不同,系统的服务周期以及在不同周期的重要程度也会有所不同。所谓时间随机,就是说如果系统对某故障场景支持特定时间随机,则在特定时间范围内触发该故障,业务应当无损或者能够快速执行恢复动作。",
"metadata": {
"node_id": "0649fee117452299bdc7901418fcad61a5573641a7dc95150299b55e42021dcd",
"node_type": "text",
"ppr_score": 0.0033840736331189536,
"edge_score": 0.0,
"passage_score": 0.08221022,
"rank": 13,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统的工作原理是什么它如何实现故障场景随机能力和部署单元双随机成熟度的计算",
"pagerank_available": true
}
}
],
"all_passages": [
"蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"进行测试评估模型验证。",
"云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查",
"东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"进行模型训练。",
"平台运维功能需求。",
"完善测试评估方法与规则。",
"制定分布实施计划",
"故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"数字越大, 表明风险越大越值得优先重视和积极改善。RPN 的数值由三个参数 相乘得到,分别是严重度(Severity)、发生频率/可能性(Occurrence/ Probability )、识别难易程度(Detection)。在评估后,要综合考虑,严 重度和发生度矩阵,严重度和可识别度矩阵,发生频率和可识别度矩 阵。还需评估风险和故障对系统的可用性、数据丢失、财务成本和业 务中断有什么影响。 确定应用程序响应和恢复程序。对于每种故障模式,确定应用程 序将如何响应和恢复。考虑在成本与应用程序复杂程度之间作出折衷。 评估后,企业应优先考虑高等级故障并定义缓解措施,并不断更新和 审查。 ### 2.BCM RA 风险评估是业务连续性管理工作中的重要环节,是对各方面风险 进行辨识和分析的过程,是对威胁、资源、脆弱性及三者相互作用的 结果进行评估。评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。",
"评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。混沌工程前利用BCM 中的RA 方法进行自检的价值:建立对业 务运行环境的整体认识,了解业务连续运行所面临的各类潜在风险因 素,识别影响业务大范围中断的关键风险场景;分析各业务系统运行 所面临的首要风险场景,识别风险发生的可能性,并定性描述可能造 成的损失;根据风险评估结果,对关键风险场景提出风险管控措施, 对于处置后仍在不可接受范围内的残余风险提出进一步处置策略,可 围绕评估出的关键风险场景,在专项预案编制过程中有针对性的进行 应急处置流程设计,同时可以作为混沌工程实验的重点。 ### 3.FTA 故障树是一种特殊的倒立树状的逻辑因果关系图。故障树分析Fault Tree Analysis, FTA是以一个不希望发生的产品故障事件或灾害性危险事件即顶事件作为分析的对象通过由上向下的严格按层次 的故障因果逻辑分析,逐层找出故障事件的必要而充分的直接原因,画出故障树,最终找出导致顶事件发生的所有可能原因和原因组合,在有基础数据时可计算出顶事件发生的概率和底事件重要度。 ![](images/a9b5af5b974c4d25d0358df03bf4db87886abf29c36d52b0abe72300649ded7d.jpg) 1961 年, FTA 由美国贝尔电话研究室的华特先生首先提出的。",
"青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"按计划部署",
"1998年组建信产部。",
"贵州省人民政府办公厅于2023年6月发布《贵州省政务数据资源管理办法》。",
"1994年邮电部实行邮电分营。",
"2022年5月黑龙江省人大常委会发布《黑龙江省促进大数据发展应用条例》。",
"2008年组建工信部。",
"jpg) 包括DNS服务器、负载均衡器、交换机等 该平台具有以下几个特点: 1适配全栈式异构金融云基础设施 完成了跨平台及“一体多芯”式的混编架构中故障注入体系的建 设,提供云上资源自助、自动构建、自动发布、自动运维、快速扩容、 多环境一致等场景,实现流程自动化,使开发人员能够更多地专注在 业务功能的实现和创新上,大幅提高了应用的交付效率,提升了业务 产品推出效率和竞争力。2引入“一隔离两最小化”实现权限隔离和管控 通过 RBAC 实现不同应用系统间沙箱容器的混沌故障隔离;引入 k8s Operator 机制,根据演练需求为沙箱容器进行权限控制,实现 权限最小化,同时通过集群调度限制混沌环境的范围,实现爆炸半径 最小化。分布式系统及微服务架构下,实现更细粒度的权限控制,有 效避免了不同应用系统同时实施混沌工程造成“环境污染”的风险, 同时也保障了不同应用系统间故障注入的原子能力。 (3) 混淆工具链与异构环境相融合 将四类主流混沌工具引入到异构金融云环境中,全栈式适配底层 复杂基础设施,解决了工具集合的离线部署、内核及版本不兼容、混 淀工具与多种操作系统及容器云运行时适配等疑难问题。同时将混沌 工具链融合在异构环境中,提供更多样化的故障类型,能够针对不同 的故障类型,推荐使用适配的注入工具,使故障注入更加精准化。",
"蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"组织为顺利完成零信任战略实施需提供保障措施",
"云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"贵州省人民政府办公厅于2023年6月发布《贵州省政务数据资源管理办法》。",
"制定分布实施计划",
"按计划部署",
"进行测试评估模型验证。",
"### 2.定级时间随机能力 为了便于衡量应用系统对不同业务场景的时间随机水平,需要进 行时间随机能力定级,我们结合证券类应用的运行特点,将时间随机 能力定为如下4 个等级。 任意时间随机。指系统具有非常强的双随机能力,可以在任意时 间注入故障,业务可以确保无损或及时恢复; 交易日特定时间随机。指系统具有较强的双随机能力,考虑到故障的影响等因素,可以在交易日的特定时间段注入故障,业务可以确保无损或及时恢复。 非交易日随机。指系统具备双随机能力,考虑到故障的影响等因素,可以在非交易日注入故障,业务可以确保无损或及时恢复。 不支持随机。指系统不具备随机能力,一旦故障出现,会导致业 务异常或者无法快速恢复。 ### 3.构建成熟度模型 管理学大师德鲁克曾经说过,如果你无法度量它,就无法管理它, 进而无法进行有效的改进。双随机成熟度模型可以客观检验和评价业 务系统在时间、场景不固定情况下的风险防控能力。 故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。",
"故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"要将实验后果最小化并加以控制会使用到根因分析算法包含时间、注入IP、调用链等同时混沌工程可作为一种主动制造故障的方式还可以验证与提升根因分析算法的准确率与召回率。 ### 2.混沌工程组织价值 通常企业的 IT 部门中架构、开发、测试、运维团队都是各司其 职,完成指定的相关领域工作。架构团队从各种不同架构角度设计审 视核心系统,包括组件、技术选型等,也会关注少部分的系统稳定性 相关能力;而开发主要是则一般是单纯按照技术文档实现相应功能, 一般很少主动关注所开发组件的稳定性,除非需要开发相关特性或有 成熟的能力;测试团队以功能测试和性能测试为主,可靠性测试还是 以系统中的可靠性特性做有针对性的测试,不会进行故障场景的深挖; 运维团队往往是对系统稳定性了解最清楚的,因为他们遇到的软硬件 问题是最多的,他们最大的问题就是不知道系统中都会存在哪些故障? 如何快速处理?只能堆人力解决问题,是最不高效的一种方式。 我们需要将业务系统的稳定性问题分解出来,各个团队需要认识 到各种故障场景对业务的影响是什么?是否有监控恢复手段?应急 预案是否完备?那么就需要有改变。 混沌工程改变了企业 IT 团队的思考方式,促使各团队在设计、 开发、测试等过程中增加了对故障的考虑:在架构设计的时候考虑一 类故障的监控、恢复、业务的 HA开发过程中审视出现故障时故障 的快速跟踪定位;测试需要覆盖的故障场景更加全面;运维清楚在出 现某种故障时业务的表现是什么,应该如何进行恢复,应急预案是否 完备。 混沌工程提供了同一个认知体系内的方法论,将架构、开发、测 试、运维等团队之间工作推动盘活起来。",
"东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"按计划部署",
"1998年组建信产部。",
"贵州省人民政府办公厅于2023年6月发布《贵州省政务数据资源管理办法》。",
"1994年邮电部实行邮电分营。",
"2022年5月黑龙江省人大常委会发布《黑龙江省促进大数据发展应用条例》。",
"2008年组建工信部。",
"故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"### 2.定级时间随机能力 为了便于衡量应用系统对不同业务场景的时间随机水平,需要进 行时间随机能力定级,我们结合证券类应用的运行特点,将时间随机 能力定为如下4 个等级。 任意时间随机。指系统具有非常强的双随机能力,可以在任意时 间注入故障,业务可以确保无损或及时恢复; 交易日特定时间随机。指系统具有较强的双随机能力,考虑到故障的影响等因素,可以在交易日的特定时间段注入故障,业务可以确保无损或及时恢复。 非交易日随机。指系统具备双随机能力,考虑到故障的影响等因素,可以在非交易日注入故障,业务可以确保无损或及时恢复。 不支持随机。指系统不具备随机能力,一旦故障出现,会导致业 务异常或者无法快速恢复。 ### 3.构建成熟度模型 管理学大师德鲁克曾经说过,如果你无法度量它,就无法管理它, 进而无法进行有效的改进。双随机成熟度模型可以客观检验和评价业 务系统在时间、场景不固定情况下的风险防控能力。 故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。",
"附件:案例 # 一、华泰证券混沌工程实践案例 ## (一)背景介绍 应用系统在生产环境长期运行过程中,会受到各种不可预知的事 件的影响,例如配置参数修改、软件代码缺陷、负载流量增加、硬件 网络故障,异常数据引入等,有些业务场景会随着影响的引入而逐渐 失效。考虑到分布式系统的复杂性和业务场景的多样性,要想完全评 估清楚对业务场景的全部影响是很困难的。如何实现业务场景影响从 主观评估到客观测量的转换?华泰证券结合证券行业生产系统运维 经验和混沌工程相关理念提出了混沌工程双随机成熟度模型。 ## (二)概念定义 混沌工程双随机成熟度模型中的双随机指的是“场景随机”和“时 间随机”,如果某系统具备双随机能力,用户可以在故障场景定义的 范围内的任意时间注入任意故障,业务应当无损或者快速执行恢复动 作。 场景随机。随着分布式成为主流的系统架构设计方案,业务系统的 迭代速度越来越快,后端系统架构变得越来越复杂,需要根据业务 特性和应用系统建设的阶段,构建故障场景矩阵,并基于故障场景矩 阵评估业务对故障场景的应对能力。所谓场景随机,就是说对于故障 场景矩阵中的任一故障场景,如果系统支持随机能力,则该系统的任 何一个部署单元或集群节点触发该故障,业务都应当无损或者能够快 速执行恢复动作。 时间随机。根据业务系统提供的功能不同,系统的服务周期以及在不同周期的重要程度也会有所不同。所谓时间随机,就是说如果系统对某故障场景支持特定时间随机,则在特定时间范围内触发该故障,业务应当无损或者能够快速执行恢复动作。"
],
"passage_sources": [
"子查询1-event-837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"子查询1-event-fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"子查询1-event-52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"子查询1-event-8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"子查询1-event-ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"子查询1-event-71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"子查询1-event-df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"子查询1-event-3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"子查询1-event-4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"子查询1-event-e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"子查询1-text-dd5197f51f6021ef9044b96b2fa07a0729111c6e048f0c24449cbf6be6369ec5",
"子查询1-text-7ddb41a16d2c78b1aa5d3524ba9b717ee8a0f32b54947624fa1785987747b161",
"子查询1-text-28bc0692b60ed668688fd58d9c5163a6e923a177125a5782164888844e061a2e",
"子查询2-event-0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"子查询2-event-597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"子查询2-event-006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"子查询2-event-71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"子查询2-event-a4bfec0430a945b451f4d2a4d56638ad0d75304d4f47c9441f745cf3b1a268b1",
"子查询2-event-0f5d8bb9a91217c45c257bc473f63cb729fe03b41c4573d523459fa2af6dc7bd",
"子查询2-event-4c975a923b633c445c92b3b66acf1719602314d1ef6cf8dedd1aab5f28c3ce04",
"子查询2-text-5f593c4a4c8b89a95644375ee4952d1a4acc08146262cb3a56d5376db5ee1713",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown"
],
"retrieval_path": "unknown",
"initial_retrieval_details": {},
"current_sub_queries": []
}