Files
AIEC-new/AIEC-RAG/retriver/langsmith/json_langsmith/langsmith_full_20250924_212738.json
2025-10-17 09:31:28 +08:00

978 lines
85 KiB
JSON
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"query": "什么是RAG系统",
"answer": "RAG系统主要指在云计算和软件技术栈领域中用于观测、监控和管理系统状态的一系列技术、平台或工具。这类系统通过整合数据采集、洞察分析、智能告警等功能帮助用户清晰地观测整个软件技术栈与业务的状态从而实现对系统健康状况的实时监控与管理。RAG系统通常具备以下特性\n\n### 工作原理与应用场景\n\n**工作原理**RAG系统的核心工作原理在于整合和分析来自不同来源的数据包括但不限于性能指标、日志、错误报告等通过智能化算法对数据进行处理和解读进而提供系统状态的实时监控、预测和诊断能力。这些系统往往具备以下功能\n\n- **数据采集**:收集系统运行过程中的各类数据。\n- **洞察分析**:对采集到的数据进行深入分析,提取关键指标和趋势。\n- **智能告警**:基于分析结果,设置阈值和规则,当系统状态偏离正常范围时,自动触发告警通知。\n\n**应用场景**RAG系统广泛应用于软件开发、运维、安全等领域具体包括但不限于\n\n- **软件技术栈与业务状态观测**:帮助开发者和运维人员实时监控应用程序、服务、基础设施等的健康状态,快速定位问题,提高响应速度。\n- **故障场景分析**:通过双随机成熟度模型等方法,评估系统在特定故障场景下的表现,提高系统的鲁棒性和可靠性。\n- **风险评估与管理**利用风险评估模型如RPN对系统进行风险分析提前识别威胁和脆弱性指导业务连续性管理BCM和混沌工程实践提升系统的稳定性和安全性。\n- **故障注入与混沌工程**:通过人为引入故障,模拟真实世界中的异常情况,检验系统的应急响应能力和自愈能力,从而优化系统设计和运维流程。\n\n### 成功应用案例\n\n- **蚂蚁集团推出的HoloInsight**作为云原生时代的轻量化、全功能的智能可观测性技术平台HoloInsight提供了一站式解决方案帮助用户清晰观测整个软件技术栈与业务状态。\n- **云杉网络的DeepFlow**基于eBPF实现的零插桩、全覆盖指标、追踪、日志采集功能配合智能标签技术实现高效的数据关联和存储提供全面的系统观测能力。\n- **滴滴推出的夜莺Nightingale**采用All-in-One设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成适用于顶级互联网公司的可观测性需求。\n- **Analysys发布的DolphinScheduler**:支持复杂任务调度和依赖管理的分布式任务调度系统,提供监控和告警功能,帮助用户实现任务的可靠执行和故障排查。\n\n这些系统和平台的成功应用不仅展示了RAG系统在提升系统监控能力、故障预防和恢复方面的巨大潜力同时也反映了它们在实际业务场景中的价值和重要性。",
"query_complexity": {
"is_complex": true,
"complexity_level": "complex",
"confidence": 0.95,
"reason": "这是一个复杂查询因为它涉及到对RAG系统的定义和理解。RAG系统可能指的是多种不同的系统或概念包括但不限于知识图谱构建、文档检索与生成、知识管理等。因此回答此查询可能需要从多个角度和来源获取信息并可能涉及到复合问题和关系型查询。"
},
"is_complex_query": true,
"iterations": 1,
"total_passages": 47,
"sub_queries": [
"RAG系统是什么",
"RAG系统的工作原理是什么",
"RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。"
],
"decomposed_sub_queries": [
"RAG系统是什么",
"RAG系统的工作原理是什么"
],
"sufficiency_check": {
"is_sufficient": false,
"confidence": 0.5,
"reason": "检索信息缺少某些关键内容具体包括1) 缺少RAG系统的工作原理的详细描述2) 缺少RAG系统在实际应用场景中的例子3) 缺少RAG系统与其他技术或系统的对比等...",
"iteration": 1
},
"is_sufficient": false,
"supporting_facts": [
[
"Fact_1",
"蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态"
],
[
"Fact_2",
"进行测试评估模型验证。"
],
[
"Fact_3",
"云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取"
],
[
"Fact_4",
"滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用"
],
[
"Fact_5",
"Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查"
],
[
"Fact_6",
"东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。"
],
[
"Fact_7",
"进行模型训练。"
],
[
"Fact_8",
"平台运维功能需求。"
],
[
"Fact_9",
"完善测试评估方法与规则。"
],
[
"Fact_10",
"制定分布实施计划"
]
],
"supporting_events": [],
"debug_info": {
"total_time": 0,
"retrieval_calls": 2,
"llm_calls": 7,
"token_usage": {
"has_llm": true,
"has_generator": true,
"last_call": {
"prompt_tokens": 5408,
"completion_tokens": 621,
"total_tokens": 6029
},
"total_usage": {
"prompt_tokens": 16479,
"completion_tokens": 980,
"total_tokens": 17459,
"call_count": 6
},
"model_name": "qwen2-7b-instruct",
"has_last_usage": true,
"has_total_usage": true
}
},
"all_documents": [
{
"page_content": "蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"metadata": {
"node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"graph_node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"node_type": "event",
"ppr_score": 1.078856637985766e-06,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 1,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "进行测试评估模型验证。",
"metadata": {
"node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"graph_node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"node_type": "event",
"ppr_score": 6.400781511681461e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"metadata": {
"node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"graph_node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"node_type": "event",
"ppr_score": 4.3418035922489897e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 3,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"metadata": {
"node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"graph_node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"node_type": "event",
"ppr_score": 4.1870812039794013e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 4,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查",
"metadata": {
"node_id": "ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"graph_node_id": "ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"node_type": "event",
"ppr_score": 3.7074606527733825e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"metadata": {
"node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"graph_node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"node_type": "event",
"ppr_score": 3.694064809279057e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "进行模型训练。",
"metadata": {
"node_id": "df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"graph_node_id": "df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "平台运维功能需求。",
"metadata": {
"node_id": "3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"graph_node_id": "3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 8,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "完善测试评估方法与规则。",
"metadata": {
"node_id": "4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"graph_node_id": "4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 9,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "制定分布实施计划",
"metadata": {
"node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"graph_node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"node_type": "event",
"ppr_score": 2.887736961847779e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 10,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"metadata": {
"node_id": "dd5197f51f6021ef9044b96b2fa07a0729111c6e048f0c24449cbf6be6369ec5",
"node_type": "text",
"ppr_score": 0.051251718658492394,
"edge_score": 0.0,
"passage_score": 0.076101035,
"rank": 11,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "数字越大, 表明风险越大越值得优先重视和积极改善。RPN 的数值由三个参数 相乘得到,分别是严重度(Severity)、发生频率/可能性(Occurrence/ Probability )、识别难易程度(Detection)。在评估后,要综合考虑,严 重度和发生度矩阵,严重度和可识别度矩阵,发生频率和可识别度矩 阵。还需评估风险和故障对系统的可用性、数据丢失、财务成本和业 务中断有什么影响。 确定应用程序响应和恢复程序。对于每种故障模式,确定应用程 序将如何响应和恢复。考虑在成本与应用程序复杂程度之间作出折衷。 评估后,企业应优先考虑高等级故障并定义缓解措施,并不断更新和 审查。 ### 2.BCM RA 风险评估是业务连续性管理工作中的重要环节,是对各方面风险 进行辨识和分析的过程,是对威胁、资源、脆弱性及三者相互作用的 结果进行评估。评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。",
"metadata": {
"node_id": "7ddb41a16d2c78b1aa5d3524ba9b717ee8a0f32b54947624fa1785987747b161",
"node_type": "text",
"ppr_score": 0.05099583892777976,
"edge_score": 0.0,
"passage_score": 0.075718905,
"rank": 12,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。混沌工程前利用BCM 中的RA 方法进行自检的价值:建立对业 务运行环境的整体认识,了解业务连续运行所面临的各类潜在风险因 素,识别影响业务大范围中断的关键风险场景;分析各业务系统运行 所面临的首要风险场景,识别风险发生的可能性,并定性描述可能造 成的损失;根据风险评估结果,对关键风险场景提出风险管控措施, 对于处置后仍在不可接受范围内的残余风险提出进一步处置策略,可 围绕评估出的关键风险场景,在专项预案编制过程中有针对性的进行 应急处置流程设计,同时可以作为混沌工程实验的重点。 ### 3.FTA 故障树是一种特殊的倒立树状的逻辑因果关系图。故障树分析Fault Tree Analysis, FTA是以一个不希望发生的产品故障事件或灾害性危险事件即顶事件作为分析的对象通过由上向下的严格按层次 的故障因果逻辑分析,逐层找出故障事件的必要而充分的直接原因,画出故障树,最终找出导致顶事件发生的所有可能原因和原因组合,在有基础数据时可计算出顶事件发生的概率和底事件重要度。 ![](images/a9b5af5b974c4d25d0358df03bf4db87886abf29c36d52b0abe72300649ded7d.jpg) 1961 年, FTA 由美国贝尔电话研究室的华特先生首先提出的。",
"metadata": {
"node_id": "28bc0692b60ed668688fd58d9c5163a6e923a177125a5782164888844e061a2e",
"node_type": "text",
"ppr_score": 0.05063678893756968,
"edge_score": 0.0,
"passage_score": 0.07518748,
"rank": 13,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "什么是RAG系统",
"pagerank_available": true
}
},
{
"page_content": "青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"metadata": {
"node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"graph_node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"node_type": "event",
"ppr_score": 1.0564743243185571e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "按计划部署",
"metadata": {
"node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"graph_node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"node_type": "event",
"ppr_score": 5.833311202196603e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "1998年组建信产部。",
"metadata": {
"node_id": "006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"graph_node_id": "006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"node_type": "event",
"ppr_score": 5.813227407106867e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "贵州省人民政府办公厅于2023年6月发布《贵州省政务数据资源管理办法》。",
"metadata": {
"node_id": "71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"graph_node_id": "71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"node_type": "event",
"ppr_score": 5.355534664475652e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "1994年邮电部实行邮电分营。",
"metadata": {
"node_id": "a4bfec0430a945b451f4d2a4d56638ad0d75304d4f47c9441f745cf3b1a268b1",
"graph_node_id": "a4bfec0430a945b451f4d2a4d56638ad0d75304d4f47c9441f745cf3b1a268b1",
"node_type": "event",
"ppr_score": 4.82914480107628e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 8,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "2022年5月黑龙江省人大常委会发布《黑龙江省促进大数据发展应用条例》。",
"metadata": {
"node_id": "0f5d8bb9a91217c45c257bc473f63cb729fe03b41c4573d523459fa2af6dc7bd",
"graph_node_id": "0f5d8bb9a91217c45c257bc473f63cb729fe03b41c4573d523459fa2af6dc7bd",
"node_type": "event",
"ppr_score": 4.714749078577141e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 9,
"source": "hipporag2_langchain_event",
"source_text_id": "['fa5dd0b6f3b57d07d08ba0730a4540c59b6d99d05153b35f1f3cd5227ea07907']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "2008年组建工信部。",
"metadata": {
"node_id": "4c975a923b633c445c92b3b66acf1719602314d1ef6cf8dedd1aab5f28c3ce04",
"graph_node_id": "4c975a923b633c445c92b3b66acf1719602314d1ef6cf8dedd1aab5f28c3ce04",
"node_type": "event",
"ppr_score": 4.668835571500824e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 10,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "jpg) 包括DNS服务器、负载均衡器、交换机等 该平台具有以下几个特点: 1适配全栈式异构金融云基础设施 完成了跨平台及“一体多芯”式的混编架构中故障注入体系的建 设,提供云上资源自助、自动构建、自动发布、自动运维、快速扩容、 多环境一致等场景,实现流程自动化,使开发人员能够更多地专注在 业务功能的实现和创新上,大幅提高了应用的交付效率,提升了业务 产品推出效率和竞争力。2引入“一隔离两最小化”实现权限隔离和管控 通过 RBAC 实现不同应用系统间沙箱容器的混沌故障隔离;引入 k8s Operator 机制,根据演练需求为沙箱容器进行权限控制,实现 权限最小化,同时通过集群调度限制混沌环境的范围,实现爆炸半径 最小化。分布式系统及微服务架构下,实现更细粒度的权限控制,有 效避免了不同应用系统同时实施混沌工程造成“环境污染”的风险, 同时也保障了不同应用系统间故障注入的原子能力。 (3) 混淆工具链与异构环境相融合 将四类主流混沌工具引入到异构金融云环境中,全栈式适配底层 复杂基础设施,解决了工具集合的离线部署、内核及版本不兼容、混 淀工具与多种操作系统及容器云运行时适配等疑难问题。同时将混沌 工具链融合在异构环境中,提供更多样化的故障类型,能够针对不同 的故障类型,推荐使用适配的注入工具,使故障注入更加精准化。",
"metadata": {
"node_id": "5f593c4a4c8b89a95644375ee4952d1a4acc08146262cb3a56d5376db5ee1713",
"node_type": "text",
"ppr_score": 0.04462080921944727,
"edge_score": 0.0,
"passage_score": 0.07549548,
"rank": 11,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统的工作原理是什么",
"pagerank_available": true
}
},
{
"page_content": "蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"metadata": {
"node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"graph_node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"node_type": "event",
"ppr_score": 1.078856637985766e-06,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 1,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "进行测试评估模型验证。",
"metadata": {
"node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"graph_node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"node_type": "event",
"ppr_score": 6.400781511681461e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"metadata": {
"node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"graph_node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"node_type": "event",
"ppr_score": 4.3418035922489897e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 3,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"metadata": {
"node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"graph_node_id": "8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"node_type": "event",
"ppr_score": 4.1870812039794013e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 4,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查",
"metadata": {
"node_id": "ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"graph_node_id": "ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"node_type": "event",
"ppr_score": 3.7074606527733825e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"metadata": {
"node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"graph_node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"node_type": "event",
"ppr_score": 3.694064809279057e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "进行模型训练。",
"metadata": {
"node_id": "df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"graph_node_id": "df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "平台运维功能需求。",
"metadata": {
"node_id": "3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"graph_node_id": "3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 8,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "完善测试评估方法与规则。",
"metadata": {
"node_id": "4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"graph_node_id": "4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"node_type": "event",
"ppr_score": 3.2003907558407303e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 9,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "制定分布实施计划",
"metadata": {
"node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"graph_node_id": "e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"node_type": "event",
"ppr_score": 2.887736961847779e-07,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 10,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"metadata": {
"node_id": "dd5197f51f6021ef9044b96b2fa07a0729111c6e048f0c24449cbf6be6369ec5",
"node_type": "text",
"ppr_score": 0.049954534056970736,
"edge_score": 0.0,
"passage_score": 0.07703441,
"rank": 11,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "混沌工程对于开发团队而言,可以通过混沌工程能力从开发之初 或开发时就可以将由于开发或引入的组件导致的故障场景考虑进去, 从故障场景分析如何增强问题的快速定位、防护、跟踪等能力。混沌工程对于测试团队而言,可以通过混沌工程全面提升系统的 可靠性测试能力,更丰富的故障场景库,打破传统的“一对一”的、有什么特性就测什么用例的情况,可以更全的覆盖历史发生过的问题或可能发生的问题场景,帮助系统将问题拦截在上线前。 混沌工程对于运维团队而言, 是运维工程师的绝对利器, 困扰运维工程师最大的问题就是不知道系统什么时候会出现问题? 系统会出现哪些问题? 当前有没有自愈手段? 应急预案是否完备? 而混沌工程正好帮忙解决了这个问题, 通过对系统进行故障场景分析及历史问题分析, 用注入故障手段快速模拟故障的发生, 观察系统的反应、对业务的影响、以及当前的应急预案完备性, 最终帮助运维人员对系统建立起稳定性信心。 ### 3.混淆工程业务价值 通过混沌工程实验对现网事件进行复盘演练(治已病)或对系统 可靠性进行主动探索演练(治未病),以期降低已知缺陷的复发率、 提升潜在缺陷的拦截率、降低MTTR因此可以通过如下维度衡量混 淀工程的业务价值: ### 1、已知缺陷复发率 混沌工程应用于现网事件时,就是要通过对事件进行根因梳理改 进、混沌实验验证,解决现存缺陷的同时保障不再重犯。",
"metadata": {
"node_id": "21a18ce91b1e9504b6073e2982bd9941adb8e4618a13d9a4db018bb28c57c3d0",
"node_type": "text",
"ppr_score": 0.04988042566491436,
"edge_score": 0.0,
"passage_score": 0.076917465,
"rank": 12,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "附件:案例 # 一、华泰证券混沌工程实践案例 ## (一)背景介绍 应用系统在生产环境长期运行过程中,会受到各种不可预知的事 件的影响,例如配置参数修改、软件代码缺陷、负载流量增加、硬件 网络故障,异常数据引入等,有些业务场景会随着影响的引入而逐渐 失效。考虑到分布式系统的复杂性和业务场景的多样性,要想完全评 估清楚对业务场景的全部影响是很困难的。如何实现业务场景影响从 主观评估到客观测量的转换?华泰证券结合证券行业生产系统运维 经验和混沌工程相关理念提出了混沌工程双随机成熟度模型。 ## (二)概念定义 混沌工程双随机成熟度模型中的双随机指的是“场景随机”和“时 间随机”,如果某系统具备双随机能力,用户可以在故障场景定义的 范围内的任意时间注入任意故障,业务应当无损或者快速执行恢复动 作。 场景随机。随着分布式成为主流的系统架构设计方案,业务系统的 迭代速度越来越快,后端系统架构变得越来越复杂,需要根据业务 特性和应用系统建设的阶段,构建故障场景矩阵,并基于故障场景矩 阵评估业务对故障场景的应对能力。所谓场景随机,就是说对于故障 场景矩阵中的任一故障场景,如果系统支持随机能力,则该系统的任 何一个部署单元或集群节点触发该故障,业务都应当无损或者能够快 速执行恢复动作。 时间随机。根据业务系统提供的功能不同,系统的服务周期以及在不同周期的重要程度也会有所不同。所谓时间随机,就是说如果系统对某故障场景支持特定时间随机,则在特定时间范围内触发该故障,业务应当无损或者能够快速执行恢复动作。",
"metadata": {
"node_id": "0649fee117452299bdc7901418fcad61a5573641a7dc95150299b55e42021dcd",
"node_type": "text",
"ppr_score": 0.049790612096204584,
"edge_score": 0.0,
"passage_score": 0.076774985,
"rank": 13,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统在哪些实际应用场景中被成功应用过请提供案例说明其工作效果和价值。",
"pagerank_available": true
}
},
{
"page_content": "进行测试评估模型验证。",
"metadata": {
"node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"graph_node_id": "fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"node_type": "event",
"ppr_score": 4.967543665207289e-06,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 1,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
},
{
"page_content": "进行模型训练。",
"metadata": {
"node_id": "df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"graph_node_id": "df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"node_type": "event",
"ppr_score": 2.4837718326036445e-06,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 2,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
},
{
"page_content": "平台运维功能需求。",
"metadata": {
"node_id": "3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"graph_node_id": "3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"node_type": "event",
"ppr_score": 2.4837718326036445e-06,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 3,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
},
{
"page_content": "完善测试评估方法与规则。",
"metadata": {
"node_id": "4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"graph_node_id": "4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"node_type": "event",
"ppr_score": 2.4837718326036445e-06,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 4,
"source": "hipporag2_langchain_event",
"source_text_id": "['4fd368909a072e07e3ec76006abdb20ce37ec52f4d0e3ebf69ea1474d3b6862f']",
"evidence": "PPT_20240326下午-医疗健康行业大模型评价体系研究及测试评估工具研发E部门-工程技术课题)(1).md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
},
{
"page_content": "东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"metadata": {
"node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"graph_node_id": "71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"node_type": "event",
"ppr_score": 1.3924205044200936e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 5,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
},
{
"page_content": "青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"metadata": {
"node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"graph_node_id": "0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"node_type": "event",
"ppr_score": 1.0564743243185571e-08,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 6,
"source": "hipporag2_langchain_event",
"source_text_id": "['8b1e94cfe88e0fe9aa73611eca98b04567db8253ed068692a2deb64af2c5107e']",
"evidence": "88-《公共数据授权运营发展洞察2023》定稿印刷0102.md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
},
{
"page_content": "蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"metadata": {
"node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"graph_node_id": "837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"node_type": "event",
"ppr_score": 9.10248791126777e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 7,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
},
{
"page_content": "云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"metadata": {
"node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"graph_node_id": "52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"node_type": "event",
"ppr_score": 7.678002157579536e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 8,
"source": "hipporag2_langchain_event",
"source_text_id": "['833310a7d4dc0e345e4e7cde890f7d84f2cf03a07c5e53671fce351e8f941781']",
"evidence": "可观测性技术发展研究报告.md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
},
{
"page_content": "按计划部署",
"metadata": {
"node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"graph_node_id": "597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"node_type": "event",
"ppr_score": 5.833311202196603e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 9,
"source": "hipporag2_langchain_event",
"source_text_id": "['7e6068f850e4a480cb84c8e397497cddc83e55dc19995b00d3dac9e347c33f8e']",
"evidence": "PPT_吴倩琳-2023云和软件安全大会-零信任分论坛-零信任成熟度.md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
},
{
"page_content": "1998年组建信产部。",
"metadata": {
"node_id": "006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"graph_node_id": "006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"node_type": "event",
"ppr_score": 5.813227407106867e-09,
"edge_score": 0.0,
"passage_score": 0.0,
"rank": 10,
"source": "hipporag2_langchain_event",
"source_text_id": "['05575614c0a56ca752a2c4a4f94512b223eb0672171d3ab6c797bcc7e9dc9e33']",
"evidence": "PPT_ICPMM-行业云平台运营管理能力成熟度标准解读.md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
},
{
"page_content": "在某商业银行的实践中,部署了一套基于 AI 的实时风险评估系统,该系统能够实时监测和分析信贷业务 数据,包括借款人的交易记录、行为特征、社交数据等多维度 信息。通过机器学习算法,该系统能够自动识别异常交易模式 和潜在风险信号,并实时预警。自部署该系统以来,该商业银 行的信贷业务风险识别准确率提高了约30%,潜在风险预警的 响应时间缩短了50%以上。同时该系统帮助银行减少了约20% 的坏账率。 # 人工智能在信贷风险管理的前沿实践 # 1.数据挖掘与特征工程 在信贷风险管理中,数据挖掘和特征工程是构建有效风险 评估模型的基础。AI 技术能够从海量数据中识别出与信贷风险 高度相关的特征,这些特征可能包括客户的交易行为、社交媒 体活动、甚至是地理位置信息。通过机器学习算法,如随机森 林和梯度提升机GBM可以从这些特征中学习到复杂的风险 模式,从而提高风险评估的准确性。 # 2.深度学习与模式识别 深度学习技术尤其是卷积神经网络CNN和循环神经网 络RNN在处理非结构化数据方面展现出了强大的能力。在 信贷风险管理中,这些技术可以用于分析客户的文本信息,如 贷款申请书和信用报告,以识别潜在的风险信号。此外,深度 学习模型能够通过自我学习不断优化,以适应金融市场的变 化。 # 3.实时风险监控与预警系统 AI 技术能够实现对信贷业务数据的实时监控,通过设置预 警阈值和触发条件,及时发现并识别出异常行为或潜在风险 点。",
"metadata": {
"node_id": "453be1f1f2a512023387e3867063c67f0e2f0100905e57ffc8c3be7a36338716",
"node_type": "text",
"ppr_score": 0.010538096658768212,
"edge_score": 0.0,
"passage_score": 0.07701868,
"rank": 11,
"source": "hipporag2_langchain_text",
"evidence": "【原创文章】浅谈人工智能驱动下的信贷风险管理20241212V1.md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
},
{
"page_content": "故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"metadata": {
"node_id": "dd5197f51f6021ef9044b96b2fa07a0729111c6e048f0c24449cbf6be6369ec5",
"node_type": "text",
"ppr_score": 0.008965828282853385,
"edge_score": 0.0,
"passage_score": 0.080391555,
"rank": 12,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
},
{
"page_content": "数字越大, 表明风险越大越值得优先重视和积极改善。RPN 的数值由三个参数 相乘得到,分别是严重度(Severity)、发生频率/可能性(Occurrence/ Probability )、识别难易程度(Detection)。在评估后,要综合考虑,严 重度和发生度矩阵,严重度和可识别度矩阵,发生频率和可识别度矩 阵。还需评估风险和故障对系统的可用性、数据丢失、财务成本和业 务中断有什么影响。 确定应用程序响应和恢复程序。对于每种故障模式,确定应用程 序将如何响应和恢复。考虑在成本与应用程序复杂程度之间作出折衷。 评估后,企业应优先考虑高等级故障并定义缓解措施,并不断更新和 审查。 ### 2.BCM RA 风险评估是业务连续性管理工作中的重要环节,是对各方面风险 进行辨识和分析的过程,是对威胁、资源、脆弱性及三者相互作用的 结果进行评估。评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。",
"metadata": {
"node_id": "7ddb41a16d2c78b1aa5d3524ba9b717ee8a0f32b54947624fa1785987747b161",
"node_type": "text",
"ppr_score": 0.008889474944671521,
"edge_score": 0.0,
"passage_score": 0.07970682500000001,
"rank": 13,
"source": "hipporag2_langchain_text",
"evidence": "《混沌工程技术实践指南》.md",
"query": "RAG系统的工作原理是什么特别是它如何应用于软件技术栈与业务状态的观测",
"pagerank_available": true
}
}
],
"all_passages": [
"蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"进行测试评估模型验证。",
"云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查",
"东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"进行模型训练。",
"平台运维功能需求。",
"完善测试评估方法与规则。",
"制定分布实施计划",
"故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"数字越大, 表明风险越大越值得优先重视和积极改善。RPN 的数值由三个参数 相乘得到,分别是严重度(Severity)、发生频率/可能性(Occurrence/ Probability )、识别难易程度(Detection)。在评估后,要综合考虑,严 重度和发生度矩阵,严重度和可识别度矩阵,发生频率和可识别度矩 阵。还需评估风险和故障对系统的可用性、数据丢失、财务成本和业 务中断有什么影响。 确定应用程序响应和恢复程序。对于每种故障模式,确定应用程 序将如何响应和恢复。考虑在成本与应用程序复杂程度之间作出折衷。 评估后,企业应优先考虑高等级故障并定义缓解措施,并不断更新和 审查。 ### 2.BCM RA 风险评估是业务连续性管理工作中的重要环节,是对各方面风险 进行辨识和分析的过程,是对威胁、资源、脆弱性及三者相互作用的 结果进行评估。评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。",
"评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。混沌工程前利用BCM 中的RA 方法进行自检的价值:建立对业 务运行环境的整体认识,了解业务连续运行所面临的各类潜在风险因 素,识别影响业务大范围中断的关键风险场景;分析各业务系统运行 所面临的首要风险场景,识别风险发生的可能性,并定性描述可能造 成的损失;根据风险评估结果,对关键风险场景提出风险管控措施, 对于处置后仍在不可接受范围内的残余风险提出进一步处置策略,可 围绕评估出的关键风险场景,在专项预案编制过程中有针对性的进行 应急处置流程设计,同时可以作为混沌工程实验的重点。 ### 3.FTA 故障树是一种特殊的倒立树状的逻辑因果关系图。故障树分析Fault Tree Analysis, FTA是以一个不希望发生的产品故障事件或灾害性危险事件即顶事件作为分析的对象通过由上向下的严格按层次 的故障因果逻辑分析,逐层找出故障事件的必要而充分的直接原因,画出故障树,最终找出导致顶事件发生的所有可能原因和原因组合,在有基础数据时可计算出顶事件发生的概率和底事件重要度。 ![](images/a9b5af5b974c4d25d0358df03bf4db87886abf29c36d52b0abe72300649ded7d.jpg) 1961 年, FTA 由美国贝尔电话研究室的华特先生首先提出的。",
"青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"按计划部署",
"1998年组建信产部。",
"贵州省人民政府办公厅于2023年6月发布《贵州省政务数据资源管理办法》。",
"1994年邮电部实行邮电分营。",
"2022年5月黑龙江省人大常委会发布《黑龙江省促进大数据发展应用条例》。",
"2008年组建工信部。",
"jpg) 包括DNS服务器、负载均衡器、交换机等 该平台具有以下几个特点: 1适配全栈式异构金融云基础设施 完成了跨平台及“一体多芯”式的混编架构中故障注入体系的建 设,提供云上资源自助、自动构建、自动发布、自动运维、快速扩容、 多环境一致等场景,实现流程自动化,使开发人员能够更多地专注在 业务功能的实现和创新上,大幅提高了应用的交付效率,提升了业务 产品推出效率和竞争力。2引入“一隔离两最小化”实现权限隔离和管控 通过 RBAC 实现不同应用系统间沙箱容器的混沌故障隔离;引入 k8s Operator 机制,根据演练需求为沙箱容器进行权限控制,实现 权限最小化,同时通过集群调度限制混沌环境的范围,实现爆炸半径 最小化。分布式系统及微服务架构下,实现更细粒度的权限控制,有 效避免了不同应用系统同时实施混沌工程造成“环境污染”的风险, 同时也保障了不同应用系统间故障注入的原子能力。 (3) 混淆工具链与异构环境相融合 将四类主流混沌工具引入到异构金融云环境中,全栈式适配底层 复杂基础设施,解决了工具集合的离线部署、内核及版本不兼容、混 淀工具与多种操作系统及容器云运行时适配等疑难问题。同时将混沌 工具链融合在异构环境中,提供更多样化的故障类型,能够针对不同 的故障类型,推荐使用适配的注入工具,使故障注入更加精准化。",
"蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"进行测试评估模型验证。",
"云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"滴滴推出了夜莺Nightingale该系统采用All-in-One的设计理念集数据采集、可视化、监控告警、数据分析于一体与云原生生态紧密集成融入了顶级互联网公司可观测性最佳实践沉淀了众多社区专家经验开箱即用",
"Analysys 发布了 DolphinScheduler一个支持复杂任务调度和依赖管理的分布式任务调度系统提供了可观测性的监控和告警功能帮助用户实现任务的可靠执行和故障排查",
"东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"进行模型训练。",
"平台运维功能需求。",
"完善测试评估方法与规则。",
"制定分布实施计划",
"故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"混沌工程对于开发团队而言,可以通过混沌工程能力从开发之初 或开发时就可以将由于开发或引入的组件导致的故障场景考虑进去, 从故障场景分析如何增强问题的快速定位、防护、跟踪等能力。混沌工程对于测试团队而言,可以通过混沌工程全面提升系统的 可靠性测试能力,更丰富的故障场景库,打破传统的“一对一”的、有什么特性就测什么用例的情况,可以更全的覆盖历史发生过的问题或可能发生的问题场景,帮助系统将问题拦截在上线前。 混沌工程对于运维团队而言, 是运维工程师的绝对利器, 困扰运维工程师最大的问题就是不知道系统什么时候会出现问题? 系统会出现哪些问题? 当前有没有自愈手段? 应急预案是否完备? 而混沌工程正好帮忙解决了这个问题, 通过对系统进行故障场景分析及历史问题分析, 用注入故障手段快速模拟故障的发生, 观察系统的反应、对业务的影响、以及当前的应急预案完备性, 最终帮助运维人员对系统建立起稳定性信心。 ### 3.混淆工程业务价值 通过混沌工程实验对现网事件进行复盘演练(治已病)或对系统 可靠性进行主动探索演练(治未病),以期降低已知缺陷的复发率、 提升潜在缺陷的拦截率、降低MTTR因此可以通过如下维度衡量混 淀工程的业务价值: ### 1、已知缺陷复发率 混沌工程应用于现网事件时,就是要通过对事件进行根因梳理改 进、混沌实验验证,解决现存缺陷的同时保障不再重犯。",
"附件:案例 # 一、华泰证券混沌工程实践案例 ## (一)背景介绍 应用系统在生产环境长期运行过程中,会受到各种不可预知的事 件的影响,例如配置参数修改、软件代码缺陷、负载流量增加、硬件 网络故障,异常数据引入等,有些业务场景会随着影响的引入而逐渐 失效。考虑到分布式系统的复杂性和业务场景的多样性,要想完全评 估清楚对业务场景的全部影响是很困难的。如何实现业务场景影响从 主观评估到客观测量的转换?华泰证券结合证券行业生产系统运维 经验和混沌工程相关理念提出了混沌工程双随机成熟度模型。 ## (二)概念定义 混沌工程双随机成熟度模型中的双随机指的是“场景随机”和“时 间随机”,如果某系统具备双随机能力,用户可以在故障场景定义的 范围内的任意时间注入任意故障,业务应当无损或者快速执行恢复动 作。 场景随机。随着分布式成为主流的系统架构设计方案,业务系统的 迭代速度越来越快,后端系统架构变得越来越复杂,需要根据业务 特性和应用系统建设的阶段,构建故障场景矩阵,并基于故障场景矩 阵评估业务对故障场景的应对能力。所谓场景随机,就是说对于故障 场景矩阵中的任一故障场景,如果系统支持随机能力,则该系统的任 何一个部署单元或集群节点触发该故障,业务都应当无损或者能够快 速执行恢复动作。 时间随机。根据业务系统提供的功能不同,系统的服务周期以及在不同周期的重要程度也会有所不同。所谓时间随机,就是说如果系统对某故障场景支持特定时间随机,则在特定时间范围内触发该故障,业务应当无损或者能够快速执行恢复动作。",
"进行测试评估模型验证。",
"进行模型训练。",
"平台运维功能需求。",
"完善测试评估方法与规则。",
"东营市人民政府办公室于2023年5月发布《东营市公共数据授权运营暂行管理办法征求意见稿》。",
"青岛市大数据发展管理局于2023年6月发布《青岛市公共数据运营试点管理暂行办法》。",
"蚂蚁集团推出了 HoloInsight作为云原生时代的轻量化、全功能的智能可观测性技术平台。HoloInsight作为集数据采集、洞察分析、智能告警的一站式可观测综合解决方案可帮助用户清晰观测整个软件技术栈与业务的状态",
"云杉网络发布了 DeepFlow该产品基于eBPF实现了零插桩Zero Code、全覆盖FullStack的指标、追踪、日志采集并通过智能标签技术实现了所有观测数据的全关联(Universal Tagging)和高效存取",
"按计划部署",
"1998年组建信产部。",
"在某商业银行的实践中,部署了一套基于 AI 的实时风险评估系统,该系统能够实时监测和分析信贷业务 数据,包括借款人的交易记录、行为特征、社交数据等多维度 信息。通过机器学习算法,该系统能够自动识别异常交易模式 和潜在风险信号,并实时预警。自部署该系统以来,该商业银 行的信贷业务风险识别准确率提高了约30%,潜在风险预警的 响应时间缩短了50%以上。同时该系统帮助银行减少了约20% 的坏账率。 # 人工智能在信贷风险管理的前沿实践 # 1.数据挖掘与特征工程 在信贷风险管理中,数据挖掘和特征工程是构建有效风险 评估模型的基础。AI 技术能够从海量数据中识别出与信贷风险 高度相关的特征,这些特征可能包括客户的交易行为、社交媒 体活动、甚至是地理位置信息。通过机器学习算法,如随机森 林和梯度提升机GBM可以从这些特征中学习到复杂的风险 模式,从而提高风险评估的准确性。 # 2.深度学习与模式识别 深度学习技术尤其是卷积神经网络CNN和循环神经网 络RNN在处理非结构化数据方面展现出了强大的能力。在 信贷风险管理中,这些技术可以用于分析客户的文本信息,如 贷款申请书和信用报告,以识别潜在的风险信号。此外,深度 学习模型能够通过自我学习不断优化,以适应金融市场的变 化。 # 3.实时风险监控与预警系统 AI 技术能够实现对信贷业务数据的实时监控,通过设置预 警阈值和触发条件,及时发现并识别出异常行为或潜在风险 点。",
"故障场景随机能力。故障场景随机能力 RA_FSRandom Ability of Fault Scenario用于衡量应用对特定故障场景的时间随机能力的支持程度从任意时间随机到不支持随机能力分为 4 个等级,如果系统不涉及该故障场景,则不计算得分,计算公式详情如下: RA_FS = { 100: 任意时间随机; 60: 交易日特定时间随机; 30: 非交易日随机; 0: 不支持; NA: 不涉及; } 部署单元双随机成熟度。部署单元双随机成熟度 DRD_DU( Dual Random Degree of Deployment Unit ):用于衡量系统下特定部署单元 的双随机能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ D U } = \\frac { 1 } { n } \\Sigma _ { i = 1 } ^ { n } W _ { i } * \\mathrm { D R A \\_ F S P } _ { i } } nd{array} $$ 注:$W_{i}$为部署单元第i个故障场景的权重。 系统双随机成熟度。系统双随机成熟度 DRD_ASDual Random Degree of Application System用于衡量应用系统整体的双随机能力 评估应用系统的整体风险防控能力,计算公式详情如下: $$ \\begin{array} { r } { \\mathrm { D R D \\_ A S } = \\frac { 1 } { m } \\Sigma _ { i = 1 } ^ { m } W _ { i } * \\mathrm { D R D \\_ D U } _ { i } } nd{array} $$ 注: $W_{i}$ 为第 $\\mathrm{i}$ 个部署单元在整个应用系统中所占的权重。 评估双随机能力。针对每个故障场景组织业务各个角色一起评估 时间随机能力等级,如果不能支持任意时间随机,则需要业务进行改 进,待改进完毕之后,进入检验环节。 检验双随机能力。对于双随机场景矩阵中每个故障场景的评估结论,需要通过故障演练进行检验,确保评估结论与实际效果一致,如果检验结论与实际效果有偏差,则需要进行业务改进和重新评估。 例行检验能力。双随机能力检验通过之后,需要配置定期例行检 验任务,确保双随机能力持续有效。",
"数字越大, 表明风险越大越值得优先重视和积极改善。RPN 的数值由三个参数 相乘得到,分别是严重度(Severity)、发生频率/可能性(Occurrence/ Probability )、识别难易程度(Detection)。在评估后,要综合考虑,严 重度和发生度矩阵,严重度和可识别度矩阵,发生频率和可识别度矩 阵。还需评估风险和故障对系统的可用性、数据丢失、财务成本和业 务中断有什么影响。 确定应用程序响应和恢复程序。对于每种故障模式,确定应用程 序将如何响应和恢复。考虑在成本与应用程序复杂程度之间作出折衷。 评估后,企业应优先考虑高等级故障并定义缓解措施,并不断更新和 审查。 ### 2.BCM RA 风险评估是业务连续性管理工作中的重要环节,是对各方面风险 进行辨识和分析的过程,是对威胁、资源、脆弱性及三者相互作用的 结果进行评估。评估关键资源所面临的风险及风险等级,并针对高风 险等级事项提出风险处置建议。 在进行混沌工程前可以利用RA风险评估方法对资源和业务系统 进行风险分析,利用风险评估模型提早识别出威胁和脆弱性,计量出 风险分值之后,按照分值从高到底排序,在混沌工程开展时,风险分 值比较高的资源和业务系统作为重点实验对象。"
],
"passage_sources": [
"原始查询-event-837914fd192ce24405e505d00bacfc4e7d67581c480a792eab1735ae40034a53",
"原始查询-event-fa2178eade20caa6435d7969d7e4fc292ae8594fd60266456e076d560770721e",
"原始查询-event-52d7ba687569c10025742eed85ffc69d28886cb9a8c5c4403180d85ab77267b2",
"原始查询-event-8fadaeeb758ccced65c64b80e2315c1af34ebbbc0b03fcd7535828960b29b20c",
"原始查询-event-ccefc8edd9ac190647aaade05325e68f3773c8575a58f689512b7661524ca029",
"原始查询-event-71c47e73feef6d66dc478cad69c4ad58a0b3ecfd04f09a1b00fa42decb9e9294",
"原始查询-event-df605b303a0d8bb54f4aeac641c0dcf0c128e34c544e0193d9c8bfa9e7719d9f",
"原始查询-event-3bf8041501694e4cb799bdd944dc7cdb9d70423f7339d81cb2bfee76e1de7052",
"原始查询-event-4f7f0c1c613764a8dccb6df4fb8a4cdd531c5145f8f981b32a705780630a9e76",
"原始查询-event-e37fe0b847647fbfb6116faa77736c145ab7584878ae380318c88685999901cc",
"原始查询-text-dd5197f51f6021ef9044b96b2fa07a0729111c6e048f0c24449cbf6be6369ec5",
"原始查询-text-7ddb41a16d2c78b1aa5d3524ba9b717ee8a0f32b54947624fa1785987747b161",
"原始查询-text-28bc0692b60ed668688fd58d9c5163a6e923a177125a5782164888844e061a2e",
"子查询2-event-0d3d869ec37f825c33eefbbeb73d0a25e100c5e9a1e1ec06e086f286057943ea",
"子查询2-event-597cef3ac2af04dbf4532f5f5a2bc5bfa762a06ab0f90626fddac7f0aaeecdb3",
"子查询2-event-006db96629b2e82ec2fc7a652f775df4173c1c31dfde02e96a72a55f3be91d91",
"子查询2-event-71324bbe38be7dc2f579536f22143c3d8f0deadec318e634492f597d7d0badfd",
"子查询2-event-a4bfec0430a945b451f4d2a4d56638ad0d75304d4f47c9441f745cf3b1a268b1",
"子查询2-event-0f5d8bb9a91217c45c257bc473f63cb729fe03b41c4573d523459fa2af6dc7bd",
"子查询2-event-4c975a923b633c445c92b3b66acf1719602314d1ef6cf8dedd1aab5f28c3ce04",
"子查询2-text-5f593c4a4c8b89a95644375ee4952d1a4acc08146262cb3a56d5376db5ee1713",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询2-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown",
"子查询1-unknown"
],
"retrieval_path": "unknown",
"initial_retrieval_details": {},
"current_sub_queries": []
}