标签:load 运维 根因 Server High 智能 client 日志
B. 智能运维 --- 质量保障 --- 根因分析
机器学习定位故障责任部门 --- 微软 NetPoirot
特点
轻量级的持续监控:仅需收集TCP的数据,避免收集整个系统海量的日志(SNMP,网络拓扑,性能指标,程序日志等)。
准确的机器学习分类:利用决策树/随机森林来实现自动且准确的根因分类。
简单的系统实现:不需要了解系统方面的信息,包括网络拓扑,程序模块关系等。
解决方案
训练阶段:由于异常的数据远远比正常的时候少,不利于机器学习,NetPoirot还可以模拟注入一些故障,丰富异常数据集,提升模型的准确度
运行阶段
模拟注入故障类型
Server
High CPU load on Server
Slow reading Server
High I/O on Server
High memory load on server
Client
High CPU load on client
High I/O on client
High memory load on client
Network
Bandwidth throttling
Sporadic packetdrops
Packet reordering
Random connections drops
High Latency
微软AIOps工作:时序数据与事件的关联分析
解决核心问题
E和S之间是否存在相关关系?
若存在相关关系,E和S的时间先后顺序是什么?E先发生,还是S先发生?
E和S的单调关系。假设S(或者E)先发生,S的增加还是降低导致的E发生?
具体实现
相关性:???
时间先后顺序
单调关系
美团的日志聚类,实现根因分析
标签:load,运维,根因,Server,High,智能,client,日志 来源: https://blog.csdn.net/micklongen/article/details/89437275
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。