ICode9

精准搜索请尝试: 精确搜索
  • rust warning: unused imports、dead_code等elints告警禁止方法2021-07-19 02:32:33

    编写rust项目时,声明了一些变量或导入了一些模块目前没有用到,,编译的时候一直有黄色的告警,诸如"dead_code", "unused_imports","unused_variables","unused_mut"...等,很影响看调试日志,最重要的是!!这些告警我知道,一直报很影响心情。 基本的方法就是代码添加#[allow(dead_code)] 或 #![

  • elastalert 告警配置说明2021-07-14 23:33:19

    部署 ElastAlert # ElastAlert 在数据与特定模式匹配时发送警告。是可靠、模块化、易配置的工具 # 通过将 Elasticsearch 与两种类型组件: 规则、警报结合使用,定期执行查询并将数据传递到规则 # 首次运行前要使用其提供的可执行文件 "elastalert-create-index" 创建相关索引

  • Prometheus实现钉钉告警2021-07-14 09:32:03

    一.安装概括 Alertmanager 安装 安装prometheus-webhook-dingtalk 二.详细步骤 1. 官网下载Alertmanager https://prometheus.io/download/#alertmanager wget https://github.com/prometheus/alertmanager/releases/download/v0.17.0/alertmanager-0.17.0.linux-amd64.tar.gz ta

  • 打造0代码可定制的日志分析平台——秒云日志2021-07-12 14:34:36

    ​  目 录 第1章 搜索--焕然一新................................................................................................................... 4 第2章 日志代理—横空出世.....................................................................................

  • 打造0代码可定制的日志分析平台——秒云日志2021-07-12 11:01:35

    目 录 第1章 搜索--焕然一新................................................................................................................... 4 第2章 日志代理—横空出世.......................................................................................

  • prometheus-altermanager告警2021-07-11 17:04:52

             

  • 大话Devops之监控神器2021-07-07 15:02:47

    在过往的运维经历中,很多研发甚至是运维自己都把运维放在了一个资源(服务器、网络)提供者的定位上。常常就造成了运维人的惯性思维——我是一块砖,哪有需要往哪搬。 思考一个问题:在云计算、大数据、微服务的新时代场景下,我们如何提升运维的价值?   >> 3点提升运维价值 << 我认为可从以

  • Zabbix:配置钉钉告警2021-07-05 13:34:00

    一.申请钉钉机器人器 1.建立钉钉群组 2.添加一个机器人-智能群助手   二.zabbix服务器配置 1. 进入zabbix脚本路径,添加监听脚本   cd /usr/lib/zabbix/alertscripts vim dingding.sh #!/bin/bash to=$1 subject=$2 text=$3 #此处的 xxxxx 就是刚刚复制存留的 api 接口地址

  • 飞书告警模板2021-07-05 09:31:37

    public class ParseFailedAlert { private static final Map<Integer, Integer> countMap = new HashMap<>(); public static void sendAlert(int mlsId, String mlsNumber, Exception e) { //net.sf.json包 countMap.merge(mlsId, 1, Integer::su

  • Prometheus+JmxExporter 监控告警最佳实践2021-07-03 14:29:46

    概述 当你的 Java 应用运行起来之后,如果对其进行监控呢?Prometheus 社区开发了 JMX Exporter 来导出 JVM 的监控指标和自定义指标(自定义MBean),以便使用 Prometheus 来采集监控数据。本文将介绍如何利用 Prometheus 与 JMX Exporter 来监控你 Java 应用,并使用Grafana和Alertman

  • 磁盘阵列中磁盘状态监控及邮件告警2021-06-29 23:35:16

    邮件发送脚本 cat > sendMail.py << EOF #!/usr/bin/python #python2 #-*- coding: UTF-8 -*- import smtplib import sys from email.mime.text import MIMEText from email.utils import formataddr #发送邮件的地址 mailHost="mail.xxx.com" #发送邮件的用户名地址 mailUser=&q

  • 监控EC2的预留实例使用情况并设置使用率告警2021-06-29 22:01:30

    EC2 默认可以采购预留实例,即Reserved Instance(RI),这个服务我看起来觉得有点笨,例如不能指定或者无需指定此RI是分配给哪部EC2的,而且过期了也不会告诉你。 后来在Billing Dashboard那里,发现可以通过设定Budget告警的方式,实现RI使用率的监控。   进入Billing Dashboard,点击Budget,然后

  • 老男孩Linux高级架构师SpringCloud微服务及Kubernetes集群架构学习笔记2021-06-29 18:01:42

    链接: https://pan.baidu.com/s/1_4PIUb-Yl68aTW9Bw95iJA 提取码:tnav 运维通俗的理解即为运行和维护,来保证系统和网站的正常运行,维护它们的安全。保证7×24小时的正常运行,数据的稳定、不丢失,并持续进行系统及网站的优化。那它具体是做什么的呢? 1. 备份有备无患,总是没错的!!!从数据

  • 支持多品牌UPS电源和环境温湿度扩展短信、电话语音告警方案2021-06-29 10:00:46

    一、方案背景: 某公司机房管理人员通过网络联系到我们,希望能实时监控机房内的一台UPS电源和机房环境温湿度的变化情况,在UPS电源或者环境温湿度发生异常情况时,及时发出告警… 1.1、用户设备概况: 用户机房面积为36㎡,已搭建有线网络,有一台山特3C10KS的UPS电源。后期会多增加3台UPS

  • 记录一次内存泄漏导致服务端口不可用问题的定位过程,第一次发博客2021-06-28 10:03:24

    背景:2021年4月的某一天,公司迁移服务器之后,某服务的端口,出现大量端口不通告警,告警机制为使用nc命令扫描端口    nc -v -w 3 -z| 猜想原因1:是否是网络问题 排除1:因为服务器上另外一端口,无告警情况 排除2:通过其他服务器ping告警主机,无异常丢包情况 猜想原因2:是否是因为负载不均

  • 降低网络 AI 应用开发门槛,AIOps 两大部署模式来助力2021-06-22 10:54:13

    ​​​​​​​​​​​​​​​​摘要:企业运维需求及挑战,来看看华为 AIOps 如何解决! 本文分享自华为云社区《【云驻共创】AIOps?企业运维新力量!》,原文作者:启明。   国际惯例,我们先介绍一下 AIOps 的概念:AIOps,即 ArtificialIntelligence for IT Operations,智能运维,将人工智能应

  • AIOps:企业运维新力量!2021-06-22 10:35:06

    摘要:企业运维需求及挑战,来看看华为AIOps如何解决! 本文分享自华为云社区《【云驻共创】AIOps?企业运维新力量!》,原文作者:启明。 国际惯例,我们先介绍一下AIOps的概念:AIOps,即 Artificial Intelligence for IT Operations,智能运维,将人工智能应用于运维领域,基于已有的运维数据(日志、监控

  • Grafana 8重磅发布:统一警报、实时流、继续炫酷到底!2021-06-21 17:04:08

    作者 | JAVA架构日记 来源 | https://mp.weixin.qq.com/s/VZOERf9N_7ucujw9dzp0Wg 前言 Grafana v8.0 的重大变更包括对告警系统的重构;新的可视化改进,包括状态时间线、状态历史和直方图面板;实时流;可以重用的库面板;和细粒度的访问控制,允许企业客户确保其组织中的每个人都具有适

  • 云上安全保护伞--SLS威胁情报集成实战2021-06-16 11:03:24

    什么是威胁情报 根据Gartner对威胁情报的定义,威胁情报是某种基于证据的知识,包括上下文、机制、标示、含义和能够执行的建议。威胁情报描述了现存的、或者是即将出现针对资产的威胁或危险,并可以用于通知主体针对相关威胁或危险采取某种响应。业内大多数所说的威胁情报可以认为是

  • 云上安全保护伞--SLS威胁情报集成实战2021-06-16 10:32:23

    简介: 威胁情报是某种基于证据的知识,包括上下文、机制、标示、含义和能够执行的建议。 什么是威胁情报 根据Gartner对威胁情报的定义,威胁情报是某种基于证据的知识,包括上下文、机制、标示、含义和能够执行的建议。威胁情报描述了现存的、或者是即将出现针对资产的威胁或危险,并可

  • 使用prometheus-operator构建监控系统 (三) —— 设置自定义告警规则监告警2021-06-15 15:02:42

    >根据生产环境的需求,自定义监控指标,并配置触发告警规则后告警信息自动发送到邮箱 ### 1.清除原来服务默认的监控指标数据 查看默认的监控指标规则 kubectl get PrometheusRule -n monitoring ![image.png](https://s2.51cto.com/images/20210615/1623737469884031.png?x-oss-pr

  • 监控 prometheus及其部署2021-06-14 22:04:30

    prometheus 一、常用监控简介1、cacti2、Nagios3、Zabbix4、Prometheus 二、运维监控平台设计思路三、prometheus监控体系(一)监控体系: 四、Prometheus简介1.Prometheus特点:2.使用场景3.不适合的场景 五、prometheus时序数据1.数据来源:2.收集数据:3.prometheus(获取方式)

  • 这篇不可不读!监控系统选型你真的了解?2021-06-13 23:55:43

    转自:骆俊武 之前,我写过几篇有关「线上问题排查」的文章,文中附带了一些监控图,有些读者对此很感兴趣,问我监控系统选型上有没有好的建议? 目前我所经历的几家公司,监控系统都是自研的。其实业界有很多优秀的开源产品可供选择,能满足绝大部分的监控需求,如果能从中选择一款满足企业当下

  • alertmanger告警规则的编写2021-06-11 18:33:17

    1,netdata中cpu和磁盘分区的使用率 如: 100 / sum(netdata_disk_space_GiB_average{family="/data", group=~"^back.*|^gam.*"}) by (env,group,host,instance) * sum(netdata_disk_space_GiB_average{family="/data",dimension=~"avail|cached"

  • 金融监控实践常用的方式与可靠手段2021-06-11 11:52:00

    前言 从电商转金融 2 年多了,由于两者商业模式,流量的不同,期间踩了很多坑,尤其是在监控这一块,我们吃过不少苦头,前期由于监控缺失,造成了多起线上事故,经过一番摸索,我们实现了一些相对可行的监控方法,有效地保证了大盘及业务的稳定,在此总结出来分享给大家,希望能为大家提供一些金融场景下

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有