排查

记一次cpu100%问题排查2021-11-14 18:02:23

值班的时候发现有几台机器一直在报cpu使用率100%，下面是处理过程。先去top命令看一下cpu的使用率，发现是java应用使用率最高。去看下jvm的内存使用情况，因为公司有监控系统可以直接查看堆内存使用情况和gc情况（没有监控的可以使用命令查看），发现频繁的full gc，但young gc次数较少，并
性能问题排查2021-11-14 16:34:49

性能优化 1.硬件1.1.CPU1.2.内存1.3.IO1.4.网络1.5.工具1.5.1.top1.5.2.vmstat1.5.3.iostat1.5.4.pidstat 2.操作系统2.1.内核2.1.1.linux内核参数注释2.1.2.两种修改内核参数方法2.1.3.内核生产环境优化参数 2.2.limits.conf 3.软件3.1.数据库3.2.内存泄漏3.3.死锁3.4.程
Redis 排查性能2021-11-13 23:33:43

目录 Redis真的变慢了吗？使用复杂度过高的命令操作bigkey 集中过期实例内存达到上限 fork耗时严重开启内存大页开启AOF 绑定CPU 使用Swap 碎片整理网络带宽过载其他原因总结注意：本文参考 Redis为什么变慢了？一文讲透如何排查Redis性能问题 | 万字长文 Redis真的变慢
Redis性能问题排查解决手册(七)2021-11-13 15:32:51

阅读目录：性能相关的数据指标内存使用率used_memory 命令处理总数total_commands_processed 延迟时间内存碎片率回收key 总结性能相关的数据指标通过Redis-cli命令行界面访问到Redis服务器，然后使用info命令获取所有与Redis服务相关的信息。通过这些信息来分析文章后面提
pgsql问题排查2021-11-11 20:01:25

1.项目启动时报错 FATAL: remaining connection slots are reserved for non-replication superuser connections --查看当前的连接 select datname,pid,application_name,state from pg_stat_activity; --查看当前剩余的连接 select max_conn-now_conn as resi_conn from (sele
Linux磁盘占用100%的排查方法2021-11-10 18:34:00

背景： /分区被堆满了，导致一些服务无法正常运行。在删掉/下占用空间大的文件后，查看该分区占用率依旧很高。解决： 1对/下所有文件大小进行统计，排查文件存储占用磁盘空间 #du -sh /* 2排查inode使用率过高将磁盘空间占满 #df -i 3排查空间不释放问题 #lsof |grep deleted|awk '{
行人检测程序对接景区测试人数比对数据库切换时间不准确排查2021-11-10 18:00:39

TSINGSEE青犀视频行人检测需要做到将本地分析人数数据库和票务系统的数据库进行对比，这样可比较每个时间段的人数，系统将一天的人数进行对比完成时，最后会保存一个json文件，用于查看切换的每个时间点。我们对该功能进行测试，当打开json的时候，发现这里数据切换有误：当数据切换是整点时间
记一次线上崩溃问题的排查过程2021-11-10 16:01:48

大家好，我是雨乐！前几天，突然收到报警，线上服务崩溃，然后自动重启。由于正值双十一期间，业务以稳定为主，线上服务崩溃，这可不是一件小事，赶紧登陆线上服务器，分析原因，迅速解决。借助这篇文章，记录下整个崩溃的分析和解决过程。收到报警上午上班后，正在划水，突然收到邮件报警，如下：问题分析
Linux项目排查命令经验总结2021-11-07 20:30:00

网络排查命令项目部署后得不到预期结果，往往是由于网络故障原因，下面介绍一些网络故障排查命令 ping命令网络排查第一步，查看对方主机是否存在，毕竟也有可能把ip输错或者把私有地址当成公网ip地址的情况，ping命令用于查看主机网络用法如下： ping ip地址例如 ping 120.25.xxx.x
IDEA14：maven快速排查依赖包冲突2021-11-04 12:35:21

文章目录一、提问：二、解决步骤：一、提问：在maven导入架包的过程中，如果架包出现冲突，如何快速去排查依赖包的冲突并进行解决？二、解决步骤： 1、IDEA打开pom.xml–定位到内容里点击右键–Diagrams–show Dependencies打开看架包依赖关系结构图注：ctrl+鼠标可以放大 2、pom.x
Java--进程突然消失--原因/排查方案2021-11-02 20:33:50

原文网址：Java--进程突然消失--原因/排查方案_IT利刃出鞘的博客-CSDN博客简介说明本文介绍Java进程突然不见了的原因及排查步骤。有时候Java进程突然消失，一般是前端接口返回404最终排查到Java进程消失的。 Java进程消失原因 Java应用程序的问题：发生O
生产环境部署springcloud微服务启动慢的问题排查2021-10-29 08:32:17

今天带来一个真实案例，虽然不是什么故障，但是希望对大家有所帮助。一、问题现象：生产环境部署springcloud应用，服务部署之后，有时候需要10几分钟才能启动成功，在开发测试环境则没有这个问题。最开始是所有微服务都有这种情况，随着项目周期的进行，zwfw微服务的问题最为突出，每次部署后，
binlog内容时间乱序问题排查2021-10-28 18:03:27

今天在分析binlog长事务，无间看到 binlog 文件中，记录时间竟然乱序了， 0:08:22 先写的binlog 0:08:20 后写的binlog，而且exec_time=8 秒，这个也不正常。exec_time记录DDL命令执行时间是正确的，记录DML操作不太准确，它取值是SQL访问到第一条记录所需时间（意思是一条SQL更新100W条记录耗
线上故障如何快速排查2021-10-28 12:34:19

前言上线定位问题的思路很重要，先分析大致方向是哪出现的问题内存、CPU、恶意攻击、使用的服务，包含 NGINX REDIS MYSQL PHP，最好搞一个监控系统用来实时监控设置预警值到达一定上限后进行报警，技术人员及时跟进处理以规避此问题一服务器层面主要分析几个方面磁盘内存
Linux系统宕机故障排查及原因分析2021-10-26 23:32:53

一、故障描述突然发现某云主机无法ssh，业务线宕机，虽然主机处于开机状态，但是管理console VNC无法连入，无法ping通地址，云主机被判定为宕机。二、排查过程 1）查看宕机记录使用last -F |grep carsh last reboot //查看主机起来的时间 2）访问/var/logmessage日期查看宕机前的系统日
linux系统下排查cpu过高原因2021-10-26 17:31:47

上篇讲到windows下排查cpu过高原因，后续将demo放到了linux系统里面，再写篇linux下排查cpu高 1、首先查看当前linux下跑的cpu 　　命令：top，查看cpu使用异常的进程PID，我本地环境的异常进程时71983 2、查看所有java进程找到具体哪个项目的进程命令：ps - ef | grep j
zabbix4.0-故障排查2021-10-25 15:33:16

此随笔意在总结在zabbix使用中遇到的报错，及解决方式。 1.zabbix_server端在使用zabbix_get时报错：　　原因：zabbix_agent端在编辑了自定义监控后，企图直接/opt/zabbix/sbin/zabbix_agentd -c /opt/zabbix/etc/zabbix_agentd.conf ，让zbbix_agent服务重新加载配置文件，结果服
阿里线上bug排查命令2021-10-25 13:59:49

Linux命令类 tail 最常用的tail -f tail -300f shopbase.log #倒数300行并进入实时监听文件写入模式 grep grep forest f.txt #文件查找 grep forest f.txt cpf.txt #多文件查找 grep 'log' /home/admin -r -n #目录下查找所有符合关键字的文件 cat f.txt | grep -i sho
Linux入侵应急响应思路2021-10-25 12:58:11

Linux入侵应急响应思路 0x01 登录情况排查 w：用于显示目前登入系统的用户信息，以及正在执行的程序，便于查看当前系统的使用情况 last：用于显示用户最近登录信息，可能会留下入侵者的痕迹 uptime：查看当前时间、系统运行了多久时间、当前登录的用户有多少，以及前 1、5 和 15 分钟系
Centos定时任务，删除日志文件2021-10-24 10:02:40

前言：突然有一天，发现部署nacos的那台服务器访问特别慢，最近没人改动过什么，为什么会慢呢？接下来就是对服务器各种排查，可谓是“一顿操作猛如虎，发现磁盘全用尽” 1.查看磁盘使用情况： df -lh 2.查看该目录下所有文件及目录的大小 du -sh * 好，问题排查到这里，原因基本可以确定
EasyCVR调用批量删除接口出现错误排查及解决2021-10-21 18:02:18

EasyCVR作为一款功能完善的视频结构化智能分析平台，支持多种协议的视频流输出，同时也能够支持语音对讲，只要前端设备带有语音功能，用户即可通过EasyCVR来进行隔空喊话。同时EasyCVR开放了很多接口供大家调用，比如批量添加通道或者批量删除通道，都可以借助接口更便捷地完成操作。我们在
故障排查：CPU和CPU load问题排查2021-10-21 12:03:02

涉及到的命令：top、iotop、vmstat .... CPU： - us(user) 用户进程占用CPU时间比例 - sy(system) 系统占用CPU时间比例 - id(idel) CPU空闲时间比 - wa(iowait) IO等待时间比（IO等待高时，可能是磁盘性能有问题了） - st(steal) steal time vmstat procs（p
oracle undo表空间异常激增排查2021-10-21 11:02:35

1.查看undo表空间使用大于98% 2.查看视图v$undostat，确认MAXQUERYID 占用undo最大的sql，TUNED_UNDORETENTION和预设的show parameter undo undo_retention是否一致，理想是一致的。 select * from v$undostat; MAXQUERYID ： SQL identifier of the longest running SQL statement
记录一次hbase宕机之后，对问题的排查2021-10-19 10:33:41

hbase宕机问题排查起因是在使用spark将数据库数据写入到hbase时，发现在正常运行过程中，突然发现了有三个spark任务突然假死，通过查看日志发现程序卡在了如下的位置： 2021-10-18 18:23:58,158 INFO jdbc.Utils: Supplied authorities: 192.168.xx.xx:10000 2021-10-18 18:23:58,1
2、脱敏数据2021-10-18 10:03:18

脱敏数据测试注意事项测试字段中脱敏数据来源一个服务器日志一个是ES系统中 ES系统日志有延时性质。所以测试过程优先排查应用服务器打印日志 /home/finance/Logs/stdprocwithdraw.msxf.lo 日志：all.8080.2021-10-12.0.log 异常日志：error.8080.2021-09-09.log 业务日志 /ho

首页 < 5 6 7 8 > 尾页

ICode9

记一次cpu100%问题排查2021-11-14 18:02:23

性能问题排查2021-11-14 16:34:49

Redis 排查性能2021-11-13 23:33:43

Redis性能问题排查解决手册(七)2021-11-13 15:32:51

pgsql问题排查2021-11-11 20:01:25

Linux磁盘占用100%的排查方法2021-11-10 18:34:00

行人检测程序对接景区测试人数比对数据库切换时间不准确排查2021-11-10 18:00:39

记一次线上崩溃问题的排查过程2021-11-10 16:01:48

Linux项目排查命令经验总结2021-11-07 20:30:00

IDEA14：maven快速排查依赖包冲突2021-11-04 12:35:21

Java--进程突然消失--原因/排查方案2021-11-02 20:33:50

生产环境部署springcloud微服务启动慢的问题排查2021-10-29 08:32:17

binlog内容时间乱序问题排查2021-10-28 18:03:27

线上故障如何快速排查2021-10-28 12:34:19

Linux系统宕机故障排查及原因分析2021-10-26 23:32:53

linux系统下排查cpu过高原因2021-10-26 17:31:47

zabbix4.0-故障排查2021-10-25 15:33:16

阿里线上bug排查命令2021-10-25 13:59:49

Linux入侵应急响应思路2021-10-25 12:58:11

Centos定时任务，删除日志文件2021-10-24 10:02:40

EasyCVR调用批量删除接口出现错误排查及解决2021-10-21 18:02:18

故障排查：CPU和CPU load问题排查2021-10-21 12:03:02

oracle undo表空间异常激增排查2021-10-21 11:02:35

记录一次hbase宕机之后，对问题的排查2021-10-19 10:33:41

2、脱敏数据2021-10-18 10:03:18