博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
线上系统问题定位
阅读量:7123 次
发布时间:2019-06-28

本文共 2124 字,大约阅读时间需要 7 分钟。

一、线上系统查看命令

(1)查看系统限制

cat /proc/sys/kernel/pid_max #查看系统支持的最大线程数(相当于理论值)cat /proc/sys/kernel/thread-maxmax_user_process(ulimit -u) #系统限制某用户下最多可以运行多少线程cat /proc/sys/vm/max_map_count #硬件内存大小

(2)JVM虚拟机本身限制

-Xms #Inital java heap size-Xmx #Maximum java heap size-Xss  #The stack size for each thread

(3)查询当前某程序的线程或者进程数

pstree -p `ps -ef|grep XXX |awk '{print $1}'`|wc -l或pstree -p PID |wc -l

示例:

获取Tomcat进程PID ps -ef|grep tomcat统计该tomcat进程内的线程个数 ps -Lf PID|wc -l

(4)查询当前整个系统已用的线程或者进程数

pstree -p | wc -l

 参见:

(5)内存使用情况查询

./jstack pid|grep "on condition" |wc -lA.heap usage  jmap -heap pidB.dump文件  jmap -dump:live,format=b,file=XXX.bin pid

 参考:

 一次Tomcat hang住问题排查手记:

 Tomcat性能参数优化:

 Java服务线上系统性故障:

(6)指定端口的TCP连接数

netstat -an|grep 7090|wc -l#查看某个端口TCP连接来源并排序netstat -antl|grep ^tcp|grep ":2181"|awk '{print $5}'|awk -F":" '{count[$1]++}; END{for(ip in count) print ip, ":" count[ip]}'|sort -n -k3 -r#找到最多的TCP对应的机器,在那台机器上查看哪个进程占用的最多连接netstat -anp|grep ":2181"|awk '{print $7}'|awk -F"/" '{print $1}'|sort|uniq -c|sort -nr

二、线上系统启动

  (1)redis启动

src/redis-cli -h 10.2.137.141 -p 6379Server模块nohup /data01/public/redis/redis_cluster1/src/redis-server /data01/public/redis/redis_cluster1/redis.conf &nohup /data01/public/redis/redis_cluster1/src/redis-sentinel /data01/public/redis/redis_cluster1/sentinel.conf &Master模块nohup /data01/public/redis/redis_cluster2/src/redis-server /data01/public/redis/redis_cluster2/redis.conf &nohup /data01/public/redis/redis_cluster2/src/redis-sentinel /data01/public/redis/redis_cluster2/sentinel.conf &nohup /data01/public/redis/redis_cluster3/src/redis-server /data01/public/redis/redis_cluster3/redis.conf &nohup /data01/public/redis/redis_cluster3/src/redis-sentinel /data01/public/redis/redis_cluster3/sentinel.conf &

 config set slowlog-log-slower-than 指定执行时间超过多少微秒

 (2)Flume启动

nohup /data01/java/flume/bin/flume-ng agent -c conf/ -f /data01/java/flume/conf/xxx.properties -n agent -Dflume.root.logger=INFO,console >/dev/null 2 &

(3)ELK启动

  A.Logstash启动

nohup bin/logstash -f config/translate.beats-es4.conf &

B.ElasticSearch启动

nohup ./elasticsearch &

C.Kibana启动

fuser -n tcp 5601nohup ./kibana &

  

  

转载地址:http://kwael.baihongyu.com/

你可能感兴趣的文章
航空公司大数据建设的思考
查看>>
优秀程序员眼中的整洁代码
查看>>
为什么说人工智能是业界下一个增长点?
查看>>
大数据开放面对的瓶颈究竟是什么?
查看>>
威联通科技QNAP QTS4.0北京发布会落幕
查看>>
从“憋大招”到快速迭代 细数Windows 10变化背后的小秘密
查看>>
小城大梦 鄂尔多斯康巴什“互联网+智慧城市”项目启动
查看>>
5月举办的大数据产业博览会筹备发布会透露哪些信息?
查看>>
数据中心供电方式详解
查看>>
大咖 | 从Ian Goodfellow到Yann LeCun,对话Quora AI大佬TOP 10
查看>>
警示:锁定中小企业的勒索软件正在改变战术
查看>>
观点 | 99%区块链公司会死掉,1%的幸存者都是区块链+
查看>>
监测网络攻击,麻省理工用上了人工智能
查看>>
不看不知道,容器化OpenStack的10个好处
查看>>
移动通信核心网需引入NFV
查看>>
《云计算揭秘企业实施云计算的核心问题》——3.3节云不适合什么场景
查看>>
Spark学习之RDD简单算子
查看>>
ARM第二季度营收增长17%至3.5亿美元
查看>>
Incorporating Copying Mechanism in Sequence-to-Sequence Learning
查看>>
咸阳市位列智慧城市时空云建设年度考核全国第二名
查看>>