作为一名运维人员,在系统的运维过程中, 经常会遇到各种各样的运维问题,今天小编总结一个常见的运维问题,以及解决方法,希望能够给你提供指导。
工具/原料
Linux
oracle
一、网络问题
1、系统都要在网络中运行,所以懂得基础的网络知识,可以让你的运维工作更加得心应手。像基本的网络排查工具ping,tracert,以及telnet,我们至少要掌握。例如网站加载和访问慢,我们可以使用ping命令进行测试网站是否丢包。ping www.baidu.com如图返回结果丢失25%的包,代表当前的网络环境不稳定,在windows上,可以加上-t参数连续ping包ping www.baidu.com -t
2、端口测试:遇到网站无法访问和主机无法登陆,我们可以通过对应用的端口进行测试,来测试网络连通性。例如,测试192.168.149.66主机22端口,使用命令telnet 192.168.149.66 22
二、inode问题
1、一次数据库主机出现挂起,查看日志发现报错:操作系统空间满了,无法创建审计日志文件,定位发现磁盘空间充足,但是inode满了,如图所示,达到100%。
2、手动创建文件,出现如下报蕾蓄允嘞错。所以数据库也无法读写,业务异常,inode占用过高,一般是小文件过道导致,定位发现,数据字羿岚寺库的审计日志过大,并且都是小文件。touch test.txttouch: cannot touch `test.txt': No space left on device
3、for i i艘绒庳焰n /*; do echo $i; find $i | wc -l; done用此命令统计文件个数,删除目录下无吹涡皋陕用文件,可以释放inode空间。进入审计日志,进行删除find ./ -type f -name "*.aud" -mtime +91|xargs rm -f
4、注:当文件过多,执行ls命令卡住时,ls -l -f adump/ 此命令可以立即显示出文件,很有效哦!