linux服务器死机_linux服务器死机日志

hacker|
81

文章目录:

amd显卡在linux系统睡眠死机

解决方法如下:

一)服务器配置:

(1).检验netdump服务器是否安装完毕:rpm-qnetdump-server。如果未安装,请在光盘RedFlag/RPMS/目录中找到netdump-server打头的软件包,执行命令:rpm-ivhnetdump-server-x.x.x.rpm(x为版本号)进行安装。

(2).服务器包安装后,用命令:passwdnetdump更改用户的密码。

(3).打开服务:chkconfignetdump-serveron

(4).运行服务器:servicenetdump-serverstart

(二)客户端配置:

(1).校验客户端是否已安装rpm-qnetdump,如果未安装,在光盘RedFlag/RPMS/目录中找到netdum打头的软件包,执行命令:rpm-ivhnetdump-x.x.x.rpm(x为版本号)安装。

(2).编辑文件/etc/sysconfig/netdump,添加如下行:DEV=eth0,NETDUMPADDR=172.16.81.182,NETDUMPMACADDR=00:0C:29:79:F4:E0,172.16.81.182指netdump服务器地址。

(3).运行下面的命令,出现提示符时输入密码:servicenetdumppropagate

(4).打开客户端:chkconfignetdumpon

(5).运行客户端:servicenetdumpstart

(6).测试:为了测试netdump的配置是否正确,在netdump客户机上做下面操作:cp/usr/share/doc/netdump-xxxxxx/crash.c,gcc-DKERNEL-DMODULE-I/lib/modules/$(uname-r)/build/include-ccrash.c,insmod./crash.o。

linux服务器死机,重启后正常,怎么回事?

死机有N多种情况,如果出现经常性质的司机,并且重新启动后就没问题的话,一般情况下是服务器风扇的问题,散热有问题造成的。

你可以查看服务器的相关日志DMESG,LOG等相关文件这样来确定是什么原因导致的,就算硬盘,CPU过热等情况系统都有记录,多看看日志,学会看日志将会很好的了解服务器的状态

Linux服务器死机

做一下DoS攻击保护

# vi /etc/sysctl.conf在最后面加上下面三行net.ipv4.tcp_syncookies = 1net.ipv4.icmp_echo_ignore_broadcasts = 1net.ipv4.icmp_ignore_bogus_error_responses = 1

linux服务器死机

服务器死机的原因很多。如果确保在硬件没问题的情况下。

可以先从/var/log下的日志查起..通过iostat 或者 vmstat sar 等命令来检查机器的整体性能状态。

我不知道你是否做了相关的监控措施,比如通过某些监控软件对服务器进行监控。

通过监控数据分析服务器的整体状况。

也可以协调应用部门查看应用方面的日志是否有异常。这个还得按照具体情况分析。

linux内存占用卡死分析

一、硬件问题

可以考虑分析以下几点:

1、不要超频CPU,如果已经超频的先回复到原来的频率

虽然平时运行没有问题,但可能在高负载的使用中就会出现不可预料的故障了。特别是linux系统在某些应用上,是可以把硬件的性能发挥到极限的,但这样的硬件运行Windows可能是没有问题的。

2、确认电源供电充足

必须确保在高负载的状态下,电源可以满足负载。

3、使用memtest86检查内存状态

4、恢复BIOS到默认状态

对于服务器,可以使用自带的监测工具进行测试,也是一个不错的排错方法。

二、软件问题

如果已经基本排除硬件问题,那我们就必须考虑从软件上去获得死机状态的系统信息了。

1、运气足够好的话,系统死机不一定是完全死掉(此时键盘可能还能响应),那我们就可以使用Sysrq大法。

前提是我们必须先打开sysrq功能:

#echo "1" /proc/sys/kernel/sysrq

#setterm -blank

这样,当系统出现问题的时候,我们可以使用:

引用

Alt+Sysrq-T 获得进程系统堆栈信息

Alt+Sysrq-M 获得内存分配信息

Alt+Sysrq-W 获得当前寄存器信息

更多的热键可以参考系统上的/usr/src/linux/Documentaion/sysrq.txt

其中,setterm -blank可以关闭字符下定时黑屏保护,方便记录屏幕信息。

2、为了让屏幕显示更多的内核调试信息,可以修改控制台的显示模式为80x25,在/boot/grub/menu.lst中对应的kernel一行最后,增加vga=0x305,如:

引用

kernel /boot/vmlinuz-2.4.21-9.30AXsmp ro root=/LABEL=/1 vga=0x305

3、万一键盘也不幸死掉了,那我们只能采用串口方式,把系统信息发送到另一台系统上,方法:

修改/boot/grub/menu.lst文件,在kernel一行最后增加核心参数"console=ttyS0 console=tty1",如:

引用

kernel /boot/grub/vmlinuz-2.4.21-9.30AXsmp ro root=/LABEL=/1 console=ttyS0 console=tty1

然后,修改/etc/sysconfig/syslog,加入klogd选项"-c 7",如:

引用

KLOGD_OPTIONS="-x -c 7"

重启服务器;进行测试:

1)使用串口直连线连接客户机和服务器,在客户机上运行:

cat /dev/ttyS0

服务器上运行:

echo hi /dev/ttyS0

如果客户机有"hi"输出即可。

2)服务器上运行:

echo w /proc/sysrq-trigger

看看客户机上是否有相应的内核信息输出

3)服务器上运行:

modprobe loop

看看客户机上是否有相应的内核信息输出

如果测试都通过的话,那么在客户机上运行:

cat /dev/ttyS0 | tee /tmp/result

当死机出现的时候,我们就可以从客户机上看到需要的内核信息了(查看/tmp/result)。

三、总结

一般造成Linux系统死机的原因有:

系统硬件问题(SCSI卡,主板,RAID卡,HBA卡,网卡,硬盘等)

外围硬件问题(网络等)

软件问题(系统、应用软件)

驱动bug(找新的驱动)

核心系统bug(到LKML看看,或更换核心再试)

系统设置(恢复到缺省状态,关闭防火墙等)

2条大神的评论

  • avatar
    访客 2022-07-11 下午 02:23:53

    上运行: cat /dev/ttyS0 | tee /tmp/result 当死机出现的时候,我们就可以从客户机上看到需要的内核信息了(查看/tmp/result)。 三、总结 一般造成Lin

  • avatar
    访客 2022-07-11 上午 11:48:47

    可。 2)服务器上运行: echo w /proc/sysrq-trigger 看看客户机上是否有相应的内核信息输出 3)服务器上运行: modprobe loop 看看客户机上是否有相应的内核信息输出 如果测试都通过的话,那么在客户机上运行: cat /dev/tt

发表评论