1、选择合适的服务器进行使用,也就是大家经常说的,以需求和业务为主。比如服务器上层所运行的应用就决定了底层该使用那种服务器硬件设备,不匹配搭配,会给硬件带来加速损耗进而出现宕机故障,比如在高性能计算(Deeplearning,深度学习)场景下选用低档次服务器,进而出现小马拉大车。
2、为服务器提供合适的机房环境,众所周知,服务器在运行的时候会产生大量热量,机房温度和干湿度等如果不控制在合适水平,会大大降低服务器的使用寿命,增加宕机风险。
3、针对服务器硬件做完善的硬件监控和日常巡检,做到有日常小故障的时候及时维修和更换,避免大的宕机事故出现。
4、当然,未来主流还是以云计算为主(IaaS服务),使用云主机服务时使用者不需要关注所使用的具体物理机,具体的高可用由云计算底层集群架构来保证,完善的故障热迁移,也就是基本上根除了宕机问题。
当然除了这四个方面,还有很多其他措施,就不在此一一列举了。