解决nutanix莫名的问题
莫名的nutanix主机断开的问题
昨天在进行虚拟机部署的时候,部署到90%,发现一直卡在这里不动了.
看的时候,发现该主机已经在vCenter上显示断开 但是用ssh 访问esxi还是可以登录,但是只能ls,其他的命令只要输入就会卡死。
因为快要下班,先看到这里,明天继续。
第二天
首先这个esxi 主机是无法touch到的,想要重启,就联想到了IPMI,刚好有这个口令,重启了这台主机。
重启后,检查了下存放cvm机器的存储,这个里面多了一台虚拟机,移走。
至此,cvm显示正常了,但是主机显示缺少HA的存储心跳,看了下,数据存储只有本身的,没有nutanix创建出来的nfs部分。
进prism,到存储,到storage container,update对应的存储到这台重启的esxi主机。
发现提示这个 “a datastore based on the provided spec already exists on the node。。。”,
用 ssh进esxi,发现vmfs果然有nfs存储的目录,而且都可以访问。但是vsphere中就是看不到。
解决问题
想着莫非是HA导致的问题,检查了隐藏的vsphere-ha目录下的文件,没有什么异常。
想着,要不再重启一次。。。。。。,算了,一般不是这个问题,重启比较费时间。
要不重启下对应的服务,
/etc/init.d/hostd restart /etc/init.d/vpxa restart
确保这两个服务重启成功,一个是主机值守服务,一个是vcenter的代理服务。
重启完成后,再看存储,好了,出现了。
问题解决了。
耗时2个小时。
总结
出现问题,明确的分析,找对方法,都是可以解决的。 要分析,分析问题是比较困难的,也是价值的体现。