云服务器安装苍穹环境遇到问题分析原创
金蝶云社区-吴辉宇
吴辉宇
9人赞赏了该文章 1628次浏览 未经作者许可,禁止转载编辑于2021年02月25日 17:33:52

背景:在阿里云或华为云上购买云服务器,搭建苍穹。安装后检查日志,发现有服务启动失败。

问题:在安装完苍穹,检查服务时发现部分服务启动异常,应当如何检查?以kafka服务为例子

解决思路:

    1. 通过service 服务名 status 查看服务状态。

image.png

    2. 若服务异常,最直接的分析方式,找到这个服务,进入到服务的启动目录,查看日志。

image.png

    3. 要懂得查看分析日志,找到报异常的地方,异常信息就能帮助我们定位问题。例如上图的zookeeper,time out。意思已经很明显了,zookeeper连接超时。

    4. 既然找到原因了,zookeeper连接不上,那么我们就要思考有什么原因会影响zookeeper连接不上呢?原因一:服务异常,原因二:服务正常,网络异常。

    5. 根据上面的两个原因,首先确认zookeeper的服务是否正常。可采用service zookeeper status,也可以使用netstat -anp|grep 2181命令查看端口是否监听,来判断服务是否正常。

image.png

    6. 按上图,zookeeper服务是正常,那么导致zookeeper连接超时的就只能是网络原因了。网络原因又应该如何分析?无非两种情况:1.IP连不上;2.端口连不上。

    7. 确认是否IP连不上,可通过ping IP 的方式,查看IP是否正常。

    8. 确认是否端口连不上,可通过telnet IP port的命令。注意:这个IP是安装苍穹时填写的IP,不是本机的内部IP。若telnet命令不存在,可百度搜下如何安装telnet。

    9. telnet发现,端口其实是不通的。那么最终的原因也就找到了,是因为端口连接不上,导致kafka服务启动异常

    image.png

    10. 既然是端口问题,那么这种情况如何处理呢?


解决方案:

    1. 因为购买的是云厂商资源,购买云服务器时,需要绑定安全组的,也就是该服务器的入网出网规则,简单的说,就是配置云服务器哪些端口可对外开放的,或者配置云服务器允许访问哪些公网服务和端口。

image.png

    2. 如果是默认的安全组,大部分的端口都是不对外开放的。需要自己在这个界面上添加规则,增加2181的端口对外访问。

image.png

    3. 配置完,就能通过telnet连接上这个端口了,重启kafka服务就正常了。其他服务异常,分析原理一样。


Tips:

    1. 若安装苍穹,配置文件上填写的是公网Ip,那么2181,3306,5672,6379,9200等相关端口都是要对外开放的。

    2. 若只是安装苍穹服务,安装时配置文件上,可填写内网IP,安装完成后,第一:在mc服务的安装目录下,修改setappenv.sh,将mc的地址改成外网地址,重启mc。第二:访问mc,集群管理,修改苍穹访问地址和文件服务器访问地址。

image.png

image.png

    

    3. 若是安装线上公共环境,一定要用公网IP,除非你的开发环境能连接上云服务器的内网IP。

赞 9