Zookeeper(3.4.5)集群崩了报错如下:
网上看了下一般硬盘满后才会抛出:Last transaction was partial 这个报错。集群崩了重启报这个错,分析应该是数据文件同步读取异常,缺失导致无法启动,解决方法就是将zk的数据目录下version-2目录mv或者删除再重启集群就ok了。这个好像是zk的一个bug。生产中建议datadir和datalogdir不要放同一个目录下:
dataDir=/data/zookeeper/version-2
dataLogDir=/data/zookeeper/logs/
详情如下:
Zookeeper CancelledKeyException报错是同步延时造成的,可以修改zoo.cfg把同步时间加大,或者打补丁解决。
解决方法如下: