HDFS missing block 问题处理记录
问题&环境说明
- 问题
IDC机房突然异常断电,导致机器大规模断电重启,并出现IDC内网网络故障 |
- 环境信息
Hadoop Version: 2.6.0-cdh5.8.4 |
排查问题
nanmenode 提示miss block
获取missing block 列表
sudo su - hdfs |
- 查看内容
head 1215-miss-block.txt
blk_12885018324 /user/hive/warehouse/.... |
- 统计涉及的表和目录
提取目录的前7层,涉及的hive库和table
cat 1215-miss-block.txt | awk '{print $2}' | awk -F'/' '{ print $1"/"$2"/"$3"/"$4"/"$5"/"$6"/"$7 }' | sort | uniq |
后续
对于缺失的块,如何修复:
机器可以恢复 ---> ,修复机器,并启动datanode |