‡A Case Of Identity‡

頑張ります!

HDFSのfindコマンド

HDFS上の/tmpにログがたまってるので消したいけど、findコマンドとかないかなぁと探したらあった。「hfind」というやつ。
http://pub.mouraf.org/blog/2010/09/hfind-a-find-utility-for-hadoop/
結局mtimeが取りたいのだけど、他のやり方だとawk使ったりでスクリプト書くか、Javaで更新時間取るとかかなぁ・・・。
findコマンドのmtimeで+10,-10とかするけど、hfindのはfindコマンドのとは逆の動きをしている気がする・・・。
Hadoopのバージョンが違うと怒られ続けて、gitから落としてきてhadoop-coreのバージョン変えたりしてみたけど、結局逆方向にバージョンを変えていたようだ。使っているHadoopのバージョンの方が新しいようだ。でも、本番環境では使えた。Staging環境とバージョンが違うのをどうにかしないと・・・。