Thursday, March 18, 2010

解决Hadoop中的“输出目录已存在”的问题

Hadoop中使用Map Reduce时,每次运行的输出目录必须事先未建好,导致如果想使用相同的output目录,每次运行程序之前都要先删掉之前的输出目录。其实这一操作可以嵌到代码中执行:

FileSystem fstm = FileSystem.get(conf);
Path outDir = new Path(args[2]);
fstm.delete(outDir, true);


这样即可解决问题。

No comments: