Hadoop输入文件是.gz files,一般怎么处理?# JobHunting - 待字闺中
j*v
1 楼
hadoop jar test.jar Test inputFileFolder outputFileFolder
inputFileFolder里存了5个9G左右的.gz files,想请问一下大家,用Hadoop处理这个
inputFileFolder里的文件,如果不解压缩文件一般采用什么方法?怎样配置参数比较
好?谢谢!
inputFileFolder里存了5个9G左右的.gz files,想请问一下大家,用Hadoop处理这个
inputFileFolder里的文件,如果不解压缩文件一般采用什么方法?怎样配置参数比较
好?谢谢!