Redian新闻
>
Hadoop输入文件是.gz files,一般怎么处理?
avatar
Hadoop输入文件是.gz files,一般怎么处理?# JobHunting - 待字闺中
j*v
1
hadoop jar test.jar Test inputFileFolder outputFileFolder
inputFileFolder里存了5个9G左右的.gz files,想请问一下大家,用Hadoop处理这个
inputFileFolder里的文件,如果不解压缩文件一般采用什么方法?怎样配置参数比较
好?谢谢!
avatar
m*n
2
http://stackoverflow.com/questions/26576985/mapreduce-in-java-g

【在 j********v 的大作中提到】
: hadoop jar test.jar Test inputFileFolder outputFileFolder
: inputFileFolder里存了5个9G左右的.gz files,想请问一下大家,用Hadoop处理这个
: inputFileFolder里的文件,如果不解压缩文件一般采用什么方法?怎样配置参数比较
: 好?谢谢!

avatar
C*e
3
hadoop可以自动根据输入的后缀名来解压缩,用户什么都不用做。

【在 j********v 的大作中提到】
: hadoop jar test.jar Test inputFileFolder outputFileFolder
: inputFileFolder里存了5个9G左右的.gz files,想请问一下大家,用Hadoop处理这个
: inputFileFolder里的文件,如果不解压缩文件一般采用什么方法?怎样配置参数比较
: 好?谢谢!

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。