Redian新闻
>
如何快速处理大量网上xml文件? (转载)
avatar
如何快速处理大量网上xml文件? (转载)# Java - 爪哇娇娃
g*n
1
【 以下文字转载自 Programming 讨论区 】
发信人: guanjun (guanjun), 信区: Programming
标 题: 如何快速处理大量网上xml文件?
发信站: BBS 未名空间站 (Mon Aug 24 20:33:14 2015, 美东)
小弟新手,恳请各位大侠指点。万分感激!
只用单个电脑, 不用hadoop/spark这些框架
网上有大约60万个xml文件,比如下面是一个:
http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?db=pub
需要解析每个文件,结果然后存在电脑上。现在的程序每次都要访问网上的文件,大约
耗时3天才能完成。
有没有更加高效的方法,快速完成?
avatar
m*u
2
为什么要解析后存放,不解析文件能存放么?难道会影响后续分析?
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。