avatar
Cravath's profit down 24%# Law - 律师事务所
w*r
1
我已经取了大约5千到1万个网页,分析,提取其中的内容。
提取出来的内容,保存的时候,需要有id, url, 正文,访问时间等等一系列内容。正
文一般都不大,可能1k字节是上限。
我该采取什么结构来存这些文件呢?这些文件存在一个大文件里即可,不需要分开存储
。 我能想到的是数据库和xml文件。大部分时间只是阅读这些文件,偶尔可能会排一下
序。怎么保存能够容易读取、排序呢?还有,阅读的时候,偶尔可能在某个文件上面加
上几行注释再保存。
高手们给我指点一下?
谢谢!
avatar
D*s
2
Cravath is hurt more probably because of their lack of diversification.
WLRK's profit will probably decline a lot, too.
avatar
g*g
3
DB

【在 w*********r 的大作中提到】
: 我已经取了大约5千到1万个网页,分析,提取其中的内容。
: 提取出来的内容,保存的时候,需要有id, url, 正文,访问时间等等一系列内容。正
: 文一般都不大,可能1k字节是上限。
: 我该采取什么结构来存这些文件呢?这些文件存在一个大文件里即可,不需要分开存储
: 。 我能想到的是数据库和xml文件。大部分时间只是阅读这些文件,偶尔可能会排一下
: 序。怎么保存能够容易读取、排序呢?还有,阅读的时候,偶尔可能在某个文件上面加
: 上几行注释再保存。
: 高手们给我指点一下?
: 谢谢!

avatar
c*d
4
what a surprise
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。