Redian新闻
>
python 网络爬虫和数据处理
avatar
python 网络爬虫和数据处理# DataSciences - 数据科学
D*o
1
这是上个月拍摄的一组婚纱照。很喜欢这对留学生新人,感谢她们的信任。拍摄在旧金
山,男生今年刚PHD毕业,双喜临门。在旧金山的市政厅举行了一个简短小型的婚礼仪
式,温馨感人,仪式结束后拍摄了一组婚纱照。自己很喜欢这组复古风格的婚纱照。
avatar
B*5
2
正在学习python。 请问高手们一个问题。如果需要从几个特定的专业网站上抓取有用
的信息。 每个网站大概有3千个产品,也就是有三千页格式大致相同的网页。每个网页
我需要提取产品名称,价格,产地,等等大概5到8条关键文本信息, 图片啥的统统不
要。我需要用到什么库呢。需要把这些网页拔下来存成某种格式的文件。
第二阶段就是做数据处理,从比较乱的文件中提取我要的几条信息,以统一格式存到
excel里。这个是不是也可以用python来实现? 还是用VBA等别的语言比较好。
请有经验的大牛分享一下。 谢过!
avatar
z*r
3
很美,赞!

【在 D********o 的大作中提到】
: 这是上个月拍摄的一组婚纱照。很喜欢这对留学生新人,感谢她们的信任。拍摄在旧金
: 山,男生今年刚PHD毕业,双喜临门。在旧金山的市政厅举行了一个简短小型的婚礼仪
: 式,温馨感人,仪式结束后拍摄了一组婚纱照。自己很喜欢这组复古风格的婚纱照。

avatar
d*n
4
scrapy . 如果是table, pandas 的read_html就行了。

【在 B*********5 的大作中提到】
: 正在学习python。 请问高手们一个问题。如果需要从几个特定的专业网站上抓取有用
: 的信息。 每个网站大概有3千个产品,也就是有三千页格式大致相同的网页。每个网页
: 我需要提取产品名称,价格,产地,等等大概5到8条关键文本信息, 图片啥的统统不
: 要。我需要用到什么库呢。需要把这些网页拔下来存成某种格式的文件。
: 第二阶段就是做数据处理,从比较乱的文件中提取我要的几条信息,以统一格式存到
: excel里。这个是不是也可以用python来实现? 还是用VBA等别的语言比较好。
: 请有经验的大牛分享一下。 谢过!

avatar
o*g
5
很赞!祝福新人

【在 D********o 的大作中提到】
: 这是上个月拍摄的一组婚纱照。很喜欢这对留学生新人,感谢她们的信任。拍摄在旧金
: 山,男生今年刚PHD毕业,双喜临门。在旧金山的市政厅举行了一个简短小型的婚礼仪
: 式,温馨感人,仪式结束后拍摄了一组婚纱照。自己很喜欢这组复古风格的婚纱照。

avatar
B*5
6
非常感谢!明天又有新东西学习了。

【在 d*****n 的大作中提到】
: scrapy . 如果是table, pandas 的read_html就行了。
avatar
o*g
7
喜欢这个色彩

【在 D********o 的大作中提到】
: 这是上个月拍摄的一组婚纱照。很喜欢这对留学生新人,感谢她们的信任。拍摄在旧金
: 山,男生今年刚PHD毕业,双喜临门。在旧金山的市政厅举行了一个简短小型的婚礼仪
: 式,温馨感人,仪式结束后拍摄了一组婚纱照。自己很喜欢这组复古风格的婚纱照。

avatar
B*5
8
正在学习python。 请问高手们一个问题。如果需要从几个特定的专业网站上抓取有用
的信息。 每个网站大概有3千个产品,也就是有三千页格式大致相同的网页。每个网页
我需要提取产品名称,价格,产地,等等大概5到8条关键文本信息, 图片啥的统统不
要。我需要用到什么库呢。需要把这些网页拔下来存成某种格式的文件。
第二阶段就是做数据处理,从比较乱的文件中提取我要的几条信息,以统一格式存到
excel里。这个是不是也可以用python来实现? 还是用VBA等别的语言比较好。
请有经验的大牛分享一下。 谢过!
avatar
d*n
9
scrapy . 如果是table, pandas 的read_html就行了。

【在 B*********5 的大作中提到】
: 正在学习python。 请问高手们一个问题。如果需要从几个特定的专业网站上抓取有用
: 的信息。 每个网站大概有3千个产品,也就是有三千页格式大致相同的网页。每个网页
: 我需要提取产品名称,价格,产地,等等大概5到8条关键文本信息, 图片啥的统统不
: 要。我需要用到什么库呢。需要把这些网页拔下来存成某种格式的文件。
: 第二阶段就是做数据处理,从比较乱的文件中提取我要的几条信息,以统一格式存到
: excel里。这个是不是也可以用python来实现? 还是用VBA等别的语言比较好。
: 请有经验的大牛分享一下。 谢过!

avatar
B*5
10
非常感谢!明天又有新东西学习了。

【在 d*****n 的大作中提到】
: scrapy . 如果是table, pandas 的read_html就行了。
avatar
s*f
11
可以看看beautiful soup相关的。
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。