python 网络爬虫和数据处理# DataSciences - 数据科学D*o2015-10-21 07:101 楼这是上个月拍摄的一组婚纱照。很喜欢这对留学生新人,感谢她们的信任。拍摄在旧金山,男生今年刚PHD毕业,双喜临门。在旧金山的市政厅举行了一个简短小型的婚礼仪式,温馨感人,仪式结束后拍摄了一组婚纱照。自己很喜欢这组复古风格的婚纱照。
B*52015-10-21 07:102 楼正在学习python。 请问高手们一个问题。如果需要从几个特定的专业网站上抓取有用的信息。 每个网站大概有3千个产品,也就是有三千页格式大致相同的网页。每个网页我需要提取产品名称,价格,产地,等等大概5到8条关键文本信息, 图片啥的统统不要。我需要用到什么库呢。需要把这些网页拔下来存成某种格式的文件。第二阶段就是做数据处理,从比较乱的文件中提取我要的几条信息,以统一格式存到excel里。这个是不是也可以用python来实现? 还是用VBA等别的语言比较好。请有经验的大牛分享一下。 谢过!
z*r2015-10-21 07:103 楼很美,赞!【在 D********o 的大作中提到】: 这是上个月拍摄的一组婚纱照。很喜欢这对留学生新人,感谢她们的信任。拍摄在旧金: 山,男生今年刚PHD毕业,双喜临门。在旧金山的市政厅举行了一个简短小型的婚礼仪: 式,温馨感人,仪式结束后拍摄了一组婚纱照。自己很喜欢这组复古风格的婚纱照。
d*n2015-10-21 07:104 楼scrapy . 如果是table, pandas 的read_html就行了。【在 B*********5 的大作中提到】: 正在学习python。 请问高手们一个问题。如果需要从几个特定的专业网站上抓取有用: 的信息。 每个网站大概有3千个产品,也就是有三千页格式大致相同的网页。每个网页: 我需要提取产品名称,价格,产地,等等大概5到8条关键文本信息, 图片啥的统统不: 要。我需要用到什么库呢。需要把这些网页拔下来存成某种格式的文件。: 第二阶段就是做数据处理,从比较乱的文件中提取我要的几条信息,以统一格式存到: excel里。这个是不是也可以用python来实现? 还是用VBA等别的语言比较好。: 请有经验的大牛分享一下。 谢过!
o*g2015-10-21 07:105 楼很赞!祝福新人【在 D********o 的大作中提到】: 这是上个月拍摄的一组婚纱照。很喜欢这对留学生新人,感谢她们的信任。拍摄在旧金: 山,男生今年刚PHD毕业,双喜临门。在旧金山的市政厅举行了一个简短小型的婚礼仪: 式,温馨感人,仪式结束后拍摄了一组婚纱照。自己很喜欢这组复古风格的婚纱照。
o*g2015-10-21 07:107 楼喜欢这个色彩【在 D********o 的大作中提到】: 这是上个月拍摄的一组婚纱照。很喜欢这对留学生新人,感谢她们的信任。拍摄在旧金: 山,男生今年刚PHD毕业,双喜临门。在旧金山的市政厅举行了一个简短小型的婚礼仪: 式,温馨感人,仪式结束后拍摄了一组婚纱照。自己很喜欢这组复古风格的婚纱照。
B*52015-10-21 07:108 楼正在学习python。 请问高手们一个问题。如果需要从几个特定的专业网站上抓取有用的信息。 每个网站大概有3千个产品,也就是有三千页格式大致相同的网页。每个网页我需要提取产品名称,价格,产地,等等大概5到8条关键文本信息, 图片啥的统统不要。我需要用到什么库呢。需要把这些网页拔下来存成某种格式的文件。第二阶段就是做数据处理,从比较乱的文件中提取我要的几条信息,以统一格式存到excel里。这个是不是也可以用python来实现? 还是用VBA等别的语言比较好。请有经验的大牛分享一下。 谢过!
d*n2015-10-21 07:109 楼scrapy . 如果是table, pandas 的read_html就行了。【在 B*********5 的大作中提到】: 正在学习python。 请问高手们一个问题。如果需要从几个特定的专业网站上抓取有用: 的信息。 每个网站大概有3千个产品,也就是有三千页格式大致相同的网页。每个网页: 我需要提取产品名称,价格,产地,等等大概5到8条关键文本信息, 图片啥的统统不: 要。我需要用到什么库呢。需要把这些网页拔下来存成某种格式的文件。: 第二阶段就是做数据处理,从比较乱的文件中提取我要的几条信息,以统一格式存到: excel里。这个是不是也可以用python来实现? 还是用VBA等别的语言比较好。: 请有经验的大牛分享一下。 谢过!