S*e
3 楼
就是从一些网站抓link分析然后下载点东西。我目前只知道用java和apache的
httpclient抓回网页然后分析文本,今天google到一个叫selenium的东西,好像能简化
开发过程。不知道还有什么简单易用的?
httpclient抓回网页然后分析文本,今天google到一个叫selenium的东西,好像能简化
开发过程。不知道还有什么简单易用的?
i*i
6 楼
c*l
8 楼
phantomjs口碑相当不错
【在 i**i 的大作中提到】
: https://github.com/cheeriojs/cheerio 很好用
: http://phantomjs.org/ 没用过,比较牛。
【在 i**i 的大作中提到】
: https://github.com/cheeriojs/cheerio 很好用
: http://phantomjs.org/ 没用过,比较牛。
t*r
10 楼
赞,正打算找
c*l
11 楼
http://python.memect.com/?tag=textextraction
这里有一些text extract的东西,和web scrape不完全一样,但相关度很高
这里有一些text extract的东西,和web scrape不完全一样,但相关度很高
l*t
12 楼
嗯 动态页面 或者很多交互的话phantomjs不错
如果只是静态页面的话python beautifulsoup就可以搞定了
【在 i**i 的大作中提到】
: https://github.com/cheeriojs/cheerio 很好用
: http://phantomjs.org/ 没用过,比较牛。
如果只是静态页面的话python beautifulsoup就可以搞定了
【在 i**i 的大作中提到】
: https://github.com/cheeriojs/cheerio 很好用
: http://phantomjs.org/ 没用过,比较牛。
相关阅读
我发现这个版上搞安卓的好少请教java高手vert 跟 akka比有什么优势spring mobile frameworkPNWScala 2014开发IOS app 用的什么语言?说说这些技术,马工是不是都要掌握Hadoop运行时是不是用命令行执行的?Hadoop和Java有什么联系?这次python糗大了各位牛人士给说说kotlin问个技术问题下个月月初就失业了,请帮帮忙。is Haskell good?哪位大俠能简单解释一下怎麼用pypy么data visualization还是js最牛逼吧sml, any one know about it?求推荐free的ticket tracking system推荐一下几个可读性比较强的文档和书Def and val has a huge differenceGoogle了一下为啥Python留着GIL