Redian新闻
>
自动分析网页的Python 库?
avatar
自动分析网页的Python 库?# Programming - 葵花宝典
n*2
1
有没有方便的Python 库用来自动分析一个复杂的网页?
比如, 有的复杂网页需要比较复杂的Form Post, 不符合该网页的 Post 会被服务器拒
绝。 如果有一个方便的工具能自动分析该网页,然后自动构建合适的Post,那就比较
方便了。
再比如http://www.kuwo.cn/yinyue/1846021/ 怎样才能下载这个网页里的音乐文件?如果有一个方便的工具能自动分析该网页,然后自动构建合适的request,那就比较方便了。
如果 Python 没有这样的库,别的语言(比如Java 或者JavaScript)也是可以的。
谢谢。
avatar
a9
2
用fiddler,charles抓一下包。
或者直接用chrome分析一下也行。

【在 n*********2 的大作中提到】
: 有没有方便的Python 库用来自动分析一个复杂的网页?
: 比如, 有的复杂网页需要比较复杂的Form Post, 不符合该网页的 Post 会被服务器拒
: 绝。 如果有一个方便的工具能自动分析该网页,然后自动构建合适的Post,那就比较
: 方便了。
: 再比如http://www.kuwo.cn/yinyue/1846021/ 怎样才能下载这个网页里的音乐文件?如果有一个方便的工具能自动分析该网页,然后自动构建合适的request,那就比较方便了。
: 如果 Python 没有这样的库,别的语言(比如Java 或者JavaScript)也是可以的。
: 谢谢。

avatar
n*2
3
谢谢回复。
这个感觉还是太底层了点,感觉需要很多劳力。而且每个网站都不同,来一个新的网站
,就得从头再来。
有没有一些库将这些步骤自动化(减少人工干预)?

【在 a9 的大作中提到】
: 用fiddler,charles抓一下包。
: 或者直接用chrome分析一下也行。

avatar
n*3
4
data driven 的东西, 狠难很简单得 自动化

【在 n*********2 的大作中提到】
: 谢谢回复。
: 这个感觉还是太底层了点,感觉需要很多劳力。而且每个网站都不同,来一个新的网站
: ,就得从头再来。
: 有没有一些库将这些步骤自动化(减少人工干预)?

avatar
L*s
5
http://www.crummy.com/software/BeautifulSoup/
特殊的需求要自己定制

方便了。

【在 n*********2 的大作中提到】
: 有没有方便的Python 库用来自动分析一个复杂的网页?
: 比如, 有的复杂网页需要比较复杂的Form Post, 不符合该网页的 Post 会被服务器拒
: 绝。 如果有一个方便的工具能自动分析该网页,然后自动构建合适的Post,那就比较
: 方便了。
: 再比如http://www.kuwo.cn/yinyue/1846021/ 怎样才能下载这个网页里的音乐文件?如果有一个方便的工具能自动分析该网页,然后自动构建合适的request,那就比较方便了。
: 如果 Python 没有这样的库,别的语言(比如Java 或者JavaScript)也是可以的。
: 谢谢。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。