avatar
y*r
1
请教一个问题:我要去德国工作3个月,申请德国签证 需要 valid US visa 可是我想
的是去了德国后再到当地使馆申请美国签证 这样会有问题么?不会非得要我去加拿大
申请个美国签证然后才能申请德国签证吧?
谢谢
avatar
l*c
2
用urllib2.urlopen() dump网页,发觉速度很慢,比Firefox慢1-2个数量集。问一下问
题在哪里?有什么好的解决方案?
avatar
w*g
3

我觉得就是要这样的。

【在 y********r 的大作中提到】
: 请教一个问题:我要去德国工作3个月,申请德国签证 需要 valid US visa 可是我想
: 的是去了德国后再到当地使馆申请美国签证 这样会有问题么?不会非得要我去加拿大
: 申请个美国签证然后才能申请德国签证吧?
: 谢谢

avatar
r*t
4
firefox 是个很大的软件了,你用 urllib2 没有任何 cache 的话,总的来说当然慢。

【在 l*****c 的大作中提到】
: 用urllib2.urlopen() dump网页,发觉速度很慢,比Firefox慢1-2个数量集。问一下问
: 题在哪里?有什么好的解决方案?

avatar
c*a
5
申请美国签证,否则你很可能就要美-》德—》中-》美玩转地球了
avatar
r*t
6
bench 一下看看哪个部分花时间最多?

【在 l*****c 的大作中提到】
: 用urllib2.urlopen() dump网页,发觉速度很慢,比Firefox慢1-2个数量集。问一下问
: 题在哪里?有什么好的解决方案?

avatar
l*c
7
我这么写的
handle = urllib2.urlopen("http://www.google.com/")
doc = handle.read()
在handle.read()上很慢。昨天在家里特别慢,今天到公司试了试,快了一个数量级,
比firefox还是慢不少。

【在 r****t 的大作中提到】
: bench 一下看看哪个部分花时间最多?
avatar
l*c
8
有比较popular且比urllib2强大的库推荐么?

【在 r****t 的大作中提到】
: firefox 是个很大的软件了,你用 urllib2 没有任何 cache 的话,总的来说当然慢。
avatar
r*t
9
你看中 performance 的话,可能用 pycurl 比较容易达到目标。
我没怎么用过,但是觉得 urllib2 灵活性很好,你可以轻松对付 cookie 这种东西。
因为 javascript 的原因我只用 selenium, 但是 firefox 3 支持还没发布。
http://pycurl.sourceforge.net/

【在 l*****c 的大作中提到】
: 有比较popular且比urllib2强大的库推荐么?
avatar
l*c
10
对performance没有要求那么高,不过是个LD要的小工具。不过现在是太慢了点。



【在 r****t 的大作中提到】
: 你看中 performance 的话,可能用 pycurl 比较容易达到目标。
: 我没怎么用过,但是觉得 urllib2 灵活性很好,你可以轻松对付 cookie 这种东西。
: 因为 javascript 的原因我只用 selenium, 但是 firefox 3 支持还没发布。
: http://pycurl.sourceforge.net/

avatar
r*t
11
华蟒用户组上有人问一样的问题,还搞定了,但是从邮件里面看不出怎么搞定的。
如果 firefox 比速度,建议把 UserAgent fake 成和 Firefox 一样,这样 server 端
的 throttle 可以避开。
urllib2 也可以让 http stay live, 怎么搞就不知道了,应该不是瓶颈。

【在 l*****c 的大作中提到】
: 对performance没有要求那么高,不过是个LD要的小工具。不过现在是太慢了点。
:
: 。

avatar
r*t
12
仔细看了下邮件列表,和我说的一样,把 UserAgent fake 一下就行了。刚看到你问的时候把这个基本 trick 给忘了, 因为不 fake UserAgent,不仅仅可能慢,通常你根本抓不到网页就出错了,server 端一般禁止这些 UserAgent。如果你是知道 server 端没有特别处理就不用这么做了。

【在 r****t 的大作中提到】
: 华蟒用户组上有人问一样的问题,还搞定了,但是从邮件里面看不出怎么搞定的。
: 如果 firefox 比速度,建议把 UserAgent fake 成和 Firefox 一样,这样 server 端
: 的 throttle 可以避开。
: urllib2 也可以让 http stay live, 怎么搞就不知道了,应该不是瓶颈。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。