Redian新闻
>
开始卖了.今天卸了不少下去.
avatar
开始卖了.今天卸了不少下去.# Stock
o*g
1
要用python web crawling 搜狗微信。http://weixin.sogou.com 这个网站。
对于某个关键词,想找到某一定时间段,如一天内提到的文章。后来发现网站上有一个
filter, 可以限制时间段。现实在url 里是一个tsn 的参数,可以等于1,2,3,4.
但是发现如果在python 里直接用这个url crawl 往往结果是一堆乱码。如果去掉tsn
前面的"&"并且在搜索keyword里加上一个date,就会有结果。如果不加"&", 但是
keyword里不加date得到的html 不是乱码,但是没有结果。
具体的代码如下:
searchcontent=keyword
searchcontent=quote(searchcontent)
time_total=[]

sogou_search_url='http://weixin.sogou.com/weixin?type=2&ie=utf8&query='+searchcontent+'tsn='+str(timeframe)+'&ft=&et=&interation=&wxid=&usip='

if sogou_search_url is not None:
pages = requests.get(sogou_search_url, headers = cc_headers1, proxies=
urllib.request.getproxies(),)
soup = BeautifulSoup(pages.text, 'html.parser')

我用beautifulsoup 想爬虫那个web的html. python 3.6. 感觉是url有问题。谁知道怎
么改吗?
多谢。
avatar
s*2
2
NETEASE白折腾了. 没亏没赚.
其他的有亏有赚,2/3天总共赚了个1000不到.
觉得这么没有量的张心里没底,准备减仓先看看了.不然老不踏实.
avatar
o*g
3
谁给解答一下,有包子。谢谢。
avatar
v*e
4
90% cash... bought some edz.
avatar
x*9
5
包子有啥用
微信红包还有点用
avatar
s*2
6
我也持有少量FAZ. 等着看明天了.

【在 v********e 的大作中提到】
: 90% cash... bought some edz.
avatar
o*g
7

paypal 行吗?我是认真的。我的微信里没有钱。最近有点疲惫。

【在 x********9 的大作中提到】
: 包子有啥用
: 微信红包还有点用

avatar
a*i
8
http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&ft=&et=&interation=&wxid=&usip=
在浏览器里显示没问题

【在 o****g 的大作中提到】
: 要用python web crawling 搜狗微信。http://weixin.sogou.com 这个网站。
: 对于某个关键词,想找到某一定时间段,如一天内提到的文章。后来发现网站上有一个
: filter, 可以限制时间段。现实在url 里是一个tsn 的参数,可以等于1,2,3,4.
: 但是发现如果在python 里直接用这个url crawl 往往结果是一堆乱码。如果去掉tsn
: 前面的"&"并且在搜索keyword里加上一个date,就会有结果。如果不加"&", 但是
: keyword里不加date得到的html 不是乱码,但是没有结果。
: 具体的代码如下:
: searchcontent=keyword
: searchcontent=quote(searchcontent)
: time_total=[]

avatar
o*g
9
你好,多谢回复。
我试了一下,如果在url 里加入tsn 参数,再贴在browser 里,搜索直接跳到weixin.
sogou.com
下面这个链接
http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&tsn=1&ft=&et=&interation=&wxid=&usip=
如果url 里没有tsn 参数,把链接贴在browser 里,能有搜索结果,但不是某个
tiemframe 的。
下面这个链接
http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&ft=&et=&interation=&wxid=&usip=
问题出在tsn 参数上。
我再去看看。谢谢。

【在 a****i 的大作中提到】
: http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&ft=&et=&interation=&wxid=&usip=
: 在浏览器里显示没问题

avatar
o*g
10
试一下只用query 这个参数的连接也有结果
http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump
但是加上tsn 参数就不行。
http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&tsn=1
又跳转。
tsn 代表一个filter. 加filter 跳转说明了什么。
如何在python 代码里自动化 filter搜索?

【在 o****g 的大作中提到】
: 你好,多谢回复。
: 我试了一下,如果在url 里加入tsn 参数,再贴在browser 里,搜索直接跳到weixin.
: sogou.com
: 下面这个链接
: http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&tsn=1&ft=&et=&interation=&wxid=&usip=
: 如果url 里没有tsn 参数,把链接贴在browser 里,能有搜索结果,但不是某个
: tiemframe 的。
: 下面这个链接
: http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&ft=&et=&interation=&wxid=&usip=
: 问题出在tsn 参数上。

avatar
a*i
11
你要看看 weixin.sogou.com 的api啊
怎么样过滤时间

【在 o****g 的大作中提到】
: 你好,多谢回复。
: 我试了一下,如果在url 里加入tsn 参数,再贴在browser 里,搜索直接跳到weixin.
: sogou.com
: 下面这个链接
: http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&tsn=1&ft=&et=&interation=&wxid=&usip=
: 如果url 里没有tsn 参数,把链接贴在browser 里,能有搜索结果,但不是某个
: tiemframe 的。
: 下面这个链接
: http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&ft=&et=&interation=&wxid=&usip=
: 问题出在tsn 参数上。

avatar
w*u
12
url.encode?查查cookie header
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。