开始卖了.今天卸了不少下去. - 未名空间MITBBS历史存档

国际科技财经博客移民网络热点娱乐民生时事公众号

Redian新闻

>未名空间

>Stock

开始卖了.今天卸了不少下去.

开始卖了.今天卸了不少下去.# Stock

o*g2011-03-30 07:03

1 楼

要用python web crawling 搜狗微信。http://weixin.sogou.com 这个网站。
对于某个关键词，想找到某一定时间段，如一天内提到的文章。后来发现网站上有一个
filter, 可以限制时间段。现实在url 里是一个tsn 的参数，可以等于1,2,3,4.
但是发现如果在python 里直接用这个url crawl 往往结果是一堆乱码。如果去掉tsn
前面的"&"并且在搜索keyword里加上一个date,就会有结果。如果不加"&", 但是
keyword里不加date得到的html 不是乱码，但是没有结果。
具体的代码如下:
searchcontent=keyword
searchcontent=quote(searchcontent)
time_total=[]

sogou_search_url='http://weixin.sogou.com/weixin?type=2&ie=utf8&query='+searchcontent+'tsn='+str(timeframe)+'&ft=&et=&interation=&wxid=&usip='

if sogou_search_url is not None:
pages = requests.get(sogou_search_url, headers = cc_headers1, proxies=
urllib.request.getproxies(),)
soup = BeautifulSoup(pages.text, 'html.parser')

我用beautifulsoup 想爬虫那个web的html. python 3.6. 感觉是url有问题。谁知道怎
么改吗？
多谢。

s*22011-03-30 07:03

2 楼

NETEASE白折腾了. 没亏没赚.
其他的有亏有赚,2/3天总共赚了个1000不到.
觉得这么没有量的张心里没底,准备减仓先看看了.不然老不踏实.

o*g2011-03-30 07:03

3 楼

谁给解答一下，有包子。谢谢。

v*e2011-03-30 07:03

4 楼

90% cash... bought some edz.

x*92011-03-30 07:03

5 楼

包子有啥用
微信红包还有点用

s*22011-03-30 07:03

6 楼

我也持有少量FAZ. 等着看明天了.

【在 v********e 的大作中提到】

: 90% cash... bought some edz.

o*g2011-03-30 07:03

7 楼

paypal 行吗？我是认真的。我的微信里没有钱。最近有点疲惫。

【在 x********9 的大作中提到】

: 包子有啥用
: 微信红包还有点用

a*i2011-03-30 07:03

8 楼

http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&ft=&et=&interation=&wxid=&usip=
在浏览器里显示没问题

【在 o****g 的大作中提到】

: 要用python web crawling 搜狗微信。http://weixin.sogou.com 这个网站。
: 对于某个关键词，想找到某一定时间段，如一天内提到的文章。后来发现网站上有一个
: filter, 可以限制时间段。现实在url 里是一个tsn 的参数，可以等于1,2,3,4.
: 但是发现如果在python 里直接用这个url crawl 往往结果是一堆乱码。如果去掉tsn
: 前面的"&"并且在搜索keyword里加上一个date,就会有结果。如果不加"&", 但是
: keyword里不加date得到的html 不是乱码，但是没有结果。
: 具体的代码如下:
: searchcontent=keyword
: searchcontent=quote(searchcontent)
: time_total=[]

o*g2011-03-30 07:03

9 楼

你好，多谢回复。
我试了一下，如果在url 里加入tsn 参数，再贴在browser 里，搜索直接跳到weixin.
sogou.com
下面这个链接
http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&tsn=1&ft=&et=&interation=&wxid=&usip=
如果url 里没有tsn 参数，把链接贴在browser 里，能有搜索结果，但不是某个
tiemframe 的。
下面这个链接
http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&ft=&et=&interation=&wxid=&usip=
问题出在tsn 参数上。
我再去看看。谢谢。

【在 a****i 的大作中提到】

: http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&ft=&et=&interation=&wxid=&usip=
: 在浏览器里显示没问题

o*g2011-03-30 07:03

10 楼

试一下只用query 这个参数的连接也有结果
http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump
但是加上tsn 参数就不行。
http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&tsn=1
又跳转。
tsn 代表一个filter. 加filter 跳转说明了什么。
如何在python 代码里自动化 filter搜索？

【在 o****g 的大作中提到】

: 你好，多谢回复。
: 我试了一下，如果在url 里加入tsn 参数，再贴在browser 里，搜索直接跳到weixin.
: sogou.com
: 下面这个链接
: http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&tsn=1&ft=&et=&interation=&wxid=&usip=
: 如果url 里没有tsn 参数，把链接贴在browser 里，能有搜索结果，但不是某个
: tiemframe 的。
: 下面这个链接
: http://weixin.sogou.com/weixin?type=2&ie=utf8&query=trump&ft=&et=&interation=&wxid=&usip=
: 问题出在tsn 参数上。

a*i2011-03-30 07:03

11 楼

你要看看 weixin.sogou.com 的api啊
怎么样过滤时间

【在 o****g 的大作中提到】