问个用python scratch yelp html 数据的问题# Programming - 葵花宝典y*e2014-11-14 08:111 楼这次过来,待了半年回去,如果接下来半年不打算来的话,下次再去签证是免面签么,大概是哪段时间,签证过期一年内?中信代签要交多少手续费啊,打指纹怎么办?要外地的还得飞到北京去打指纹么?多谢了
X*12014-11-14 08:112 楼请问如何在yelp的网页里,只下载1 star and 2 star的review data? 下面的code只是下载review的,包含送有star的review. 多谢了。import sysimport urllib.requestfrom bs4 import BeautifulSoupurl = ('http://www.yelp.com/biz/starbucks-new-york-134')ourUrl = urllib.request.urlopen(url)soup = BeautifulSoup(ourUrl)new_string = str(soup.find_all('p', "review_comment ieSucks"))a = new_string.index('')review = str(new_string[0:a])while a > 0:try:a = new_string.index('')except ValueError:breakreview = new_string[0:a]if '' in review:review.replace('', '')print(review, 'n')new_string = new_string[a+73: -1]
s*r2014-11-14 08:113 楼对,你理解的对【在 y***e 的大作中提到】: 这次过来,待了半年回去,如果接下来半年不打算来的话,下次再去签证是免面签么,: 大概是哪段时间,签证过期一年内?中信代签要交多少手续费啊,打指纹怎么办?要外: 地的还得飞到北京去打指纹么?多谢了
p*r2014-11-14 08:116 楼怎么抓不出来?看了一下source code可以根据class抓star-img stars_2python不知道,用c#很方便先把网页内容抓下来,然后用regex pattern含有stars_1 or 2的parent tag然后再抓review。
t*r2014-11-14 08:118 楼i mean LZ's script cannot get star.【在 p**r 的大作中提到】: 怎么抓不出来?: 看了一下source code: 可以根据class抓star-img stars_2: python不知道,用c#很方便: 先把网页内容抓下来,: 然后用regex pattern含有stars_1 or 2的parent tag: 然后再抓review。
e*g2014-11-14 08:119 楼是免面签,签证过期两年内.代交手续费具体多少看大使馆网站.不用打指纹.【在 y***e 的大作中提到】: 这次过来,待了半年回去,如果接下来半年不打算来的话,下次再去签证是免面签么,: 大概是哪段时间,签证过期一年内?中信代签要交多少手续费啊,打指纹怎么办?要外: 地的还得飞到北京去打指纹么?多谢了
y*e2014-11-14 08:1111 楼多谢多谢是免面签,签证过期两年内.代交手续费具体多少看大使馆网站.不用打指纹.【在 e*******g 的大作中提到】: 是免面签,: 签证过期两年内.: 代交手续费具体多少看大使馆网站.: 不用打指纹.
y*e2014-11-14 08:1113 楼已有的签证仍有效或失效日期未超过12个月是一年内吧,前面是什么意思,签证有效谁会去再次送钱签证啊是免面签,签证过期两年内.代交手续费具体多少看大使馆网站.不用打指纹.【在 e*******g 的大作中提到】: 是免面签,: 签证过期两年内.: 代交手续费具体多少看大使馆网站.: 不用打指纹.