Redian新闻
>
漂亮法国妹妹 Juliette Valduriez 自弹原创
avatar
漂亮法国妹妹 Juliette Valduriez 自弹原创# MusicPlayer - 乐手之家
h*l
1
我现在J1,博后,老婆和小孩从国内过来度假,大概呆一个月,应该申请J2还是B2?
J2好像学校帮cover保险,是不是申请J2好一些?
avatar
B*D
2
偶有1.7万个厂家的名称和厂家网站这两个信息。
需要进一步人工整理出标准化的地址数据。
这样的活,国内什么网站上去找人做比较合适?
偶不太想到大学的BBS上去找兼职。
avatar
l*i
3
Chin & Ho CPAs
264 Canal Street Suite 4E
对OPT,tax treaty不懂不熟悉就算了,还要态度蛮横无理,诋毁羞辱顾客,以无知为
荣,因循守旧。一女性主管态度尤为恶劣,当你提出点异议,她立刻显露泼妇之势,拒
绝退还预定金也就是情理之中的了。真后悔自讨苦吃。在此揭发,让大家不要浪费时间
浪费金钱还自找郁闷。
avatar
s*u
5
J2 is better.
avatar
b*y
6
如果不复杂,我可以免费帮你做。如果复杂,收一点点工本费,可以帮你。站内联系吧
avatar
R*i
7
我想做这把吉他,在美女的胸口挤来挤去!
avatar
b*y
8
补充:如果需要编程解决的话。否则纯手工,偶帮不上啦
avatar
k*t
10
amazon's human cloud:
https://www.mturk.com/mturk/welcome

【在 B*D 的大作中提到】
: 偶有1.7万个厂家的名称和厂家网站这两个信息。
: 需要进一步人工整理出标准化的地址数据。
: 这样的活,国内什么网站上去找人做比较合适?
: 偶不太想到大学的BBS上去找兼职。

avatar
f*g
11
没记错的话你不是女生吗。怎么有这种不良嗜好。

【在 R**i 的大作中提到】
: 我想做这把吉他,在美女的胸口挤来挤去!
avatar
e*7
12
Re,
排除去国内找便宜劳力,这个算是很好的选择

【在 k******t 的大作中提到】
: amazon's human cloud:
: https://www.mturk.com/mturk/welcome

avatar
R*i
13
我替你说的

【在 f****g 的大作中提到】
: 没记错的话你不是女生吗。怎么有这种不良嗜好。
avatar
a*s
14
Shouldn't this be an ETL issue? I thought there was a guy doing it on this
board?
avatar
l*g
15
有认识这个mm的吗?
我去投条!
avatar
B*D
16
我想只能人工处理
否则那么多不同的网站,你怎么抓取每个公司的地址信息,并且标准化呢?
自动抓我觉得数据质量肯定很低?

【在 a***s 的大作中提到】
: Shouldn't this be an ETL issue? I thought there was a guy doing it on this
: board?

avatar
e*7
18
是啊,除非这些公司的信息都在同一网站

【在 B*D 的大作中提到】
: 我想只能人工处理
: 否则那么多不同的网站,你怎么抓取每个公司的地址信息,并且标准化呢?
: 自动抓我觉得数据质量肯定很低?

avatar
l*g
21
我喜欢这个姑娘
avatar
d*n
22
看起来是牛人来了,请教一个入门级问题。自己租空间搞的购物系统,没有专人维护的
话,安全性如何?不保存信用卡信息就没安全问题了?Amazon上开店的话,安全应该就
是amazon负责了吧?

【在 ET 的大作中提到】
: 我还面试过这个组的manager
avatar
L*w
23
你这程序这么聪明?

【在 b******y 的大作中提到】
: 补充:如果需要编程解决的话。否则纯手工,偶帮不上啦
avatar
b*y
24

过奖,没那么聪明。另外,我从来不喜欢artificial intelligence的东东,认为都是
忽悠。我的计算机领域是distributed systems and information retrieval.

【在 L******w 的大作中提到】
: 你这程序这么聪明?
avatar
L*w
25
那你怎么抓地址?

【在 b******y 的大作中提到】
:
: 过奖,没那么聪明。另外,我从来不喜欢artificial intelligence的东东,认为都是
: 忽悠。我的计算机领域是distributed systems and information retrieval.

avatar
a*s
26
通过screen scraping/browser automation查关键字,打开新的url,再模糊匹配,最
后查邮局的服务纠正地址。有冲突就根据公司名字去政府注册表查一下。
这个问题细节有点复杂,有的公司贴出多个地址,只有一个是headquarter。总之这一
类的doable

【在 L******w 的大作中提到】
: 那你怎么抓地址?
avatar
L*w
27
政府注册表去哪里查?就算能查,也不能自动吧, 太花时间了。
邮局的服务怎么纠正地址,能给你接口白用?

【在 a***s 的大作中提到】
: 通过screen scraping/browser automation查关键字,打开新的url,再模糊匹配,最
: 后查邮局的服务纠正地址。有冲突就根据公司名字去政府注册表查一下。
: 这个问题细节有点复杂,有的公司贴出多个地址,只有一个是headquarter。总之这一
: 类的doable

avatar
a*s
28
yes it is a detailed work but you can automate it
and yes it is a free api. USPS has a stake in this since the inaccurate
address increases their side of cost as well.
只有想不到的,没有做不到的。

【在 L******w 的大作中提到】
: 政府注册表去哪里查?就算能查,也不能自动吧, 太花时间了。
: 邮局的服务怎么纠正地址,能给你接口白用?

avatar
b*y
29

赞,就是看花多大功夫的问题。至少可以半自动化的解决

【在 a***s 的大作中提到】
: yes it is a detailed work but you can automate it
: and yes it is a free api. USPS has a stake in this since the inaccurate
: address increases their side of cost as well.
: 只有想不到的,没有做不到的。

avatar
a*s
30
Actually the validation of business names can be done fully automated, with
some code. The challenge is when the business name has a conflict or is not
complete (e.g. ABC Tech on website, ABC Technologies Incorporated in the
registry) the logic has to somehow resolve it.
I once parsed SEC Filings and encountered similar problems.

【在 b******y 的大作中提到】
:
: 赞,就是看花多大功夫的问题。至少可以半自动化的解决

avatar
L*w
31
registry在哪里可以找到? 也有API?
这些缩写就要程序处理了,比如ctr和center自动转换,两个都试试。

with
not

【在 a***s 的大作中提到】
: Actually the validation of business names can be done fully automated, with
: some code. The challenge is when the business name has a conflict or is not
: complete (e.g. ABC Tech on website, ABC Technologies Incorporated in the
: registry) the logic has to somehow resolve it.
: I once parsed SEC Filings and encountered similar problems.

avatar
i*i
32
你先贴几个比较典型的数据,不需要真实数据。看看格式怎么样。
应该不难吧。

【在 B*D 的大作中提到】
: 偶有1.7万个厂家的名称和厂家网站这两个信息。
: 需要进一步人工整理出标准化的地址数据。
: 这样的活,国内什么网站上去找人做比较合适?
: 偶不太想到大学的BBS上去找兼职。

avatar
b*y
33

我怀疑API都是要钱的。

【在 L******w 的大作中提到】
: registry在哪里可以找到? 也有API?
: 这些缩写就要程序处理了,比如ctr和center自动转换,两个都试试。
:
: with
: not

avatar
w*e
34
做中文的要用猪八戒,mturk上放过中文的东西,不但慢、少,而且质量不高。
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。