c*t
2 楼
我的H1-B延了几次,需要把所有的I-797 notice都提交吗?还是要最近一次
I-94我只保留现在的,我看到有人还把以前的也留底并提交了,请问需要这样做吗
谢谢
I-94我只保留现在的,我看到有人还把以前的也留底并提交了,请问需要这样做吗
谢谢
c*a
3 楼
想去homedepot用,明天就要,来不及网上申请了。有谁能share一个不?
多谢
多谢
u*o
4 楼
cache?
M*X
5 楼
documents since the last entry only.
c*n
7 楼
网页里插段js?
z*e
15 楼
aop上一个interceptor生成log
把log放到cassandra里面去
最后用mapreduce找结果
这是大的具体到实现的想法
如果是纯粹内存中的结果的话
先实现拦截器
然后找个结构存放
随便你用什么,比如最简单的,用arraylist吧
然后启动一个额外的线程
对list里面的超时的予以删除
这里有并发冲突的问题,那么老样子,上java.util.concurrent包
解法很多,看对方期望的是什么
把log放到cassandra里面去
最后用mapreduce找结果
这是大的具体到实现的想法
如果是纯粹内存中的结果的话
先实现拦截器
然后找个结构存放
随便你用什么,比如最简单的,用arraylist吧
然后启动一个额外的线程
对list里面的超时的予以删除
这里有并发冲突的问题,那么老样子,上java.util.concurrent包
解法很多,看对方期望的是什么
r*s
17 楼
这个是经典的stream processing问题。
Server把url扔到后端,后端有数个server或者process,最简单的方法就是hash url然
后决定按hashcode把url扔到那个server或者process (modulo就可以了),这个
process就把url累计count一下,然后把url:count这个pair 扔到后一级的process或者
server,后一级的server把url:count存到一个concurrent hashmap里。一个thread 大
概每10秒钟把这个map扫一遍,给出前10名。
这是很粗略的方法,讲究一些的可以加各种花里胡哨的东西上去。
知道twitter storm吗?就是干这个的。http://storm-project.net/ 阿里巴巴和淘宝都在用,估计那个主要开发者Xu Mingming也是淘宝的。 竞争对手是Apache S4,但是S4明显不是对手。
Server把url扔到后端,后端有数个server或者process,最简单的方法就是hash url然
后决定按hashcode把url扔到那个server或者process (modulo就可以了),这个
process就把url累计count一下,然后把url:count这个pair 扔到后一级的process或者
server,后一级的server把url:count存到一个concurrent hashmap里。一个thread 大
概每10秒钟把这个map扫一遍,给出前10名。
这是很粗略的方法,讲究一些的可以加各种花里胡哨的东西上去。
知道twitter storm吗?就是干这个的。http://storm-project.net/ 阿里巴巴和淘宝都在用,估计那个主要开发者Xu Mingming也是淘宝的。 竞争对手是Apache S4,但是S4明显不是对手。
A*H
19 楼
你这些counter都是ignore time的
如果查询是dynamic time range的呢(top K urls in recent N mins)
storm也不是完美的,它本身design是允许有误差的,twiiter要发布的hummingbird就
是结合online (storm) &offline (hadoop),for accuracy
【在 r****s 的大作中提到】
: 这个是经典的stream processing问题。
: Server把url扔到后端,后端有数个server或者process,最简单的方法就是hash url然
: 后决定按hashcode把url扔到那个server或者process (modulo就可以了),这个
: process就把url累计count一下,然后把url:count这个pair 扔到后一级的process或者
: server,后一级的server把url:count存到一个concurrent hashmap里。一个thread 大
: 概每10秒钟把这个map扫一遍,给出前10名。
: 这是很粗略的方法,讲究一些的可以加各种花里胡哨的东西上去。
: 知道twitter storm吗?就是干这个的。http://storm-project.net/ 阿里巴巴和淘宝都在用,估计那个主要开发者Xu Mingming也是淘宝的。 竞争对手是Apache S4,但是S4明显不是对手。
如果查询是dynamic time range的呢(top K urls in recent N mins)
storm也不是完美的,它本身design是允许有误差的,twiiter要发布的hummingbird就
是结合online (storm) &offline (hadoop),for accuracy
【在 r****s 的大作中提到】
: 这个是经典的stream processing问题。
: Server把url扔到后端,后端有数个server或者process,最简单的方法就是hash url然
: 后决定按hashcode把url扔到那个server或者process (modulo就可以了),这个
: process就把url累计count一下,然后把url:count这个pair 扔到后一级的process或者
: server,后一级的server把url:count存到一个concurrent hashmap里。一个thread 大
: 概每10秒钟把这个map扫一遍,给出前10名。
: 这是很粗略的方法,讲究一些的可以加各种花里胡哨的东西上去。
: 知道twitter storm吗?就是干这个的。http://storm-project.net/ 阿里巴巴和淘宝都在用,估计那个主要开发者Xu Mingming也是淘宝的。 竞争对手是Apache S4,但是S4明显不是对手。
z*e
21 楼
上次看swjtuer的回答
还有一个可能可以用的数据结构:priorityqueue
如果多线程,priorityblockingqueue
还有一个可能可以用的数据结构:priorityqueue
如果多线程,priorityblockingqueue
r*s
26 楼
omfg, 少侠,你就不能想想办法?
比如那个每10秒钟的thread,读完数据之后你就不能扔到Kafka里面按时间查询?或者随
便一个数据库Mongo之类的都可以。对不对?
sorting on-the-fly是一个very bad idea,注意为什么那个10秒的thread要把数据结构
抄一遍下来,就是因为如果你有几千个url,每秒有几千个点击进来(比如Amazon),你
不可以做logN的insertion,只能做constant time的hash.
【在 A*H 的大作中提到】
: 一般top k都会想到priority queue,要回答好这个问题,还是有很多细节要考虑
: 比如queue size维护多大,expired的node要remove掉,怎么remove又要保证
: concurrency performance
比如那个每10秒钟的thread,读完数据之后你就不能扔到Kafka里面按时间查询?或者随
便一个数据库Mongo之类的都可以。对不对?
sorting on-the-fly是一个very bad idea,注意为什么那个10秒的thread要把数据结构
抄一遍下来,就是因为如果你有几千个url,每秒有几千个点击进来(比如Amazon),你
不可以做logN的insertion,只能做constant time的hash.
【在 A*H 的大作中提到】
: 一般top k都会想到priority queue,要回答好这个问题,还是有很多细节要考虑
: 比如queue size维护多大,expired的node要remove掉,怎么remove又要保证
: concurrency performance
l*0
28 楼
基本思路应该就是use hash to count and min heap with size k to get top k? 如
果想要考虑时间区间的话的话,可否使得value复杂一些(key 还是url本身),比如说
是一个结构,结构内有多个单元,例如可以每小时一个单元,一天24个单元,记录整点
时候的点击数。 感觉实际中,这种东西不可能做到很精确吧?不大可能说你任意选一
个时间,然后往前数1个小时,就能得到一个点击数。。。那样的话,需要log的东西太
多了。。。还有什么更好的办法?
果想要考虑时间区间的话的话,可否使得value复杂一些(key 还是url本身),比如说
是一个结构,结构内有多个单元,例如可以每小时一个单元,一天24个单元,记录整点
时候的点击数。 感觉实际中,这种东西不可能做到很精确吧?不大可能说你任意选一
个时间,然后往前数1个小时,就能得到一个点击数。。。那样的话,需要log的东西太
多了。。。还有什么更好的办法?
j*t
29 楼
关注此题。
f*b
30 楼
M
r*s
32 楼
这道题你要整出个单机版的解法,我包你进不了下一轮。
给个链接,你们学习一下。
http://www.michael-noll.com/blog/2013/01/18/implementing-real-t
【在 t*********h 的大作中提到】
: 这个体有没有比较偏算法的一些idea? 回帖都太偏SYStem了
给个链接,你们学习一下。
http://www.michael-noll.com/blog/2013/01/18/implementing-real-t
【在 t*********h 的大作中提到】
: 这个体有没有比较偏算法的一些idea? 回帖都太偏SYStem了
t*h
33 楼
太长了呀 大牛能不能给总结一下
【在 r****s 的大作中提到】
: 这道题你要整出个单机版的解法,我包你进不了下一轮。
: 给个链接,你们学习一下。
: http://www.michael-noll.com/blog/2013/01/18/implementing-real-t
【在 r****s 的大作中提到】
: 这道题你要整出个单机版的解法,我包你进不了下一轮。
: 给个链接,你们学习一下。
: http://www.michael-noll.com/blog/2013/01/18/implementing-real-t
相关阅读
北方冬天盖房请教刚买的房子的面积比卖房者打的广告上小了79sqft该怎么办呢?请问Drywall能承受多重的墙饰?Amazon home service 装 油烟机紧急求助 房贷希望渺茫[求推荐] 壁挂式油烟机求教洗衣房水龙头更换问题$170!!!疯了 收到PG&E 账单 求助!在卫生间铺了traffic master的vinyl tile,感觉好滑啊,很容易滑倒割草【闲话房贷】房贷中什么叫reserve请教一个关于sprinkler system的问题哈一个车库门的问题Costco草籽上货了吗?stain阳台上地板,为什么有小泡泡怎样改写public report从Lumber Liquidators 定solid hardwood一般多久?大家是不是买年都要做一次termite inspection?对于买房中介来说,带客户看房和客户自己open house看房拿到的佣金一样吗微信里的亲戚