Redian新闻
>
问一道(大)数据 algorithm (转载)
avatar
问一道(大)数据 algorithm (转载)# Programming - 葵花宝典
m*h
1
我妈去中信让他们代签B2,中信的人要求她办一张五万元的回卡,说不然不给代递。
请问这是新规定吗?怎么从来没听过?
avatar
n*3
2
【 以下文字转载自 JobHunting 讨论区 】
发信人: nacst23 (cnc), 信区: JobHunting
标 题: 问一道(大)数据 algorithm
发信站: BBS 未名空间站 (Sun Mar 22 00:11:01 2015, 美东)
请教大家一下:
两组人, POSITIVE 和 Negative ,
say
POSITIVE 100K ppl,
Negative 900K ppl.
基本的数据结构 是 人的 ID 和 length of stay(待了几天)。
ID length of stay(days)
ppl-0000001 8
ppl-0000002 10
...
目的是 sample Negative 组 出来 100K 人 ,
which one-to-one match the Positive 组 人
的 length of stay(待了几天),
这样 match 完, 两组人的 100K 个 length of stay(待了几天)
完全一样.
当然如果 negative
组人 有多个 match 一个 POSITIVE 组人 , 任取一个就好了。
想用 c++ 写 ,use STL/Map hash,
不知有没好的算法哦 ,
or 更好的 STL 数据结构/算法 可用?
因为是 准备 写成 RCPP for R, 现在不考虑用
并行 Solution.
谢谢。
avatar
a*n
3
你们那里中信土规定或者忽悠你,大使馆没有这个规定。

【在 m*h 的大作中提到】
: 我妈去中信让他们代签B2,中信的人要求她办一张五万元的回卡,说不然不给代递。
: 请问这是新规定吗?怎么从来没听过?

avatar
n*3
4
the for loop will take a long time to finish;
I want to figure out some good algorithm/Data strucute
to speed it up. Thanks.

【在 n*****3 的大作中提到】
: 【 以下文字转载自 JobHunting 讨论区 】
: 发信人: nacst23 (cnc), 信区: JobHunting
: 标 题: 问一道(大)数据 algorithm
: 发信站: BBS 未名空间站 (Sun Mar 22 00:11:01 2015, 美东)
: 请教大家一下:
: 两组人, POSITIVE 和 Negative ,
: say
: POSITIVE 100K ppl,
: Negative 900K ppl.
: 基本的数据结构 是 人的 ID 和 length of stay(待了几天)。

avatar
i*i
5
你是在哪个城市哪家中信啊,五万元回卡是啥呀--是存款么?
avatar
k*g
6
not a statistician, 有错轻拍
first break down the larger set by length of stay. After this step, the
random sampling will be performed within records of the same length of stay.
check that for each length of stay, the larger data set provides enough data
for the task (i.e. larger than the number of records in the smaller data
set). If not, you have to change your subsampling strategy.
assign uniform random numbers to each record in the larger set. sort them.
Select the first N records, where N = number of records in the smaller set.
make sure you know how to use a random number generator.
avatar
w*g
7
我也觉得是忽悠.
avatar
s*x
8
拿不出五万元的就不给签证
你想想可能么?

【在 m*h 的大作中提到】
: 我妈去中信让他们代签B2,中信的人要求她办一张五万元的回卡,说不然不给代递。
: 请问这是新规定吗?怎么从来没听过?

avatar
t*s
9
去其他中信,遇到无耻的拉业务的了。
avatar
j*6
10
还有一定要小心中信门口的黄牛
avatar
m*h
11
谢谢各位,我妈最后去了省城的中信。小地方不太好。。。
相关阅读
用python生成傻shell脚本如何?VisualStudio的LoadTest咋入门?90后贪玩CEO,被扎克伯格相中,创20亿收购神话(图)请教一下大家对于职业发展的一些看法你们吵着要javascript的: How to delete the last line in the file in node.js?project architecture方面有什么好书值得推荐的?msft买错了,应该买亚麻啊你不是逗我吧,.net core居然要用npm及其各种package?Linus Torvalds因内核注解标点格式发飙 solidot teikaei 21小时54分钟前 Linus Torvalds在Linux内核邮件开发者列表上再次发飙,将部分程序员偏爱的代码注解标点格式称为“脑残”。他强烈反对的注解格式类似:/* This is disgusting drug-induced * crap, and should die */(具体见下图) http://static.cnbetacdn.com/article/2016/0713/00a2039be872980.png 和/* This is also very nasty * and visually unbalanced */ 他个人支持的格式类似: /* This is a comment */ 和 /* * This is also a comment, but it can now be cleanly * split over multiple lines */es2016daxu06 封 jobhuntinger 在 Basketball 版 (转载)js: 如何确认st1是str2+" \ 0 \ 0 \ 0 " ?headless chrome要出来了 不用再将就破phantom了The future of Javascript module management finally comes【工作机会/长期内推】Equal Experts招Sr Software Engineers (转载)有大牛可以解释下bloom filter是在什么条件下使用最好一道填空题,请教。其实有时候google多了会脑残的程序员就是产品/项目经理的爹啊简单说说这几年机器学习的形势 (转载)
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。