Redian新闻
>
Chip-Seq 样品制备求助
avatar
Chip-Seq 样品制备求助# Biology - 生物学
w*o
1
一共有N个机器,每个机器上有N个数。每个机器最多存O(N)个数并对它们操作。如何找
到N^2个数的中数(median)?
我只能想到一种方法:如果知道数的总range,就把数划分成N个range,每个机器都算
自己range里面的数的个数,这样就知道median在哪个range的第K大。然后再把那个
range的拿出来同样分布到N个机器上处理,这样递归下去直到数目很小可以直接一台机
器sort找到。
但是这样只能对均匀分布才行,如果某个range的数特别多,一台机器都放不下就不行
了。
avatar
j*r
2
帮朋友问下,有人知道或者做过从国内转钱到这里么,金额估计几w刀吧?是怎么操作
的?哪家的手续费低些,他说,查了西联的,觉得比较贵?我看到有人做现金的交易,
不知道可靠么?不知道做这种交易有什么风险?谢谢了。
avatar
O*e
3
如何解读这个表?
http://www.travel.state.gov/pdf/WaitingListItem.pdf
Employment-based Preferences
Increase/Decrease
From 2011 Totals
Category FY 2011 FY 2012 (and % of change)
EMPLOYMENT FIRST 2,961 2,118 -843 (- 28.5%)
EMPLOYMENT SECOND 6,738 6,888 +150 (+ 2.2%)
EMPLOYMENT THIRD TOTAL 119,183 112,023 -7,160 (- 6.0%)
Skilled Workers: 102,395 97,060 -5,335 (- 5.2%)
Other Workers: 16,788 14,963 -1,825 (- 10.9%)
EMPLOYMENT FOURTH TOTAL 554 498 -56 (- 10.1%)
EMPLOYMENT FIFTH TOTAL 1,183 1,806 +623 (+52.7%)
TOTAL
130,619 123,333 -7,286 (- 5.6%)
GRAND TOTAL
avatar
l*p
4
15天之内
一次触摸板出问题换了一个
这个又是同样问题
触摸板地下空了
随便click scroll都听到响声
再去换一个人家会不会不干?
★ 发自iPhone App: ChineseWeb 11
avatar
l*i
5
1,2,3使用10m细胞,Covaris超声30min,三个样品的Bioanalyzer Ultra Sensitive
DNA分析图谱。
4,5,6是对应于1,2,3,使用Millipore的Magana Chip kit,抗体CHIP后得到的结果。
请问为什么会得到这么烂的CHIP DNA?
超声片段的图谱有问题么(大小在300-400之间)?
多谢
avatar
h*3
6

一个笨办法是:
每台机器放n个数,然后排序。
然后挨个数,直到找到median.


【在 w****o 的大作中提到】
: 一共有N个机器,每个机器上有N个数。每个机器最多存O(N)个数并对它们操作。如何找
: 到N^2个数的中数(median)?
: 我只能想到一种方法:如果知道数的总range,就把数划分成N个range,每个机器都算
: 自己range里面的数的个数,这样就知道median在哪个range的第K大。然后再把那个
: range的拿出来同样分布到N个机器上处理,这样递归下去直到数目很小可以直接一台机
: 器sort找到。
: 但是这样只能对均匀分布才行,如果某个range的数特别多,一台机器都放不下就不行
: 了。

avatar
z*e
7
大额的还是直接银行电汇,有凭有据,不怕被查。
西联会以安全防洗钱的名义要求你提供一大堆东西,很麻烦。 找人做现金交易超过一
万的话万一被银行报上去给IRS,解释不清。
avatar
l*i
8
附件
Sensitive DNA分析图谱。
果。
avatar
l*a
9
你做得就是正解
为啥没有信心呢

【在 w****o 的大作中提到】
: 一共有N个机器,每个机器上有N个数。每个机器最多存O(N)个数并对它们操作。如何找
: 到N^2个数的中数(median)?
: 我只能想到一种方法:如果知道数的总range,就把数划分成N个range,每个机器都算
: 自己range里面的数的个数,这样就知道median在哪个range的第K大。然后再把那个
: range的拿出来同样分布到N个机器上处理,这样递归下去直到数目很小可以直接一台机
: 器sort找到。
: 但是这样只能对均匀分布才行,如果某个range的数特别多,一台机器都放不下就不行
: 了。

avatar
i*0
10
借宝地一问, 如果直接银行电汇的话需不需要交税给IRS? 这种赠予需要交税吗?
avatar
k*n
11
1-3,我没用过covaris,而且检测sonication效果的话一般都是琼脂糖胶。不过根据
你的bioanalyzer的结果,如果是library preparation之前的话,size偏大且范围偏窄
。这不是个好兆头。如果是pcr后的文库的话,大小还算合适
至于4-6,chip下来的dna量太少,没有任何检测size的意义。
avatar
c*n
12
My thought on this issue:
To generalize the problem, let say, for machine i, it has an array A[i], A[i
+1] ... A[j]. The initial state is i = 0; j = N-1;
Assuming there is a controller machine C.
1) Sort N numbers on each machine.
2) For each machine, randomly pick up a number A[k] (i<=k<=j) and send it to
the controller C. The Controller C calculates the median M from these N
numbers
3) Controller sends M back to each machine and let them report P[i] back
which is number of data that are less than M on the machine i.
let T = P[0]+P[1]+...+P[n],
M = lower(N*N/2) + 1
if T = M, then we find the median;
if T > M, then the problem becomes finding the median in N machines, for
ith machine, the array is A[i]...A[i+P[i]-1]
if T < M, then the problem becomes finding the (M-T)th item in N machine,
for ith machine, the array is A[i+P[i]+1]..A[j]
so the problem can be solved recursively.
The time complexity should be O(N*N), since each number should only be
visited once.
avatar
l*i
13
1-3是刚刚Sonication之后的DNA(冻在-80有一个星期)。条带太大,可以延长
Sonication时间么?范围窄要怎么解决?多谢!
CHIP下来的DNA太少是不是基本没救了?我用的是Millipore的CHIP Magana kit,是不
是被坑了?

【在 k*****n 的大作中提到】
: 1-3,我没用过covaris,而且检测sonication效果的话一般都是琼脂糖胶。不过根据
: 你的bioanalyzer的结果,如果是library preparation之前的话,size偏大且范围偏窄
: 。这不是个好兆头。如果是pcr后的文库的话,大小还算合适
: 至于4-6,chip下来的dna量太少,没有任何检测size的意义。

avatar
g*y
14
你说的办法对非均匀分布也可以用,就是动态地去re-range,要求scheduler比较智能
可以根据动态信息重新schedule job.

【在 w****o 的大作中提到】
: 一共有N个机器,每个机器上有N个数。每个机器最多存O(N)个数并对它们操作。如何找
: 到N^2个数的中数(median)?
: 我只能想到一种方法:如果知道数的总range,就把数划分成N个range,每个机器都算
: 自己range里面的数的个数,这样就知道median在哪个range的第K大。然后再把那个
: range的拿出来同样分布到N个机器上处理,这样递归下去直到数目很小可以直接一台机
: 器sort找到。
: 但是这样只能对均匀分布才行,如果某个range的数特别多,一台机器都放不下就不行
: 了。

avatar
k*n
15
1-3,重新跑个电泳胶吧
4-6,chip本来拉下来的dna就少,没有检测size的意义
avatar
h*3
16
为啥是正解呢?把数按range分到各个机器的时候,不就已经统计出在这个range有多
少个数了吗?那么为什么还需要在每个机器上统计各个range有多少个数呢?不如就把
这些数存在本机的disk上?

【在 l*****a 的大作中提到】
: 你做得就是正解
: 为啥没有信心呢

avatar
g*y
17
不是, 加入知道这些数range是0-1000,那假设是均匀分布的,如果有10台机器,
那就按0-100,100-200,分给这些机器处理。每个机器负责数range内的个数。
如果分着分着发现有的机器明显overload,有的underloda,那scheduler可以再进行
re-range, load balancing..

【在 h*********3 的大作中提到】
: 为啥是正解呢?把数按range分到各个机器的时候,不就已经统计出在这个range有多
: 少个数了吗?那么为什么还需要在每个机器上统计各个range有多少个数呢?不如就把
: 这些数存在本机的disk上?

avatar
h*3
18

当你分得时候,你就已经统计出来各个range里的数目了吧。
何必还需要各个机器在统计数目呢?

【在 g***y 的大作中提到】
: 不是, 加入知道这些数range是0-1000,那假设是均匀分布的,如果有10台机器,
: 那就按0-100,100-200,分给这些机器处理。每个机器负责数range内的个数。
: 如果分着分着发现有的机器明显overload,有的underloda,那scheduler可以再进行
: re-range, load balancing..

avatar
g*y
19
当然没有。加入有1000个数放在network file system上面,10台机器都去读这些数,
机器1只负责数0-100内的数,加入读到range外面的,ignore。

【在 h*********3 的大作中提到】
:
: 当你分得时候,你就已经统计出来各个range里的数目了吧。
: 何必还需要各个机器在统计数目呢?

avatar
h*3
20
题目是n台机器,没台n个数吧。
如果是你说的这种情况(有1000个数放在network file system上面),也不需要每台
机器都读阿。如果10台都读,那就读了1000*10次,还不如就一台读,那就是1000次,
一样得到了分布情况阿。

【在 g***y 的大作中提到】
: 当然没有。加入有1000个数放在network file system上面,10台机器都去读这些数,
: 机器1只负责数0-100内的数,加入读到range外面的,ignore。

avatar
g*y
21
n台机器 每个n个数 同样可以用类似的办法,分m个range(noted as 0,1,2,..m-1),每
台机器负责数自己的n个数,输出m个,key是0,1...m-1, value包括range
内出现的个数,和一个pointer指向local n个数中range内的那部分数。
全部弄完后,n台机器在进行aggregation,产生最终,这时候value是
aggregated value, 到这时候,可以看出median具体在哪个range内。剩下的工作就是
告诉n台机器去找这个range内的第X个数了。

【在 h*********3 的大作中提到】
: 题目是n台机器,没台n个数吧。
: 如果是你说的这种情况(有1000个数放在network file system上面),也不需要每台
: 机器都读阿。如果10台都读,那就读了1000*10次,还不如就一台读,那就是1000次,
: 一样得到了分布情况阿。

avatar
R*i
22
随机一个数字, 发送到每台机器上
每台电脑返回大于次数的数字个数x, 以及小于此数的数字个数y
如果X1+X2+...+Xn == Y1+Y2+...Yn, 则找到median
不然就用二分法生产一个新的数字继续发送到每台电脑上,循环
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。