Redian新闻
>
请教一道 G 家 DNA edit distance的题
avatar
请教一道 G 家 DNA edit distance的题# JobHunting - 待字闺中
x*3
1
Assume the gene library exist for all 7 Billion people on earth. Each person
's gene sequence is 3 billion length of 4 basic construction unit. You are
given the genetic sequence of one person. Describe how you can find his
closest genetic sequence neighbor. The closeness is defined by the edit-
distance between the two sequences. Describe how you store data and conduct
search.
朋友Onsite面的, 完全没思路。谢谢
avatar
n*y
2
suffix tree
check out ukkonen's algorithm
avatar
s*n
3
Edit Distance可增可删。

【在 n********y 的大作中提到】
: suffix tree
: check out ukkonen's algorithm

avatar
s*n
4
基本方法应该就是Edit Distance的定义用Dynamic Programming来做。面试的本意大概
就是考这个点吧。
不过字符集这么小,字符串这么长,应该有能优化的地方。
avatar
s*a
5
编码,AGTC分别用00,01,10,11表示,可以编码成一个8位的int

【在 s******n 的大作中提到】
: 基本方法应该就是Edit Distance的定义用Dynamic Programming来做。面试的本意大概
: 就是考这个点吧。
: 不过字符集这么小,字符串这么长,应该有能优化的地方。

avatar
s*g
6
8位? 你的整个DNA sequence是什么结构?

【在 s*a 的大作中提到】
: 编码,AGTC分别用00,01,10,11表示,可以编码成一个8位的int
avatar
p*a
7
这是算法题还是system design题?
[在 xm1223 (天天想上) 的大作中提到:]
:Assume the gene library exist for all 7 Billion people on earth. Each
person's gene sequence is 3 billion length of 4 basic construction unit.
You are
:given the genetic sequence of one person. Describe how you can find his
:closest genetic sequence neighbor. The closeness is defined by the edit-
:distance between the two sequences. Describe how you store data and conduct
search.
:朋友Onsite面的, 完全没思路。谢谢
相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。