Redian新闻
>
如何拿到人类和小鼠整个基因组的基因list
avatar
如何拿到人类和小鼠整个基因组的基因list# Biology - 生物学
h*u
1
差前年的W2表找不到,怎么办?没有W2表是不是一定不能贷款?天哪!好不容易看上一
个房子,inspection也做了,居
然在节骨眼上出这种差错!
avatar
j*1
2
《甄嬛传》相信很多人都看过这部剧,这部剧是孙俪,蔡少芬,蒋欣,陈建斌等演员联
袂出演的清宫戏。这部剧说的是后宫宫斗戏,不知道为什么这么火?除了大陆很火,港
台也很火。并且这部剧还火到了国外。这部剧和很多古装剧,清代的宫斗戏有什么区别
。这部剧好像当年的《还珠格格》,爆红程度都差不多。《甄嬛传》播出几年了还有很
多人看这部剧,有很多朋友喜欢看这部电视剧。我承认这部电视剧拍的很好,演员演技
好,场景很美,服装道具都不错。
不过这部只是一部宫斗剧而已,为什么这么火?
avatar
y*i
3
据爆料现在的苹果系统出问题了,说是系统里安插了监视跟踪插件,现实版的《黑镜》
要上演了。面对如此情况,你会怎么办?你还会用吗?
原来正用的好好的苹果电脑和手机,你会怎么处理,你可能说了,我能有啥秘密,我又
不是什么重要人物,只是小老百姓,监视我那是既浪费人力也浪费物力。
不过我想说的是,即便如此你就任由别人监视你了,虽说我们不是什么大人物,但是也
有隐私,你的隐私都成为别人的筹码时,你不感到愤怒吗?系统安插跟踪和插件,这件
事想想很可能,想想看用苹果产品的都是什么人,至少是白领吧,否则谁买得起。
如此说来一旦情况属实,那么监视的可是中国的精英啊,如果以此推论那么苹果手机越
来越贵是有目的的。怪不得越来越贵,这本身就是要锁定部分人群,不会管你是不是有
钱买的去。原本美国可能就是想这么做,先是锁定人群,然后再监视这部分人,只是他
们失算了,没想到中国的人比较好面子,即便自己穷的叮当响,也要打肿脸充胖子,非
要买苹果手机来标榜一下自己的身份。
这么以来苹果虽然越卖越贵,可不是有钱人想要的,失算了吧,伙计!
avatar
r*i
4
请问各位xdjm,如何拿到人类和小鼠整个基因组的基因list。
谢谢。
avatar
j*8
5
Easy, ask pay office to reprint one for you. They have records

【在 h****u 的大作中提到】
: 差前年的W2表找不到,怎么办?没有W2表是不是一定不能贷款?天哪!好不容易看上一
: 个房子,inspection也做了,居
: 然在节骨眼上出这种差错!

avatar
C*t
6
不喜欢这部戏,试着看了几次都看不下去
avatar
f*h
7
我有个script可以干这事,你给我个邮箱吧,我发给你,不是我写的,但我找不到下载
地址了

【在 r*****i 的大作中提到】
: 请问各位xdjm,如何拿到人类和小鼠整个基因组的基因list。
: 谢谢。

avatar
a*o
8
tax return有吗?

【在 h****u 的大作中提到】
: 差前年的W2表找不到,怎么办?没有W2表是不是一定不能贷款?天哪!好不容易看上一
: 个房子,inspection也做了,居
: 然在节骨眼上出这种差错!

avatar
f*h
9
给你贴了吧,大家想用都可以
#!/usr/bin/perl -w
#############################################
#Author: Jiang Li
#email: r**********[email protected]
#Creat Time: Tue 23 Oct 2012 01:37:54 PM CDT
#Vanderbilt Center for Quantitative Sciences
#############################################
use strict;
use warnings;
=pod
=head1 SYNOPSIS
Given a genbank format file (.gb), parse its feature parts (mRNA feature to
get exon regions) to get information like transcript id, gene name, etc.,
and store the result in gtf format
=head1 USAGE
perl genbank2gtf_mRNA.pl input.gb chromosome >chromosome_mRNA.gtf
=head1 RESULTS
The output is a file named as chromosome_mRNA.gtf, in which chromosome is
given as the input parameter
=cut
#Script begin
#Convert a genbank file into a gtf format file (Only parse mRNA feature)
my $usage = "perl $0 GenBank.gb chromosome >chromosome.gtf n";
die $usage unless (@ARGV==2);
genbank2gtf($ARGV[0],$ARGV[1]);
sub genbank2gtf{
my ($in,$chr) = @_;
print $in," ",$chr,"n";
open(IN,$in) or die "The genbank annotation is not exists n";
my $feature="";
my $flag=0;

#Getting feature lines
while(){
if(/^FEATURES/){
$flag=1;
next;
}
last if(/^ORIGIN/); #The following lines display the sequences
$feature.=$_ if ($flag);
}
close IN;

#Begin parse the $feature;
#print $feature;
my @features;
while($feature=~/^ {5}S.*n(^ {21}S.*n)*/gm){
push @features,$&;
# print $&,"hahan";
# print $feature,"wawan";
}

#Loop each feature and only parse those mRNA features to get the exon
region, together with other
#information like gene name, transcript id, etc.
foreach my $f (@features){
if($f=~/^ {5}(S+).*n(^ {21}S.*n)*/){
#Only feature is mRNA
if($1 ne "source"){
# information need to be fetched
my ($gene_id,$transcript_id,$gene_name,$transcript_name);
my $strand="+";
$strand="-" if($f=~/complement(/);

#transcript_id and transcript_name share the same name
if($f=~//transcript_id="(.*?)"/){
$transcript_id=$1;
$transcript_name=$1;
}
#gene id
if($f=~//db_xref="GeneID:(d+)"n/){
$gene_id=$1;
}
#gene name
if($f=~//gene="(.*?)"/){
$gene_name=$1;
}
=head1 EXON REGION PARSE
=head2 CODE
if($f=~/(complement()?(join()?(d+[d.n,> ]+d)())?/){
my $tmp=$3;
$tmp=~s/s|n|>//g;
my @array = split ",",$tmp;
my @start;
my @end;
foreach my $s(@array){
if($s=~/(d+)..(d+)/){
push @start,$1;
push @end,$2;
}else{
push @start,$s;
push @end,$s+1;
}
}

if($strand eq "-"){
@start=reverse @start;
@end=reverse @end;
}
}

=head2 EXAMPLE
mRNA complement(join(102429..103045,104811..104942,
105561..105643,105732..105835,105910..106035))
/gene="CCDC115"
/product="coiled-coil domain containing 115"
/note="Derived by automated computational analysis
using
gene prediction method: GNOMON. Supporting evidence
includes similarity to: 4 ESTs, 1 Protein"
/transcript_id="XM_003980242.1"
/db_xref="GI:410947098"
/db_xref="GeneID:101080349"
=cut
#Parse exons
if($f=~/(complement()?(join()?(d+[d.n,> ]+d)())?/){
my $tmp=$3;
$tmp=~s/s|n|>//g;
my @array = split ",",$tmp;
my @start;
my @end;
foreach my $s(@array){
if($s=~/(d+)..(d+)/){
push @start,$1;
push @end,$2;
}else{
push @start,$s;
push @end,$s+1;
}
}

if($strand eq "-"){
@start=reverse @start;
@end=reverse @end;
}

#if($gene_name eq "ITK"){print STDERR $tmp,"n";print
STDERR join "n",@array;};
for(my $i=0;$imy $j=$i+1;
my $group="gene_id "$gene_id"; transcript_id "$
transcript_id"; exon_number "$j"; gene_name "$gene_name"; transcript_name "$
transcript_name";n";
print join "t",($chr,"protein_coding","exon",$start[
$i],$end[$i],
".",$strand,".",$group);
}
}
}
}
}
}

【在 r*****i 的大作中提到】
: 请问各位xdjm,如何拿到人类和小鼠整个基因组的基因list。
: 谢谢。

avatar
d*n
10
没关系的,反正我们可以帮客人向IRS request W2。不是什么大事,问一下你的broker。
avatar
r*i
11
谢谢,
好人一生平安

【在 f*****h 的大作中提到】
: 给你贴了吧,大家想用都可以
: #!/usr/bin/perl -w
: #############################################
: #Author: Jiang Li
: #email: r**********[email protected]
: #Creat Time: Tue 23 Oct 2012 01:37:54 PM CDT
: #Vanderbilt Center for Quantitative Sciences
: #############################################
: use strict;
: use warnings;

avatar
s*n
12
我的loan agent说一年就行!
avatar
d*7
13
use ucsc table browser

【在 r*****i 的大作中提到】
: 请问各位xdjm,如何拿到人类和小鼠整个基因组的基因list。
: 谢谢。

avatar
w*i
14
我们当时也没有要前年的W2。就是要了一年的。
avatar
X*n
15
bioconductor packages:
org.Hs.eg.db
org.Mm.eg.db
avatar
l*o
16
找当时单位的payroll, 他们可以直接email给你的。

【在 h****u 的大作中提到】
: 差前年的W2表找不到,怎么办?没有W2表是不是一定不能贷款?天哪!好不容易看上一
: 个房子,inspection也做了,居
: 然在节骨眼上出这种差错!

avatar
r*i
17
谢谢各位
avatar
b*d
18
给HR打个电话就搞定了.

【在 h****u 的大作中提到】
: 差前年的W2表找不到,怎么办?没有W2表是不是一定不能贷款?天哪!好不容易看上一
: 个房子,inspection也做了,居
: 然在节骨眼上出这种差错!

avatar
y*n
19
MARK,3x
avatar
y*n
20
能解释下这句什么意思?
if($f=~/(complement()?(join()?(d+[d.n,> ]+d)())?/){
Perl编译报错:
Unmatched ( in regex; marked by )?(d+[d.n,> ]+d)())?/ at genbank2gtf.pl line 135.
avatar
f*h
21
话说我原来的Script可以用,肯定是由于mitbbs每行只能显示若干字符,把原来script
truncate了。。。 我刚找到原网址
https://sites.google.com/site/riverlee2008/post/
asetofscriptstogetannotationingtffromncbigenbankfiles

join(

【在 y****n 的大作中提到】
: 能解释下这句什么意思?
: if($f=~/(complement()?(join()?(d+[d.n,> ]+d)())?/){
: Perl编译报错:
: Unmatched ( in regex; marked by : )?(d+[d.n,> ]+d)())?/ at genbank2gtf.pl line 135.

avatar
f*h
22
话说我原来的Script可以用,由于mitbbs每行只能显示若干字符,原来script被
truncate了。。。 我刚找到原网址
https://sites.google.com/site/riverlee2008/post/
asetofscriptstogetannotationingtffromncbigenbankfiles

【在 r*****i 的大作中提到】
: 请问各位xdjm,如何拿到人类和小鼠整个基因组的基因list。
: 谢谢。

相关阅读
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。