作者tear2001 ( Play ball !!)
看板perl
标题Re: [问题] 新手想问个例题...
时间Thu Jun 7 14:00:05 2007
※ 引述《aminoacids (胺基酸)》之铭言:
: 打扰了.....
: 假设是在某档案 % new < Genome10.fasta 执行下
: > gi|10795382|gb|DV732100.1|DV752100 102s Arabid.......英文 其後为AGTC序列
: ----------
: 问一 只想得到虚线部分
: 问二 只想得到102d以後开始部分 (不包括DNA序列)
: while (<STDIN>) {
: if
: 後面要怎麽表示才能得到所求呢
: 新手 第一次问问题 还请多多包含 m (_ _) m
@splistr = split /gb\||\|/, $line;
print @splistr[1];
看起来你也是为了fasta而伤神的bioinformatist
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.114.96.144
1F:推 cot123:这个regexp会抓出10795382吧 06/07 17:58
2F:推 tear2001:不会ㄚ 06/09 14:04
3F:→ tear2001:写成split /gi\||\|/, $line; 才会吧 06/09 14:05
4F:→ tear2001:不过我不确定那个".1"能不能如期取出就是了 06/09 14:05
5F:→ cot123:以gb\|或\|当作分隔来切 那就会变成 "gi" "10795382" 06/11 04:32
6F:→ cot123:index为1 就是10795382啊 你要不要试试看啊? 06/11 04:33
7F:→ cot123:不过我觉得fasta file还是用Bio::SeqIO比较快些 比较方便 06/11 04:35