作者huggie (huggie)
看板BioMedInfo
标题[转录][求救] 有关FASTA format
时间Mon Jun 2 12:38:48 2008
※ [本文转录自 Biotech 看板]
作者: TZUKI (汉堡) 看板: Biotech
标题: [求救] 有关FASTA format
时间: Mon Jun 2 12:21:37 2008
有个问题很困扰...
就是如何能不使用一些特殊程式来将不是FASTA format 的序列转换成FASTA
我想了很久
也只能想出用word来去算字数再来依长度分行
这方法感觉很逊...
请问板上的大大们
有没有更好的方法?
不然每次我都只能慢慢来>"<
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 134.208.44.23
1F:推 huggie:借转 BioMedInfo 欢迎任何dry lab 讨论唷 06/02 12:38
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.129.160.62
2F:→ huggie:请问来源格式? 06/02 12:40
3F:→ hajimels:我猜应该是像GenBank或EMBL那样的format吧 我要上seminar 06/02 12:53
4F:→ hajimels:晚点再回好了...不过在下载时 就可以下载fasta格式了 06/02 12:53
5F:推 cot123:如果有来源格式就好办了 06/02 13:04
6F:推 masamonster:没有来源格式应该也可以写~ 不过一次只能一笔 ^^ 06/02 13:41
7F:→ hajimels:我上seminar偷上b中 cot帮人家写个code算了XD 06/02 13:42
8F:→ cot123:写支小程式是ok啦.. 只是如果可以了解问题详细细节比较方便 06/02 14:02
9F:推 nightcatman:#!/usr/bin/perl -w 06/03 06:24
10F:→ nightcatman:open(IN,'data.txt'); 06/03 06:25
11F:→ nightcatman:<IN>; 06/03 06:25
12F:→ nightcatman:@a=<IN>; 06/03 06:25
13F:→ nightcatman:$seq=join('',@a); 06/03 06:25
14F:→ nightcatman:$seq=~s/\s//g; 06/03 06:26
15F:→ nightcatman:print length($seq); 06/03 06:26
16F:→ nightcatman:<>; 06/03 06:26
17F:→ nightcatman:以上 06/03 06:26
18F:→ nightcatman:不过这只有算序列长度而已,分行就再加个for印出,不难 06/03 06:29
19F:→ nightcatman:其他像.gb或.embl之类的也差不多,格式有的话随手可写 06/03 06:31