作者chhuang (我是瓶男我很难懂)
看板Biotech
标题Re: 请问要去哪抓所有人类蛋白质序列的资料呢?
时间Sat May 27 16:56:00 2006
※ 引述《[email protected] (幸福金金幸福)》之铭言:
: 所以
: 这个档案应该有包含一些功能
: 参考资料上的叙述
: 我想要找只有 fasta 档就好
: 感谢感谢
用 perl 写去 NCBI 抓资料就好啦...
例如抓所有 virus 的 protein fasta
先查询有多少笔:
http://www.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?
db=protein&retmax=1&usehistory=y&term=viruses[orgn]
再从查结果...去抓对应的资料 (XXX, YYY, ZZZ)
http://www.ncbi.nlm.nih.gov/entrez/eutils/esearch.fcgi?
rettype=fasta&retmode=text&retstart=XXX&retmax=2000&
db=protein&query_key=YYY&WebEnv=ZZZ
--
我是瓶男~我很难懂!
http://blog.yam.com/chhuang
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 61.62.84.89