作者subtropical (風大雨大)
看板BioMedInfo
標題[問題] N50
時間Wed Sep 9 14:08:59 2009
關於genome在做assembly時,paper都會提到N50 size為多少。
這是網路上我所查到的定義:
http://www.cbcb.umd.edu/research/castats.shtml
The N50 size of a set of entities (e.g., contigs or scaffolds) represents the
largest entity E such that at least half of the total size of the entities is
contained in entities larger than E.
For example if we have a collection of
contigs with sizes 7, 4, 3, 2, 2, 1, and 1 kb (total size = 20kbp), the N50
length is 4 because we can cover 10 kb with contigs bigger than 4kb.
我的解讀是佔50%的contig, 所以20kbp的N50應該是10kbp
不過看了下面的例子又明顯不是這樣...
請問N50的定義到底該怎麼下呢?
謝謝不吝解惑.
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.114.88.228
1F:推 huggie:因為大於4 kbp 的 contigs 有 7 跟 4 加起來超過20kbp的 09/09 16:54
2F:→ huggie:一半,因此這個例子內N50是4 kbp。並非每個加起來20kbp的 09/09 16:55
3F:→ huggie:例子都會是4 kbps 09/09 16:55
4F:→ subtropical:為何不是7kbp呢@@? 09/09 17:17
5F:推 huggie:7 kbps < 10 kbps 所以不是 7 09/11 14:14
6F:→ subtropical:原來如此!謝謝h大! 09/14 10:02