作者lelojack (莉罗夹克)
看板Biotech
标题Re: [求救] 关於minor-allele frequency (MAF)
时间Tue Oct 4 00:18:58 2016
※ 引述《x9060000456》之铭言:
: [2,] 2 1 0 0 1 0
: [3,] 2 2 0 0 2 0
: [4,] 1 2 0 0 2 0
: [5,] 2 1 0 0 2 0
: [6,] 2 2 0 0 2 0
: gene资料形式是以copy number呈现,
: 想请问各位大大,分析的软体是R software,
: 为什麽在很多packages里MAF的计算,是colMeans(genodata)/2 来计算MAF?
: 也就是对每一个column做平均在除二,google找不到相关解释,谢谢各位大能大神!
HI 我拿rs671 南方华人独有的酒精代谢缺失作为例子
参考资料:dbSNP
http://imgur.com/a/a1sRB
参考资料:Taiwan biobank
http://imgur.com/a/KwUMn
简单来说: 人有两个allel 所以除二
这边以Taiwan bank为例
Ref:G, Alt:A
总共987个台湾人,带G/A的人数384, 带A/A的人数有76
A allel 出现的次数是384+76*2=536
987台湾人有987*2个allel
所以A出现的比例是536/(987*2)[ 536/987<-colMeans(genodata) ]
照你的公式算 就会得到上面的结果
所以看台湾biobank整理的资料就清楚了
小知识: 台湾人的A MAF达两成
很多人喝酒会脸红是因为很多人先天代谢甲醛[毒]的能力差
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 122.146.53.14
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Biotech/M.1475511542.A.2B7.html
※ 编辑: lelojack (122.146.53.14), 10/04/2016 00:28:02
1F:推 x9060000456: 非常清楚!! 谢谢l大大 10/04 08:54