作者blence ( )
看板Biotech
标题Re: GWAS,GO(Gene Ontology)
时间Wed Apr 22 01:01:27 2015
先说一般怎麽做,初步分析的部分
一般如果是case/control的,会排除那些有多重位置或如A/T/C三种type的
当然考虑HWE, callrate....一些东西我就不熟了,只能从专业的paper参考
我只知道GWAS先画张manhattan plot
这样不懂的人都可以清楚了解你的结果
接着这笔data有几种利用方式
1.根据plot上的cluster归纳出几个最关键的chr位点
从中进行fine-mapping, re-sequencing等,找出causal SNP/mutation
2.找另一群case/control(找合作单位)
进行同一平台或不同平台replicate study
3.从big data中进行传统的candidate gene association study
包括haplotype, G-G间的joint effect,或G-E分层分析等
4.把最感兴趣的SNP拿去做functional assay
1-3是相关的,再发paper之前,钱/人力够多的话可以都做
对GWAS研究者来说,4是最不熟也最不会想做,
但对生物/分生的研究者则是相反,以为真的是挖到宝藏
几年前,我们lab来一位老师觉得我们有这麽多significant SNP
拜访後想谈合作,说或许可以让他做些recombinant protein跟in vitro assay
很可惜,多数实验背景的研究者都以为SNP在cds上
(如果这麽好康,我早就留着自己做了)
事实上,这些SNP能落在intron已经不错了
有些跟基因的TSS都数k~十数k的距离,functional assay都不知从何着手
GWAS快速进展以来更是如此(不易实验分析)
原因是既然GWAS,厂商出的chip就至少该满足两个条件才会好卖
一是点的密度要均匀,不能客制化哪些loci要密集一些
二是上面SNP的MAF要够,case/control都没variant怎麽办?
顾及密度及MAF,可用的那些点就不太会座落在cds了
因此你的本文提到後续"验证"其实有两种解读
除了是直接地认为探讨该SNP的功能影响
或者看到你的回应後,觉得是上述2这个replication
你现在应该很困扰,除了慢慢拖到毕业时间到老板放人外(误)
画张上述彩色的manhattan plot是能有起码交代
(前提是抓出这些SNP要是比照一般paper的筛选流程找出来的才能信服别人)
接着藉用中研院Genepipe等网站功能,这些SNP丢到variowatch等去做annotation
用FANS评估SNP对gene影响的可能性与程度
又或1000genome (1KG)网站也能计算z score评估functional significance
透过这些量化的数值,就可以让"真的想做functional assay的人"退缩了
假使你从中做出兴趣,以下的不妨考虑看看
因为你的两群都是case
利用1KG可以选定接近的族群当作reference healthy control
此外台湾Biobank也有释出local based control,也能申请个别资料
弥补你没有control的困扰
如果SNP落在功能未知或太大(e.g.>500kda)的基因附近,建议直接放弃
非关该phenotype的已知基因,可以用si/shRNA看cell based assay
若有幸找到有相关的基因,上述(1-3)等replicated或fine-mapping不妨试试
也能用1KG或hapmap等找LD region上有没有exonic SNP
z score够显着就可以试试site-direct看enzyme activity或protein interaction
次之则是找proximal promoter region至intron 1范围
满足LD, MAF又有一定比例的SNP
这样可以试reporter assay後,回去再做该点的SNP应该也会显着
对了这里提到的"显着"都指p值,但是有时候往往odd ratio都不高
这也是限制投入细胞实验的冲动
最後想提一下,别太相信这是"中研院那边提供"的研究这单纯的理由
我觉得可能是某医师念硕博班,於是对方切出一笔小小的data玩玩用途
或者医师提供检体供对方lab研究
但觉得一阵子没发表所以急了
於是要求拿自己sample做的data回来另觅合作单位进行分析
看起来後面这个比较合理
但尽管如此也太随便了
我们是个别有生统、分生的助理,才对GWAS的後续用途更顺利衔接
※ 引述《sinclairJ (Jun)》之铭言:
: 作者: sinclairJ (Jun) 看板: Biology
: 标题: GWAS,GO(Gene Ontology)
: 时间: Mon Apr 20 23:05:59 2015
: 大家好,想在这边请教有分析过Genome-wide association studys(GWAS)的前辈,因为
: 本身非生物或统计背景,所以对这种分析较缺乏sense
: 小弟手上的GWAS data, 其Phenotype有1及2,SNP(rs number)则约有60万个(已genotype
: 为0,1,2)
: 小弟目前已经用资料探勘的手法找出与Phenotype显着的SNP,共有50几个
: 小弟想请教的是
: 1.该如何验证我找出的这些SNP确实是这疾病的致病基因(小弟有阅读过paper,似乎可以
: 用模拟的方式来验证?)
: 2.若我找出这些SNP所对应的gene name,是否可以做Geno Ontology,藉此建立一个pathway
: 来证明我所找的那些SNP确实会影响该疾病
: 3.还是有其他验证方法,也请各位前辈提点我一下,甚至直接个paper叫我阅读也可以,
: 因为又非生物背景,每当辛苦看完一篇超难懂的paper时,之後发现又对研究没帮助,那
: 种感觉真是。。。
: 以上,谢谢各位前辈帮忙,如果问题有说明不清楚的再跟我说,我会再进行补充
※ 编辑: blence (180.218.165.124), 04/22/2015 01:03:52
1F:推 jabari: 4. 泪推...看看我家满坑满谷的ko B6...QwQ 04/22 01:44
※ 编辑: blence (180.218.165.124), 04/22/2015 01:59:29
2F:推 sinclairJ: 谢谢专业的文章,我会再试着做做看的 04/22 03:02
3F:推 lelojack: 强 04/22 20:09
4F:推 teresa0925: 推 02/26 11:45