众所周知,全基因组关联分析(GWAS)发现的很多变异位点基本为非编码,这些变异位点1)要么调控基因表达(eQTL); 2)要么影响增强子活性; 3)要么影响转录因子(TF)结合特异性; 4)要么啥也不是。
针对以上四种情况:
1)是否调控基因表达(eQTL)可通过GTEx(https://gtexportal.org/home/)查询。
2)是否影响增强子活性可通过之前的推文查询:感兴趣的SNP/区域上是否有增强子/转录因子?增强子/转录因子调控哪个靶基因?(EnhancerDB)
3)是否影响转录因子(TF)结合特异性则可通过今天介绍的数据库进行查询:GVATdb(http://renlab.sdsc.edu/GVATdb/search.html)
上周Nature发了一篇文献Systematic analysis of binding of transcription factors to noncoding variants
。
该文献针对95,886个常见变异位点(SNPs,欧洲和亚洲人群的MAF> 1%)与270个转录因子的结合特异性进行了大量的SNP-SELEX实验,并以此构建了GVATdb数据库。
下图是针对转录因子或者SNP位点进行检索的实验结果图:
每列的释义如下:
oligo_auc:转录因子与40bp DNA 序列的结合得分, 用AUC(Area under Curve)值表示;
oligo_pval:对OBS进行25,000次蒙特卡洛随机化后得到的p值。p<0.05表示TF与基因组片段的特异性“结合”;
Alt:SNP(hg19)的替代等位基因;
Ref:SNP(hg19)的参考等位基因;
ref_auc:ref 与 TF 的结合得分;
alt_auc:alt 与 TF 的结合得分;
pbs:结合倾向性得分,公式为:Ref 等位基因得分减去 Alt 等位基因得分,负值表示转录因子更倾向于结合 Alt 等位基因;
p-value:对 PBS 进行25,000次蒙特卡洛随机化后得到的 p 值。 p<0.01 表示 TF 与 Ref 等位基因和 Alt 等位基因结合“存在差异”。
此外,对于没有纳入 SNP-SELEX 实验的 SNP 位点,作者还建立了 deltaSVM 模型,用于预测未纳入的 SNP 位点与 TF 的结合特异性,如下图所示:
参考文献:Yan J, Qiu Y, Dos Santos A M R, et al. Systematic analysis of binding of transcription factors to noncoding variants[J]. Nature, 2021: 1-5.
由于这个网站相当简单易懂,本次推文就不多介绍啦,祝各位周末愉快~
标签:GVATdb,结合,因子,转录,SNP,TF,位点 来源: https://www.cnblogs.com/chenwenyan/p/14379716.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。