标签:表达 填补 dropout 测序 真零值 单细胞 资源
RNA的表达水平矩阵稀疏
把reads比对到基因组,然后计算比对到基因上的read count。发现表达矩阵十分稀疏。
RNA的表达水平填补问题:
相对于bulk转录组测序,单细胞测序具有更高的噪声水平。
单细胞测序时,有些基因表达量较低而无法完全被检测到,这种由技术造成的检测基因表达数据不真实的情况被称为dropout效应。与此同时,在细胞中有些基因确实没有表达,我们称之为真零值。在测序结果中,往往混杂着由于dropout效应造成的零值和真零值。
区分真零值和dropout效应造成的零值,降低技术噪音,对于单细胞测序数据后续分析具有较为重要的作用。但是这一方法也存在副作用,即其在进行数据预测填补的过程中会引入一些假阳性结果。
目前,已经有多种软件可以对单细胞测序数据进行预测和填补,其中主要原理是通过数据内部的信息,处理被软件判断为dropout效应造成的零值。一篇发表在F1000Research的文章选择了六种imputation相关的软件进行了相关评测,分为是scImpute、SAVER、DrImpute、MAGIC、dca以及knn-smoothing。
https://doi.org/10.12688/f1000research.16613.2
- 1.Imputation 归罪, 归咎, 设算, 分配
- 2.multiple imputation 多重替代法, 多重填补, 多重插补法, 多重填补法
(REF:https://cloud.tencent.com/developer/article/1675219)
标签:表达,填补,dropout,测序,真零值,单细胞,资源 来源: https://www.cnblogs.com/emanlee/p/14879775.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。