标签:文件 在线 Nature 白介素 浸润 自己 signature gene Methods
https://cibersort.stanford.edu/
聊一个发表在26分杂志上的在线分析神器,此前白介素同学写过一期关于免疫浸润分析,数据挖掘新高度的推文。 这里是续集,数据挖掘新高度(二)
Step1准备数据
在数据分析之前首先需要准备好自己的数据格式,要求不能有缺失值,txt文档不能有双引号,建议数据不要经过log转换。
mixture文档,实际上就是要自己准备好一个表达矩阵,举个栗子如下:
第一个文件
特别注意一点是,数据格式对ID类型不作要求,唯一的要求是必须跟其它提供的文件ID是匹配的,这个还是比较容易做到的嘛。
第二个文件
可以自己输入Signature文件作为参考signature,如果自己准备就准备成下面框框的格式。 也可以选择它本身提供的 LM22 这个signature文件,但要强调的是 LM22仅仅在两个芯片平台上验证过,RNA-seq平台未验证,并且,如果用这个,必须保证你的Mixture文件的ID也用的HUGO。
________________________________________
如果行自己上传 gene signature也是可行的,准备好 signature文件即可。 除此以外如果自己没有 gene signature的话,又不用它自带的 gene signature的话,也可以用,这时就要提供下面两个文件,利用这个数据库来产生 gene signature:
还需要一个 phenotype的文件,格式如下:
Step2-上传文件 and Run
下面我们来上传一个数据分析下试试看,上传一个mixture文件,格式如下:
需要几分钟的时间处理,然后就可以在结果部分看到,行为sample名,列为免疫浸润分数。
还有另外一个图:
除此之外呢,提供所有,分析结果的 CSV, pdf等格式的数据下载,这样就方便大家自己去下载,然后按照自己的要求绘制其它图形,得到的重要结果就是免疫浸润分数。
聊一聊这个免疫浸润分析工具的来头,该数据库由斯坦福大学医学院的研究团队开发的,相关论文2015年发表在 Nature Methods杂志上,截止目前的引用量为645次。
这个工具其实在此前白介素同学撰写的[肿瘤免疫浸润分析工具汇总]一文中有提到过,上次还做了标注。跟此前介绍的 TIMER 数据库(https://cistrome.shinyapps.io/timer/)相比呢,在使用的友好程度上没有那么高,但是引用次数更高。
需要注册,比较麻烦。而且教程不够完善,个人认为教程讲的不是很清楚,对新手而言要使用需要一定的学习成本。另外就是可视化程度不够高,而TIMER的美图,确实是超酷啊。不过既然发表的论文在高级的杂志,可能在算法层面有自己的优越性吧,这个就超出白介素同学能力范围了,这里不作评价了。至于究竟使用哪个,还是需要看大家自己的需求哈,反正都是可靠的!
好了,这是白介素同学自己探索这个分析工具的所得基本就是这些啦,探索的过程比较曲折,还是分享给大家。
标签:文件,在线,Nature,白介素,浸润,自己,signature,gene,Methods 来源: https://blog.51cto.com/u_15127646/2778603
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。