不得不感慨,现代信息技术造就的海量数据给了我们许多便利,越来越多的医学研究项目认识到数据的力量,将重心转移到数据上来。已发表数据可以利用起来,做新的分析挖掘,找出事物之间未曾发现的关联;或者整合零散的信息建立新的数据库;或开发新的算法,成为更有力的数据分析工具。这不,2017年国自
TCGA大名我们都不陌生了,其海量数据便于我们找到有研究价值的基因,再展开后续的研究。万事开头难,筛选基因时就好不容易学了一堆技术,开完头发现后边更迷茫,怎么办?酸菜大大把整个过程给我们整理出了八大问题,说清其中的思路。今天先来看看前四步,怎样获得靶基因,并确定它具有值得研究的表型
要么筛,要么猜。分子生物学里有一个概念叫“顺式剪接”,意思是在同一个基因内,切除内含子,使相邻的外显子彼此相连的剪接方式叫做顺式剪接。因为内含子和外显子有多个,所以如何“剪”和“接”也就形成了一个新的科学问题——“可变剪接”。一条未经剪接的RNA,含有多种外显子,可以被剪成不
压箱底的神器,轻易不告诉人!相信大家了解不少TCGA的网页版工具,有分析差异表达,有分析甲基化的,有生存分析的。今天给大家介绍的这款工具可以说是一个全能型工具,它就是GSCALite,网址是http://bioinfo.life.hust.edu.cn/web/GSCALite/。这个工具由华中科技大学生科院的郭安源教授团队开发
如何复现一篇3分生信研究做科研需要先学习套路,才能超越套路。今天给大家介绍的套路文献是今年发表在《Oncology reports》(IF= 3.041)上的一篇文章。文章的标题虽然看上去比较泛,但也让读者一眼就能知道主题了,“molecular mechanism”、“potential drugs”、“papillary renal cell c
新鲜出炉的Biomaker神器 在医院抽血检查辅助诊断疾病时,每个指标都有自己的意义。也有很多指标是用来辅助筛查肿瘤的,像CEA、CA199等等这些都是非常经典的肿瘤标志物。但随着技术的进步,大家都希望能够找出一些更好的biomarker帮助医生更早也更方便地发现肿瘤的来。基于血液的检查,也
除了信号通路,KEGG还有这么多功能!KEGG数据库是由京都大学化学研究所提出建立并维护的,该数据库的特色是一系列经人手绘制而成KEGG代谢路径图的构成,以代表关于代谢以及其他细胞与生物机能的实验成果。总之,KEGG是从代谢通路这方面起家的,后来慢慢壮大,其他的通路也做得不错了。如果你研究
本笔记主要参考 https://www.jianshu.com/p/75c6d55a63bb?from=timeline 主要是为了理清思路,记录一下,方便以后查找 Seurat软件介绍 导入分析需要的包 library(Seurat) library(dplyr) library(magrittr) 读入矩阵 #matrix.mtx, genes.tsv, and barcodes.tsv #使用Read10X函
大家好,我是濤濤。上一篇我们一起学习了单基因的泛癌分析,你学会了吗?(藏鏡人:啊这……别问,问就是没有)(濤濤醬:那还不赶紧戳这个连结复习一下?文章复现丨用了这个工具,带你快速复现一篇单基因泛癌免疫分析wen)那么我们文章复现的第二期,就继续深入,一起来探讨一下单基因在具体肿瘤中的复现思路
本周最新文献速递20210509 一 文献题目: Neuronal ApoE upregulates MHC-I expression to drive selective neurodegeneration in Alzheimer's disease 不想看英文题目: 神经元ApoE上调MHC-1表达,并驱动阿尔茨海默氏病的神经元选择性变性 杂志和影响因子: Nat Neurosci (20.071 1区
据相关机构的研究报告显示,全球基因测序市场规模从2007年的800万美元增长至2013年约45亿美元,至2018年将达到约117亿美元。其中,2007-2013年复合增长率为33.53%,预计2013-2023年复合增长率为21.06%,市场潜力巨大。 一时间,基因测序成为各国生物公司竞争的焦点,再加上我国政
https://mp.weixin.qq.com/s/k450Ssza-8ciib8fGjtYdg 谷歌突然宣布:谷歌最新人工智能 AlphaFold,在一项极其困难的任务中击败了所有对手,成功根据基因序列预测了生命基本分子——蛋白质的三维结构。 谷歌宣布:上帝的密码防线逐渐崩溃!世界为之震憾 于无声处听惊雷! 这一天,真的
摘 要:锂离子电池正极材料需要有较大的能量密度和稳定的循环寿命,循环寿命与其脱锂前后的结构变化有直接关系。但是,影响循环寿命的原子层次因素是什么,还没有明确的答案。探究和优化正极材料的核心工作就是要寻找微观结构与性能之间的关系,这里不仅需要用到大数据统计,也需要对比分析脱
校内 ICPC 模拟赛考到了此题,考完后发现考场代码喜提本体最优解 (虽然本来就没几个提交)。这道题很多人都是用 <set> 设计的 \(O(nlogn)\) 的算法,这里就介绍一个 \(O(n)\) 的算法。 题目分析 这个题面不是很好懂,校内赛中因为不明确 \(s\),\(e\) 后面数字的意思耽误了很长时间。字母后
一、DNA甲基化简介 1 、概念:DNA甲基化是一种重要的表观遗传,是指DNA被化学小分子修饰的一种方式,即甲基(-CH3)共价结合到脱氧核糖核苷酸上,可以不改变脱氧核糖核苷酸序列而引起基因表达的的改变。 2 、发生位点:真核生物常见的甲基化位点有CpG(最主要)、CHG(H指A/T/C)、CHH等,而胞嘧啶的C-5甲
前言 该算法旨在在一组数据点中,用基因表达式编程的方法,根据基因遗传定律,物竞天择、优者生存,劣者淘汰的思想,不断进化种群,找出适宜度最高的染色体来模拟出数据点之间所存在的数学表达式关系。通常该算法用来解决符号回归问题:符号回归(Symbolic Regression)作为一种一种监督学习方法,试
InferCNV可以用于肿瘤单细胞RNA-Seq数据中鉴定大规模染色体拷贝数变异,例如整个染色体或大片段染色体的扩增或缺失。基本思路是在整个基因组范围内,将每个肿瘤细胞基因表达与平均表达或“正常”参考细胞基因表达对比,确定其表达强度。 这段话来自InferCNV官方文档:https://github.co
延缓大脑衰老,这听起来像是深夜电视商业节目广告里的最新的速效噱头,但这一概念背后的科学依据却是非常真实的。大脑年龄并不是反映你实际年龄的平均机能状态,而是关注大脑相对于实际年龄的衰老程度。我们都知道,有些人看起来比实际年龄更聪明,行为也更年轻:当你意识到在飞机上跟你聊天的
摘要癌症基因组的变化强烈地影响着临床对治疗的反应和在许多情况下对药物作出反应的有效生物标志物。癌症药物敏感性基因组学(GDSC)数据库(www.cancerRxgene.org)是癌症细胞药物敏感性和药物反应分子标志物信息的最大的公共资源,无限制地免费提供数据。GDSC目前包含近75 000个实验的药
简介Enrichr是一个基于网页端的综合性的基因集富集分析工具。富集分析是用于分析由全基因组实验产生的基因集合的流行方法。在这里,我们介绍一个重要的更新到这个域名为Enrichr的工具(此为第二版)。 Enrichr目前包含大量可用于分析和下载的基因组库。 En
摘要肿瘤的高通量基因组和分子分析正在成为重要的临床方法,越来越多的分子分析被用于指导癌症患者的护理,特别是在晚期和不可治愈的癌症中。然而,浏览科学文献去进行基于分子普分析的临床决定对许多肿瘤临床医生和研究人员来说都是耗时耗力的。个性化癌症治疗网站(www.personalizedcanc
摘要高等生物转录组的主要部分包括广泛的长非编码RNA(lncRNA),具有细胞类型和发育阶段表达特异性。虽然lncRNAs是表观遗传基因表达调控的组成之一,但是lncRNA本身的表观遗传调节仍然知之甚少。在此,本文分析了四种不同细胞类型和代表不同细胞阶段的三种不同
摘要组蛋白经常用共价修饰进行装饰。这些组蛋白修饰被认为参与各种染色质依赖性过程,包括转录。为了阐明组蛋白修饰和转录之间的关系,文中得出了定量模型来预测组蛋白修饰水平的基因表达水平。发现组蛋白修饰水平和基因表达非常相关。此外,文中显示只有少量
亲爱的同学们~~~今天给大家介绍一个超牛的解决方案,我第一次知道的时候都惊呆了!这就是~~~基因 法算 之前给大家介绍过单表超大的时候,需要分表,一般都是用主键进行hash,或者直接用雪花算法生成全局唯一id,然后按2^n取模,把一张超多数据的表,分成2^n个表。这个时候,问题来了:如果一个
本章绘图要点: 生成元算法:重复性的绘图步骤可抽象提炼成数据,保存在列表或元组里,然后,依据抽象规则,读取数据,调用绘图函数,生成所需要的图形,从而降低程序的复杂性,减少程序的代码量。 绘图效率:当图形的数据计算量比较大时,可先统一计算,然后再绘图,从而提高图形的生成效率。 一生二,二