欢迎访问桓峰基因公众号,我们为您提供转录组分析教程。以下是转录分析教程的整理:
RNA 1. 基因表达那些事 -- 基于 GEO
RNA 2. SCI文章中基于GEO的差异表达基因之 limma
RNA 3. SCI 文章中基于T CGA 差异表达基因之 DESeq2
RNA 4. SCI 文章中基于TCGA 差异表达之 edgeR
RNA 5. SCI 文章中差异基因表达之 MA 图
RNA 6. 差异基因表达之 -- 火山图 (volcano)
RNA 7. SCI 文章中的基因表达 -- 主成分分析 (PCA)
RNA 8. SCI文章中差异基因表达--热图 (heatmap)
RNA 9. SCI 文章中基因表达之 GO 注释
RNA 10. SCI 文章中基因表达富集之 --KEGG
RNA 11. SCI 文章中基因表达富集之 GSEA
RNA 12. SCI 文章中肿瘤免疫浸润计算方法之 CIBERSORT
RNA 13. SCI 文章中差异表达基因之 WGCNA
RNA 14. SCI 文章中差异表达基因之 蛋白互作网络 (PPI)
RNA 15. SCI 文章中的融合基因之 FusionGDB2
RNA 16. SCI 文章中的融合基因之可视化
RNA 17. SCI 文章中的筛选 Hub 基因 (Hub genes)
RNA 18. SCI 文章中基因集变异分析 GSVA
RNA 19. SCI 文章中无监督聚类法 (ConsensusClusterPlus)
RNA 20. SCI 文章中单样本免疫浸润分析 (ssGSEA)
RNA 21. SCI 文章中单基因富集分析
RNA 22. SCI 文章中基于表达估计恶性肿瘤组织的基质细胞和免疫细胞(ESTIMATE)
RNA 23. SCI文章中表达基因模型的风险因子关联图(ggrisk)
RNA 24. SCI文章中基于TCGA的免疫浸润细胞分析 (TIMER)
RNA 25. SCI文章中估计组织浸润免疫细胞和基质细胞群的群体丰度(MCP-counter)
RNA 26. SCI文章中基于转录组数据的基因调控网络推断 (GENIE3)
RNA 27 SCI文章中转录因子结合motif富集到调控网络 (RcisTarget)
FigDraw 28. SCI文章中绘制雷达图/蛛网图 (RadarChart)
RNA 29. SCI文章中基于TCGA的免疫浸润细胞分析 (TIMER2.0)
国家癌症研究所的临床蛋白质组肿瘤分析联盟(CPTAC)是一项全国性的努力,旨在通过大规模蛋白质组学和基因组分析或蛋白质基因组学的应用来加速对癌症分子基础的理解。CPTAC于2011年启动,旨在通过结直肠癌、乳腺癌和卵巢癌的综合蛋白质基因组分析,揭示这些癌症类型的新见解。CPTAC正在利用其在癌症蛋白质基因组学方面的投资,通过描述其他癌症类型,通过开源社区资源扩大其应用,并通过将蛋白质基因组学应用于临床试验中的毒性和耐药性问题来加速精准肿瘤学。CPTAC在蛋白质基因组学方面的进展使2016年的两个项目得以创建,旨在加深我们对这一新兴领域的理解。应用蛋白质基因组学组织学习与结果(APOLLO)网络旨在通过与国防部和退伍军人管理局的医疗保健系统合作,研究如何使患者肿瘤的蛋白质基因组分析成为常规癌症护理的一部分,从而有效地连接肿瘤研究和护理。同样,国际癌症蛋白质基因组联盟(ICPC)促进了10多个国家的合作,以研究其独特人群中常见诊断的癌症,目标是提高精准肿瘤学,并与世界各地的科学家和医生共享收集的数据。
数据(基因组学、蛋白质组学、成像)、分析和试剂作为社区资源提供给公众,以加速癌症研究和推进患者护理。进入主页之后,我们可以看到右侧又三个入口:
进入 Data portal:
OCCPR的核心任务之一是与生物医学研究界共享和重用蛋白质基因组数据和图像数据,因为这对于加速科学发现及其临床转化为患者护理至关重要。
蛋白质组学数据共享(PDC)是NCI最大的蛋白质基因组综合肿瘤数据集公共存储库,本质上是一个蛋白质基因组癌症图谱。蛋白质组数据和相关数据文件按肿瘤类型、研究和亚蛋白质组组织成数据集。除了基于原始质谱的数据文件外,还进行了计算处理,以将光谱映射到肽序列并识别蛋白质。CPTAC研究中收集的所有光谱都作为CPTAC公共数据分析管道的一部分进行了一致性和可重复性分析,并为每个研究生成了交互式QC报告。所有数据都免费向公众开放。CPTAC和ICPC蛋白质组学数据可以在PDC上找到。
基因组数据共享(GDC)为癌症研究社区提供了统一的存储库和癌症知识库,支持在癌症基因组研究中共享数据,以支持精准医疗。CPTAC的基因组数据可以在GDC上找到。请向dbGaP申请访问受保护的CPTAC基因组数据。
癌症影像档案(链接为外部)(TCIA)是一项识别和托管大型癌症医学影像档案的服务,供公众下载。TCIA数据被组织为“集合”。尝试使用表上方的过滤框,使用关键字“CPTAC”快速查找CPTAC集合。当在出版物中使用CPTAC生成的蛋白质组学、基因组学或成像数据时,请使用以下确认。“本出版物中使用的数据由临床蛋白质组学肿瘤分析联盟(CPTAC)生成。”当使用由ICPC所属机构生成的数据时,请确认相应的机构。
进入 PDC:
提到TCGA,我们都知道对应的基因组数据访问入口是GDC Data Portal。而Proteomic Data Commons (PDC)则是NCI最大的基于质谱的肿瘤蛋白质组学数据库。除了原始的质谱基础数据,数据库也通过计算分析,将质谱映射到多肽序列并鉴定蛋白。CPTAC 原本的数据访问入口在2022年2月已关停,目前已转移到PDC。PDC是一个对蛋白质组学数据进行高质量质控,整合并统一标准,提供高效查询,可视化,分析和下载的平台,有效提升了多组学分析的便利性。CPTAC和ICP,以及其他项目的蛋白组学数据都可以在PDC上查看,分析和下载。
PDC可供下载的文件类型如下,其中大部分是原始文件,主要的结果文件是 summary.tsv,包含了蛋白的定量结果。
以结直肠癌为例介绍数据详情。点击进入后,类似TCGA GDC页面,左侧是多种筛选类型。右侧分别是样本介绍和数据文件描述。数据文件包括Studies,Biospecimens,Clinical,Files,Genes五个部分组织。或直接通过主菜单EXPLORE进入,页面内容相同,可查看全部样本或通过左侧筛选。
数据页面除Genes页面查看对应丰度信息,其他数据多需要下载进行下游分析。
数据分析PDC分析工具ANALYSIS
PDC通过标准分析流程产生结果后可用于鉴别蛋白质和翻译后修饰(PTMs)丰度的pattern,并通过热图展示。Explore Quantitation Data 可对每个study的蛋白定量结果进行分析和展示。其中行为基因(蛋白),列为样本,并可嵌入临床信息。可选择一个或多个study分析。该类分析的主要目的是根据蛋白丰度进行样本聚类分析,通过Tools菜单可实现。
主要是各种类型数据在基因组上的可视化展示。
这是一个以肽段序列为中心的搜索,与Blast类似,Pepquery使用户能够在MS数据库中查询感兴趣的新的肽段或DNA序列。基因组改变导致产生新的蛋白序列,经过蛋白组学验证,这些新的序列可能会是潜在的疾病标志物或治疗靶标。Pepquery不需要定制化的构建数据库,区别于spectrum-centric的方法,使用peptide-centric,允许快速和方便的验证基因组改变导致的蛋白质组改变。
可指定肿瘤类型和数据集,针对单个基因,分析其在肿瘤和癌旁组织的丰度差异,磷酸化位点差异等。可用于验证目标基因是否在指定类型肿瘤中存在高表达,磷酸化等。
按照基因分析
除了在cProSite中查询单个基因,也可直接在首页搜索框输入目标基因,点击查看,或进入EXPLORE左侧Genes 筛选框输入一组基因或选择某个信号通路的基因,查询后进入右侧Genes页面查看。展示的信息包括:检测到的PTM,在不同study中的表达丰度。
按照肿瘤类型分析
蛋白质组定量的结果形式与RNA定量结果类似,可进行的分析也类似。且相比于mRNA需要再经过翻译才能生成蛋白质,直接对蛋白定量的准确度更高。常规针对肿瘤样本和癌旁样本,进行差异表达,GO/KEGG注释,蛋白互作网络分析等。结合Clinical 标签数据,可进行生存分析,挖掘与临床病理或结果真正相关的标志物或靶点,通过机器学习方法可进行疾病分型,诊断预测等。
使用起来还是非常方便,避免了自己写代码,又找数据又作图,有需要的老师可以参考使用!
桓峰基因,铸造成功的您!
未来桓峰基因公众号将不间断的推出转录组系列生信分析教程,敬请期待!!
有想进生信交流群的老师可以扫最后一个二维码加微信,备注“单位+姓名+目的”,有些想发广告的就免打扰吧,还得费力气把你踢出去!
本文使用 文章同步助手 同步
本文如未解决您的问题请添加抖音号:51dongshi(抖音搜索懂视),直接咨询即可。