【TPLS-019】ハード踏み拷問金蹴りマラ潰し処刑 JUN女王様 代谢组学 | 第5期. 代谢组学多元统计分析,你学会了吗
发布日期:2024-08-03 16:55    点击次数:54

【TPLS-019】ハード踏み拷問金蹴りマラ潰し処刑 JUN女王様 代谢组学 | 第5期. 代谢组学多元统计分析,你学会了吗

往期记忆:【TPLS-019】ハード踏み拷問金蹴りマラ潰し処刑 JUN女王様

第1期.2024年了,上车代谢组学还不晚

第2期. 对于代谢组学,你必须了解的事

第3期.行将发车,快来学习代谢组学基本过程与工夫

第4期. 快来学,一文掌抓代谢组学上游分析

Introduction 

在上一期推文中,咱们先容了MetaboAnalyst在代谢组学上游分析中的行使以及MetaboAnalystR包简介,诸君小伙伴是否还是对代谢组学下流分析迫不足待了呢?本文咱们将率领各人学习掌抓代谢组学下流分析之多元统计分析。

代谢组学下流分析,即从拿到矩阵数据发轫,进行多元统计分析与形式识别、互异代谢物筛选、通路与功能分析等。代谢组学数据下流分析不错基于网页用具在线分析(如MetaboAnalyst等),也不错基于R说念话个性化分析。这期咱们为各人先容基于R说念话的MetaboAnalystR、ropls包。

本期的共享包括2个话题:

1. MetaboAnalystR包用于多元统计分析【TPLS-019】ハード踏み拷問金蹴りマラ潰し処刑 JUN女王様

2. ropls包用于多元统计分析

1

一、MetaboAnalystR包

MetaboAnalystR包是为代谢组学高下流分析修复的集成R包(https://www.metaboanalyst.ca/docs/RTutorial.xhtml),装配智商参考github教程(https://github.com/xia-lab/MetaboAnalystR)。上期咱们简要先容了它在代谢组学上游分析中的行使。这期为各人带来的是MetaboAnalystR包在代谢组学多元统计分析中的实战行使。1. 加载R包、载入数据、圭臬化
# 加载MetaboAnalystR包library(MetaboAnalystR)# 载入代谢组数据mSet<-InitDataObjects("pktable", "stat", FALSE) # 开动化数据对象mSet,数据类型为“pktable”,分析类型为“stat”,不进行高维数据惩处mSet<-Read.TextData(mSet, "https://rest.xialab.ca/api/download/metaboanalyst/human_cachexia.csv", "rowu", "disc") # 从CSV文献中读取数据,行数据默示样本,破裂变量类型# 实行数据圭臬化mSet<-SanityCheckData(mSet) # 对数据进行完好性检查mSet<-ReplaceMin(mSet) # 替换数据中的最小值mSet<-PreparePrenormData(mSet) # 准备数据进行圭臬化惩处mSet<-Normalization(mSet, "NULL", "NULL", "NULL", ratio=FALSE, ratioNum=20) # 对数据进行圭臬化,未指定具体圭臬化措施
2. 主要素分析(PCA)
# 主要素分析mSet<-PCA.Anal(mSet)  # 对数据进行主要素分析,以降维和可视化高维数据,mSet是包含数据和分析效果的对象# 创建2D PCA得分图mSet<-PlotPCA2DScore(mSet, "pca_score2d_0_", format = "png", dpi=72, width=NA, 1, 2, 0.95, 1, 0)  # "pca_score2d_0_"是输出文献的前缀,format="png"指定输出时势为PNG,dpi=72指定分离率为72,width=NA默示使用默许宽度, 1和2指定绘图第1和第2主要素,0.95默示置信区间为95%,1默示清楚样本点标签,0默示不清楚置信椭圆

图片【TPLS-019】ハード踏み拷問金蹴りマラ潰し処刑 JUN女王様

MetaboAnalystR

2D PCA得分图

3. 偏最小二乘判别分析(PLS-DA)
# PLS回首分析mSet<-PLSR.Anal(mSet, reg=TRUE)  # reg=TRUE默示进行回首分析,mSet是包含数据和分析效果的对象# 创建2D PLS得分图mSet<-PlotPLS2DScore(mSet, "pls_score2d_0_", "png", 72, width=NA, 1,2,0.95,1,0)  # "pls_score2d_0_"是输出文献的前缀,"png"指定输出时势为PNG,72指定分离率为72,width=NA默示使用默许宽度,1和2指定绘图第1和第2潜在变量,0.95默示置信区间为95%,黄色社区1默示清楚样本点标签,0默示不清楚置信椭圆

图片

MetaboAnalystR

2D PLS得分图4. 正交偏最小二乘判别分析(OPLS-DA)
# 正交偏最小二乘判别分析mSet<-OPLSR.Anal(mSet, reg=TRUE)  # reg=TRUE默示进行回首分析,mSet是包含数据和分析效果的对象# 创建2D oPLS-DA得分图mSet<-PlotOPLS2DScore(mSet, "opls_score2d_0_", format = "png", dpi=72, width=NA, 1,2,0.95,1,0)  # "opls_score2d_0_"是输出文献的前缀,format="png"指定输出时势为PNG,dpi=72指定分离率为72,width=NA默示使用默许宽度,1和2指定绘图第1和第2潜在变量,0.95默示置信区间为95%,1默示清楚样本点标签,0默示不清楚置信椭圆

图片

MetaboAnalystR

谷物肉系列

2D oPLS-DA得分图

2

二、ropls包

ropls包用于进行偏最小二乘(PLS)回首、PLS判别分析(PLS-DA)和正交偏最小二乘(OPLS)分析。该包主要行使于代谢组学、卵白质组学和基因组学等高维生物数据的分析。本次为各人先容的是ropls包用于PLS-DA、OPLS-DA分析代码。

1. 加载R包、载入数据
# 加载必要的R包library(ropls)        # 用于PLS-DA和OPLS-DA分析library(ggplot2)      # 用于数据可视化# 读取数据到data变量中,其中行是样本,列是代谢物特征data <- read.csv("metabolomics_data.csv", row.names = 1
2. PCA分析
# PCA分析pca_result <- prcomp(data, scale. = TRUE) # 使用prcomp函数进行PCA分析,scale. = TRUE默示圭臬化数据# 索要PCA效果scores <- pca_result$x  # 索要PCA得分(样本在主要素空间中的坐标)# 可视化PCA效果ggplot(as.data.frame(scores), aes(PC1, PC2)) +  # 使用ggplot2绘图PCA得分图,x轴是PC1,y轴是PC2  geom_point() +  # 绘图样本点  theme_minimal() +  # 使用松懈的主题  labs(title = "PCA Score Plot", x = "PC1", y = "PC2")  # 添加图标题和轴标签
3. PLS-DA分析
# PLS-DA分析group <- factor(rep(c("Group1", "Group2"), each = nrow(data)/2))  # 数据分为两组,生要素组因子plsda_result <- opls(data, group, predI = 2, orthoI = 0)  # 使用opls函数进行PLS-DA分析,predI = 2默示给与两个主要素,orthoI = 0默示不进行正交调遣# 索要PLS-DA效果plsda_scores <- plsda_result@scoreMN  # 索要PLS-DA得分# 可视化PLS-DA效果ggplot(as.data.frame(plsda_scores), aes(p1, p2, color = group)) +  # 使用ggplot2绘图PLS-DA得分图,x轴是p1,y轴是p2,按分组着色  geom_point() +  # 绘图样本点  theme_minimal() +  # 使用松懈的主题  labs(title = "PLS-DA Score Plot", x = "PLS1", y = "PLS2")  # 添加图标题和轴标
4. OPLS-DA分析
# OPLS-DA分析oplsda_result <- opls(data, group, predI = 1, orthoI = 1)  # 使用opls函数进行OPLS-DA分析,predI = 1默示一个展望要素,orthoI = 1默示一个正交要素# 索要OPLS-DA效果oplsda_scores <- oplsda_result@scoreMN  # 索要OPLS-DA得分# 可视化OPLS-DA效果ggplot(as.data.frame(oplsda_scores), aes(p1, o1, color = group)) +  # 使用ggplot2绘图OPLS-DA得分图,x轴是p1,y轴是o1,按分组着色  geom_point() +  # 绘图样本点  theme_minimal() +  # 使用松懈的主题  labs(title = "OPLS-DA Score Plot", x = "Predictive Score", y = "Orthogonal Score")  # 添加图标题和轴标签

Summary

总结一下,代谢组学多元统计分析不错使用已修复集成的代谢组学分析R包,举例MetaboAnalystR,也不错使用其他具有相同功能的R包,举例ropls等。后期咱们将赓续带着各人一皆从浅入深地战斗、交融、掌抓代谢组学!

图片

本站仅提供存储劳动,统统本体均由用户发布,如发现存害或侵权本体,请点击举报。