湖南管理系统开发 Seurat V5|一个函数就能贬责多种去批次模范，按需尝试

Seurat 是单细胞RNA数据分析的一个终点主流的R包，升级到现时V5版块后，会带来一些不友好的场合，关联词也有一些功能上的升级，人人一定凭证我方的情况和分析需求来详情是否升级。V5的升级部分主要体当今以下4个方面（https://satijalab.org/seurat/articles/get_started_v5_new），本次先先容第一个：Seurat V5中去批次模范的集成。

图片

Seurat v5引入了愈加天真和精简的基础架构，不错用一瞥代码完成不同的集成去批次算法，极大的减少了不同模范的环境准备和数据处理时候，不错更聚焦在使用哪种模范后果更好。这使得探索不同集成模范的摈弃变得愈加容易，并将这些摈弃与排斥集成要领的使命流进行相比。本文以ifnb数据集当作示例，展示去批次的流程和模范。

一 R包，数据准备

1 载入R包下载联系的R包，醒目当今径直install.packages('Seurat')默许装配的便是V5版块。

library(Seurat)library(SeuratData)#remotes::install_github("satijalab/seurat-wrappers")remotes::install_local("./seurat-wrappers-master.zip",upgrade = F,dependencies = F)library(SeuratWrappers)library(ggplot2)library(patchwork)options(future.globals.maxSize = 1e9)

该系列会有较多的R包是在github中，可能存在无法装配的问题。以satijalab/seurat-wrappers为例，当github的包无法下载时候，不错找到github地址然后点击Code，下载zip文献，

图片

然后使用remotes::install_local的形势腹地装配。2 下载示例数据测试数据集相似在外网，受限于上网形势和网速，也约略率会报错。无法下载的不错尝试下载到腹地然后再装配（http://seurat.nygenome.org/src/contrib/ifnb.SeuratData_3.1.0.tar.gz），更巨额据集的称呼以及下载伙同参考https://zhuanlan.zhihu.com/p/661800023https://zhuanlan.zhihu.com/p/661800023 。

# 下载测试数据集#InstallData("ifnb")install.packages('./ifnb.SeuratData_3.1.0.tar.gz', repos = NULL, type = "source")

下载后载入数据，然后搜检待处理的批次情况（stim列）

# load in the pbmc systematic comparative analysis datasetobj <- LoadData("ifnb")obj <- UpdateSeuratObject(obj)obj <- subset(obj, nFeature_RNA > 1000)objAn object of class Seurat 14053 features across 1254 samples within 1 assay Active assay: RNA (14053 features, 0 variable features) 2 layers present: counts, data

图片

不错看到Seurat V5一个很大的变化便是layer。

二数据整合（批次处理）

1，数据拆分示例的Seurat对象中包含2种不同处理的数据(meta的stim列)，使用Seurat v5 整合时是拆分为不同的layer 而无需拆分为多个对象。不错看到拆分后出现4个layer (stim列中的每个批次王人有我方的count和data矩阵)。Seurat V4 需要将数据拆分为2个不同的Seurat对象。

obj[["RNA"]] <- split(obj[["RNA"]], f = obj$stim)objAn object of class Seurat 14053 features across 1254 samples within 1 assay Active assay: RNA (14053 features, 0 variable features) 4 layers present: counts.CTRL, counts.STIM, data.CTRL, data.STIM

请醒目，由于数据被分红几层，因此对每一批次寂寥扩充归一化和HVG 。(自动识别一组一致的变量特征)。

obj <- NormalizeData(obj)obj <- FindVariableFeatures(obj)obj <- ScaleData(obj)obj <- RunPCA(obj)

图片

三区比：上期红球三区比为2：3：1，红二区走热，红三区走冷，联系我们最近10期红球三区比为19：23：18，红二区表现较热。本期预计三区红球平衡，推荐三区比2：2：2。

这里会针对每个“batch”分别进行NormalizeData 和 FindVariableFeatures。2 数据径直团结（不去批次）先尝试径直团结的形势，搜检数据的批次情况

#径直整合obj <- FindNeighbors(obj, dims = 1:30, reduction = "pca")obj <- FindClusters(obj, resolution = 2, cluster.name = "unintegrated_clusters")obj <- RunUMAP(obj, dims = 1:30,                reduction = "pca",                reduction.name = "umap.unintegrated")DimPlot(obj, reduction = "umap.unintegrated",         group.by = c("stim", "seurat_annotations"))

图片

软件开发3，一瞥代码去批次Seurat v5中的integratelayer函数复旧一瞥代码完成去批次集要素析，现时复旧以下五种主流的单细胞集成去批次模范。Anchor-based CCA integration (method=CCAIntegration)Anchor-based RPCA integration (method=RPCAIntegration)Harmony (method=HarmonyIntegration)FastMNN (method= FastMNNIntegration)scVI (method=scVIIntegration)

#CCAobj <- IntegrateLayers(  object = obj, method = CCAIntegration,  orig.reduction = "pca", new.reduction = "integrated.cca",  verbose = FALSE)#RPCAobj <- IntegrateLayers(  object = obj, method = RPCAIntegration,  orig.reduction = "pca", new.reduction = "integrated.rpca",  verbose = FALSE)#Harmonyobj <- IntegrateLayers(  object = obj, method = HarmonyIntegration,  orig.reduction = "pca", new.reduction = "harmony",  verbose = FALSE)#FastMNNobj <- IntegrateLayers(  object = obj, method = FastMNNIntegration,  new.reduction = "integrated.mnn",  verbose = FALSE)obj

图片

可见新增多了4种去批次模范，底下便是顺次可视化，然后聘请最终的模范连续后续分析。还要醒目界说new.reduction的名字，否则会被隐讳掉。4，详情去批次模范4.1 ，umap展示这里用CCA 和 RPCA 示例，其他的两种相似的形势，醒目修改reduction.name 。

#####CCA######obj <- FindNeighbors(obj, reduction = "integrated.cca", dims = 1:30)obj <- FindClusters(obj, resolution = 2, cluster.name = "cca_clusters")obj <- RunUMAP(obj, reduction = "integrated.cca",                dims = 1:30,                reduction.name = "umap.cca")p1 <- DimPlot(  obj,  reduction = "umap.cca",  group.by = c("Method", "CellType", "cca_clusters"),  combine = FALSE, label.size = 2)#####RPCA######obj <- FindNeighbors(obj, reduction = "integrated.rpca", dims = 1:30)obj <- FindClusters(obj, resolution = 2, cluster.name = "rpca_clusters")obj <- RunUMAP(obj, reduction = "integrated.rpca",                dims = 1:30,                reduction.name = "umap.rpca")p2 <- DimPlot(  obj,  reduction = "umap.rpca",  group.by = c("Method", "CellType", "rpca_clusters"),  combine = FALSE, label.size = 2)wrap_plots(c(p1, p2), ncol = 2, byrow = F)

图片

对比径直团结，不错看到不同stim之间的批次效应被整合，不错加上另两种同期展示4种模范，当今一种进行后续的分析。4.2 Marker 可视化还不错应用经典marker相比不同去批次模范的发扬（1）VlnPlot 图

p1 <- VlnPlot(  obj,  features = "rna_CD8A", group.by = "unintegrated_clusters") +   NoLegend() + ggtitle("CD8A - Unintegrated Clusters")p2 <- VlnPlot(  obj, "rna_CD8A",  group.by = "cca_clusters") +   NoLegend() + ggtitle("CD8A - CCA Clusters")p3 <- VlnPlot(  obj, "rna_CD8A",  group.by = "rpca_clusters") +   NoLegend() + ggtitle("CD8A - RPCA Clusters")p1 | p2 | p3

图片

（2）DimPlot 图

p4 <- DimPlot(obj, reduction = "umap.unintegrated", group.by = c("cca_clusters"))p5 <- DimPlot(obj, reduction = "umap.rpca", group.by = c("cca_clusters"))p6 <- DimPlot(obj, reduction = "umap.cca", group.by = c("cca_clusters"))p4 | p5 | p6

图片

凭证以上的信息详情最终使用的去批次模范。

三 FindMarker 分析

详情去批次模范后，就不错进行FindMarker 以及注目。1，rejoin layer要醒目现时的layer是凭证stim批次拆分开的，在进行任何的differential expression analysis之前王人要先使用JoinLayers函数进行rejoin the layers 。

objobj2 <- JoinLayers(obj) #仅为了别离，施行情况下使用obj即可obj2

图片

接下来便是DEG分析，找到各个cluster的marekr基因进行手动注目或者径直使用singleR等自动注目软件完成注目。参考贵寓：https://satijalab.org/seurat/articles/seurat5_integrationhttps://satijalab.org/seurat/articles/integration_introduction

◆ ◆ ◆ ◆ ◆

全心整理（含图PLUS版）|R道话生信分析，可视化（R统计，ggplot2绘制，生信图形可视化汇总）

RNAseq纯生信挖掘念念路共享？不湖南管理系统开发，主如若送你代码！（提议储藏）

本站仅提供存储做事，通盘内容均由用户发布，如发现存害或侵权内容，请点击举报。

上一篇：联系我们 28条英语当然拼读法基本规章和小决窍（经典保藏）

下一篇：没有了