6场半全场中几场才有奖 晶誠所至 生命所能

Engage to Life Energy

 
看Loupe可視化軟件如何分析10x單細胞ATAC數據
發布日期:2019-11-28瀏覽:

(圖片來源:10x Genomics官方素材,侵刪)

 

Loupe Cell Browser主要用于打開10X單細胞結果文件中的.cloupe文件,導入數據后,可捕獲更多數據信息。在ATAC數據的應用主要在于:用于尋找顯著peaks,區分轉錄因子motif,識別細胞類型,比較細胞群間染色質可接近性,以及探索細胞群內的亞群。

在開始學習教程之前,相信各位小伙伴們已經下載并安裝了Loupe Cell Browser(https://support.10xgenomics.com/single-cell-atac/software/visualization/latest/what-is-loupe-cell-browser),和3’/5’基因表達譜數據可視化一樣,同樣使用的Loupe Cell Browser 3.3.1。

 

大家可以用10x官方ATAC教程數據集或自己的10x scATAC數據跟著我們一起測試。

10x官方ATAC教程數據集

打開界面后你可以通過點擊“Recent Files”頁面中的“ATACTutorial.cloupe”來獲取ATAC教程數據集。ATAC教程數據集是根據標準Chromium™ Single-Cell ATAC protocol利用cellranger-atac流程分析人外周血單核細胞得到的結果,流程分析得到的barcode計數為5335。

自己的10x scATAC數據

點擊下方Browse for a Loupe Cell Browser File按鈕打開新的cloupe文件。在我們公司所提供的10×ATAC的分析結果中,每一個樣本都有對應的.cloupe文件,Loupe Cell Browser安裝后可以直接點擊sample.cloupe文件打開并查看相應結果。

 

打開后我們可以看到多種操作工具,運用這些工具我們可以實現五大應用:

>Identifying Cell Types 鑒定細胞類型

>Analyzing Differential Accessibility 分析差異可接近性

>Exploring Cell Subtypes 探索細胞亞型

>Finding Significant Features 發現顯著性特征

>Sharing Results 分享結果(輸出想要的圖表)

 

本次Dr.cell先帶各位先熟悉使用loupe軟件鑒定細胞類型和分析差異可接近性兩大應用。

 

相信各位已經使用過Loupe Cell Browser來分析10×單細胞基因表達,當各位開始著手分析10×ATAC數據時,會發現與10×單細胞基因表達既有相同之處,又有不同之處。

Cell Ranger ATAC算法文檔包含了更多算法和分析方面的細節,敲黑板,以下是在loupe上查看10×ATAC數據時值得注意的關鍵性要點:

、UMI count per cell是基因表達的單位。Cut sites per cell是染色質可接近性的單位。

、基因表達矩陣中每一行是基因。染色質可接近性矩陣中每一行是peak。

、Peaks是基因組區域,這些區域在片段切割位點(fragment cut sites)顯著上升,即表明為開放染色質區域。它們通過其位置來命名(例如“Chr1:10244-10510”)。

、通常,ATAC數據集中的peaks數要比參考基因組中的基因多。

、除了peaks之外,還有一些其他累加特性類型可用來進行細胞區分:

啟動子總和(Promoter sums),是接近該基因的轉錄起始位點之一的cut sites per cell (within peaks)的總和。這些特征被命名為'(Gene)Sum'。并非所有peaks都被關聯到了一個基因。

轉錄因子motif(Transcription factor motifs),是位于被Cell Ranger ATAC流程關聯了motif的peak中的cut sites per cell的總和。Motif特征是以motif本身命名的(例如“SPI1”)。一個peak通?;峁亓喔鰉otifs。

 

1 Identifying Cell Types 鑒定細胞類型

根據已知的markers識別細胞類型非常直接,快速??梢岳悶舳幼芎腿范ㄏ赴嘈?,首先,在模式選擇器中選擇Accessibility Mode(可接近性模式)進行操作,可以看到一個Active Feature List(活動特征列表)。就B細胞的marker MS4A1而言,在搜索框中輸入“MS4A1”,檢索得到“MS4A1 Sum”特征。按下Tab鍵或回車鍵來將啟動子總和加入活動特征列表,并計算整個數據集中該啟動子的切割位點數。我們發現B細胞marker明顯地聚集在圖中一群中,并呈高亮模式。

 

接下來,可以通過添加B細胞的其他markers,如CD19和IGKC,將其啟動子總和加入到活動特征列表,可確定高亮的區域就代表B細胞。

 

除了利用啟動子總和來確定細胞類型,還可以利用轉錄因子motifs確定細胞類型。研究表明,SPI1(PU.1)轉錄因子在單核細胞功能中扮演了關鍵角色[1], 選擇將SPI1加入到活動特征列表,將高z-score的細胞顯示為紅色,表明在所有具有SPI1 motif的peak之間具有較高的相對可接近性。SPI1在B細胞調節中也具有一定作用,由于我們已經通過B細胞的marker(MS4A1、CD19和IGKC)標記識別了B細胞分群,因此,左上方的大群應該是單核細胞。

 

和利用loupe軟件查看10×單細胞基因表達數據類似,除了直接在搜索框中輸入基因symbol外,還可以導入感興趣細胞類型marker的CSV文件(ATACBloodCell.csv),CSV文件內容如下截圖所示。

 


 

接下來,我們可以嘗試創建一個B細胞分群。在工具箱中選擇矩形套索工具,拖動選框選中我們之前通過輸入B細胞marker(MS4A1、CD19和IGKC)高亮的細胞群,會彈出一個對話框,如下圖填寫名稱,將這些細胞命名為“B細胞”。按下保存按鈕,一個新的細胞類型分類就創建成功了??梢圓扇⊥姆椒ù唇ㄒ桓魴碌?ldquo;單核細胞”分群。

 

也可以定量的創建細胞分群,選擇從 ATACBloodCell.csv 中導入的All T Cells,點擊列表中的CD3D Sum,隨后在“Select by Count - CD3D Sum”下方的輸入框輸入“0”,點擊過濾按鈕。這將會高亮含有CD3D啟動子peak內存在fragment的每一個細胞,并彈出一個分群的對話框。選擇“Cell Types”作為分類,將這些細胞加入到“T Cells”分群中。如下圖所示。

 

2 Analyzing Differential Accessibility 分析差異可接近性

在1中創建了以 “Cell Types”為分類,共3種細胞群,即B細胞、T細胞和單核細胞??梢岳肞eak Viewer分析差異可接近性,在選擇器中選擇Gene(基因)選項,輸入 “CD33”,得到下圖結果。

 

用鼠標點擊peak,可以看到關于該peak細胞類型的百分及其他重要信息。單擊一個peak也會在barcode圖中展示在該區域擁有開放染色質的細胞,如下圖所示。很明顯,相較于其他細胞類型,很高比例的單核細胞在該peak區有開放染色質。

 

在我們公司Cell Ranger ATAC流程生成的fragments.tsv.gz文件可以在更精細的分辨率下查看可接近性,主要查看切割位點信息。通過文件夾圖標可加載報告中生成的fragments.tsv.gz文件,Fragment文件可以通過文件系統或URL加載。這里,可以加載10×官網提供的ATACTutorial fragments文件,結果如下圖。

 

關于10x Genomics神器Loupe Cell Browser ATAC 操作寶典,本期Dr.cell介紹到這里,咱們下期繼續解析,看10x Genomics Loupe可視化軟件如何探索細胞亞型、發現顯著性特征!

 

3 Exploring Cell Subtypes 探索細胞亞型

 

Dr.cell先帶各位了解下本應用的目標:探索數據集中已知的未成熟(immature)和成熟的(mature)的B細胞類型。

上篇我們已經使用MS4A1和CD19的啟動子總和鑒定了B細胞分群,通過在已經鑒定B細胞分群的基礎上創建未成熟和成熟B細胞的亞型。小伙伴們好奇怎樣去創建嗎?請聽Dr.cell娓娓道來。

我們先來了解下TCL1A基因,它是在未成熟B細胞中表達而在成熟B細胞中不表達的基因,所以可以利用TCL1A 啟動子總和來區分B細胞亞型。

首先,在選擇類目中選擇Filter,隨后開始構建一個Filter。通過點擊loupe軟件中“Create New Rule”圖標增加過濾規則。因為我們想要設置啟動子總和>0的閾值,所以在Threshold by count處點擊“>”按鈕,后輸入名稱“MS4A1”并選擇“MS4A1 Promoter Sum”。CD19也是同樣的操作。當嘗試將“AND”按鈕切換到“OR”按鈕,立即會看到B細胞分群中更多的barcodes以紫色高亮顯示(如下圖所示)。

 

接下來,跟隨Dr.cell來尋找未成熟的B細胞之旅,我們希望找到一群MS4A1或CD 19啟動子總和大于0并且表達TCL1A基因的barcodes。首先點擊“Add new ruleset”按鈕,接著點擊“Create new rule”按鈕,在Threshold by count處點擊“>”按鈕,后輸入名稱“TCL1A”并選擇“MS4A1 Promoter Sum”,從barcode圖中可以看到未成熟的B細胞呈紫色高亮。

 

如下圖所示,通過點擊'Assign 17 barcodes'按鈕,將這些細胞分配到一個category,命名category為 'B Cell Subtypes',命名cluster為'Immature'。由于成熟B細胞中不表達TCL1A基因,可以將'TCL1A Promoter Sum >0'修改為'TCL1A Promoter Sum =0'。設置完畢后可以在barcodes圖中看出B細胞分群中有部分細胞呈紫色高亮。接下來通過點擊'Assign 243 barcodes'按鈕,將這些細胞分配到命名為'B Cell Subtypes'的category中,并將cluster命名為'Mature'。

 

最后,未成熟和成熟B細胞的亞型如下圖所示。這樣,我們就成功地使用loupe軟件探索了細胞亞型。

 

4 Finding Significant Features 發現顯著性特征

 

我們可以看看barcode圖,看看帶有T細胞標記的細胞區域。通過LSA降維和隨后的聚類將T細胞分成幾個單獨的群組,如t-SNE圖所示。是什么導致了這些亞群之間的差異?我們可以使用顯著性特征工具來找出答案。

首先,利用套索工具高亮T細胞最右側(rightmost)的分群并將其標記為“T細胞2”,如下圖所示。

 

下圖是loupe軟件顯著性特征工具的介紹和使用說明。使用此工具,我們可以在當前選定的Clusters之間計算區別motifs,獨立Peaks,或啟動子總和。

 

下面,請跟隨Dr.cell 使用顯著性特征工具來計算每個細胞類型的區分啟動子總和。首先,單擊底部面板左側的列表圖標,使特征表格視圖可見。接著,當處于分類模式下,Cell Types可見時,在顯著性特征比較工具中選擇Globally Distinguishing,選擇啟動子總和(Promoter Sum)作為特征類型。點擊計算按鈕,等待 Loupe Cell Browser計算顯著富集啟動子總和。

 

當計算完成后,出現B細胞群的最顯著富集啟動子總和,以及根據p-value排序的,且相較于其他細胞群的log2 fold change值。毫無意外,最顯著富集的啟動子總和就是我們用來鑒定B細胞分群的MS4A1(CD20)。如下圖所示。

 

接下來,我們來探索一下兩個T細胞分群(T Cells和T Cells 2)之間的差異。在Cell Types面板中,去除B細胞和單核細胞分群的選中項,接著在顯著性特征比較工具中選擇Locally Distinguishing,將Motif作為特征類型,點擊計算顯著Motif。得出結果如下圖所示。

C:UserschentingPictures~11.15微信圖片_20191122132501.jpg

 

首先在工具箱底部點擊分屏按鈕,選擇Other Category(Cell Types),barcode圖中的細胞將會以Cell Types(細胞類型)進行分屏顯示。接著在特征表格中點擊T Cells中最顯著富集的motif “BATF::JUN”,將其加入活動特征列表,可在barcode圖中查看BATF::JUN motif的z-score值。

 

從下圖中可以看出,T Cells 2組中的細胞在顏色上相對更藍一些,表明該組中BATF相關peaks相較于T Cells組,其平均可接近性更低。研究表明,BATF motif可接近性在細胞分化和衰老中表現出增加趨勢[2],因此這也可能說明T Cells 2組中的細胞相對更年輕,或者說包含更多原態T細胞(naive T cells)。

最后,我們來看下兩組T細胞之間(T Cells和T Cells 2)的顯著性peaks。切換回分類模式,選擇Peaks作為特征類型。點擊計算按鈕,等待計算完成。隨后點擊顯著富集的前5個Peaks(如下圖),將其逐次添加到新的“T Cell 1 Drivers”列表。關于新的“T Cell 1 Drivers”列表的創建,即在Add to Feature List輸入區輸入“T Cell 1 Drivers”即可。

 

為了了解這些獨立的Peaks,我們可以將分類模式切換成可接近性模式,選擇列表中的第一個Peak,“chr1:159046026-159047751”,點擊Peak Viewer圖標,如下圖展示。在Peak Viewer中點擊放大或縮小按鈕可以顯示其他附加信息,從基因注釋軌跡中看到該Peak位于AIM2基因轉錄起始位點的右側。

 

5 Sharing Results 分享結果

 

上述各種神操作,各位小伙伴們一定好奇怎樣將結果保存下來呢,請繼續跟隨Dr.cell的步伐。從我們10×ATAC數據集中導出數據和圖表有多種方法。工具箱、分類列表、特征列表、特征表以及Peak Viewer都具有導出功能。下面來一一闡述。

關于導出Barcode圖,導出前的設置如下圖所示。點擊工具箱中的導出屏幕圖形圖標將會導出現在展示的barcode圖。你可以選擇導出為PNG格式或SVG矢量圖格式。

 

關于導出特征表(Significant Features),導出前的設置如下圖所示。導出包含p-values 值和 log2fold changes值的CSV文件。

 

關于導出Peak Viewer圖,導出前的設置如下圖所示??傻汲齙鼻翱墑踴疨eaks到一個CSV文件中,或者將Peak Viewer圖導出為PNG或SVG格式。

 

關于10x Genomics神器Loupe可視化軟件ATAC 操作寶典,已全部介紹完畢。小伙伴們趕緊行動起來吧!

 

參考文獻:

[1] Takahiro S , Mika N I , Haruka Y O , et al. Reconstruction of Monocyte Transcriptional Regulatory Network Accompanies Monocytic Functions in Human Fibroblasts[J]. PLoS ONE, 2012, 7(3):e33474.

[2] Moskowitz D M , Zhang D W , Hu B , et al. Epigenomics of human CD8 T cell differentiation and aging[J]. Science Immunology, 2017, 2(8):eaag0192.

上一條:介紹一下~一種新的表面抗體類型集合,對接10x 3’端轉錄組測序
下一條:晶能生物開啟全新定制Twist人核心外顯子組捕獲測序服務
返回
網站地圖 | 法律聲明 | 聯系我們

地址:上海市漕河涇開發區漕寶路401號3號樓4B 電話:021-60901207/60901208
晶能生物技術(上海)有限公司 Copyright 2012 Genergy Inc. 滬ICP備10017363號

友情鏈接: