【佳學(xué)基因檢測】scRNAseq在基因解碼、基因檢測中的作用
scRNAseq導(dǎo)讀
scRNAseq是一種基因解碼技術(shù),其主要作用在于可以揭示過去被認(rèn)為是單一生理過程、單一組織的異質(zhì)性。佳學(xué)基因等基因信息分析機(jī)構(gòu)利用單細(xì)胞測序可以將人體基因序列的變化與人體的發(fā)育過程、生理過程和病理過程的調(diào)節(jié)方式和調(diào)節(jié)途徑的揭示。是否采用了單細(xì)胞測序結(jié)果用于指導(dǎo)致病基因的鑒定是基因解碼與基因檢測的又一個(gè)本質(zhì)區(qū)別。
單細(xì)胞測序可以揭示哪些基因檢測不能提供的結(jié)果?
人類各種組織之間細(xì)胞的類型,狀態(tài)和相互作用差異巨大。而單細(xì)胞RNA測序(snRNA-seq)技術(shù)提供了在單細(xì)胞水平觀測基因表達(dá)的方法,可以更好地研究這些組織及其中存在的不同類型的細(xì)胞。
這一先進(jìn)且激動(dòng)人心的技術(shù)可被用于:
研究一個(gè)組織中到底存在哪些種類的細(xì)胞
識(shí)別未知或少見的細(xì)胞類型或狀態(tài)
闡明在分化過程或時(shí)間及狀態(tài)變化中基因表達(dá)的改變
找出在不同條件下(如加藥組和疾病組)在某一特定類型的細(xì)胞中差異表達(dá)的基因
探究一種細(xì)胞類型之間基因表達(dá)的變化,同時(shí)納入空間,調(diào)控和/或蛋白質(zhì)信息
單細(xì)胞測序中解決一些較常見問題的方法包括:
單細(xì)胞RNA測序分析中面臨的挑戰(zhàn)
在單細(xì)胞RNA測序(scRNA-seq)出現(xiàn)之前,轉(zhuǎn)錄組分析是使用批量RNA測序(bulk RNA-seq)進(jìn)行的,這是一種比較細(xì)胞基因表達(dá)平均值 (averages of cellular expression)的直接方法。如果要尋找疾病的生物學(xué)標(biāo)志物 (disease biomarkers),或者不關(guān)心樣本中的細(xì)胞異質(zhì)性,這可能是賊好的方法。
雖然批量RNA測序可以探索不同條件(如加藥或疾病)之間基因表達(dá)的差異,但在細(xì)胞水平上的差異并沒有被充分挖掘。例如,在下圖的展示中,如果進(jìn)行批量(bulk)分析(左),我們將無法檢測到基因A和基因B表達(dá)之間的正確關(guān)系。但是,如果我們按照細(xì)胞類型或細(xì)胞狀態(tài)對(duì)細(xì)胞進(jìn)行適當(dāng)分群,我們可以看到基因之間的正確關(guān)系。
探究異質(zhì)性 (Studying heterogeneity)
譜系路徑分析 (Lineage tracing study)
隨機(jī)基因表達(dá)研究 (Stochastic gene expression study)
盡管單細(xì)胞RNA測序能夠獲得在細(xì)胞水平上的基因表達(dá),但樣本制備和建庫成本更高,分析也更復(fù)雜,更難解讀。單細(xì)胞RNA測序分析的復(fù)雜性包括:
數(shù)據(jù)量巨大
每個(gè)細(xì)胞測序深度低
跨細(xì)胞/樣本的生物學(xué)誤差
跨細(xì)胞/樣本的技術(shù)性誤差
數(shù)據(jù)量巨大
單細(xì)胞RNA測序項(xiàng)目的表達(dá)量數(shù)據(jù)代表了成千上萬個(gè)細(xì)胞中上萬或數(shù)十萬條讀取 (reads),產(chǎn)生的數(shù)據(jù)要大得多,需要更多的內(nèi)存來分析,更大的硬盤來存儲(chǔ),以及更多的時(shí)間來運(yùn)行分析。
每個(gè)細(xì)胞測序深度低
對(duì)于基于油滴(droplet)的單細(xì)胞RNA測序方法,測序的深度較淺,通常每個(gè)細(xì)胞只能檢測到10-50%的轉(zhuǎn)錄組。這導(dǎo)致細(xì)胞中許多基因顯示為零計(jì)數(shù)。然而,在一個(gè)特定的細(xì)胞中,一個(gè)基因的零計(jì)數(shù)可能意味著該基因沒有被表達(dá),或者只是沒有檢測到轉(zhuǎn)錄本。在細(xì)胞中,表達(dá)水平較高的基因往往具有較少的零計(jì)數(shù)。由于這一特性,許多基因在任何細(xì)胞中都不會(huì)被檢測到,細(xì)胞間的基因表達(dá)也會(huì)有很大的差異。
跨細(xì)胞/樣本的生物學(xué)誤差
我們不感興趣的生物學(xué)變異會(huì)導(dǎo)致細(xì)胞間的基因表達(dá)跟實(shí)際的生物細(xì)胞類型或狀態(tài)更為相似或不同,從而影響細(xì)胞類型的識(shí)別。這些生物學(xué)變異(除非是實(shí)驗(yàn)研究的一部分)包括:
轉(zhuǎn)錄脈沖 (Transcriptional Bursting):并非所有基因的基因轉(zhuǎn)錄都處于開啟狀態(tài)。捕獲時(shí)間點(diǎn)將決定每個(gè)細(xì)胞中的基因是打開還是關(guān)閉狀態(tài)。
RNA加工的不同速度 (Varying rates of RNA processing):不同的RNA以不同的速率進(jìn)行加工。
連續(xù)或離散的細(xì)胞特征 (Continuous or discrete cell identities):例如單個(gè)T細(xì)胞的促炎癥潛能。連續(xù)的表型通過基因表達(dá)上的變化來定義,有時(shí)很難區(qū)分表型是連續(xù)的,還是離散的。
環(huán)境刺激 (Environmental stimuli):細(xì)胞的周邊環(huán)境可以通過空間位置、信號(hào)分子等方式影響基因的表達(dá)。
時(shí)序改變 (Temporal changes):基本的細(xì)胞時(shí)序變化過程,例如細(xì)胞周期,可以影響單個(gè)細(xì)胞的基因表達(dá)譜。
跨細(xì)胞/樣本的技術(shù)性誤差
技術(shù)來源的變異會(huì)導(dǎo)致細(xì)胞間的基因表達(dá)因技術(shù)來源而變得更相似/不同,而不是細(xì)胞類型/狀態(tài),這會(huì)影響細(xì)胞類型的識(shí)別。技術(shù)來源的變異包括:
不同細(xì)胞的捕獲效率 (Cell-specific capture efficiency):不同細(xì)胞捕獲的轉(zhuǎn)錄本數(shù)量不同,導(dǎo)致測序深度不同(例如,轉(zhuǎn)錄組的10-50%)。
文庫質(zhì)量 (Library quality):降解的RNA、低活性/瀕死的細(xì)胞、大量游離的RNA、分離不好的細(xì)胞以及細(xì)胞定量不正確都會(huì)導(dǎo)致測序質(zhì)量過低。
擴(kuò)增偏差 (Amplification bias):在建庫(library preparation)的擴(kuò)增步驟中,并非所有的轉(zhuǎn)錄本都被擴(kuò)增到相同的水平。
批次差異 (Batch effects):批次問題是單細(xì)胞RNA分析中的一個(gè)重要問題,因此你可以看到由于批次問題而導(dǎo)致的基因表達(dá)上的顯著差異。
如何知道你是否有批次問題?
所有的RNA提取都是在同一天進(jìn)行的嗎?
所有的建庫工作都是在同一天進(jìn)行的嗎?
所有樣品的RNA提取或建庫是否由同一個(gè)人完成?
你是否對(duì)所有樣品都使用了相同的試劑?
你是否在同一地點(diǎn)進(jìn)行了RNA的提取或建庫?
如果這些答案中有一個(gè)是“不”,那么你就有批次問題。
有關(guān)批次問題的賊佳實(shí)踐
在實(shí)驗(yàn)設(shè)計(jì)中盡可能地避免產(chǎn)生批次
如果無法避免批次:
不要混淆不同批次的實(shí)驗(yàn)
請(qǐng)?jiān)诓煌沃凶霾煌悇e樣品的重復(fù)(replicates)。如果是想找出不同處理?xiàng)l件下的差異基因或者在群體水平上下結(jié)論,重復(fù)自然越多越好(當(dāng)然要大于2)。如果使用一次實(shí)驗(yàn)只建庫一次的inDrops方法,則應(yīng)替換樣本組(例如,不要先建所有疾病組的文庫,然后再建所有治療組的文庫)。
總結(jié)
雖然單細(xì)胞RNA測序是一種強(qiáng)大而深刻的從單細(xì)胞水平分析基因表達(dá)的方法,但由于存在許多挑戰(zhàn)和變異因素,單細(xì)胞轉(zhuǎn)錄組的數(shù)據(jù)分析顯得復(fù)雜且受限。
綜上所述,我們提出以下建議:
除非對(duì)解決我們感興趣的科學(xué)問題有必要,否則不要進(jìn)行單細(xì)胞RNA測序。你是否能夠使用更簡單,更廉價(jià)的批量RNA測序解決你的科學(xué)問題?也許可以使用流式細(xì)胞儀(FACS)對(duì)樣本進(jìn)行分選,以便進(jìn)行批量分析?
了解你想解決的科學(xué)問題的各種細(xì)節(jié)。推薦的建庫方法和分析流程可以根據(jù)具體實(shí)驗(yàn)而有所不同。
盡可能地避免技術(shù)來源的差異:
實(shí)驗(yàn)開始前與專家討論實(shí)驗(yàn)設(shè)計(jì)
同時(shí)從樣品中提取RNA
同時(shí)建庫或替換樣本組以避免批次混淆
不要混淆不同性別、年齡和批次的樣本組