在生命科學(xué)研究的微觀世界中,細(xì)胞分化是一個(gè)動(dòng)態(tài)、連續(xù)且復(fù)雜的過(guò)程,涉及大量基因的精密調(diào)控和細(xì)胞狀態(tài)的逐步轉(zhuǎn)變。傳統(tǒng) bulk 測(cè)序技術(shù)因掩蓋了單細(xì)胞層面的異質(zhì)性,無(wú)法捕捉細(xì)胞分化過(guò)程中的中間過(guò)渡狀態(tài),難以完整還原細(xì)胞從起始到終末的發(fā)育路徑。而單細(xì)胞擬時(shí)序分析(Pseudotime Analysis)技術(shù)的問(wèn)世,打破了這一局限。它以單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)為基礎(chǔ),通過(guò)挖掘基因表達(dá)的動(dòng)態(tài)變化規(guī)律,構(gòu)建細(xì)胞分化的虛擬時(shí)間軸,精準(zhǔn)模擬細(xì)胞分化軌跡,成為解碼細(xì)胞命運(yùn)決定機(jī)制的核心工具,為發(fā)育生物學(xué)、腫瘤學(xué)、免疫學(xué)等領(lǐng)域的研究帶來(lái)了突破性進(jìn)展。
一、技術(shù)核心:理論基礎(chǔ)與核心特征
(一)核心理論支撐
單細(xì)胞擬時(shí)序分析的核心理論源于對(duì)細(xì)胞群體異質(zhì)性的深刻認(rèn)知:細(xì)胞發(fā)育并非簡(jiǎn)單地劃分為少數(shù)幾個(gè)離散階段,而是存在大量連續(xù)且漸進(jìn)的中間過(guò)渡狀態(tài)。這些過(guò)渡狀態(tài)是細(xì)胞分化過(guò)程中基因表達(dá)逐步重構(gòu)的關(guān)鍵階段,承載著細(xì)胞命運(yùn)轉(zhuǎn)變的核心信息。通過(guò)單細(xì)胞測(cè)序技術(shù)獲得的單細(xì)胞表達(dá)譜,能夠真實(shí)反映每個(gè)細(xì)胞的基因表達(dá)特征,進(jìn)而為評(píng)估細(xì)胞間的親緣關(guān)系、推斷細(xì)胞分化順序提供了數(shù)據(jù)基礎(chǔ)。

與傳統(tǒng)的時(shí)間序列實(shí)驗(yàn)不同,擬時(shí)序分析無(wú)需對(duì)細(xì)胞進(jìn)行連續(xù)的時(shí)間點(diǎn)采樣,而是通過(guò) “橫斷面” 式的單次樣本檢測(cè),利用單細(xì)胞表達(dá)譜的差異信息,反向推測(cè)細(xì)胞群體的完整發(fā)育進(jìn)程,因此被稱(chēng)為 “擬時(shí)序”—— 即通過(guò)計(jì)算模擬出的細(xì)胞發(fā)育時(shí)間,而非真實(shí)的物理時(shí)間。
(二)基因表達(dá)的核心規(guī)律
細(xì)胞分化過(guò)程中,基因表達(dá)的動(dòng)態(tài)變化是擬時(shí)序分析的關(guān)鍵依據(jù),其核心規(guī)律主要體現(xiàn)在兩方面:
特征基因的時(shí)相特異性:不同發(fā)育時(shí)相的細(xì)胞會(huì)表達(dá)一套特定的特征基因,這些基因通常以轉(zhuǎn)錄因子(TF)為核心,構(gòu)成調(diào)控細(xì)胞分化的分子網(wǎng)絡(luò)。例如,在胚胎干細(xì)胞向神經(jīng)元分化的過(guò)程中,Oct4、Sox2 等多能性轉(zhuǎn)錄因子的表達(dá)逐漸下調(diào),而 NeuroD1、Map2 等神經(jīng)元特異性基因的表達(dá)逐步上調(diào)。
表達(dá)變化的平穩(wěn)性:在細(xì)胞分化的連續(xù)過(guò)程中,特征基因的表達(dá)并非劇烈波動(dòng),而是呈現(xiàn)出平穩(wěn)上升或平穩(wěn)下降的趨勢(shì)。擬時(shí)序分析的核心目標(biāo)就是捕捉這種平穩(wěn)變化的基因表達(dá)模式,通過(guò)對(duì)細(xì)胞進(jìn)行合理排序,讓大部分基因的表達(dá)在虛擬時(shí)間軸上實(shí)現(xiàn)平滑過(guò)渡,從而真實(shí)還原細(xì)胞分化的分子動(dòng)態(tài)過(guò)程。
二、關(guān)鍵原理:算法邏輯與軌跡構(gòu)建
單細(xì)胞擬時(shí)序分析的核心是通過(guò)算法構(gòu)建能夠反映細(xì)胞分化關(guān)系的軌跡圖,其底層邏輯與關(guān)鍵步驟如下:
(一)核心算法:最小生成樹(shù)(Minimum Spanning Tree, MST)
擬時(shí)序分析中最常用的軌跡構(gòu)建算法基于最小生成樹(shù)原理。最小生成樹(shù)是指在一個(gè)包含多個(gè)節(jié)點(diǎn)的無(wú)向圖中,找到一棵連接所有節(jié)點(diǎn)且邊的權(quán)重之和最小的樹(shù)。在單細(xì)胞數(shù)據(jù)中,每個(gè)細(xì)胞被視為一個(gè)節(jié)點(diǎn),節(jié)點(diǎn)間的權(quán)重由細(xì)胞表達(dá)譜的相似性(如歐氏距離、皮爾遜相關(guān)系數(shù)等)決定 —— 表達(dá)譜越相似的細(xì)胞,節(jié)點(diǎn)間的權(quán)重越小。通過(guò)構(gòu)建最小生成樹(shù),能夠找到連接所有細(xì)胞的最短路徑之和,從而建立起細(xì)胞之間的 “親緣關(guān)系” 網(wǎng)絡(luò),為后續(xù)的細(xì)胞排序提供基礎(chǔ)。
(二)細(xì)胞排序與軌跡優(yōu)化
在最小生成樹(shù)的基礎(chǔ)上,結(jié)合基因表達(dá)的平穩(wěn)性規(guī)律,對(duì)所有細(xì)胞進(jìn)行時(shí)間排序:
首先識(shí)別出具有顯著時(shí)相特異性的特征基因(即表達(dá)隨分化過(guò)程平穩(wěn)變化的基因);
以這些特征基因?yàn)橐罁?jù),對(duì)最小生成樹(shù)中的細(xì)胞節(jié)點(diǎn)進(jìn)行順序調(diào)整,使特征基因的表達(dá)在節(jié)點(diǎn)序列上呈現(xiàn)連續(xù)的上升或下降趨勢(shì);
最終形成的細(xì)胞序列即為擬時(shí)序軸,軸上的每個(gè)位置代表細(xì)胞在分化過(guò)程中的一個(gè)特定狀態(tài),而整個(gè)序列構(gòu)成的分支結(jié)構(gòu)則對(duì)應(yīng)細(xì)胞分化的不同路徑(如單向分化、分支分化等)。
此外,軌跡構(gòu)建后還可根據(jù)研究需求進(jìn)行優(yōu)化,例如重新選擇時(shí)序方向(reverse)—— 當(dāng)初始排序的分化方向與已知生物學(xué)事實(shí)不符時(shí),可反轉(zhuǎn)擬時(shí)序軸;或指定起始狀態(tài)(root_state)—— 通過(guò)已知的干細(xì)胞或前體細(xì)胞標(biāo)記基因,確定擬時(shí)序軸的起點(diǎn),提升軌跡的生物學(xué)合理性。
(三)不同軌跡類(lèi)型的適配
根據(jù)細(xì)胞分化的實(shí)際情況,擬時(shí)序分析可構(gòu)建多種類(lèi)型的軌跡,以適配不同的生物學(xué)場(chǎng)景:
線性軌跡:適用于細(xì)胞向單一方向分化的場(chǎng)景(如造血干細(xì)胞向紅細(xì)胞分化);
分支軌跡:適用于細(xì)胞分化過(guò)程中出現(xiàn)命運(yùn)分支的場(chǎng)景(如神經(jīng)嵴細(xì)胞分化為神經(jīng)元、膠質(zhì)細(xì)胞或平滑肌細(xì)胞);
循環(huán)軌跡:適用于細(xì)胞存在周期性狀態(tài)變化的場(chǎng)景(如細(xì)胞周期、干細(xì)胞自我更新與分化的循環(huán))。
三、標(biāo)準(zhǔn)化分析步驟
(一)特征選擇
特征基因的篩選是擬時(shí)序分析的基礎(chǔ),直接影響后續(xù)軌跡構(gòu)建的準(zhǔn)確性,主要通過(guò)三種方式實(shí)現(xiàn):
高表達(dá)基因篩選:選取所有平均表達(dá)量(mean_expr)>0.1 的高表達(dá)基因,這類(lèi)基因能夠?yàn)榧?xì)胞狀態(tài)區(qū)分提供穩(wěn)定的表達(dá)信號(hào);
亞群特異基因篩選:可導(dǎo)入 Seurat 軟件計(jì)算得到的特征基因,或利用 Monocle 軟件分析獲得的差異表達(dá)基因(DEG),這類(lèi)基因具有細(xì)胞亞群特異性,能精準(zhǔn)反映不同細(xì)胞群體的分化特征;
手動(dòng)輸入基因:基于已有的先驗(yàn)知識(shí),手動(dòng)輸入與目標(biāo)發(fā)育過(guò)程相關(guān)的已知基因集,進(jìn)一步提升分析的針對(duì)性與有效性。
(二)數(shù)據(jù)降維與批次效應(yīng)去除
在特征選擇之后,需要進(jìn)行數(shù)據(jù)降維處理。數(shù)據(jù)降維能夠剔除冗余信息,讓細(xì)胞軌跡更加簡(jiǎn)潔清晰,同時(shí)減少后續(xù)計(jì)算的復(fù)雜度。此外,若數(shù)據(jù)存在批次效應(yīng),需通過(guò)相應(yīng)的技術(shù)手段去除,以避免批次差異對(duì)軌跡構(gòu)建的干擾,確保分析結(jié)果的可靠性。
(三)細(xì)胞時(shí)間排序
這是擬時(shí)序分析的核心環(huán)節(jié),需要對(duì)所有細(xì)胞進(jìn)行順序調(diào)換,以匹配模擬的分化軌跡。該過(guò)程往往需要消耗大量的計(jì)算資源和時(shí)間,且在分析過(guò)程中可根據(jù)實(shí)際研究需求,重新選擇時(shí)序方向(reverse)和起始狀態(tài)(root_state),從而更靈活地探索細(xì)胞分化的潛在路徑。
四、技術(shù)應(yīng)用核心場(chǎng)景
單細(xì)胞擬時(shí)序分析憑借其強(qiáng)大的軌跡構(gòu)建與動(dòng)態(tài)解析能力,已廣泛應(yīng)用于多個(gè)生命科學(xué)研究領(lǐng)域:
發(fā)育生物學(xué):解析胚胎與器官發(fā)育中細(xì)胞分化路徑及調(diào)控機(jī)制,如還原小鼠胚胎干細(xì)胞向三胚層分化軌跡,識(shí)別關(guān)鍵調(diào)控因子;
腫瘤學(xué):揭示腫瘤細(xì)胞異質(zhì)性與分化層級(jí),探索腫瘤干細(xì)胞起源擴(kuò)散,如發(fā)現(xiàn)肺癌細(xì)胞多表型分化分支,為靶向治療提供依據(jù);
免疫學(xué):追蹤免疫細(xì)胞發(fā)育成熟與活化軌跡,如T細(xì)胞胸腺到外周的分化、B細(xì)胞免疫應(yīng)答中的增殖分化路徑;
再生醫(yī)學(xué):評(píng)估干細(xì)胞移植后分化命運(yùn),優(yōu)化治療方案,如分析間充質(zhì)干細(xì)胞向功能細(xì)胞分化軌跡,驗(yàn)證移植效果。
五、LabEx單細(xì)胞測(cè)序服務(wù)

單細(xì)胞擬時(shí)序分析作為單細(xì)胞測(cè)序技術(shù)體系中的核心分析模塊,廣泛應(yīng)用于發(fā)育生物學(xué)、腫瘤學(xué)、免疫學(xué)等多個(gè)研究領(lǐng)域,為解析細(xì)胞分化機(jī)制、腫瘤異質(zhì)性、免疫細(xì)胞發(fā)育成熟等關(guān)鍵科學(xué)問(wèn)題提供了重要的技術(shù)支撐。 為助力相關(guān)研究的開(kāi)展,LabEx提供全面的單細(xì)胞測(cè)序配套服務(wù),涵蓋三大核心服務(wù)類(lèi)型:
1. 單細(xì)胞轉(zhuǎn)錄組測(cè)序(ScRNA-seq):在單細(xì)胞水平對(duì)全mRNA表達(dá)譜進(jìn)行精準(zhǔn)檢測(cè),為擬時(shí)序分析提供核心數(shù)據(jù)基礎(chǔ);
2. 單細(xì)胞蛋白檢測(cè)(Ab-seq):實(shí)現(xiàn)單細(xì)胞水平蛋白與基因表達(dá)的聯(lián)合檢測(cè),屬于多組學(xué)研究范疇,可提供人蛋白249個(gè)+小鼠蛋白219個(gè)的抗體組合,更大panel支持定制化服務(wù);
3. 單細(xì)胞免疫組庫(kù)測(cè)序:通過(guò)富集TCR/BCR基因并測(cè)序,全面解析免疫組庫(kù)多樣性,支持多種屬檢測(cè),為免疫細(xì)胞相關(guān)的擬時(shí)序分析提供專(zhuān)屬解決方案。
同時(shí),LabEx搭建了完整的單細(xì)胞研究工作流程,從樣本制備、單細(xì)胞分離、基因捕獲、文庫(kù)構(gòu)建、測(cè)序到數(shù)據(jù)分析,配備專(zhuān)業(yè)的實(shí)驗(yàn)設(shè)備(如美天旎MACS八通道全自動(dòng)組織處理器、SEOGEO上樣工作站等)和數(shù)據(jù)分析軟件,提供一站式的技術(shù)支持,確保從實(shí)驗(yàn)數(shù)據(jù)到擬時(shí)序分析結(jié)果的高效轉(zhuǎn)化,為科研工作者提供可靠的技術(shù)保障。
樂(lè)備實(shí)是國(guó)內(nèi)專(zhuān)注于提供高質(zhì)量蛋白檢測(cè)以及組學(xué)分析服務(wù)的實(shí)驗(yàn)服務(wù)專(zhuān)家,自2018年成立以來(lái),樂(lè)備實(shí)不斷尋求突破,公司的服務(wù)技術(shù)平臺(tái)已擴(kuò)展到單細(xì)胞測(cè)序、空間多組學(xué)、流式檢測(cè)、超敏電化學(xué)發(fā)光、Luminex多因子檢測(cè)、抗體芯片、PCR Array、ELISA、Elispot、PLA蛋白互作、多色免疫組化、DSP空間多組學(xué)等30多個(gè),建立起了一套涵蓋基因、蛋白、細(xì)胞以及組織水平實(shí)驗(yàn)的完整檢測(cè)體系。