清華新聞網(wǎng)3月19日電 大多數(shù)生理與病理組織都具有高度的細胞異質(zhì)性。對異質(zhì)細胞譜圖的系統(tǒng)解讀以及關(guān)鍵細胞亞型的精準鑒定對于理解組織發(fā)育及其功能、細胞互作微環(huán)境、疾病動態(tài)發(fā)展等生理與病理過程具有重要價值。當(dāng)前主流的細胞異質(zhì)性分析以單細胞轉(zhuǎn)錄組數(shù)據(jù)為基礎(chǔ),使用基因表達譜信息定義細胞類群,繪制了大量復(fù)雜生理與病理組織的異質(zhì)性譜圖。但是長期以來,這一類異質(zhì)性分析停留于基因?qū)用妫茨苓_到基因轉(zhuǎn)錄本的解析度,幾乎完全忽略了RNA可變剪接在塑造生理狀態(tài)、執(zhí)行生物學(xué)功能及驅(qū)動疾病發(fā)展過程中的關(guān)鍵作用。
高等真核生物中的RNA可變剪接是重要的轉(zhuǎn)錄后調(diào)控機制。通過剪接模式的變化,細胞中同一個基因可以生成多個不同的轉(zhuǎn)錄本,極大擴展了轉(zhuǎn)錄組及蛋白組的復(fù)雜性,體現(xiàn)了基因表達及功能的多樣性與可塑性。傳統(tǒng)的基因表達譜數(shù)據(jù)僅能反映基因總體表達豐度,無法表征轉(zhuǎn)錄后RNA剪接這一重要調(diào)控層級。因此,復(fù)雜組織的細胞異質(zhì)性分析有必要補足RNA剪接譜這一關(guān)鍵維度的缺失。
針對這一重要需求,清華大學(xué)生命學(xué)院楊雪瑞副教授課題組開發(fā)了生物信息工具SCASL(single-cell clustering based on alternative splicing landscapes),用于單細胞RNA剪接譜異質(zhì)性的系統(tǒng)、定量分析,基于剪接譜重新定義細胞亞群。相關(guān)研究成果以“使用SCASL對單細胞RNA剪接譜的解析提出了具有生理學(xué)意義的細胞身份新定義”(Interrogations of single-cell RNA splicing landscapes with SCASL define new cell identities with physiological relevance)為題,于3月9日發(fā)表于《自然·通訊》(Nature Communications)。
SCASL方法使用單細胞RNA測序數(shù)據(jù),在不依賴于轉(zhuǎn)錄組注釋的前提下,對不同的可變剪接模式進行定量。以此為基礎(chǔ),SCASL通過kNN插補,重點解決了單細胞RNA剪接數(shù)據(jù)的低覆蓋度與高稀疏性問題,最后使用譜聚類方法對細胞亞型進行了無監(jiān)督分類,繪制單細胞RNA剪接異質(zhì)性圖譜。測試結(jié)果顯示,SCASL在對稀疏數(shù)據(jù)的插補準確性、細胞聚類穩(wěn)定性、低頻細胞類群鑒定、隨機噪音容忍度等方面均表現(xiàn)出色,這也體現(xiàn)出單細胞剪接譜所包含信息的高冗余度。更重要的是,基于相同的單細胞RNA-seq數(shù)據(jù),SCASL利用剪接譜信息對細胞身份的定義與僅僅基于基因表達譜的細胞聚類結(jié)果有顯著差異。

圖1.SCASL分析流程概念示意圖
進一步,作者使用了七套已發(fā)表的單細胞RNA-seq數(shù)據(jù),對SCASL剪接譜異質(zhì)性分析結(jié)果的生物學(xué)意義進行了深入挖掘和討論。
首先,通過對三陰性乳腺癌細胞剪接譜異質(zhì)性的分析,SCASL明確定義了正常上皮細胞的癌前發(fā)展狀態(tài)、早期腫瘤細胞、惡性腫瘤細胞及微轉(zhuǎn)移腫瘤細胞簇。事實上,由于腫瘤細胞高度的異質(zhì)性,特別是基因表達譜的無序擾動,此前對腫瘤單細胞基因表達譜的聚類通常不夠穩(wěn)定,難以明確定義細胞亞型及其邊界。SCASL的分析結(jié)果表明RNA剪接譜對于定義細胞亞型,特別是過渡態(tài)細胞,具有獨特優(yōu)勢,表明RNA可變剪接在驅(qū)動腫瘤發(fā)生發(fā)展中潛在的重要作用。
在對正常組織發(fā)育動態(tài)過程的解讀中,SCASL也表現(xiàn)出獨特的優(yōu)勢。例如,SCASL重現(xiàn)了小鼠胚胎肝臟中肝母細胞發(fā)育為肝細胞和膽管細胞的兩個譜系,明確定義了分化譜系中的時序過渡態(tài)細胞。更有趣的是,SCASL基于剪接譜的分析揭示了一個特殊的細胞簇,它此前被定義為膽管細胞,但其剪接譜位于肝細胞和膽管細胞兩個發(fā)育譜系之間,且同時表現(xiàn)出兩種細胞的功能特征,表明其可能代表了肝臟發(fā)育過程中兩個細胞分化路徑之間的交流。

圖2.SCASL重現(xiàn)小鼠胚胎肝細胞發(fā)育譜系(左),發(fā)現(xiàn)肝細胞和膽管細胞兩個譜系間的中間態(tài)細胞(右)
最后,在對腫瘤免疫微環(huán)境的分析中,SCASL完成了對腫瘤相關(guān)T細胞亞型的精細鑒定,包括腫瘤浸潤的耗竭型、激活型CD8T細胞、不同功能活性的CD4T細胞等。以上新的細胞身份定義為理解免疫細胞浸潤、激活與耗竭、細胞互作調(diào)控等重要過程提供了新的線索,特別是重要基因的RNA可變剪接對腫瘤免疫微環(huán)境的塑造。
該研究為復(fù)雜組織中細胞異質(zhì)性的解讀提出了新的視角與方法。通過這一技術(shù)的應(yīng)用,研究深入分析了多個重要的生物學(xué)過程,提出一系列新觀察、新線索與新發(fā)現(xiàn)。
清華大學(xué)生命學(xué)院2019級博士生向賢珂為論文第一作者,楊雪瑞為論文通訊作者。北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心教授張澤民及團隊成員何堯博士為研究提供了數(shù)據(jù)、工具等方面的重要貢獻。研究得到國家重點研發(fā)計劃、國家自然科學(xué)基金委、國家高層次人才特殊支持計劃、清華大學(xué)的資助。國家蛋白質(zhì)科學(xué)研究(北京)設(shè)施(清華大學(xué)蛋白質(zhì)研究技術(shù)中心)下屬生物計算平臺、基因測序與分析平臺為研究提供了大力支持。
論文鏈接:
https://www.nature.com/articles/s41467-024-46480-9
供稿:生命學(xué)院
編輯:李華山
審核:郭玲