清華新聞網(wǎng)5月15日電 液體活檢是近年來(lái)發(fā)展起來(lái)的新型無(wú)創(chuàng)診斷技術(shù),可以實(shí)時(shí)動(dòng)態(tài)地監(jiān)測(cè)人體的健康和疾病狀態(tài)。細(xì)胞游離RNA(cell-free RNA,cfRNA)由于具有高度的敏感性、動(dòng)態(tài)性和組織溯源能力,為腫瘤、自身免疫疾病、孕期疾病、神經(jīng)退行性疾病等復(fù)雜性疾病的無(wú)創(chuàng)檢測(cè)帶來(lái)了新的希望。cfRNA廣泛存在于血液等多種人類(lèi)體液中,通常被包裹在細(xì)胞外囊泡(EV)中或與蛋白結(jié)合形成核糖核酸蛋白復(fù)合體(RNP)。然而cfRNA本身高度碎片化、異質(zhì)性高且信噪比低(病灶來(lái)源的cfRNA占比低),為其靈敏識(shí)別和臨床應(yīng)用帶來(lái)了諸多挑戰(zhàn)。另一方面,被核小體或轉(zhuǎn)錄因子保護(hù)的碎片化cfRNA的片段組學(xué)近年來(lái)已有很多研究的積累,被證明在腫瘤診斷和預(yù)后等多個(gè)場(chǎng)景均有一定應(yīng)用潛力,而具有廣闊臨床應(yīng)用前景的cfRNA中的片段化特征則由于生物信息學(xué)分析方法的缺乏很少被研究。
5月8日,清華大學(xué)生命學(xué)院魯志團(tuán)隊(duì)、北京協(xié)和醫(yī)院李夢(mèng)濤團(tuán)隊(duì)、北京口腔醫(yī)院秦力錚團(tuán)隊(duì)的毛明惠在《基因組生物學(xué)》(Genome Biology)雜志上發(fā)表題為“細(xì)胞游離RNA峰值分析揭示具有臨床潛力的高頻保護(hù)的短片段區(qū)域”(Peak analysis of cell-free RNA finds recurrently protected narrow regions with clinical potential)的論文,開(kāi)發(fā)了針對(duì)cfRNA數(shù)據(jù)的片段化分析方法cfPeak,填補(bǔ)了cfRNA片段化分析的空白,為cfRNA片段組學(xué)的發(fā)展鋪平了道路。

圖1. 文章主題概覽示意圖
魯志團(tuán)隊(duì)多年來(lái)一直專(zhuān)注于cfRNA相關(guān)的技術(shù)開(kāi)發(fā)和臨床應(yīng)用研究,在這項(xiàng)最新發(fā)表的工作中,研究人員通過(guò)統(tǒng)計(jì)建模與機(jī)器學(xué)習(xí)方法開(kāi)發(fā)了一個(gè)新型的生物信息學(xué)方法cfPeak,該方法在真實(shí)和模擬數(shù)據(jù)集中均表現(xiàn)出比其他峰值鑒定方法更敏銳的片段化峰區(qū)識(shí)別能力。該研究為cfRNA片段組學(xué)的系統(tǒng)分析提供了可行方案,揭示了cfRNA保護(hù)性片段在生物學(xué)及臨床應(yīng)用中的重要意義。同時(shí),該研究還強(qiáng)調(diào)了低豐度、潛在組織來(lái)源cfRNA信號(hào)在液體活檢中的臨床應(yīng)用價(jià)值。
為了確認(rèn)在體液細(xì)胞外數(shù)據(jù)中也可以檢測(cè)到穩(wěn)定的cfRNA信號(hào),研究人員對(duì)比了細(xì)胞內(nèi)CLIP-seq(CL-CLIP-seq)、細(xì)胞內(nèi)小RNA-seq(CL-smRNA-seq)和細(xì)胞外小RNA-seq(CF-smRNA-seq)的讀段覆蓋圖譜。使用經(jīng)典的CLIPper工具進(jìn)行傳統(tǒng)的峰值/峰區(qū)的識(shí)別/檢出。在已知cfRNA種類(lèi)的轉(zhuǎn)錄本中展示了四個(gè)示例區(qū)域(峰區(qū)所在轉(zhuǎn)錄本)。總體上,對(duì)于未捕獲或未免疫共沉淀的測(cè)序數(shù)據(jù),如CL-和CF-smRNA-seq,不同轉(zhuǎn)錄本類(lèi)型中均存在可穩(wěn)定識(shí)別的峰區(qū)信號(hào)。

圖2.在細(xì)胞內(nèi)外的RNA測(cè)序數(shù)據(jù)中識(shí)別到長(zhǎng)RNA前體上頻繁出現(xiàn)的碎片化信號(hào)峰區(qū)
考慮到本研究之前提到的不同工具的差異,在使用傳統(tǒng)的峰區(qū)識(shí)別工具探索片段化cfRNA時(shí),可能會(huì)面臨建模不恰當(dāng)或參數(shù)不適合的風(fēng)險(xiǎn)。為此,研究人員引入了信號(hào)峰區(qū)識(shí)別方法cfPeak來(lái)填補(bǔ)這一空白。cfPeak借鑒了其他方法的多項(xiàng)優(yōu)點(diǎn),整體可分解為六個(gè)主要模塊(圖3A),并搭建了片段化cfRNA峰區(qū)分析的整個(gè)流程(圖3B)。
為了在理想條件下更好地評(píng)估不同方法的性能和檢測(cè)極限,研究人員還對(duì)血漿cfRNA的多組織來(lái)源特點(diǎn)進(jìn)行了簡(jiǎn)化和建模,將其視為由主要來(lái)源(如血細(xì)胞來(lái)源)和次要來(lái)源(如結(jié)腸組織/細(xì)胞來(lái)源)組成,并人工生成了測(cè)試數(shù)據(jù)集(圖3C)。研究人員進(jìn)一步在該人工數(shù)據(jù)集中測(cè)試了cfPeak,發(fā)現(xiàn)其能夠更敏感地檢測(cè)到RNA混合物中次要來(lái)源的低豐度峰區(qū)(在50%、5%和0.5%次要來(lái)源比例下的召回率分別為90%、90%和70%),這些峰區(qū)在傳統(tǒng)方法中常被忽略或遺漏(圖3D)。

圖3.cfPeak的模塊和cfPeak-pipe的流程結(jié)構(gòu)以及在人工數(shù)據(jù)中的評(píng)測(cè)效果
在被應(yīng)用到腫瘤液體活檢時(shí),cfPeak在體液數(shù)據(jù)中有效識(shí)別了與結(jié)直腸癌相關(guān)的cfRNA信號(hào)峰(圖4AB),并提供了有關(guān)實(shí)體瘤位點(diǎn)(圖4CD)和口腔癌轉(zhuǎn)移(圖4EF)的信息。臨床應(yīng)用中的結(jié)果揭示了癌組織起源的低豐度cfRNA的重要性,表明cfPeak具有在血漿樣本中識(shí)別出具有癌癥檢測(cè)、癌種區(qū)分及轉(zhuǎn)移狀態(tài)指示能力的片段化cfRNA峰區(qū)信號(hào)的潛力。

圖4.cfPeak在幾種臨床場(chǎng)景中的應(yīng)用
總的來(lái)說(shuō),該研究通過(guò)建立cfPeak峰區(qū)識(shí)別方法和cfPeak-pipe分析框架,填補(bǔ)了cfRNA片段化分析的空白,為體液cfRNA片段組學(xué)的科學(xué)發(fā)現(xiàn)及其在各類(lèi)疾病檢測(cè)中的廣泛應(yīng)用搭建了橋梁。
魯志副教授、李夢(mèng)濤主任醫(yī)師、毛明惠主任醫(yī)師為論文通訊作者;清華大學(xué)生命學(xué)院已畢業(yè)博士生鮑鵬飛、北京大學(xué)前沿交叉學(xué)院2021級(jí)博士生王泰惟和清華大學(xué)生命學(xué)院已畢業(yè)博士生劉曉帆為論文共同第一作者。
研究得到來(lái)自國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家自然科學(xué)基金、“生物信息學(xué)”教育部重點(diǎn)實(shí)驗(yàn)室、“綠色生物制造”全國(guó)重點(diǎn)實(shí)驗(yàn)室、清華大學(xué)精準(zhǔn)醫(yī)療研究院、清華大學(xué)國(guó)強(qiáng)研究院、合肥綜合性國(guó)家科學(xué)中心大健康研究院等的支持。
論文鏈接:
https://doi.org/10.1186/s13059-025-03590-x
cfPeak代碼鏈接:
https://github.com/lulab/cfPeak
供稿:生命學(xué)院
編輯:李華山
審核:郭玲