轉(zhuǎn)錄組測(cè)序是利用第二代高通量測(cè)序技術(shù)快速獲取某一物種特定器官或組織在某一狀態(tài)下幾乎所有轉(zhuǎn)錄本的序列信息,進(jìn)行疾病與正常樣本間的基因表達(dá)差異分析、可變剪切和融合基因分析,尋找與癌癥、遺傳病相關(guān)的致病基因,已廣泛應(yīng)用于基礎(chǔ)研究、臨床診斷和藥物研發(fā)等領(lǐng)域。相對(duì)于傳統(tǒng)芯片而言,無(wú)需預(yù)先設(shè)計(jì)特異性探針,具有分辨率高、檢測(cè)范圍廣和準(zhǔn)確率高的優(yōu)點(diǎn)。
實(shí)驗(yàn)方案
測(cè)序策略:Illumina 平臺(tái) PE150
數(shù)據(jù)量:6G/樣
技術(shù)優(yōu)勢(shì)
(1)任意物種檢測(cè):相對(duì)于傳統(tǒng)芯片而言,無(wú)需預(yù)先設(shè)計(jì)特異性探針,因此無(wú)需了解物種基因或基因組信息,能夠直接對(duì)任何物種進(jìn)行最全面的轉(zhuǎn)錄組分析;
(2)分辨率高:可以檢測(cè)基因家族中相似基因及可變剪接造成的單堿基差異;
(3)檢測(cè)范圍廣:從幾個(gè)到數(shù)十萬(wàn)個(gè)拷貝精確計(jì)數(shù),可同時(shí)鑒定正常和稀有的轉(zhuǎn)錄本;
(4)信息分析全面:可以做基因差異表達(dá)分析、可變剪切、融合基因分析、新轉(zhuǎn)錄本預(yù)測(cè)及注釋。
信息分析
標(biāo)準(zhǔn)信息分析
(1)按標(biāo)準(zhǔn)流程進(jìn)行數(shù)據(jù)整理及數(shù)據(jù)質(zhì)量評(píng)估;
(2)與參考序列比對(duì),計(jì)算不同基因的RPKM值;
(3)基因的差異表達(dá)分析;
(4)樣本間基因表達(dá)水平的相關(guān)性分析(僅限于有生物重復(fù)的樣本);
(5)樣本間差異基因韋恩圖及PCA分析;
(6)差異基因的表達(dá)模式聚類分析;
(7)差異表達(dá)基因GO功能富集分析;
(8)差異表達(dá)基因Pathway顯著富集分析;
(9)差異表達(dá)基因的蛋白質(zhì)互作網(wǎng)絡(luò)分析;
(10)條件特異表達(dá);
(11)鑒定基因的可變剪切;
(12)SNP/InDel分析;
(13)新轉(zhuǎn)錄本預(yù)測(cè)及注釋;
(14)融合基因分析(僅限于人);
高級(jí)信息分析
(1)基因結(jié)構(gòu)優(yōu)化(只針對(duì)真核生物)
(2)RNA編輯
(3)差異基因的轉(zhuǎn)錄因子分析(適用于植物)
技術(shù)流程
轉(zhuǎn)錄組測(cè)序案例分析
案例(1)科學(xué)家繪制細(xì)胞周期的高分辨率轉(zhuǎn)錄組圖譜
細(xì)胞周期的推進(jìn)很大程度上依賴于周期性基因表達(dá)。本研究繪制了細(xì)胞周期的高分辨率轉(zhuǎn)錄組圖譜,揭示了周期性基因與癌癥之間的新關(guān)聯(lián)。研究人員在兩個(gè)連續(xù)的細(xì)胞周期中對(duì)人類細(xì)胞進(jìn)行RNA測(cè)序,鑒定了一千多個(gè)周期性表達(dá)的mRNA、非編碼RNA和假基因。研究顯示,這些周期性轉(zhuǎn)錄本主要集中在與DNA代謝、有絲分裂和DNA損傷應(yīng)答有關(guān)的功能上。他們分析了癌癥基因組圖譜TCGA和其他數(shù)據(jù)庫(kù)的四千多個(gè)腫瘤樣本,證實(shí)“有絲分裂特征”與遺傳改變、腫瘤類型和患者生存狀況有顯著的關(guān)聯(lián)。研究人員還定義了67個(gè)核心基因,這些基因在多種細(xì)胞中均有很強(qiáng)的周期性表達(dá)。
圖1 細(xì)胞周期核心基因的表達(dá)特征
案例(2)人類組織和個(gè)體的轉(zhuǎn)錄組差異
轉(zhuǎn)錄調(diào)控和轉(zhuǎn)錄后加工影響許多細(xì)胞和器官的表型?;蛐徒M織表達(dá)(GTEx)項(xiàng)目通過(guò)RNA測(cè)序得到的數(shù)據(jù)探索個(gè)體和組織間的轉(zhuǎn)錄組類型的變化差異。本研究從175個(gè)個(gè)體的43個(gè)身體部位采集得到1641份樣本,包括29份器官組織、11份腦亞區(qū)、全血和兩份細(xì)胞系。轉(zhuǎn)錄組測(cè)序數(shù)據(jù)表明,平均每個(gè)樣本得到8千萬(wàn)比對(duì)到的片段數(shù)。尸體的組織樣本表現(xiàn)出帶有特點(diǎn)的并且穩(wěn)定性強(qiáng)的轉(zhuǎn)錄組信號(hào)。個(gè)體之間表現(xiàn)出高度基因表達(dá)差異,包括不同性別、種族和年齡的患病人群。原始轉(zhuǎn)錄是細(xì)胞特異性的主要驅(qū)動(dòng)因子,后期剪切行使補(bǔ)充性角色。差異剪切可能在鑒定個(gè)體表型中行使更加重要的作用。
圖1 樣本和組織的表達(dá)譜相似性分析
案例(3)錫蘭鉤蟲基因組和轉(zhuǎn)錄組的解析為藥物靶向奠定基礎(chǔ)
該研究針對(duì)致病性寄生蟲錫蘭鉤蟲基因組進(jìn)行了深度測(cè)序,該寄生蟲基因組大小約313Mb。測(cè)序獲得了其每個(gè)生長(zhǎng)周期的轉(zhuǎn)錄組數(shù)據(jù)并進(jìn)行深度分析,感染期共有30,738條基因表達(dá)。大約有900條基因在感染早期下調(diào)?;谶@些測(cè)序數(shù)據(jù),研究者成功挖掘獲得錫蘭鉤蟲生命周期中各節(jié)點(diǎn)處許多重要的功能基因信息,這些功能基因信息中存在能夠治療或阻斷錫蘭鉤蟲引起致病性的重要靶向位點(diǎn)信息等。
圖1 不同感染期的錫蘭鉤蟲的基因表達(dá)差異情況
參考文獻(xiàn)
[1] Dominguez et al. A high-resolution transcriptome map of cell cycle reveals novel connections between periodic genes and cancer. Cell Research, 2016.
[2] Melé et al. The human transcriptome across tissues and individuals. Science, 2015.
[3] Schwarz et al. The genome and transcriptome of the zoonotic