【佳學(xué)基因檢測(cè)】多發(fā)性硬化癥基因檢測(cè)
基因檢測(cè)導(dǎo)讀:
多發(fā)性硬化癥(MS)是一種中樞神經(jīng)系統(tǒng)自身免疫性疾病。根據(jù)《多發(fā)性硬化癥基因檢測(cè)數(shù)據(jù)集》,中國(guó)約有160萬(wàn)到400萬(wàn)人受此疾病困擾,全球范圍內(nèi)約有800萬(wàn)人受此疾病影響。女性患MS的可能性是男性的兩倍,部分原因是兩性之間激素和遺傳對(duì)免疫系統(tǒng)的影響存在差異。激活的T細(xì)胞淋巴細(xì)胞介導(dǎo)的炎癥通常會(huì)導(dǎo)致神經(jīng)元軸突脫髓鞘,從而引發(fā)MS的神經(jīng)癥狀,并導(dǎo)致腦損傷。由于MS的早期癥狀往往輕微且多變,這些癥狀由環(huán)境觸發(fā)的CD4+自身反應(yīng)性T細(xì)胞引起,且需要數(shù)年時(shí)間才能發(fā)展成明顯的神經(jīng)系統(tǒng)表型的慢性疾病狀態(tài),因此早期識(shí)別MS非常困難。盡管先進(jìn)的成像技術(shù)和腦脊液/血液生物標(biāo)志物可以檢測(cè)到MS的進(jìn)展,這些策略通常需要初始臨床事件作為觸發(fā)條件,從而限制了早期檢測(cè)的可能性。如果MS沒(méi)有得到及時(shí)治療,神經(jīng)損傷將變得不可逆轉(zhuǎn)。如果能夠在早期階段發(fā)現(xiàn)MS,許多新療法在臨床應(yīng)用方面已有顯著進(jìn)展。因此,發(fā)現(xiàn)新的風(fēng)險(xiǎn)標(biāo)志物和評(píng)估MS的相關(guān)知識(shí)對(duì)于早期檢測(cè)至關(guān)重要。
初步研究表明,MS存在非環(huán)境性的多基因遺傳風(fēng)險(xiǎn)。全基因組關(guān)聯(lián)研究(GWAS)徹底改變了多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組對(duì)免疫系統(tǒng)在疾病中作用的認(rèn)識(shí);然而,這些研究?jī)H解釋了約四分之一的遺傳風(fēng)險(xiǎn)。來(lái)自MS遺傳學(xué)雙胞胎研究的遺傳力估計(jì)表明,同卵雙胞胎的一致率為25-30%,而異卵雙胞胎的一致率較低,這表明多種遺傳因素和環(huán)境影響對(duì)疾病發(fā)展存在復(fù)雜的相互作用。為了更好地理解這些罕見(jiàn)的多基因?qū)S的影響,全基因組/外顯子組測(cè)序已開(kāi)始識(shí)別導(dǎo)致疾病的罕見(jiàn)變異。基于這些遺傳學(xué)見(jiàn)解構(gòu)建的基因網(wǎng)絡(luò)將有助于建立系統(tǒng)風(fēng)險(xiǎn)評(píng)估,同時(shí)在個(gè)性化醫(yī)療策略中擴(kuò)展發(fā)現(xiàn)其他導(dǎo)致MS的罕見(jiàn)遺傳變異的途徑。
通過(guò)發(fā)現(xiàn)MS發(fā)生和發(fā)展的新機(jī)制,基因檢測(cè)有可能開(kāi)發(fā)出新的檢測(cè)方法和靶向治療。這一點(diǎn)尤為重要,因?yàn)槎喟l(fā)性硬化癥基因檢測(cè)項(xiàng)目組知道GWAS隊(duì)列缺乏種族多樣性,這些研究中使用的多重假設(shè)檢驗(yàn)的多樣性不足。多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組之前已展示了解決GWAS中罕見(jiàn)變異的基因組機(jī)制的能力,這些變異因種族多樣性而缺乏動(dòng)力,因此多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組提出了同樣的系統(tǒng)生物學(xué)策略來(lái)研究MS病因,以進(jìn)一步了解罕見(jiàn)和常見(jiàn)的共同遺傳對(duì)疾病的貢獻(xiàn)。
多發(fā)性硬化癥致病基因鑒定基因解碼中提出的流程提供了一種利用與MS相關(guān)的GWAS單核苷酸多態(tài)性(SNP)的方法,通過(guò)研究連鎖不平衡(LD)SNP的機(jī)制來(lái)發(fā)現(xiàn)途徑和交叉興趣點(diǎn)。研究了LD基因突變序列及之前與MS相關(guān)的研究中的基因,以確定有害的編碼序列基因突變序列及其對(duì)基因調(diào)控的影響(圖1)。因此,多發(fā)性硬化癥致病基因鑒定基因解碼為復(fù)雜剖析常見(jiàn)和罕見(jiàn)變異及其之間的系統(tǒng)通路相互作用提供了一個(gè)框架,這些相互作用導(dǎo)致了MS的多基因特性。
圖1:用于識(shí)別和研究與多發(fā)性硬化癥有關(guān)的基因/變異的工作流程。
如何進(jìn)行多發(fā)性硬化癥的致病基因鑒定基因解碼?
找出多化性硬化病的致病基因和突變位點(diǎn)
對(duì)于所有提及“多發(fā)性硬化癥”的性狀,多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組從 EBI/NHGRI GWAS 目錄 中提取了主要 SNP。然后使用 SNAP和 0.8 相關(guān)性截止值分析所有 LD SNP 的主要 SNP,并刪除冗余基因突變序列。來(lái)自多發(fā)性硬化癥嚴(yán)重程度評(píng)分 (MSSS) 關(guān)聯(lián) ) 的基因和來(lái)自 ClinVar的“多發(fā)性硬化癥”下列出的所有基因/基因突變序列均被納入列表。然后使用 STRING對(duì)所有基因進(jìn)行評(píng)估,使用基因本體 (GO) 富集來(lái)分析分子功能、KEGG 通路和 PMID 基因關(guān)聯(lián)。
蛋白質(zhì)結(jié)構(gòu)與功能變化分析
使用PolyPhen2 、SIFT 和 Provean工具對(duì)來(lái)自 ClinVar 和 gnomAD 的所有變異進(jìn)行錯(cuò)義功能評(píng)估,評(píng)估每個(gè)具有錯(cuò)義變異的基因。至少被其中一種工具鑒定為有功能的變異被納入多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組的候選基因列表 (表格1) 并進(jìn)行多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組之前描述的深度序列-結(jié)構(gòu)-功能分析。通過(guò) I-TASSER為細(xì)胞內(nèi)和細(xì)胞外結(jié)構(gòu)域生成 CD6 蛋白模型,然后設(shè)計(jì)跨膜螺旋、合并模型,并使用 YASARA 將蛋白質(zhì)嵌入 PEA 跨膜中。使用指定為 1 的每個(gè)工具的破壞性調(diào)用,然后按照以下方式生成每個(gè)錯(cuò)義基因突變序列的基因突變序列分?jǐn)?shù): (PolyPhen2 + SIFT + Proven + 保守性分?jǐn)?shù) ) × (21 個(gè)密碼子線性基序保守性)。對(duì)于保守性分?jǐn)?shù)為 1 或更高的基因突變序列,將來(lái)自 gnomAD 的等位基因計(jì)數(shù)乘以上述分?jǐn)?shù)以計(jì)算群體影響。
表1:根據(jù) GWAS、eQTL、ClinVar 和文獻(xiàn),查找多發(fā)性硬化癥的主要基因
基因 | 納入理由 | 候選位點(diǎn) | 先導(dǎo)位點(diǎn)SNP | 與先導(dǎo)SNP 的距離 | R2? | 特征 | P 值 | OR | 參考文獻(xiàn) | 權(quán)重 |
CD6† | PolyPhen2/SIFT | JX112MS30562 | rs17824933 | 15574 | 0.943 | 多發(fā)性硬化癥 | 4.00E-09 | 1.18 | 19525953 | 高的 |
CD6† | Provean/SIFT | JX207MS4233 | rs17824933 | 24852 | 0.836 | 多發(fā)性硬化癥 | 4.00E-09 | 1.18 | 19525953 | 高的 |
EVI5† | Provean/SIFT | JX118MS8092 | rs11808092 | 0 | 1 | EB 病毒核抗原 1 IgG 水平或多發(fā)性硬化癥 | 2.00E-08 | 0 | 26819262 | 高的 |
DKKL1† | Provean/SIFT | JX230MS3759 | rs2303759 | 0 | 1 | 多發(fā)性硬化癥 | 5.00E-09 | 1.11 | 21833088 | 高的 |
HNRNPA1† | 臨床研究 | JXMS | — | — | — | — | — | — | — | 高的 |
NR1H3† | 臨床研究 | JXMS | — | — | — | — | — | — | — | 高的 |
FAM69A | 脛神經(jīng)基因表達(dá)譜 | JXMS | rs6604026 | — | — | 多發(fā)性硬化癥 | 8.00E-06 | 1.15 | 17660530 | 高的 |
HLA-DRB1* | 脛神經(jīng)基因表達(dá)譜 | JX927MS980 | rs9271640 | 18291 | 0.861 | 多發(fā)性硬化癥中的寡克隆帶狀態(tài) | 5.00E-12 | 1.56 | 25616667 | 高的 |
HLA-DRB5* | 脛神經(jīng) / 脾臟 eQTL | JXMS | rs9271640 | — | — | 多發(fā)性硬化癥中的寡克隆帶狀態(tài) | 5.00E-12 | 1.56 | 25616667 | 高的 |
KIF1B‡ | 脛神經(jīng)基因表達(dá)譜 | JX十MS | rs10492972 | — | — | 多發(fā)性硬化癥 | 3.00E-10 | 1.34 | 18997785 | 高的 |
LINC00886 | 脛神經(jīng) / 脾臟 eQTL | JX867MS436 | rs12638253 | 91510 | 0.846 | 多發(fā)性硬化癥(嚴(yán)重程度) | 2.00E-06 | 0 | 19010793 | 高的 |
METTL15P1 | 脛神經(jīng)基因表達(dá)譜 | JXMS | rs12638253 | — | — | 多發(fā)性硬化癥(嚴(yán)重程度) | 2.00E-06 | 0 | 19010793 | 高的 |
NAP1L4P1 | 脛神經(jīng)基因表達(dá)譜 | JX十五MS | rs12025416 | — | — | 多發(fā)性硬化癥 | 1.00E-07 | 1.45 | 21244703 | 高的 |
PCDHGC3 | 脛神經(jīng)基因表達(dá)譜 | JX十九MS | rs1062158 | — | — | 多發(fā)性硬化癥 | 2.00E-06 | 1.08 | 21833088 | 高的 |
RGS14 | 脛神經(jīng)基因表達(dá)譜 | JXMS | rs4075958 | — | — | 多發(fā)性硬化癥 | 5.00E-07 | 1.09 | 21833088 | 高的 |
RP11–10L12.2 | 脛神經(jīng)基因表達(dá)譜 | JX十九MS | rs228614 | — | — | 多發(fā)性硬化癥 | 1.00E-07 | 1.09 | 21833088 | 高的 |
RPL37 | 脛神經(jīng)基因表達(dá)譜 | JX十七M(jìn)S | rs6896969 | — | — | 多發(fā)性硬化癥 | 2.00E-07 | 1.1 | 19525953 | 高的 |
TIPARP | 脛神經(jīng)基因表達(dá)譜 | JX289MS3226 | rs12638253 | 101871 | 0.875 | 多發(fā)性硬化癥(嚴(yán)重程度) | 2.00E-06 | 0 | 19010793 | 高的 |
TMEM87B | 脛神經(jīng)基因表達(dá)譜 | JX689MS6969 | rs17174870 | 148190 | 0.821 | 多發(fā)性硬化癥 | 1.00E-08 | 1.11 | 21833088 | 高的 |
TRIM2 | 脛神經(jīng)基因表達(dá)譜 | JX687MS9489 | rs12644284 | 0 | 1 | 多發(fā)性硬化癥 | 4.00E-06 | 2.04 | 21654844 | 高的 |
FAM213B | 全血eQTL | JX十八MS | rs4648356 | — | — | 多發(fā)性硬化癥 | 1.00E-14 | 1.14 | 21833088 | 高的 |
FCRL3 | 全血/脾臟 eQTL | JXMS | rs3761959 | — | — | 多發(fā)性硬化癥 | 3.00E-06 | 1.08 | 21833088 | 高的 |
MERTK | 全血eQTL | JXMS | rs17174870 | — | — | 多發(fā)性硬化癥 | 1.00E-08 | 1.11 | 21833088 | 高的 |
MMEL1 | 全血/脾臟 eQTL | JXMS | rs4648356 | — | — | 多發(fā)性硬化癥 | 1.00E-14 | 1.14 | 21833088 | 高的 |
AHI1 | 脾臟基因座 | JXMS | rs11154801 | — | — | 多發(fā)性硬化癥 | 1.00E-13 | 1.13 | 21833088 | 高的 |
TBKBP1 | 順式eQTL 1b | JX479MS4048 | rs8070463 | 5763 | 0.837 | 多發(fā)性硬化癥 | 1.00E-07 | 1.15 | 22190364 | 高的 |
DEXI | 順式eQTL 1b | JX649MS8169 | rs6498169 | 0 | 1 | 多發(fā)性硬化癥 | 4.00E-06 | 1.14 | 17660530 | 高的 |
SEZ6L2 | 順式eQTL 1b | JX102MS4 | rs34286592 | 6058 | 0.929 | 多發(fā)性硬化癥 | 5.00E-07 | 1.16 | 27386562 | 高的 |
PGD | 順式eQTL 1b | JX373MS7155 | rs10492972 | 106667 | 1 | 多發(fā)性硬化癥 | 3.00E-10 | 1.34 | 18997785 | 高的 |
CLTB | 順式eQTL 1b | JX117MS46443 | rs4075958 | 13794 | 0.927 | 多發(fā)性硬化癥 | 5.00E-07 | 1.09 | 21833088 | 高的 |
RMND5B | 順式eQTL 1b | JX117MS46443 | rs4075958 | 13794 | 0.927 | 多發(fā)性硬化癥 | 5.00E-07 | 1.09 | 21833088 | 高的 |
TMED9 | 順式eQTL 1b | JX117MS46443 | rs4075958 | 13794 | 0.927 | 多發(fā)性硬化癥 | 5.00E-07 | 1.09 | 21833088 | 高的 |
LRRC34 | PolyPhen | JX109MS36600 | rs10936599 | 22484 | 0.956 | 多發(fā)性硬化癥 | 7.00E-07 | 1.1 | 21833088 | 中等的 |
MPV17L2 | Provean | JX874MS628 | rs874628 | 0 | 1 | 多發(fā)性硬化癥 | 1.00E-08 | 1.11 | 21833088 | 中等的 |
IKZF2 | RegDB 1b TF | JX479MS4048 | rs8070463 | 5763 | 0.837 | 多發(fā)性硬化癥 | 1.00E-07 | 1.15 | 22190364 | 中等的 |
HES1 | RegDB 1b TF | JX649MS8169 | rs6498169 | 0 | 1 | 多發(fā)性硬化癥 | 4.00E-06 | 1.14 | 17660530 | 中等的 |
TGIF1 | RegDB 1b TF | JX102MS4 | rs34286592 | 6058 | 0.929 | 多發(fā)性硬化癥 | 5.00E-07 | 1.16 | 27386562 | 中等的 |
RGS1 | 順式eQTL 1d | JX281MS6305 | rs1323292 | 16752 | 1 | 多發(fā)性硬化癥 | 2.00E-08 | 1.12 | 21833088 | 中等的 |
CDK2AP1 | 順式eQTL 1d | JX655MS293 | rs1790100 | 128320 | 0.894 | 多發(fā)性硬化癥 | 7.00E-07 | 1.11 | 19525953 | 中等的 |
CD40 | 順式eQTL 1d | JX242MS5752 | rs2425752 | 0 | 1 | 多發(fā)性硬化癥 | 5.00E-10 | 1.11 | 21833088 | 中等的 |
MVP | 順式eQTL 1d | JX993MS8630 | rs34286592 | 16628 | 1 | 多發(fā)性硬化癥 | 5.00E-07 | 1.16 | 27386562 | 中等的 |
PRRT2 | 順式eQTL 1d | JX993MS8630 | rs34286592 | 16628 | 1 | 多發(fā)性硬化癥 | 5.00E-07 | 1.16 | 27386562 | 中等的 |
CDC37 | 順式eQTL 1d | JX129MS78984 | rs8112449 | 827 | 1 | 多發(fā)性硬化癥 | 1.00E-06 | 1.08 | 21833088 | 中等的 |
GABPA | RegDB 2a TF | JX562MS35845 | rs4075958 | 13528 | 0.964 | 多發(fā)性硬化癥 | 5.00E-07 | 1.09 | 21833088 | 中等的 |
CTCF | RegDB 2a TF | JX798MS6874 | rs17594362 | 10364 | 0.887 | 多發(fā)性硬化癥 | 4.00E-06 | 1.11 | 21833088 | 中等的 |
EGR1 | RegDB 2a TF | JX128MS89006 | rs4902647 | 6372 | 0.967 | 多發(fā)性硬化癥 | 9.00E-12 | 1.11 | 21833088 | 中等的 |
YY1 | RegDB 2a TF | JX118MS78602 | rs10411936 | 6778 | 1 | 多發(fā)性硬化癥 | 2.00E-07 | 1.16 | 22190364 | 中等的 |
GFI1‡ | RegDB 2a TF | JX617MS84580 | rs10492972 | 82616 | 0.802 | 多發(fā)性硬化癥 | 3.00E-10 | 1.34 | 18997785 | 中等的 |
SPI1 | RegDB 2a TF | JX298MS4920 | rs1323292 | 3774 | 1 | 多發(fā)性硬化癥 | 2.00E-08 | 1.12 | 21833088 | 中等的 |
CLOCK | RegDB 2a TF | JX126MS24433 | rs2425752 | 21267 | 1 | 多發(fā)性硬化癥 | 5.00E-10 | 1.11 | 21833088 | 中等的 |
ARNTL | RegDB 2a TF | JX126MS24433 | rs2425752 | 21267 | 1 | 多發(fā)性硬化癥 | 5.00E-10 | 1.11 | 21833088 | 中等的 |
BACH1 | RegDB 2a TF | JX791MS40028 | rs6984045 | 284668 | 1 | 多發(fā)性硬化癥 | 2.00E-06 | 1.59 | 19525955 | 中等的 |
ASAP1 | RegDB 2a 基因內(nèi)含子中的 SNP | JX791MS40028 | rs6984045 | 284668 | 1 | 多發(fā)性硬化癥 | 2.00E-06 | 1.59 | 19525955 | 低的 |
CDIPT-AS1 | RegDB 1b 基因內(nèi)含子中的 SNP | JX102MS4 | rs34286592 | 6058 | 0.929 | 多發(fā)性硬化癥 | 5.00E-07 | 1.16 | 27386562 | 低的 |
CLEC16A | RegDB 1b 基因內(nèi)含子中的 SNP | JX649MS8169 | rs6498169 | 0 | 1 | 多發(fā)性硬化癥 | 4.00E-06 | 1.14 | 17660530 | 低的 |
CLECL1 | RegDB 2a 基因內(nèi)含子中的 SNP | JX104MS92165 | rs10466829 | 9870 | 0.935 | 多發(fā)性硬化癥 | 1.00E-08 | 1.09 | 21833088 | 低的 |
EPS15L1 | RegDB 2a 基因內(nèi)含子中的 SNP | JX118MS78602 | rs10411936 | 6778 | 1 | 多發(fā)性硬化癥 | 2.00E-07 | 1.16 | 22190364 | 低的 |
KPNB1 | RegDB 1b 基因內(nèi)含子中的 SNP | JX479MS4048 | rs8070463 | 5763 | 0.837 | 多發(fā)性硬化癥 | 1.00E-07 | 1.15 | 22190364 | 低的 |
SLC12A5 | RegDB 2a 基因內(nèi)含子中的 SNP | JX126MS24433 | rs2425752 | 21267 | 1 | 多發(fā)性硬化癥 | 5.00E-10 | 1.11 | 21833088 | 低的 |
AFF3 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs12471490 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 3.15 × 10−5 | 0.56 | 21654844 | 低的 |
ANAPC1 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs4848821 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 1.44 × 10−5 | 0.8 | 21654844 | 低的 |
ASXL2 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs10178552 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 4.76 × 10−5 | −0.41 | 21654844 | 低的 |
CDH13 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs8047176 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 6.90 × 10−5 | 1.58 | 21654844 | 低的 |
CDHR3 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs193806 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 5.53 × 10−5 | 0.63 | 21654844 | 低的 |
CRTAC1 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs11189446 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 2.05 × 10−5 | 0.54 | 21654844 | 低的 |
CTNND2 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs11750073 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 6.49 × 10−5 | 1.99 | 21654844 | 低的 |
FHIT | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs1735457 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 1.55 × 10−5 | 2.85 | 21654844 | 低的 |
GPC5 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs17430373 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 3.12 × 10−5 | 4.19 | 21654844 | 低的 |
GPR158 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs7071606 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 4.25 × 10−5 | 3.59 | 21654844 | 低的 |
GRIN2A | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs1448239 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 2.99 × 10−5 | 1.65 | 21654844 | 低的 |
HACE1 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs7741733 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 1.97 × 10−5 | 1.69 | 21654844 | 低的 |
IFNA10 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs10811505 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 2.56 × 10−5 | −0.50 | 21654844 | 低的 |
IFNA16 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs1820314 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 2.13 × 10−5 | −0.50 | 21654844 | 低的 |
IFNA17 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs9298814 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 2.30 × 10−5 | −0.50 | 21654844 | 低的 |
JAZF1 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs735664 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 5.97 × 10−5 | 1.65 | 21654844 | 低的 |
KCNMA1 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs7087337 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 7.47 × 10−5 | 2 | 21654844 | 低的 |
KLHL9 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs8729 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 3.85 × 10−5 | −0.49 | 21654844 | 低的 |
LOC100289506 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs7789940 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 6.04 × 10−6 | 1.87 | 21654844 | 低的 |
MICB | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs2855814 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 2.09 × 10−5 | 0.4 | 21654844 | 低的 |
NKD1 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs12596811 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 1.80 × 10−5 | 2.43 | 21654844 | 低的 |
NOS1AP | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs12403202 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 7.83 × 10−5 | 0.63 | 21654844 | 低的 |
NPSR1 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs17170015 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 4.65 × 10−5 | −0.48 | 21654844 | 低的 |
OR6T1 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs1476203 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 4.43 × 10−5 | 0.65 | 21654844 | 低的 |
OR8D4 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs7942047 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 8.68 × 10−5 | 0.67 | 21654844 | 低的 |
PDZD2 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs161522 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 4.35 × 10−5 | 1.62 | 21654844 | 低的 |
PLCG2 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs7185362 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 4.48 × 10−5 | 1.7 | 21654844 | 低的 |
POPDC3 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs11962089 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 8.33 × 10−6 | −0.69 | 21654844 | 低的 |
PPARGC1A | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs8192678 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 5.94 × 10−5 | 1.72 | 21654844 | 低的 |
PRDM2 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs4344326 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 5.82 × 10−5 | 4.26 | 21654844 | 低的 |
PSD3 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs7015570 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 3.76 × 10−5 | −0.60 | 21654844 | 低的 |
PTPRD | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs10977017 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 1.02 × 10−5 | 1.67 | 21654844 | 低的 |
RBM20 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs1832745 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 2.02 × 10−5 | −0.45 | 21654844 | 低的 |
RELN | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs10487166 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 5.33 × 10−5 | 0.45 | 21654844 | 低的 |
STX8 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs7219526 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 7.14 × 10−5 | 0.64 | 21654844 | 低的 |
YWHAG | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs17149161 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 5.83 × 10−6 | 1.87 | 21654844 | 低的 |
ZFPM2 | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) | JXMS | rs10505082 | — | — | 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 協(xié)會(huì) | 2.45 × 10−5 | 0.62 | 21654844 | 低的 |
†基因用匕首標(biāo)記的位點(diǎn)有額外的蛋白質(zhì)影響分析圖 3。
*在 eQTL 分析中更詳細(xì)地細(xì)分圖 5。
‡單個(gè) LD 塊 (rs10492972) 中描述的多個(gè)數(shù)據(jù)集的連接圖 6。
基因表達(dá)
每種基因的表達(dá)數(shù)據(jù)均取自 FANTOM或小鼠單細(xì)胞數(shù)據(jù)庫(kù)。使用 Morpheus 在線工具可視化表達(dá),并使用以下公式將表達(dá)水平轉(zhuǎn)換為 z 分?jǐn)?shù):(樣本值 - 所有組織中基因的平均值)/ 所有組織中基因值的標(biāo)準(zhǔn)差。對(duì)于單細(xì)胞分析,確定表達(dá)的基因是基于計(jì)數(shù) >10 的基因。計(jì)數(shù) >10 的細(xì)胞按所有其他基因聚類,并與計(jì)數(shù) <10 的細(xì)胞進(jìn)行比較,計(jì)算表達(dá)水平的 log2 倍數(shù)變化和計(jì)數(shù) >10 的細(xì)胞百分比。
非編碼基因突變序列基因突變
首先通過(guò) RegulomeDB 工具評(píng)估所有 LD SNP 的 GWAS多發(fā)性硬化癥(MS)相關(guān)區(qū)域,整理出發(fā)生改變的轉(zhuǎn)錄因子 (TF) 結(jié)合位點(diǎn)以及 TF 結(jié)合附近的基因。使用 hg38 注釋整理出在 LD 區(qū)塊 ± 50,000 kB 內(nèi)發(fā)現(xiàn)的完整基因列表。從 GTEx 中提取表達(dá)數(shù)量性狀基因座 (eQTL) 數(shù)據(jù),并將其標(biāo)準(zhǔn)化為具有 eQTL 的組織內(nèi)總基因數(shù)量(具有 eQTL 的多發(fā)性硬化癥(MS)基因百分比/[組織 eQTL/所有組織中的平均 eQTL]),并查詢 LD 區(qū)塊基因以查找在脛神經(jīng)、全血或脾臟數(shù)據(jù)集中發(fā)現(xiàn)的任何作為 eQTL 的 SNP。 LD區(qū)塊注釋堿基的 ChromHMM 模型來(lái)自 Roadmap Epigenomics。然后使用 SNAP(截止值為 0.8 R 2)重新評(píng)估頂級(jí)功能注釋 SNP 的 LD,隨后提取 GWAS 數(shù)據(jù)庫(kù)中注釋的所有 LD SNP,以確定 LD 區(qū)塊的其他特征關(guān)聯(lián)。
對(duì)基因進(jìn)行排序
高優(yōu)先級(jí)基因被注釋為在 2/3 種工具(PolyPhen2、Provean 或 SIFT)中具有功能預(yù)測(cè)結(jié)果的錯(cuò)義變異、在 ClinVar 中具有多個(gè)映射變異或具有基因 eQTL 調(diào)控的 GWAS 基因座。中等優(yōu)先級(jí)基因是在一種工具中具有功能預(yù)測(cè)結(jié)果的錯(cuò)義變異或 RegulomeDB 優(yōu)先考慮的 TF 結(jié)合變異。低優(yōu)先級(jí)基因是定位在功能性 TF 結(jié)合位點(diǎn)附近而??沒(méi)有 eQTL 的基因或通過(guò) 多發(fā)性硬化癥嚴(yán)重程度評(píng)分(MSSS) 關(guān)聯(lián)識(shí)別的不屬于上述兩組的基因。
多發(fā)性硬化癥的發(fā)生如何受基因的影響?
MS 基因列表
從 GWAS 數(shù)據(jù)庫(kù)中,有 218 個(gè)主要 SNP 與以下一項(xiàng)或多項(xiàng)相關(guān):Epstein-Barr 病毒核抗原 1 IgG 水平或多發(fā)性硬化癥、多發(fā)性硬化癥中的免疫球蛋白 G 指數(shù)水平、多發(fā)性硬化癥、多發(fā)性硬化癥(發(fā)病年齡)、多發(fā)性硬化癥(OCB 狀態(tài))、多發(fā)性硬化癥(嚴(yán)重程度)、多發(fā)性硬化癥或肌萎縮側(cè)索硬化癥、多發(fā)性硬化癥-腦谷氨酸水平、多發(fā)性硬化癥中的寡克隆帶狀態(tài)、多發(fā)性硬化癥中的復(fù)發(fā)以及多發(fā)性硬化癥對(duì)干擾素 β 的反應(yīng)。從這些主要 SNP 中,有 3,505 個(gè) SNP 處于 LD 中。其中 8 個(gè)被識(shí)別為 RegulomeDB 評(píng)分為 1b(eQTL 和 TF 結(jié)合預(yù)測(cè)變化,位點(diǎn)處已知多個(gè) ENCODE TF),12 個(gè)被識(shí)別為 2a(TF 結(jié)合預(yù)測(cè)變化,位點(diǎn)處已知多個(gè) ENCODE TF,包括與改變的結(jié)合位點(diǎn)匹配的 ENCODE),這表明在 LD 塊內(nèi),多個(gè) SNP 可能會(huì)改變基因調(diào)控。
根據(jù)上文討論的多發(fā)性硬化癥(MS)文獻(xiàn)、ClinVar 和 GWAS 相關(guān)基因位點(diǎn)圖譜對(duì)基因進(jìn)行分析,得到了 96 個(gè)非重復(fù)的候選基因(表1)。其中,32 個(gè)為高優(yōu)先級(jí)(33%),20 個(gè)為中等優(yōu)先級(jí)(21%),44 個(gè)為低優(yōu)先級(jí)(46%)。在 43 個(gè)具有 R 2數(shù)據(jù)的預(yù)測(cè)功能性 SNP 中,11 個(gè)的值范圍為 0.802 至 0.894(26%,0.8 為 LD 映射的截止值),11 個(gè)的范圍為 0.927–0.967(26%),20 個(gè)的值為 1(47%,與人類群體完全相關(guān))。
已識(shí)別基因的多發(fā)性硬化癥(MS)通路
開(kāi)始了解基因的通路和網(wǎng)絡(luò)表1,多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組對(duì) 96 個(gè)基因使用了 STRING 工具,返回了 89 個(gè)映射基因/節(jié)點(diǎn)(圖 2)。網(wǎng)絡(luò)中的連接是實(shí)驗(yàn)確定的相互作用(19 個(gè)連接)、共表達(dá)(22 個(gè)連接)、注釋數(shù)據(jù)庫(kù)(22 個(gè)連接)和文本挖掘(42 個(gè)連接)。蛋白質(zhì)-蛋白質(zhì)相互作用的數(shù)量顯著豐富于隨機(jī)預(yù)期(P值 2e-7),表明基因列表中存在重疊的生物學(xué)途徑。這突出表明,在表1并不是隨機(jī)的,而是通過(guò)重疊的生物機(jī)制和途徑聚集在一起的。
圖 2:STRING 網(wǎng)絡(luò)和基因本體論 (GO) 多發(fā)性硬化癥基因富集。使用以下基因創(chuàng)建網(wǎng)絡(luò)表1. 顯著富集的 GO 術(shù)語(yǔ)顯示為在整個(gè)基因組中與術(shù)語(yǔ)總數(shù)映射的基因數(shù)量以及每個(gè)基因的錯(cuò)誤發(fā)現(xiàn)率 (FDR)。
在 89 個(gè)已映射基因列表中顯著富集的 GO 術(shù)語(yǔ)網(wǎng)絡(luò)包括:11 個(gè)(12.4%)為 TF(錯(cuò)誤發(fā)現(xiàn)率,F(xiàn)DR 為 4e-4),6 個(gè)(6.7%)與自身免疫性甲狀腺疾病(FDR 2e-05)相關(guān),4 個(gè)(4.5%)與 RIG-1 樣受體信號(hào)傳導(dǎo)(FDR 1e-2)相關(guān),4 個(gè)(4.5%)與自然殺傷細(xì)胞活化(FDR 8e-3)相關(guān)。此外,單純皰疹感染(7 個(gè)基因,F(xiàn)DR 2e-3)和 Epstein-Barr 病毒感染(6 個(gè)基因,F(xiàn)DR 1e-2)基因也有富集,此前有研究表明這些基因與多發(fā)性硬化癥(MS)有關(guān)。將這些結(jié)果與文獻(xiàn)進(jìn)行關(guān)聯(lián),可證實(shí)自身免疫性甲狀腺疾病與多發(fā)性硬化癥(MS)患者及其一級(jí)親屬共??;表達(dá) NKG2D 受體的自然殺傷細(xì)胞可能對(duì)表達(dá) NKG2D 配體的成體少突膠質(zhì)細(xì)胞和胎兒星形膠質(zhì)細(xì)胞具有細(xì)胞毒性,從而導(dǎo)致多發(fā)性硬化癥(MS)中的病變;RIG-1 樣受體通路的 TBKBP1 在脂肪細(xì)胞和神經(jīng)元中高表達(dá),且多發(fā)性硬化癥(MS)中的抗 DNA 抗體升高。總體而言,這表明基于網(wǎng)絡(luò)分析,MS 基因網(wǎng)絡(luò)豐富了多層次的免疫和病毒反應(yīng)生物學(xué)。
錯(cuò)義基因突變序列的分析
對(duì)于 GWAS,錯(cuò)義變異最容易進(jìn)行功能分析,因此也是多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組了解多發(fā)性硬化癥(MS)遺傳機(jī)制的起點(diǎn)。從 GWAS 的 LD SNP 中,多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組在 12 種蛋白質(zhì)(CD6、CLEC2D、DKKL1、EVI5、FCRL3、IL7R、LRRC34、MANBA、MMEL1、MPV17L2、SCO2、TNFRSF1A)中發(fā)現(xiàn)了 15 個(gè)錯(cuò)義 SNP。在 15 個(gè)錯(cuò)義變異中,有 8 個(gè)在 PolyPhen2/Provean/SIFT 中被預(yù)測(cè)為良性,一個(gè)在 PolyPhen 2 中可能是有害的,一個(gè)在 PolyPhen2 中可能是有害的而在 SIFT 中是有害的,一個(gè)在 Provean 中是有害的,一個(gè)在 PolyPhen2 中可能是有害的而在 SIFT 中是有害的,三個(gè)在 Provean 中是有害的而在 SIFT 中是有害的(表 2)。此外,ClinVar 中的兩種蛋白質(zhì)具有與多發(fā)性硬化癥(MS)相關(guān)的錯(cuò)義基因突變序列,即 NR1H3 和 HNRNPA1。多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組使用多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組的基因突變序列分析工具分析了 GWAS 中的三種蛋白質(zhì)(CD6、EVI5、DKKL1),其中至少有兩種工具報(bào)告了破壞性預(yù)測(cè),以及 ClinVar 中的兩種蛋白質(zhì)(NR1H3、HNRNPA1)(圖 3,A – C)。
表 2.錯(cuò)義變異分析
基因(基因突變序列) | PolyPhen2 | Provean | SIFT |
---|---|---|---|
CD6 (T217M) | 大概 | 中性的 | 破壞 |
EVI5 (Q612H) | 良性 | 有害的 | 破壞 |
CD6 (G606S) | 良性 | 有害的 | 破壞 |
DKKL1(M109R) | 良性 | 有害的 | 破壞 |
LRRC34(L241I) | 大概 | 中性的 | 容忍 |
DKKL1(E214K) | 可能 | 中性的 | 破壞 |
MPV17L2 (M72V) | 良性 | 有害的 | 容忍 |
TNFRSF1A (R121Q) | 可能 | 中性的 | 容忍 |
DKKL1(G187S) | 良性 | 中性的 | 容忍 |
SCO2(R20P) | 良性 | 中性的 | 容忍 |
MANBA (T701M) | 良性 | 中性的 | 容忍 |
MMEL1 (M518T) | 良性 | 中性的 | 容忍 |
CLEC2D (L23V) | 良性 | 中性的 | 容忍 |
IL7R (T244I) | 良性 | 中性的 | 容忍 |
FCRL3(N28D) | 良性 | 中性的 | 容忍 |
圖 3.來(lái)自全基因組關(guān)聯(lián)研究 (GWAS) 和 ClinVar 的多發(fā)性硬化癥 CD6、EVI5、DKKL1、NR1H3 和 HNRNPA1 錯(cuò)義變異。A :對(duì)每個(gè)基因 (CD6、EVI5、DKKL1、NR1H3、HNRNPA1) 進(jìn)行的深度密碼子進(jìn)化分析,物種數(shù)量顯示在括號(hào)中,注釋域顯示在下方。B :來(lái)自 ClinVar(良性 = 黃色、致病 = 紅色、意義不明確的變異 VUS = 洋紅色)和 gnomAD(灰色)的所有變異的排名。C :使用 gnomAD 等位基因計(jì)數(shù)按變異得分對(duì)僅位于保守或選擇位點(diǎn)的變異進(jìn)行綜合影響。D –G:CD6,右上角所有 gnomAD 變異對(duì) CD6 的相對(duì)預(yù)測(cè)影響,標(biāo)識(shí)出 T217M 的影響最大 ( D )。E:位點(diǎn) 217 附近的氨基酸保守,該位點(diǎn)位于潛在磷酸化位點(diǎn)的中間。F :嵌入脂質(zhì)膜(青色)內(nèi)的 CD6 模型,其保守性用 ConSurf 著色(黃色 = 疏水性保守,藍(lán)色 = 堿性保守,紅色 = 酸性保守,綠色 = 極性保守,灰色 = 不保守),右側(cè)為位點(diǎn) 217 的放大視圖。G:CD6 的另一個(gè)連鎖不平衡 (LD) 錯(cuò)義單核苷酸多態(tài)性 (SNP),在氨基酸 606 附近顯示無(wú)或弱保守性。H : EVI5 ,位點(diǎn) 623 周圍的氨基酸保守,在整個(gè)進(jìn)化過(guò)程中發(fā)現(xiàn)多種氨基酸。I :DKKL1,氨基酸 109 周圍的保守性,沒(méi)有保守性。J :NR1H3,位點(diǎn) 415的ClinVar 基因突變序列,位于蛋白質(zhì)的高度保守區(qū)域。K:HNRNPA1,使用多種工具和多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組的保守分析評(píng)估該基因的所有 ClinVar 基因突變序列。
對(duì)于這五種蛋白質(zhì)中的每一種,多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組都在其基因中確定了高度保守和密碼子選擇的關(guān)鍵位點(diǎn)(圖3A),結(jié)合 PolyPhen2、Provean 和 SIFT 對(duì) ClinVar 和 gnomAD 工具中發(fā)現(xiàn)的每種變異的預(yù)測(cè) (圖3B),代表了超過(guò) 130,000 個(gè)已測(cè)序個(gè)體。基于使用多種工具進(jìn)行的保守性分析,所有五個(gè)基因內(nèi)的變異都已預(yù)測(cè)了功能結(jié)果 (圖3B),其中大多數(shù)變異都出現(xiàn)在罕見(jiàn)頻率水平,這表明在將等位基因計(jì)數(shù)納入指標(biāo)時(shí),得分沒(méi)有提高(圖3C)。EVI5 有兩個(gè)最常見(jiàn)的潛在破壞性變異,rs143611208 (I343T) 和 rs140780079 (I429T),但迄今為止尚未對(duì)這些變異進(jìn)行研究,很可能是由于它們?cè)诜欠姨m高加索人中的等位基因頻率較低(rs143611208 在 0.1% 高加索人中,其中阿什肯納茲猶太人最高為 1.8%,rs140780079 在 0% 高加索人中,其中東亞人最高為 1.6%)。這兩個(gè)變異在進(jìn)化上都是 100% 保守的,并且在所有使用的工具中都有破壞性預(yù)測(cè)。NR1H3 (R415Q) 中的 ClinVar 致病注釋變異 rs61731956 是唯一已知的與所有五個(gè)基因都有等位基因計(jì)數(shù)的疾病相關(guān)變異,并且有強(qiáng)有力的保守性證據(jù)(圖3C)。
深入研究這五個(gè)基因的疾病相關(guān)錯(cuò)義變異(圖 3, D – K ) 多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組首先對(duì) CD6 進(jìn)行評(píng)估。CD6 T217M (rs11230562) 的綜合得分為 89,753,這源于 PolyPhen2 和 SIFT 中的破壞性預(yù)測(cè)、高于平均值的 −0.6 的 dN-dS 值、位點(diǎn)周圍氨基酸的高度保守性以及蘇氨酸上的潛在 CDK 磷酸化位點(diǎn) (圖3E)。43% 的阿什肯納茲猶太人存在該變異,與多發(fā)性硬化癥(MS)的 rs11230562 領(lǐng)先 SNP 的 R 2相關(guān)性為 0.943。CD6 上的 T217 位點(diǎn)預(yù)計(jì)暴露在表面,靠近多個(gè)其他保守氨基酸(圖3F)。與 rs11230562 存在 LD 的另一個(gè)潛在功能性錯(cuò)義基因突變序列是 rs2074233 (CD6 G60S),但該位點(diǎn)在該區(qū)域沒(méi)有保守性或選擇性(圖3G)。
另外兩個(gè)來(lái)自 LD SNPs 的錯(cuò)義基因突變序列具有多個(gè)破壞性預(yù)測(cè),EVI5 Q623H(圖3H) 和 DKKL1 M109R (圖3),保守性較低,周圍保守氨基酸很少。NR1H3 R415Q 基因突變序列的多發(fā)性硬化癥(MS)關(guān)聯(lián)最近受到爭(zhēng)議 ( 45 ),但預(yù)測(cè)該基因突變序列在 PolyPhen2、Provean 和 SIFT 中是有害的,在多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組分析的 NR1H3 的 199 個(gè)物種序列中 100% 保守,并且附近有許多其他氨基酸具有高度保守性 (圖3J),表明該變異具有功能性。HNRNPA1 與多發(fā)性硬化癥(MS)自身抗原相關(guān),ClinVar 包含注釋為良性、致病性和意義不明確的變異,其中變異 P275S 和 K277N 具有最高的功能預(yù)測(cè)(圖3K)。多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組對(duì)每個(gè)基因的保守性分析可以在多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組的 figshare 頁(yè)面上找到,從而可以對(duì)其他人/未來(lái)工作中發(fā)現(xiàn)的其他變異位點(diǎn)進(jìn)行額外分析。從高度保守區(qū)域的突變導(dǎo)致多發(fā)性硬化癥(MS)表型這一基本假設(shè)開(kāi)始,這將表明 GWAS 中 LD 區(qū)塊內(nèi)的其他非編碼變異與多發(fā)性硬化癥(MS)關(guān)聯(lián)的大多數(shù) LD 區(qū)塊有關(guān),而不是錯(cuò)義變異。
MS 基因表達(dá)
分析多發(fā)性硬化癥(MS)相關(guān)基因組區(qū)域的 LD 區(qū)塊中的錯(cuò)義變異幾乎無(wú)法識(shí)別導(dǎo)致病理的蛋白質(zhì)通路和細(xì)胞類型。因此,多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組接下來(lái)使用多個(gè)表達(dá)數(shù)據(jù)庫(kù)來(lái)研究來(lái)自表1的富含多發(fā)性硬化癥(MS)病理的功能細(xì)胞類型。使用人類 FANTOM 數(shù)據(jù)庫(kù),多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組繪制了 1,829 個(gè)樣本中每個(gè)基因的表達(dá)情況。利用每個(gè)組織中每個(gè)基因的 z 分?jǐn)?shù),繪制出多發(fā)性硬化癥(MS)基因組織特異性表達(dá)最多的組織,結(jié)果顯示大多數(shù)組織(99.9%,1827/1829)的多發(fā)性硬化癥(MS)相關(guān)基因的平均 Z 分?jǐn)?shù)小于 1,同時(shí) z 分?jǐn)?shù)大于 2 的單個(gè)基因也較少(圖4A),即在所有組織中高于平均值兩個(gè)標(biāo)準(zhǔn)差的值。MS 基因表達(dá)的極端值包括多個(gè)神經(jīng)區(qū)域(黑質(zhì)、枕葉皮質(zhì)和顳葉內(nèi)側(cè)回)和免疫細(xì)胞(單核細(xì)胞衍生的巨噬細(xì)胞和中性粒細(xì)胞),這與已知的多發(fā)性硬化癥(MS)免疫神經(jīng)交集一致。在前兩個(gè)組織特異性數(shù)據(jù)集(顳葉內(nèi)側(cè)回和中性粒細(xì)胞)中對(duì)單個(gè)基因的 z 分?jǐn)?shù)進(jìn)行細(xì)分,發(fā)現(xiàn)多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組列表中的大多數(shù)基因都是免疫系統(tǒng)或神經(jīng)元所特有的(圖4B)。只有一個(gè)基因,PRDM2,對(duì)兩種組織都具有高度特異性,這表明存在獨(dú)特的重疊。
圖 4.多發(fā)性硬化癥列表中的人類基因表達(dá)。A :人類 FANTOM 數(shù)據(jù)庫(kù)中組織的 z 分?jǐn)?shù)度量,表示該組織中 z 分?jǐn)?shù) >2 的多發(fā)性硬化癥 (MS) 相關(guān)基因的數(shù)量(y軸,即表達(dá)水平至少比平均值高兩個(gè)標(biāo)準(zhǔn)差)和組織中多發(fā)性硬化癥(MS)基因的平均 z 分?jǐn)?shù)(x軸)。映射到右上方的基因被標(biāo)記為可能是多發(fā)性硬化癥(MS)基因表達(dá)最高的組織。B :中性粒細(xì)胞( y軸)和內(nèi)側(cè)顳葉(x軸)中候選基因的表達(dá) z 分?jǐn)?shù),分離免疫系統(tǒng)和神經(jīng)元的基因。C :每個(gè)多發(fā)性硬化癥(MS)相關(guān)基因平均表達(dá)的熱圖(表1) 遍布 20 個(gè)單細(xì)胞器官數(shù)據(jù)集。黑色框中的基因主要與非髓系腦細(xì)胞有關(guān),橙色框中的基因與免疫系統(tǒng)有關(guān)。D :胸腺 ( y軸) 或脾臟 ( x軸) 中表達(dá)或不表達(dá)多發(fā)性硬化癥(MS)基因的細(xì)胞的基因聚類相關(guān)性。E :腦非髓系數(shù)據(jù)集中表達(dá)富集的基因 ( y軸) 或與多發(fā)性硬化癥(MS)基因相似的細(xì)胞數(shù)量 ( x軸)。
從中性粒細(xì)胞表達(dá)中鑒定出的與多發(fā)性硬化癥(MS)相關(guān)的基因包括:PLCG2,小鼠敲除導(dǎo)致中性粒細(xì)胞募集減少,人類突變與自身炎癥性疾病和 HLA II 類通路改變有關(guān);CLEC16A與多種自身免疫性疾病有關(guān),如 MS、系統(tǒng)性紅斑狼瘡和銀屑??;EVI5,異位病毒整合位點(diǎn) 5 基因,已鑒定出與多發(fā)性硬化癥(MS)相關(guān)的 OR 高達(dá) 2,但其機(jī)制尚不明確;AFF3與多種自身免疫性疾病有關(guān),包括關(guān)節(jié)炎、狼瘡和 1 型糖尿病;ASAP1是一種肌動(dòng)蛋白調(diào)節(jié)劑,與細(xì)胞運(yùn)動(dòng)和轉(zhuǎn)移密切相關(guān);RGS14與微管相關(guān),參與細(xì)胞增殖、信號(hào)傳導(dǎo),在小鼠 EAE 模型中上調(diào);TBKBP1參與脊柱炎 和 TNF-α 信號(hào)轉(zhuǎn)導(dǎo)。
從內(nèi)側(cè)顳回表達(dá)中鑒定出的與多發(fā)性硬化癥(MS)相關(guān)的基因包括:SEZ6L2,它是最富集的神經(jīng)基因,此前已發(fā)現(xiàn)與神經(jīng)突生長(zhǎng)、ASD和癲癇有關(guān);PSD3雖然對(duì)大腦有高度特異性,但在神經(jīng)細(xì)胞中的作用鮮為人知;AHI1已被證明與抑郁癥和 Joubert 綜合征(一種運(yùn)動(dòng)神經(jīng)發(fā)育障礙)有關(guān);FAM69A ( DIPK1A ) 在內(nèi)質(zhì)網(wǎng)中發(fā)揮作用并與多種神經(jīng)系統(tǒng)疾病有關(guān);PTPRD是與許多疾病、癌癥和藥物成癮相關(guān)的變異,但很少有研究確定其在神經(jīng)元中的作用;RELN,也稱為 reelin ,雙重突變會(huì)導(dǎo)致無(wú)腦畸形,即大腦光滑,并被認(rèn)為與神經(jīng)肌肉連接以及 VLDLR 和脂質(zhì)生物學(xué)有關(guān);晝夜節(jié)律基因CLOCK和ARNTL具有與多發(fā)性硬化癥(MS)相關(guān)的 SNP,并且在 EAE 小鼠中表達(dá)發(fā)生改變。
為了將多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組的基因列表擴(kuò)展到多發(fā)性硬化癥(MS)功能細(xì)胞類型的其他預(yù)測(cè)網(wǎng)絡(luò)中,多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組利用來(lái)自 20 個(gè)小鼠器官的單細(xì)胞 RNA-Seq 數(shù)據(jù)集來(lái)識(shí)別具有共表達(dá)基因網(wǎng)絡(luò)的多發(fā)性硬化癥(MS)基因富集細(xì)胞(圖4C)組織聚集顯示免疫組織中幾種基因的表達(dá)升高(橙色框,圖4D)和腦非髓系細(xì)胞(黑框,圖4E)。脾臟和胸腺中細(xì)胞的表達(dá)量最高,僅表達(dá)少量的多發(fā)性硬化癥(MS)基因。對(duì)表達(dá)多發(fā)性硬化癥(MS)相關(guān)基因的脾臟和胸腺單細(xì)胞與不表達(dá)多發(fā)性硬化癥(MS)基因的細(xì)胞進(jìn)行篩選,發(fā)現(xiàn)另外 35 個(gè)基因(Cpa3、Ccna2、Ccnb2、Igj、Mipep、Uhrf1、Phf11、Ctla4、Fcrl5、Top2a、Rrm2、Tsen54、Cdca7l、Psat1、Gsto1、Rcc1、Nol6、Tigit、Tfb2m、Fam129c、Cd160、Bcl2a1d、Slc29a1、Tfdp1、Med27、Aarsd1、Gmppb、Ddx51、Serpine2、Cox19、Chpf、Ide、Lcmt1、Rnmt和Dkc1)在兩種組織中重疊表達(dá)(圖4D)。在這些數(shù)據(jù)中識(shí)別出Igj是值得注意的,因?yàn)樗诙喟l(fā)性硬化癥(MS)患者中升高。這 35 個(gè)基因在相互作用中具有顯著富集(FDR 0.0002),并且根據(jù) GO 富集和字符串網(wǎng)絡(luò)分析,在有絲分裂細(xì)胞周期轉(zhuǎn)換中富集(FDR 3.57e-2),更具體地說(shuō)是在 G0 和早期 G1 中富集(FDR 3.26e-2)。對(duì)大腦的非髓系細(xì)胞進(jìn)行分層,發(fā)現(xiàn)有 1,709 個(gè)基因與多發(fā)性硬化癥(MS)相關(guān)基因共表達(dá)(圖4E)。在這 1,709 個(gè)基因中,少突膠質(zhì)細(xì)胞分化本體論 (FDR 3.44e-6) 和髓鞘基因 (FDR 3.45e-8) 顯著富集。因此,表達(dá)多發(fā)性硬化癥(MS)相關(guān)基因的大腦非髓系細(xì)胞是參與神經(jīng)元髓鞘形成的少突膠質(zhì)細(xì)胞。有趣的是,之前很少有相關(guān)基因被注釋為具有這種生物學(xué)作用,這表明單細(xì)胞的分離策略確定了可能參與多發(fā)性硬化癥(MS)生物學(xué)的新基因。Sez6l2在多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組的多發(fā)性硬化癥(MS)基因列表和大腦分離列表中,是大腦單細(xì)胞數(shù)據(jù)中相關(guān)性最高的基因之一,但之前從未與少突膠質(zhì)細(xì)胞聯(lián)系起來(lái)。第二個(gè)小鼠單細(xì)胞數(shù)據(jù)庫(kù) Mouse Cell Atlas (MCA)也表明Sez6l2在髓鞘少突膠質(zhì)細(xì)胞中表達(dá)升高(P值為 5.8e-155),進(jìn)一步驗(yàn)證了該基因的這一新作用。分離列表頂部的其他基因包括:Galnt6,大量參與髓鞘維持所需的高爾基體 O-連接糖基化;Plekhh1在所有細(xì)胞中研究得很少;Erbb3已知參與少突膠質(zhì)細(xì)胞成熟;Tyro3已顯示參與施萬(wàn)細(xì)胞髓鞘形成;Efnb3與多發(fā)性硬化癥(MS)中的髓鞘再生有關(guān)。根據(jù) MCA,發(fā)現(xiàn)所有基因在髓鞘少突膠質(zhì)細(xì)胞中均高表達(dá)。多發(fā)性硬化癥基因的綜合網(wǎng)絡(luò)從系統(tǒng)層面豐富了髓鞘形成和少突膠質(zhì)細(xì)胞生物學(xué),為未來(lái)工作中的進(jìn)一步網(wǎng)絡(luò)推斷和測(cè)試提供了可能。
非編碼基因突變序列
從基因表達(dá)轉(zhuǎn)向可能影響表達(dá)的變異是一種開(kāi)始過(guò)濾多發(fā)性硬化癥(MS)LD 區(qū)塊內(nèi)非編碼變異的方法。除了上述少數(shù)錯(cuò)義變異外,MS 相關(guān) LD 區(qū)塊中的大多數(shù)變異尚未評(píng)估其功能結(jié)果(圖 3)。為了進(jìn)一步分析 GWAS LD 區(qū)塊的非編碼基因突變序列,多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組使用了 GTEx eQTL 數(shù)據(jù)庫(kù)和 RegulomeDB 工具(表1)。eQTL 可以告訴多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組 LD 阻斷的任何非編碼變異是否與基因表達(dá)變化相關(guān),而 RegulomeDB 等工具可以根據(jù)轉(zhuǎn)錄因子結(jié)合和表觀基因組學(xué)見(jiàn)解縮小潛在的因果變異范圍。
對(duì)于多發(fā)性硬化癥(MS)列表中的基因,多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組發(fā)現(xiàn)脂肪組織中的 eQTL 最多(30 個(gè)基因 = 33.8%),其次是腦組織(圖5A)。從全基因組來(lái)看,脂肪組織確實(shí)含有最多的 eQTL,因此從多發(fā)性硬化癥(MS)網(wǎng)絡(luò)中識(shí)別它并不奇怪。將這些值相對(duì)于 GTEx 中觀察到的具有 eQTL 的基因總數(shù)進(jìn)行標(biāo)準(zhǔn)化,會(huì)導(dǎo)致組織具有相對(duì)均勻的值(圖5A,紅色)。其中一些基因的 eQTL 存在于多種組織中(圖5B),即EVI5 (23 種組織 = 54.8%)、HLA-DRB1 (22 種組織 = 52.4%)、HLA-DRB5 (21 種組織 = 50%) 和MERTK (20 種組織 = 47.6%)。處理多發(fā)性硬化癥(MS)相關(guān)基因在脂肪組織中的效應(yīng)大小與顯著性時(shí),發(fā)現(xiàn)所有相關(guān)基因在 LD 中都有多個(gè) eQTL。MERTK 對(duì)基因表達(dá)增加具有最顯著的遺傳影響 (圖5C)。MERTK是一種受體激酶,已知其罕見(jiàn)和常見(jiàn)基因突變序列與多發(fā)性硬化癥(MS)有關(guān),并且與蛋白質(zhì)伴侶有關(guān),這些蛋白質(zhì)伴侶顯著豐富了胰島素和脂肪酸生物合成成分的 KEGG 通路(相對(duì) FDR 0.005 和 0.013)。MERTK 表達(dá)的非編碼基因突變序列在脂肪中的平均效應(yīng)大小為 9.45,在脛骨神經(jīng)元中的平均效應(yīng)大小為 11,這表明MERTK可能具有影響神經(jīng)元脂肪酸合成過(guò)程和髓鞘形成動(dòng)力學(xué)的非編碼基因突變序列。
圖 5.多發(fā)性硬化癥的表達(dá)數(shù)量性狀基因座 (eQTL) 分析全基因組關(guān)聯(lián)研究 (GWAS) 連鎖不平衡 (LD) 單核苷酸多態(tài)性 (SNP) 以提名基因和表觀遺傳機(jī)制。A :列表中多發(fā)性硬化癥(MS)基因的百分比,其中多種人體組織中存在 eQTL(灰色),以及相對(duì)于每種組織內(nèi)映射的 eQTL 總數(shù)(包括非多發(fā)性硬化癥(MS)相關(guān)基因)的標(biāo)準(zhǔn)化值(紅色)。B :具有 eQTL 的組織最多的基因。C :皮下脂肪中 eQTL 的效應(yīng)大?。▁軸)和P值(y軸),突出顯示效應(yīng)大小最大的基因。D :HLA-DRB1/5 區(qū)域附近的功能性 SNP 視圖。頂部顯示的是該位點(diǎn)與遠(yuǎn)端區(qū)域相互作用的 Cohesin Hi-ChIP 循環(huán)數(shù)據(jù)。E :幾種組織的 ChromHMM 模型,顯示該區(qū)域是潛在的增強(qiáng)子。下面顯示的是 LD SNP 相關(guān)性。
脂肪中最大的效應(yīng)量是 HLA 基因HLA-DRB1/DRB5的效應(yīng)量。HLA 風(fēng)險(xiǎn)基因相互作用與肥胖在多發(fā)性硬化癥(MS)發(fā)展中的高度關(guān)聯(lián)表明 eQTL 的重要性值得關(guān)注。根據(jù) Cohesin HiChip 數(shù)據(jù)集,這些調(diào)控 eQTL 的 LD 區(qū)塊循環(huán)回 HLA-DRB1 和 HLA-DRB5 的啟動(dòng)子(圖5D)。LD 區(qū)塊中有一小部分區(qū)域被標(biāo)注為功能性,這是基于 Roadmap Epigenomics 在多種細(xì)胞類型(包括脂肪細(xì)胞、自然殺傷細(xì)胞、多種 T 細(xì)胞類型、單核細(xì)胞、B 細(xì)胞、胸腺、腦區(qū)和腿部肌肉)中標(biāo)注的狀態(tài)(圖5E)。23 個(gè)基因突變序列與 HLA-DRB1 和 HLA-DRB5 的領(lǐng)先 SNP 具有 0.8 R 2相關(guān)性。人們對(duì)調(diào)節(jié)該區(qū)域的 TF 知之甚少,突出表現(xiàn)為缺乏 ENCODE TF 結(jié)合位點(diǎn)映射和 RegulomeDB 的分?jǐn)?shù)(rs9271683 和 rs9271689 的分?jǐn)?shù)為 3a)。
通過(guò) RegulomeDB 對(duì)所有 LD SNP 進(jìn)行進(jìn)一步分析,發(fā)現(xiàn)了幾個(gè)預(yù)計(jì)會(huì)發(fā)生改變且可能對(duì)多發(fā)性硬化癥(MS)病因很重要的 TF 結(jié)合位點(diǎn)(表格1)這些變異之一 rs61784580 與主要 SNP rs10492972 具有 0.8 R2相關(guān)性,與多發(fā)性硬化癥(MS)的幾率比為 1.34 相關(guān),并預(yù)計(jì)會(huì)改變 GFI1 的結(jié)合位點(diǎn)(圖 6)。領(lǐng)先的 SNP 位于KIF1B基因的內(nèi)含子內(nèi),是KIF1B表達(dá)的 eQTL (圖 6,黑框),落在沒(méi)有已知 ENCODE TFs 結(jié)合的位點(diǎn)上,預(yù)計(jì)不會(huì)改變?nèi)魏?TF 結(jié)合位點(diǎn)。然而,rs61784580 位于距離主要 SNP 82,616 個(gè)堿基對(duì)處,位于 H3K27 ?;ɑ钚赞D(zhuǎn)錄標(biāo)記)Roadmap 注釋的啟動(dòng)子上,該啟動(dòng)子附近有 26 個(gè)來(lái)自 ENCODE 的 TFs 結(jié)合,環(huán)路到多個(gè)基于黏連蛋白 HiChIP 的 Roadmap 注釋增強(qiáng)子,是KIF1B eQTL,預(yù)計(jì)會(huì)改變 GFI1 TF 結(jié)合位點(diǎn)(圖 6,青色框)。GFI1 是一種對(duì)髓系和淋巴細(xì)胞發(fā)育至關(guān)重要的基因,其突變與中性粒細(xì)胞減少癥和 T 細(xì)胞發(fā)育有關(guān)。因此,僅從數(shù)據(jù)預(yù)測(cè)來(lái)看,多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組認(rèn)為 rs61784580 在多種細(xì)胞類型中調(diào)節(jié)KIF1B的機(jī)制性非編碼生物學(xué)與多發(fā)性硬化癥(MS)相關(guān),應(yīng)在實(shí)驗(yàn)室中進(jìn)一步研究。
圖 6:rs10492972 區(qū)域中功能性非編碼 SNP 的 RegulomeDB。從頂部開(kāi)始是rs61784580 啟動(dòng)子 SNP 或內(nèi)含子引導(dǎo) SNP rs10492972 的循環(huán)數(shù)據(jù),后面是人類基因組瀏覽器的多個(gè)數(shù)據(jù)集、該區(qū)域的 18 狀態(tài) ChromHMM 基因組注釋、CEU LD SNP 相關(guān)性、兩個(gè)位點(diǎn)附近轉(zhuǎn)錄因子結(jié)合位點(diǎn)的詳細(xì)信息以及來(lái)自 LD 塊的 KIF1B 的 eQTL,它們都顯示出相似的效應(yīng)大小。
結(jié)合數(shù)據(jù)來(lái)剖析多發(fā)性硬化癥(MS)LD 生物學(xué)
MS 的 GWAS SNP 與 GWAS 目錄中所有其他特征的交集可用于解釋疾病病理的重疊機(jī)制和導(dǎo)致病理的特征。根據(jù) GWAS 數(shù)據(jù)庫(kù)查詢了多發(fā)性硬化癥(MS)主導(dǎo) SNP 的整個(gè)估算 SNP 數(shù)據(jù)集,刪除了多發(fā)性硬化癥(MS)相關(guān)特征,揭示了重疊遺傳學(xué)與多種其他自身免疫性疾?。ㄈ缈肆_恩病、炎癥性腸病、狼瘡、乳糜瀉、關(guān)節(jié)炎和糖尿病)以及罕見(jiàn)的神經(jīng)系統(tǒng)疾病多系統(tǒng)萎縮(圖7A)。一些基因突變序列被發(fā)現(xiàn)具有多種相關(guān)特征,包括一些 LD 基因突變序列(圖7B)。對(duì)這些具有多種性狀的SNP的剖析闡明了本文結(jié)合數(shù)據(jù)整合的多個(gè)層次的知識(shí)(圖7C),凸顯了多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組目前的研究在將機(jī)制見(jiàn)解映射到多發(fā)性硬化癥(MS)系統(tǒng)生物學(xué)方面的能力??偨Y(jié)圖7C對(duì)于多發(fā)性硬化癥(MS)相關(guān)非編碼變異的頂級(jí)調(diào)控預(yù)測(cè):1 ) 發(fā)現(xiàn) rs140522 的 LD 阻斷與多種血液性狀和細(xì)胞類型相關(guān),影響巨噬細(xì)胞中的TYMP表達(dá);2 ) 發(fā)現(xiàn) rs10936599 的 LD 阻斷與多種癌癥和免疫功能障礙相關(guān),其基因突變序列可能會(huì)改變 STAT5 結(jié)合,影響室管膜神經(jīng)細(xì)胞中的LRRC34表達(dá);3 ) rs1036207 的 LD 阻斷與嗜酸性粒細(xì)胞和中性粒細(xì)胞生物學(xué)相關(guān),其基因突變序列可能會(huì)改變 Evi-1 轉(zhuǎn)錄因子結(jié)合,影響多種細(xì)胞類型中的 NDFIP1 表達(dá)。
圖 7:多發(fā)性硬化癥 (MS) 連鎖不平衡 (LD) 單核苷酸多態(tài)性 (SNP) 與其他全基因組關(guān)聯(lián)研究 (GWAS) 性狀重疊。A :每個(gè)性狀映射的與任何多發(fā)性硬化癥(MS)相關(guān) LD 區(qū)段基因突變序列重疊的 SNP 數(shù)量。性狀按發(fā)生情況排序。B :與其關(guān)聯(lián)性狀最多的 SNP,這些 SNP 也位于多發(fā)性硬化癥(MS)LD 區(qū)段內(nèi)。前四個(gè)在C中詳細(xì)說(shuō)明,其中兩個(gè) SNP 位于 LD,相關(guān)性為 0.93R 2。C :性狀的三個(gè)前 SNP細(xì)分。對(duì)于每一個(gè),最左邊顯示具有 95% 置信區(qū)間的性狀。接下來(lái)是通過(guò) RegulomeDB 對(duì)功能性 LD SNP 的分析,顯示每個(gè) SNP 相對(duì)于領(lǐng)先 SNP 的 R2 值和基因突變序列的 RegulomeDB 得分。此后是頂級(jí) RegulomeDB SNP 的 eQTL 列表。最右邊顯示了來(lái)自 FANTOM(免疫細(xì)胞)或 Mouse Cell Atlas(大腦)的具有最顯著 eQTL 的基因的表達(dá)數(shù)據(jù)。
多發(fā)性硬化癥基因檢測(cè)科學(xué)性及其位點(diǎn)選擇
遺傳因素對(duì)疾病和特征的影響已得到充分證實(shí),但人們對(duì)變異發(fā)揮作用的機(jī)制和途徑了解甚少,無(wú)法了解其遺傳關(guān)聯(lián)。缺乏機(jī)制的原因有幾個(gè),最明顯的是多個(gè)變異的 LD 遺傳,因此很難從統(tǒng)計(jì)學(xué)上找出致病變異。為了解決這個(gè)問(wèn)題,人們?cè)诒碛^遺傳學(xué)和 TF 結(jié)合方面投入了大量資金,但工具集成到疾病病理學(xué)解釋方面卻存在滯后。雖然目前的數(shù)據(jù)和計(jì)算能力很強(qiáng),但理解數(shù)據(jù)聯(lián)系仍然需要人工時(shí)間來(lái)整理信息并解釋遺傳因素對(duì)疾病的影響。多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組在致病基因鑒定方面證明了這一點(diǎn),展示了如何需要多種工具來(lái)識(shí)別 LD 變異對(duì)疾病的貢獻(xiàn)。利用數(shù)據(jù)庫(kù)和工具集成的系統(tǒng)遺傳策略來(lái)推導(dǎo)可能的多發(fā)性硬化癥(MS)病因的相關(guān)網(wǎng)絡(luò)。這些數(shù)據(jù)表明了多個(gè)部位的潛在機(jī)制,突出了免疫系統(tǒng)成分和神經(jīng)髓鞘生物學(xué)的交集(圖 8)。雖然可以使用現(xiàn)有工具快速篩選錯(cuò)義變異,但非編碼變異的解釋在數(shù)據(jù)整合方面仍然具有挑戰(zhàn)性,但多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組可以確定一些功能位點(diǎn),正如《多發(fā)性硬化癥基因檢測(cè)》所討論的那樣。許多其他遺傳學(xué)尚未通過(guò)現(xiàn)有工具得到很好的理解,這表明需要針對(duì)巨噬細(xì)胞和 T 細(xì)胞轉(zhuǎn)錄控制開(kāi)關(guān)定制的額外數(shù)據(jù)集,這些開(kāi)關(guān)可能會(huì)因非編碼變異而改變。自 1868 年最初將多發(fā)性硬化癥(MS)描述為一種獨(dú)特疾病以來(lái),對(duì)該疾病遺傳機(jī)制的解釋僅在過(guò)去十年中才出現(xiàn)。多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組現(xiàn)在對(duì)基因序列變化對(duì)多發(fā)性硬化癥(MS)的貢獻(xiàn)的了解程度是驚人的,這是數(shù)百萬(wàn)美元投資于遺傳關(guān)聯(lián)的結(jié)果,更重要的是,這是更大的一般轉(zhuǎn)錄數(shù)據(jù)集的結(jié)果。隨著這些數(shù)據(jù)集變得越來(lái)越便宜和更容易生成,應(yīng)該開(kāi)發(fā)更多定制的數(shù)據(jù)集以完全解釋多發(fā)性硬化癥(MS)遺傳學(xué),為風(fēng)險(xiǎn)傾向和個(gè)性化治療建立更強(qiáng)大的計(jì)算算法。
圖 8:基于多發(fā)性硬化癥基因檢測(cè)項(xiàng)目組的遺傳系統(tǒng)數(shù)據(jù)整合的與多發(fā)性硬化癥 (MS) 病因相關(guān)的途徑的工作模型。
(責(zé)任編輯:佳學(xué)基因)