【佳學(xué)基因檢測(cè)】基因解碼建立全面的增強(qiáng)子及靶基因關(guān)系數(shù)據(jù)庫(kù)提高基因檢測(cè)結(jié)果的解讀能力
明確遠(yuǎn)端調(diào)控元件的靶基因?qū)τ诮忉尰虮磉_(dá)及基因突變對(duì)人體生命活動(dòng)的發(fā)生,包括致病基因鑒定靶向藥物的選擇對(duì)于目前以數(shù)據(jù)庫(kù)為基礎(chǔ)的基因檢測(cè)極為困難。但是這一目標(biāo)極為重要。通過(guò)實(shí)驗(yàn)獲得的增強(qiáng)子靶基因關(guān)系數(shù)據(jù)會(huì)局限于一小部分增強(qiáng)子和/或細(xì)胞類(lèi)型。由于缺乏系統(tǒng)評(píng)估,全基因組測(cè)序后分析的方法的正確性仍然讓很多人持懷疑態(tài)度?!斗峭怙@子基因信息區(qū)域的基因解碼方法》結(jié)合了多種空間和信息學(xué)方法來(lái)明確增強(qiáng)子位置,通過(guò)大數(shù)據(jù)的方式將來(lái)自500種細(xì)胞類(lèi)型的數(shù)據(jù)集聚起來(lái),以間立增強(qiáng)子與其調(diào)控目標(biāo)基因的聯(lián)系。生成了1860個(gè)人類(lèi)基因組范圍的遠(yuǎn)端增強(qiáng)子與其目標(biāo)基因的關(guān)系圖,形成ENTDEF數(shù)據(jù)庫(kù),便于更多基因檢測(cè)機(jī)構(gòu)調(diào)用,并通過(guò)生物信息方法形成基因檢測(cè)報(bào)告。為了展示這一數(shù)據(jù)關(guān)系集的正確性,《非外顯子基因信息區(qū)域的基因解碼方法》課題組對(duì)來(lái)自87個(gè)芯片測(cè)序數(shù)據(jù)中的34個(gè)轉(zhuǎn)錄因子的基因調(diào)控?cái)?shù)據(jù)進(jìn)行分析,評(píng)估了預(yù)測(cè)數(shù)據(jù)的正確性。
截止到2022年年中,《基因檢測(cè)市場(chǎng)調(diào)查機(jī)構(gòu)》發(fā)現(xiàn)除了基因解碼機(jī)構(gòu)以外,99.9%的基因檢測(cè)公司通過(guò)全外顯子測(cè)試獲得人體的基因信息數(shù)據(jù),以用于罕見(jiàn)病、基因病的致病基因鑒定,僅有一定以基因解碼技術(shù)為核心的臨床醫(yī)學(xué)檢驗(yàn)中心,堅(jiān)持除全外顯子以外基因序列的重要性。堅(jiān)持了基因調(diào)控序列對(duì)于疾病發(fā)生的重要性的認(rèn)識(shí)。根據(jù)《非外顯子基因信息區(qū)域的基因解碼方法》增強(qiáng)子、沉默子及和絕緣體是關(guān)鍵的基因組順式調(diào)節(jié)元件,通過(guò)與它們控制的目標(biāo)基因、靶基因的啟動(dòng)子物理接觸,在基因表達(dá)的時(shí)空控制中發(fā)揮關(guān)鍵作用。啟動(dòng)子位于轉(zhuǎn)錄起始區(qū)(TSS)的上游,促進(jìn)對(duì)轉(zhuǎn)錄因子和RNA聚合酶II(RNAPII)的吸引和結(jié)合,以指導(dǎo)基因轉(zhuǎn)錄的啟動(dòng)和方向,而增強(qiáng)子和沉默子可以位于基因組中的任何位置,通常位于遠(yuǎn)端區(qū)域,如上游、下游,或者在目標(biāo)基因或無(wú)關(guān)基因的內(nèi)含子中。通過(guò)與靶基因啟動(dòng)子的相互作用,增強(qiáng)子與激活蛋白結(jié)合并刺激轉(zhuǎn)錄速率,而沉默子與阻遏蛋白結(jié)合并降低轉(zhuǎn)錄速率。在某些情況下,增強(qiáng)子/沉默子和啟動(dòng)子之間的相互作用是不需要的,絕緣體可以阻止它們的相互作用。順式調(diào)控元件和啟動(dòng)子連接受組織特異性轉(zhuǎn)錄因子和輔助因子(如p300和介體)的約束,指導(dǎo)基因組轉(zhuǎn)錄的內(nèi)容、時(shí)間和方式,從而控制發(fā)育和分化過(guò)程中的細(xì)胞命運(yùn)決定。為簡(jiǎn)單起見(jiàn),以下《非外顯子基因信息區(qū)域的基因解碼方法》將這些遠(yuǎn)端順式調(diào)節(jié)元件稱(chēng)為一般的“增強(qiáng)子”(>5kb來(lái)自轉(zhuǎn)錄起始位點(diǎn)[TSS])。