【佳學(xué)基因檢測(cè)】將基因解碼頂起的數(shù)據(jù)庫(kù)前輩:gnomAD數(shù)據(jù)庫(kù)介紹
遺傳病、罕見病基因檢測(cè)導(dǎo)讀:
GnomAD, 是一個(gè)基因信息分析與注釋的新型數(shù)據(jù)庫(kù)。它提全稱是Genome Aggregation Database。簡(jiǎn)稱為gnomAD。為了便于交流,佳學(xué)基因?qū)⑵浞g為格諾馬德。 由于這是一個(gè)新型基因信息分析數(shù)據(jù)庫(kù),人們常常將其誤寫為GenomAD, 或者是genomAD.
關(guān)于格諾馬德(gnomAD)
格諾馬德(gnomAD)是一種基因組聚合數(shù)據(jù)庫(kù)。它是由研究人員聯(lián)盟,搜索、收集和協(xié)調(diào)來自各種大型外顯子組、全基因組的測(cè)序數(shù)據(jù),經(jīng)過匯總后再提供給更為廣泛的基因組研究和應(yīng)用領(lǐng)域。該項(xiàng)目由共同董事海蒂·雷姆和馬克·戴利以及指導(dǎo)委員會(huì)成員丹尼爾·麥克阿瑟、本杰明·尼爾、邁克爾·塔科夫斯基、安妮·奧唐納-盧里亞、康拉德·卡切夫斯基、格蕾絲·蒂奧、馬修·所羅門森和凱特·塔拉索娃監(jiān)督。格諾馬德的先進(jìn)個(gè)版本,它僅包含 exome 數(shù)據(jù),稱為 Exome 聚合聯(lián)盟 (ExAC)。
截止到2020年12月31日,佳學(xué)基因發(fā)現(xiàn),格諾馬德已經(jīng)將該數(shù)據(jù)庫(kù)升級(jí)到v3.1,所收集的基因序列變化來自76,156個(gè)基因組,這些基因組來自沒有親緣關(guān)系的個(gè)體,它們?cè)谘芯?a href='http://m.vigrxplusreviewsreal.com/cp/fenxian/' target='_blank'>疾病的發(fā)生或者是單純?yōu)槿后w基因組提供研究數(shù)據(jù)的過程中被收集起來,采用了賊新的GCH38參照基因組進(jìn)行分析。v2版本的基因序列變化來自125,748個(gè)外顯子組和15,708個(gè)基因組,這些基因組來自不相關(guān)的個(gè)體,這些基因組被測(cè)序?yàn)楦鞣N疾病特異性和種群基因研究的一部分,共有141,456個(gè)個(gè)體,采用GCH37參照序列進(jìn)行解讀分析。但是格諾馬德移除了已知受嚴(yán)重兒科疾病影響的個(gè)人及其一級(jí)親屬的基因序列,組織者認(rèn)為因此這些數(shù)據(jù)集應(yīng)作為嚴(yán)重兒科疾病研究的等位基因頻率的有用參考集。盡管,一些患有嚴(yán)重疾病的個(gè)人可能仍包含在數(shù)據(jù)集中,但是收集致病基因序列顯然不是GnomAD的主要目的。
這些項(xiàng)目的所有原始數(shù)據(jù)都通過標(biāo)準(zhǔn)化分析程序處理,并聯(lián)合調(diào)用變體以提高項(xiàng)目之間的一致性。處理管道以 WDL 工作流定義語(yǔ)言編寫,并使用Cromwell執(zhí)行引擎執(zhí)行,這是用于在多個(gè)平臺(tái)上大規(guī)模定義和執(zhí)行基因組工作流的開源項(xiàng)目。gnomAD 數(shù)據(jù)集包含使用多種外顯類捕獲方法和測(cè)序化學(xué)方法排序的個(gè)體,因此,個(gè)體和站點(diǎn)的覆蓋率各不相同。覆蓋率的這種變化被納入每個(gè)變型的變頻計(jì)算中。
gnomAD 使用 Hail 開源框架對(duì)QCad 進(jìn)行了 QC和分析,用于可擴(kuò)展的遺傳分析。
下面提供了一份 gnomAD 首席調(diào)查員和為當(dāng)前版本提供數(shù)據(jù)和分析的小組列表。
這套呼叫集的生成主要由 Broad Institute 資助,此處的數(shù)據(jù)公開發(fā)布,以造福于更廣泛的生物醫(yī)學(xué)社區(qū)。對(duì)這些數(shù)據(jù)沒有發(fā)布限制或禁運(yùn)。請(qǐng)引用旗艦 gnomAD 文件對(duì)這些數(shù)據(jù)的任何使用。
gnomAD 結(jié)構(gòu)變異 (SV) v2.1 數(shù)據(jù)集跨越了 10,847 個(gè)基因組,這些基因組來自作為各種疾病特異性和種群基因研究的一部分測(cè)序的不相關(guān)個(gè)體,并且與 GRCh37 參考值對(duì)齊。它主要(但不是有效)與用于 gnomAD 短變種釋放的基因組集重疊。與 gnomAD 短變種數(shù)據(jù)集一樣,格諾馬德移除了已知受嚴(yán)重兒科疾病影響的個(gè)人及其一級(jí)親屬,因此此數(shù)據(jù)集應(yīng)作為嚴(yán)重兒科疾病研究的等位基因頻率的有用參考集 - 但是,請(qǐng)注意,一些患有嚴(yán)重疾病的個(gè)人可能仍包含在數(shù)據(jù)集中,盡管頻率可能相當(dāng)于或低于一般人群。
這些項(xiàng)目的所有原始數(shù)據(jù)都通過同一管道重新處理,并聯(lián)合調(diào)用變體以提高項(xiàng)目之間的一致性。簡(jiǎn)言之,我們從人群遺傳和復(fù)雜的疾病關(guān)聯(lián)研究中匯總了光照短讀 WGS。我們通過集成四個(gè)已發(fā)布的SV算法(曼塔、DELLY、MELT和cn)發(fā)現(xiàn)了SV。MOPS) 識(shí)別七個(gè)突變類的SV,并聯(lián)合過濾、基因型、解析和注釋這些SV跨所有基因組。所有 SV 發(fā)現(xiàn)都是使用工作流描述語(yǔ)言(WDL) 和克倫威爾執(zhí)行引擎在 FireCloud 中執(zhí)行的,其中 gnomAD SV 發(fā)現(xiàn)管道的組件可作為具有專用 Docker 映像的公共方法提供。在 gnomAD SV 論文的補(bǔ)充信息中提供了有關(guān)此過程的廣泛技術(shù)細(xì)節(jié);請(qǐng)引用本文以使用SV數(shù)據(jù)。
gnomAD發(fā)布的數(shù)據(jù)不受知識(shí)共享零公共領(lǐng)域奉獻(xiàn)的限制。這意味著,您可以使用它用于任何目的,而無(wú)需合法地給予歸因。但是,我們要求您積極確認(rèn)并歸因 gnomAD 項(xiàng)目,并盡可能鏈接回相關(guān)頁(yè)面。歸因支持將來發(fā)布其他數(shù)據(jù)的努力。它還減少了"孤立數(shù)據(jù)"的數(shù)量,有助于保留與權(quán)威來源的鏈接。
基因組聚合數(shù)據(jù)庫(kù)收集的外顯子和基因組匯總和發(fā)布數(shù)據(jù)已獲合作伙伴 IRB(協(xié)議 2013P001339,"人類基因組數(shù)據(jù)的大規(guī)模聚合")批準(zhǔn)。
首席調(diào)查員
- 瑪麗亞·阿布雷烏
- 卡洛斯·阿吉拉爾·薩利納斯
- 塔里克·艾哈邁德
- 克里斯汀·阿爾伯特
- 尼科萊特·阿雷德
- 大衛(wèi)·阿爾特舒勒
- 迭戈·阿爾迪西諾
- 吉爾·阿茨蒙
- 約翰·巴納德
- 洛朗·博杰里
- 加里·比查姆
- 埃米莉亞·本杰明
- 邁克爾·博恩克
- 洛里·邦尼卡斯特
- 歐文·博廷格
- 唐納德·鮑登
- 馬修·鮑恩
- 漢尼亞坎波斯
- 約翰·錢伯斯
- 陳麗安娜
- 丹尼爾·查斯曼
- 雷克斯·奇斯霍爾姆
- 朱迪·喬
- 拉吉夫·喬杜里
- 鐘米娜
- 鄭文迪
- 布魯斯·科恩
- 阿道夫·科雷亞
- 達(dá)娜·達(dá)貝萊亞
- 馬克·戴利
- 約翰·達(dá)內(nèi)什
- 達(dá)伍德·達(dá)爾巴爾
- 約書亞·丹尼
- 拉文德拉納特·杜吉拉爾
- 約瑟·杜普伊斯
- 帕特里克·埃利諾
- 羅伯托·埃洛蘇亞
- 珍妮特·埃爾德曼
- 特努埃斯科
- 馬特·費(fèi)爾基勒
- 黛安·法特金
- 何塞·弗洛雷斯
- 安德烈·弗蘭克
- 蓋德·蓋茨
- 大衛(wèi)·格拉恩
- 本·格拉澤
- 斯蒂芬·格拉特
- 大衛(wèi)·戈德斯坦
- 克萊塞里奧·岡薩雷斯
- 萊夫·格羅普
- 克里斯托弗·海曼
- 伊拉霍爾
- 克雷格·哈尼斯
- 馬修·哈姆斯
- 米科·希爾圖寧
- 馬蒂·霍利
- 克里斯蒂娜·霍爾特曼
- 柴姆·賈拉斯
- 米科·卡萊拉
- 雅克科·卡普里奧
- 塞卡爾·卡蒂雷桑
- 艾米爾·肯尼
- 邦喬·金
- 楊金金
- 喬治·基羅夫
- 賈斯帕爾·庫(kù)納
- 塞波·科斯金寧
- 哈蘭·克魯姆霍爾茨
- 蘇布拉·庫(kù)加塔桑
- 所以 HeonKwk
- 馬克庫(kù)·拉克索
- 特霍·萊赫蒂梅基
- 露絲·洛斯
- 史蒂文·盧比茨
- 羅納德·馬
- 丹尼爾·麥克阿瑟
- 格雷戈里·馬庫(kù)斯
- 喬梅·馬魯加特
- 卡里·馬蒂拉
- 史蒂夫·麥卡羅爾
- 馬克·麥卡錫
- 雅各布·麥考利
- 德莫特·麥戈文
- 露絲·麥克弗森
- 詹姆斯·梅格斯
- 奧勒·梅蘭德
- 黛博拉·邁耶斯
- 莉莉·米蘭尼
- 布拉克斯頓·米切爾
- 阿莉婭·納赫德
- 薩曼·納扎里安
- 本·尼爾
- 彼得·尼爾森
- 邁克爾·奧多諾萬(wàn)
- 岡田?;?/li>
- 多斯特·奧古爾
- 洛雷納·奧羅茲科
- 歐文
- 科林·帕爾默
- 阿爾諾·帕洛蒂
- 金如此公園
- 卡洛斯·帕托
- 安·普爾弗
- 丹·拉德
- 納茲寧·拉赫曼
- 亞歷克斯·雷納
- 安妮·雷姆斯
- 斯蒂芬·里奇
- 約翰·里奧
- 薩穆利·里帕蒂
- 丹·羅登
- 杰羅姆一地
- 丹麥人薩利赫
- 維克科·薩洛馬
- 尼羅什·薩馬尼
- 耶利米·沙夫
- 赫里伯特·舒克特
- 斯瓦蒂·沙阿
- 摩爾鞋匠
- 大雄
- 埃德溫·西爾弗曼
- 帕梅拉·斯克拉
- 古斯塔夫·史密斯
- 希爾卡·索伊寧
- 哈利·索科爾
- 蒂姆·斯佩克特
- 內(nèi)森·斯蒂齊爾
- 帕特里克·沙利文
- 賈納·蘇維薩里
- 肯特·泰勒
- 葉英德
- 圖奧米·蒂納馬亞
- 明翠
- 丹·特納
- 特蕾莎·圖西·盧納
- 伊爾基·瓦爾蒂亞寧
- 馬奎斯·沃特
- 詹姆斯·沃
- 休·沃特金斯
- 沖洗韋斯瑪
- 邁婭·韋斯曼
- 詹姆斯·威爾遜
- 拉姆尼克·澤維爾
貢獻(xiàn)項(xiàng)目
- 1000 個(gè)基因組
- 1958年 出生
- 非裔美國(guó)人冠狀動(dòng)脈鈣化項(xiàng)目(AACAC)
- 阿爾斯根
- 阿爾茨海默病測(cè)序項(xiàng)目(ADSP)
-
心房顫動(dòng)遺傳學(xué)聯(lián)合會(huì)(AFGen)
- 杜克導(dǎo)管遺傳學(xué)(CATHGEN)
- 孟加拉國(guó)急性血管事件風(fēng)險(xiǎn)(BRAVE)研究
- 生物群系生物庫(kù)
- 保加利亞三重奏
- 慢性阻塞性肺病基因
- 愛沙尼亞基因組中心,塔爾圖大學(xué)
- 芬蘭-美國(guó)對(duì)NIDDM遺傳學(xué)(FUSION)的調(diào)查
- 芬蘭偏頭痛研究
- 芬蘭雙隊(duì)列研究
- 芬恩-阿德根
- 芬里斯克
- 弗雷明厄姆心臟研究
- 阿米什人心肌健康遺傳學(xué)
- 魁北克省格諾梅 - 吉尼松生物銀行
- 基因組精神病學(xué)同
- 轉(zhuǎn)到 2d
- 基因型-組織表達(dá)項(xiàng)目(GTEx)
- Health2000
- 人類基因組多樣性項(xiàng)目
-
炎癥性腸病:
- 1000IBD 項(xiàng)目
- 芬蘭赫爾辛基大學(xué)醫(yī)院
- NIDDK IBD遺傳學(xué)聯(lián)合會(huì)
- 魁北克IBD遺傳學(xué)聯(lián)合會(huì)
- 杰克遜心臟研究
- 猶太基因組計(jì)劃 - 由博尼·奧拉姆資助
- 庫(kù)奧皮奧老年癡呆癥研究
- 生命線同軸
- 肺組織研究聯(lián)合會(huì)
- 麥克萊恩神經(jīng)精神病研究項(xiàng)目,精神病科
- 梅斯塔
- 男性的代謝綜合癥(METSIM)
- 動(dòng)脈硬化的多民族研究
-
心肌梗塞遺傳學(xué)聯(lián)合會(huì)(MIGen):
- 萊斯特 Exome Seq
- 北德MI研究
- 渥太華基因組學(xué)心臟研究
- 巴基斯坦心肌梗塞研究(PROMIS)
- 早熟冠狀動(dòng)脈疾病研究(PROCARDIS)
- 書記官長(zhǎng)吉羅尼·德爾·科爾(REGICOR)
- 南德軍情研究
- 康復(fù)變化:性別對(duì)年輕AMI患者結(jié)果的作用(VIRGO)
- 國(guó)家精神衛(wèi)生研究所(NIMH)控制
- 恩赫格里 · Ccdg
- NHLBI-GO 外顯組測(cè)序項(xiàng)目 (ESP)
- Nhlbi 上衣
- 大阪大學(xué)醫(yī)學(xué)研究生院
- 使用基因組學(xué)和流行病學(xué) (PAGE) 聯(lián)盟的人口結(jié)構(gòu)
- 普利茲克神經(jīng)精神病研究聯(lián)盟
- 來自臺(tái)灣的精神分裂癥三重奏
- 測(cè)序倡議蘇米(SiSu)
- 西格瑪-T2D
- 慢性阻塞性肺病研究中的亞人口和中間結(jié)果措施(SPIROMICS)
- 瑞典精神分裂癥與雙極性研究
-
T2D 基因
- 戈達(dá)茨
- T2D 搜索
- 癌癥基因組圖譜(TCGA)
- 精神疾病全基因組測(cè)序(WGSPD)
- 婦女健康倡議
數(shù)據(jù)生成
- 埃里克·班克斯
- 路易斯·貝爾格爾森
- 克里斯蒂安·西布爾斯基斯
- 米格爾·科瓦魯比亞斯
- 約西·法瓊
- 勞拉·高蒂爾
- 杰夫·根特
- 蒂博·讓德
- 黛安·卡普蘭
- 特雷文·蘭斯福德
- 克里斯托弗·蘭瓦恩
- 魯奇·蒙希
- 薩姆·諾沃德
- 尼科爾·彼得里略
- 大衛(wèi)·羅森
- 瓦倫丁·魯阿諾-魯比奧
- 納雷·薩哈基安
- 梅根·尚德
- 喬恩·史密斯
- 何塞·索托
- 凱瑟琳·蒂貝茨
- 夏洛特·多洛寧
- 戈登·韋德
結(jié)構(gòu)變化
- 瑞安·柯林斯
- 哈里森品牌
- 邁克爾·塔科夫斯基
- 埃里克·班克斯
- Ted 布魯金斯
- 洛朗·弗蘭喬利
- 傅杰
- 勞拉·高蒂爾
- 康拉德·卡爾切夫斯基
- 切爾西 · 洛瑟
- 湯姆·里昂斯
- 薩姆·諾沃德
- 特德·夏普
- 馬修·所羅門森
- 戈登·韋德
- 馬克·沃克
- 哈羅德·王
- 尼克·瓦茨
- 克里斯托弗·惠蘭
- 趙雪芳
線粒體變異
- 埃里克·班克斯
- 大衛(wèi)·本杰明
- 莎拉·卡爾沃
- 詹姆斯·埃默里
- 基蘭·加里梅拉
- 勞拉·高蒂爾
- 安德里亞·海斯利
- 妮可湖
- 克里斯汀·拉里奇亞
- 蒙科爾·萊克
- 丹尼爾·麥克阿瑟
- 瓦姆西·穆塔
- 塞巴斯蒂安·舍恩赫爾
- 梅根·尚德
- 何塞·索托
- 格蕾絲·蒂奧
- 尼克·瓦茨
廣泛的基因組學(xué)平臺(tái)
- 克里斯汀·康諾利
- 史蒂文·費(fèi)雷拉
- 史黛西·加布里埃爾
倫理
- 史黛西·唐納利
- 南拉塔·古普塔
- 艾米莉·利普斯科姆
- 安德里亞·薩爾茨曼
- 莫莉·施萊歇爾
生產(chǎn)和分析
- 伊琳娜·阿曼
- 瑞安·柯林斯
- 凱瑟琳·趙
- 貝麗爾·卡明斯
- 馬克·戴利
- 埃萊娜英格蘭
- 艾米莉·埃文格利斯塔
- 洛朗·弗蘭喬利
- 朱莉婭·古德里奇
- 勞拉·高蒂爾
- 康拉德·卡爾切夫斯基
- 克里斯汀·拉里奇亞
- 蒙科爾·萊克
- 埃里克·米尼克爾
- 本·尼爾
- 安妮·奧唐納-盧里亞
- 威廉·普
- 蒂姆·波瑟巴
- 丹·羅茲
- 凱特琳·薩莫查
- 埃莉諾·西比
- 棉花種子
- 莫里爾·辛格-伯克
- 雷切爾·兒子
- 格蕾絲·蒂奧
- 克里斯·維塔爾
- 王阿庫(kù)魯斯
- 王慶波
- 詹姆斯·沃
- 尼古拉·惠芬
- 邁克·威爾遜
協(xié)調(diào)
- 杰西卡·阿爾法爾迪
- 薩曼莎·巴克斯特
- 西尼亞德·查普曼
- 克里斯蒂娜·史蒂文斯
- 凱特·塔拉索娃
網(wǎng)站
- 康拉德·卡爾切夫斯基
- 馬修·所羅門森
- 尼克·瓦茨
- 本·韋斯伯德
指導(dǎo)委員會(huì)
- 馬克·戴利
- 海蒂·雷姆
- 薩曼莎·巴克斯特
- 康拉德·卡爾切夫斯基
- 丹尼爾·麥克阿瑟
- 本·尼爾
- 安妮·奧唐納-盧里亞
- 馬修·所羅門森
- 邁克·塔科夫斯基
- 凱特·塔拉索娃
- 格蕾絲·蒂奧
資金
-
NIGMS R01 GM104371
(PI: 麥克阿瑟) -
NIDDK U54 DK105566
(皮:麥克阿瑟和尼爾) -
NHGRI U24 HG010262
(PI: 菲利普帕基斯) -
尼姆 R56 MH115957
(PI: Talkowski) -
NHLBI R01 HL143295
(PI: 綠色) -
威康信托 WT200990/Z/16/Z
(PI: 伯尼) - 比奧馬林
- 賽諾菲-根齊姆
用于生成此呼叫集的絕大多數(shù)數(shù)據(jù)存儲(chǔ)、計(jì)算資源和人力工作是由 Broad 研究所捐贈(zèng)的
(責(zé)任編輯:佳學(xué)基因)