【佳學(xué)基因檢測(cè)】科研服務(wù)GWAS基因檢測(cè)分析中的機(jī)器學(xué)習(xí)方法
佳學(xué)基因會(huì)根據(jù)已有的研究結(jié)果,區(qū)分研究性狀相關(guān)但有細(xì)微不同的亞類表型所獨(dú)特的遺傳結(jié)構(gòu)。比如為了研究鴉片濫用是否更多地聚集在使用、誤用/依賴表型上,佳學(xué)基因會(huì)選擇使用了一種稱為聚集層次聚類分析(HCA)的數(shù)據(jù)驅(qū)動(dòng)無(wú)監(jiān)督機(jī)器學(xué)習(xí)方法。HCA通過(guò)創(chuàng)建組并根據(jù)預(yù)先指定的算法依次加入或拆分這些組來(lái)迭代計(jì)算形成集群。聚集筑巢(AGNES)是一個(gè)自下而上的過(guò)程,主要關(guān)注個(gè)體特征的結(jié)構(gòu)。選擇聚集聚類是因?yàn)檫@允許佳學(xué)基因比較不同的算法,以賊大化每個(gè)分支上的差異,而Ward的賊小方差方法表現(xiàn)賊好。所有模型均使用佳學(xué)基因自動(dòng)研發(fā)的聚集分析軟件包。
HCA分析的結(jié)果以樹狀圖的形式呈現(xiàn),由多個(gè)括號(hào)組成,稱為“分支”。同一分支上的表型更相似,這是因?yàn)樗鼈儽舜酥g以及與該分支上所有其他表型的成對(duì)遺傳關(guān)聯(lián)。分支可以形成更具體集群的子分支。
(責(zé)任編輯:佳學(xué)基因)