1. 日本VA视频,综合福利导航,麻豆熟妇乱妇熟色A片在线看,你懂的国产在线,97香蕉久久国产超碰青草专区,狼友福利在线,久久99免费麻辣视频,影音先锋成人网站
          English | 中文版 | 手機(jī)版 企業(yè)登錄 | 個(gè)人登錄 | 郵件訂閱
          當(dāng)前位置 > 首頁(yè) > 技術(shù)文章 > 如何從數(shù)據(jù)庫(kù)挖掘基因并篩選 TagSNP(醫(yī)學(xué)篇)

          如何從數(shù)據(jù)庫(kù)挖掘基因并篩選 TagSNP(醫(yī)學(xué)篇)

          瀏覽次數(shù):2599 發(fā)布日期:2024-8-4  來(lái)源:公眾號(hào)

          在人醫(yī)學(xué)遺傳學(xué)研究中,SNP 與疾病相關(guān)性一直是廣泛的研究課題。很多人在剛開始接觸課題,在沒(méi)有前期研究基礎(chǔ)指示的目的基因時(shí),都會(huì)選擇從公共數(shù)據(jù)庫(kù)中尋找與疾病相關(guān)的基因或者SNP進(jìn)行研究。本文小編帶你學(xué)習(xí)如何從數(shù)據(jù)庫(kù)中挖掘基因,并聚焦疾病相關(guān)的重要通路。

          技術(shù)路線

          1.疾病/復(fù)雜性狀相關(guān)數(shù)據(jù)庫(kù)

          百度搜索可以獲得很多人疾病相關(guān)數(shù)據(jù)庫(kù)的使用說(shuō)明,在此不再贅述。我們常用的人類疾病數(shù)據(jù)庫(kù)是 DisGeNET(https://www.disgenet.org/search ),常用 GWAS 數(shù)據(jù)庫(kù)是 EMBL-EBI  GWAS catalog(https://www.ebi.ac.uk/gwas/ )。

          2.疾病相關(guān)最全基因 list

          通過(guò)數(shù)據(jù)庫(kù)下載疾病相關(guān)基因列表;相關(guān) SNP 也可以在 VEP 在線注釋工具(http://asia.ensembl.org/Multi/Tools/VEP )注釋其所在的基因。將兩部分基因合并,獲得基本相關(guān)較為全面的基因列表。

          3.富集分析----聚焦疾病/復(fù)雜性狀相關(guān)通路

          富集分析使用 R 語(yǔ)言的 clusterProfiler 程序包。即使不會(huì) R 語(yǔ)言,不懂編程,一樣可以完成分析。

          安裝 R
          百度搜索 R,找到合適的下載源;也可直接點(diǎn)擊鏈接https://cran.dcc.uchile.cl/,選擇合適的版本下載。

          #設(shè)置工作目錄
          運(yùn)行 R 后,在《文件》菜單下選擇《改變工作目錄》;
          將基因名替換好以后,直接復(fù)制下列代碼到 R,回車運(yùn)行即可,除此之外可以不做任何改動(dòng)。如果已經(jīng)安裝 clusterProfiler 程序包,請(qǐng)從基因編號(hào)轉(zhuǎn)換開始。

          #安裝 clusterProfiler 程序包,此種安裝方法適合 R3.5.2 及以下版本,R3.6.0 以上版本請(qǐng)參考文后補(bǔ)充說(shuō)明。
          source("https://bioconductor.org/biocLite.R")
          biocLite("clusterProfiler")

          #安裝 KEGG.db
          biocLite("kegg.db")

          #安裝人 org.db 數(shù)據(jù)庫(kù)
          biocLite(“org.Hs.eg.db”)

          #基因編號(hào)轉(zhuǎn)換

          #將基因名稱列表復(fù)制給(或者任何你喜歡的文件名),如需分析自己特定的基因集,可替換括號(hào)內(nèi)容,每個(gè)基因名稱,用””,隔開。
          library(clusterProfiler)
          yh <- c("GPX3",  "GLRX",   "LBP",   "CRYAB", "DEFB1", "HCLS1",   "SOD2",   "HSPA2",
                 "ORM1",  "IGFBP1", "PTHLH", "GPC3",  "IGFBP3","TOB1",    "MITF",   "NDRG1",       "NR1H4", "FGFR3", "PVR", "IL6", "PTPRM", "ERBB2",   "NID2",   "LAMB1",       "COMP",  "PLS3",   "MCAM",  "SPP1",  "LAMC1", "COL4A2", "COL4A1", "MYOC",       "ANXA4", "TFPI2",  "CST6",  "SLPI",  "TIMP2", "CPM",     "GGT1",   "NNMT",       "MAL",   "EEF1A2", "HGD",   "TCN2",  "CDA",   "PCCA",    "CRYM",   "PDXK",       "STC1",  "WARS",  "HMOX1", "FXYD2", "RBP4",   "SLC6A12", "KDELR3", "ITM2B")

          #利用 cluterProfiler 內(nèi)置的 bitr 函數(shù)進(jìn)行基因編號(hào)轉(zhuǎn)換,并將轉(zhuǎn)換后的信息存儲(chǔ)在 gene 文件中
          gene <- bitr(yh, fromType="SYMBOL", toType=c("ENTREZID"), OrgDb="org.Hs.eg.db")
          head(gene)

          ##提取 gene 數(shù)據(jù)中的 ENTREZID 列,并賦值給 DE_list
          DE_list <- gene$ENTREZID

          #去除重復(fù)值
          DE_list[duplicated(DE_list)]
          integer(0)

          #調(diào)用 org.Hs.eg.db,并查看文件的各列名稱信息
          library(org.Hs.eg.db)
          columns(org.Hs.eg.db)

          #GO_MF 富集,基于基因數(shù)目,如果使用的是個(gè)人電腦,配置不高,為防止程序卡死,建議 MF\CC\BP 單個(gè)來(lái)運(yùn)行,生成的圖片也逐個(gè)生成保存后再運(yùn)行下一個(gè)。
          MF <- enrichGO(gene          = DE_list, #差異基因 vector
                          keyType       ="ENTREZID",
          OrgDb         = org.Hs.eg.db, #對(duì)應(yīng)的OrgDb
                          ont           = "MF", #GO 分類名稱,CC BP MF
                          pAdjustMethod = "BH", #Pvalue 矯正方法
                          pvalueCutoff  = 0.05, #Pvalue 閾值
                          qvalueCutoff  = 0.05, #qvalue 閾值
                          readable      = TRUE) #TRUE 則展示SYMBOL,F(xiàn)ALSE 則展示原來(lái)的ID

          #將 MF 對(duì)象轉(zhuǎn)換為 dataframe,新版本可以用 as.data.frame(MF)
          MF_results<-summary(MF)
          #生成 barplot PDF 格式,x 軸為 GeneRatio,展示前 20 富集的 GO,數(shù)字可以調(diào)整
          pdf(file = "MF_barplot.pdf")
          barplot(MF, showCategory=20, x = "GeneRatio")
          dev.off()

          #生成 MF 氣泡圖
          dotplot(MF)

          #GO_CC 富集,基于基因數(shù)目
          CC <- enrichGO(gene          = DE_list, #差異基因 vector
                          keyType       ="ENTREZID",
          OrgDb         = org.Hs.eg.db, #對(duì)應(yīng)的OrgDb
                          ont           = "CC", #GO 分類名稱,CC BP MF
                          pAdjustMethod = "BH", #Pvalue 矯正方法
                          pvalueCutoff  = 0.05, #Pvalue 閾值
                          qvalueCutoff  = 0.05, #qvalue 閾值
                          readable      = TRUE) #TRUE 則展示SYMBOL,F(xiàn)ALSE 則展示原來(lái)的ID

          #將 CC 對(duì)象轉(zhuǎn)換為 dataframe,新版本可以用 as.data.frame(CC)
          CC_results<-summary(CC)

          #生成 barplot PDF 格式,x 軸為 GeneRatio,展示前 20 富集的 GO,數(shù)字可調(diào)整
          pdf(file = "CC_barplot.pdf")
          barplot(CC, showCategory=20, x = "GeneRatio")
          dev.off()

          #生成 CC 氣泡圖
          dotplot(CC)

          #GO_BP 富集,基于基因數(shù)目
          BP <- enrichGO(gene          = DE_list, #差異基因 vector
                          keyType       ="ENTREZID",
          OrgDb         = org.Hs.eg.db, #對(duì)應(yīng)的OrgDb
                          ont           = "BP", #GO 分類名稱,CC BP MF
                          pAdjustMethod = "BH", #Pvalue 矯正方法
                          pvalueCutoff  = 0.05, #Pvalue 閾值
                          qvalueCutoff  = 0.05, #qvalue 閾值
                          readable      = TRUE) #TRUE 則展示SYMBOL,F(xiàn)ALSE 則展示原來(lái)的ID

          #將 BP 對(duì)象轉(zhuǎn)換為 dataframe,新版本可以用 as.data.frame(BP)
          BP_results<-summary(BP)

          #生成 barplot PDF 格式,x 軸為 GeneRatio,展示前 20 富集的 GO,數(shù)字可調(diào)整
          pdf(file = "BP_barplot.pdf")
          barplot(BP, showCategory=20, x = "GeneRatio")
          dev.off()

          #生成 BP 氣泡圖
          dotplot(BP)

          #KEGG pathway 富集
          ekp <- enrichKEGG(gene         = DE_list,
                           keyType = "kegg",
                           organism     = 'hsa',
                           pvalueCutoff = 0.05)
          ekp_results <- summary(ekp)

          #生成 KEGG 富集分析的 barplot 圖,數(shù)字可調(diào)整
          barplot(ekp, showCategory=20, x = "GeneRatio")

          #生成氣泡圖
          dotplot(ekp)

          #基因和富集排名第 1 的pathway對(duì)應(yīng)關(guān)系
          cnetplot(ekp, showCategory = 1)

          #輸出 pathway 富集結(jié)果,可以用 excel 打開查看
          write.table(ekp, file = "ekp.txt",
                        sep = "\t", quote = F, row.names = T)

          #查看通路
          browseKEGG(ekp,'hsa04512')

          過(guò)程文件展示

          MF_barplot

          MF_dotplot

          KEGG_barplot

          KEGG_dotplot

          KEGG enrichment pathway browse


          補(bǔ)充說(shuō)明

          #R3.6.0 以上版本安裝方法不同于 R3.5.2 及以下版本,biocManager 安裝方法如下:
          If(!requireNamespace(「BiocManager」,quietly=TRUE))
          Install.packages(「BiocManager」)
          BiocManager::install(「clusterProfiler」,version = 「3.8」)
          發(fā)布者:上海翼和應(yīng)用生物技術(shù)有限公司
          聯(lián)系電話:021-33559491
          E-mail:jiyn@biowing.com.cn

          用戶名: 密碼: 匿名 快速注冊(cè) 忘記密碼
          評(píng)論只代表網(wǎng)友觀點(diǎn),不代表本站觀點(diǎn)。 請(qǐng)輸入驗(yàn)證碼: 8795
          Copyright(C) 1998-2025 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com
          主站蜘蛛池模板: 国产一区二区亚洲一区二区三区 | 精品久久久久久无码中文野结衣| 九一看片| 亚洲激情综合| 99久久精品国产一区二区暴力| 久久精品中文字幕有码| 亚欧美国产色| 泸溪县| 婷婷色六月| 亚洲中文字幕在线观看| 狠狠色噜噜狠狠狠狠2021| 69久久精品无码一区二区| 白嫩少妇激情无码| 日本真人做爰免费视频120秒| 大理市| 熟女丝袜逼| 男女啪啪高潮激烈免费版| 久久夜夜免费视频| 熟女毛多熟妇人妻在线视频| 国内精品久久久久精免费| 使劲快高潮了国语对白在线| 亚洲精品A| www.av小说| 讷河市| 国产igao| 亚洲五月婷婷| 日本无码中出| 小鸡入水蜜桃免费观看电视剧| 久久一日本道色综合久久| 足交在线观看| 精品亚洲一区二区三区在线观看| 国产真人性做爰久久网站| 国产精品无码久久久久| 九九中文视频| 人伦中文字幕| 贺兰县| 91人妻无码成人精品一区91| 欧美交a欧美精品喷水| 国产日韩成人内射视频| 在线天堂中文www官网| 亚洲精品成人AV无码|