作為一個(gè)科技服務(wù)工作者,自然能夠明白每一位老師的痛處和難點(diǎn),不過(guò)現(xiàn)在都2020年了,再也不是一個(gè)轉(zhuǎn)錄組1萬(wàn)元的天價(jià)了,那么現(xiàn)在從原始的測(cè)序數(shù)據(jù)到數(shù)據(jù)挖掘直至最后完美的SCI論文圖表,究竟是怎么出來(lái)呢?
雖然君子遠(yuǎn)庖廚,不過(guò)今天小編將為您帶進(jìn)后廚,為您娓娓道來(lái)。
任務(wù)提交后,根據(jù)樣本數(shù)據(jù)量,一般24-48h左右大家就可以看到一份完整的分析結(jié)題報(bào)告和分析數(shù)據(jù)了。
講到這里可能有人會(huì)問(wèn):難道就這么簡(jiǎn)單?那人家好幾篇文章里面那些高大上的圖片都是大神用小工具做的嗎,小編可以負(fù)責(zé)任的告訴你們,不是的!我們還有很多隱藏功能:
第一:基因檢索。(小編選的蛋白是PPR蛋白,從4萬(wàn)多基因里面篩選出來(lái)60個(gè)PPR蛋白相關(guān)的基因,然后根據(jù)60個(gè)基因做GO分類圖)。
第二:WGCNA分析。這個(gè)分析主要是將基因模塊與表型數(shù)據(jù)或者表型樣本進(jìn)行關(guān)聯(lián),從而快速的鎖定一批候選基因。
運(yùn)行后打開(kāi)是下圖這樣的,對(duì)此圖有疑惑的可以點(diǎn)擊圖片左側(cè)的攝像頭。
第三:最近很火的差異基因表達(dá)趨勢(shì)分析
第四:108款分析繪圖工具(73款常用工具免費(fèi)使用)。
具體這些工具如何使用?百邁客云還有哪些隱藏功能呢?歡迎大家持續(xù)關(guān)注,小編會(huì)定期為大家進(jìn)行分享。
]]>
下載谷歌瀏覽器,輸入網(wǎng)址https://international.biocloud.net/zh/user/login?,進(jìn)入百邁客云平臺(tái)登錄界面,輸入賬號(hào)密碼登錄。賬號(hào)為手機(jī)號(hào)或者是郵箱,初始密碼為123.bmk.
百邁客云包含農(nóng)學(xué)和醫(yī)學(xué)兩大類分析平臺(tái),醫(yī)學(xué)分析平臺(tái)主要針對(duì)人、鼠數(shù)據(jù)的分析,包含:轉(zhuǎn)錄組、非編碼RNA、單基因病外顯子、腫瘤外顯子、重測(cè)序等數(shù)據(jù)分析,以及全轉(zhuǎn)錄組聯(lián)合分析;農(nóng)學(xué)分析平臺(tái)可以應(yīng)用到更多的物種,涵蓋轉(zhuǎn)錄組、非編碼RNA、微生物、蛋白、代謝等數(shù)據(jù)的分析,以及全轉(zhuǎn)錄組聯(lián)合分析等。點(diǎn)擊左側(cè)導(dǎo)航分析->農(nóng)學(xué)或者醫(yī)學(xué)打開(kāi)分析平臺(tái)列表頁(yè)面,點(diǎn)擊選擇您想要使用的分析平臺(tái),打開(kāi)其詳細(xì)介紹頁(yè)面,該頁(yè)面可以看到該平臺(tái)的應(yīng)用領(lǐng)域“平臺(tái)介紹“技術(shù)背景“案例“課堂“版本記錄,點(diǎn)擊打開(kāi)軟件即可進(jìn)入到參數(shù)頁(yè)面。
為了方便數(shù)據(jù)、任務(wù)和報(bào)告的管理,我們將同屬于一個(gè)項(xiàng)目的內(nèi)容會(huì)放到一個(gè)項(xiàng)目中,因此進(jìn)行基本分析時(shí)需要先選擇一個(gè)項(xiàng)目,如果沒(méi)有項(xiàng)目也可以點(diǎn)擊+新建先創(chuàng)建一個(gè)項(xiàng)目,見(jiàn)下圖。
導(dǎo)入數(shù)據(jù)之后,可以根據(jù)自己的需要修改樣品ID,由于此處設(shè)置的ID會(huì)體現(xiàn)在分析報(bào)告和分析結(jié)果中,因此請(qǐng)慎重考慮后再設(shè)置,分析完成后不可再次修改。如果平臺(tái)上還沒(méi)有您自己的數(shù)據(jù),請(qǐng)參考數(shù)據(jù)上傳先將您的數(shù)據(jù)傳到云平臺(tái)上。
轉(zhuǎn)錄組組裝方式?jīng)Q定了后續(xù)Unigenes庫(kù)的構(gòu)建和表達(dá)定量的策略以及分析結(jié)果的可靠性.根據(jù)實(shí)際情況選擇轉(zhuǎn)錄組組裝方式。分開(kāi)組裝是對(duì)每個(gè)樣品數(shù)據(jù)單 獨(dú)組裝;合并組裝是將所有樣品放在一起組裝;分組組裝適合于不同品種(或者是變異種)的組裝,將相同品種的樣品合并組裝,然后將每組的組裝結(jié)果 進(jìn)行合并去冗余。合并組裝獲得的Unigene庫(kù)更完整、冗余度更低,因此Trinity官方亦推薦使用合并組裝,以便進(jìn)行后續(xù)的表達(dá)定量和差異表達(dá)分析.
為了提高注釋分析的效率(縮短比對(duì)比對(duì)時(shí)間)以及獲得有效的注釋信息,在選擇注釋物種時(shí),應(yīng)盡量選擇包含物種最確切的數(shù)據(jù)庫(kù).(如果分析物種為真菌類,一定要選擇真菌選項(xiàng),否則會(huì)影響組裝效果)
根據(jù)實(shí)驗(yàn)方案設(shè)計(jì)以及樣品信息,進(jìn)行分組的設(shè)置,流程據(jù)此進(jìn)行差異比較分析,此處只支持兩組間比較,可添加多個(gè)差異分組。FDR值一般推薦選擇0.01,差異倍數(shù)閾值一般推薦選擇(此處的參數(shù)和差異分組在后期報(bào)告?zhèn)€性化中可再次進(jìn)行修改)
下載谷歌瀏覽器,輸入網(wǎng)址https://international.biocloud.net/zh/user/login?,進(jìn)入百邁客云平臺(tái)登錄界面,輸入賬號(hào)密碼登錄。賬號(hào)為手機(jī)號(hào)或者是郵箱,初始密碼為123.bmk.
百邁客云包含農(nóng)學(xué)和醫(yī)學(xué)兩大類分析平臺(tái),醫(yī)學(xué)分析平臺(tái)主要針對(duì)人、鼠數(shù)據(jù)的分析,包含:轉(zhuǎn)錄組、非編碼RNA、單基因病外顯子、腫瘤外顯子、重測(cè)序等數(shù)據(jù)分析,以及全轉(zhuǎn)錄組聯(lián)合分析;農(nóng)學(xué)分析平臺(tái)可以應(yīng)用到更多的物種,涵蓋轉(zhuǎn)錄組、非編碼RNA、微生物、蛋白、代謝等數(shù)據(jù)的分析,以及全轉(zhuǎn)錄組聯(lián)合分析等。點(diǎn)擊左側(cè)導(dǎo)航分析->農(nóng)學(xué)或者醫(yī)學(xué)打開(kāi)分析平臺(tái)列表頁(yè)面,點(diǎn)擊選擇您想要使用的分析平臺(tái),打開(kāi)其詳細(xì)介紹頁(yè)面,該頁(yè)面可以看到該平臺(tái)的應(yīng)用領(lǐng)域“平臺(tái)介紹“技術(shù)背景“案例“課堂“版本記錄,點(diǎn)擊打開(kāi)軟件即可進(jìn)入到參數(shù)頁(yè)面。
為了方便數(shù)據(jù)、任務(wù)和報(bào)告的管理,我們將同屬于一個(gè)項(xiàng)目的內(nèi)容會(huì)放到一個(gè)項(xiàng)目中,因此進(jìn)行基本分析時(shí)需要先選擇一個(gè)項(xiàng)目,如果沒(méi)有項(xiàng)目也可以點(diǎn)擊+新建先創(chuàng)建一個(gè)項(xiàng)目,見(jiàn)下圖。
為了方便后面的聯(lián)合分析內(nèi)容,需要將各RNA項(xiàng)目里的數(shù)據(jù)按照對(duì)應(yīng)關(guān)系統(tǒng)一編號(hào),有幾組對(duì)應(yīng)關(guān)系則在左側(cè)添加幾組,再?gòu)挠覀?cè)的lncRNA樣品池和miRNA樣品池中選擇對(duì)應(yīng)的樣本添加到分組。其中默認(rèn)按鈕可以按照數(shù)字的順序快速添加對(duì)應(yīng)關(guān)系。
Lib_type為窗體頂端
根據(jù)實(shí)驗(yàn)方案設(shè)計(jì)以及樣品信息,進(jìn)行分組的設(shè)置,流程據(jù)此進(jìn)行差異比較分析,此處只支持兩組間比較,可添加多個(gè)差異分組。
DEseq2軟件適用于有生物學(xué)重復(fù)的項(xiàng)目,edgeR適用于無(wú)生物學(xué)重復(fù)的項(xiàng)目,選擇第一個(gè),系統(tǒng)會(huì)自動(dòng)識(shí)別項(xiàng)目類型選擇對(duì)應(yīng)的軟件
點(diǎn)擊報(bào)告右上角的項(xiàng)目結(jié)果下載,可以選擇下載HTML報(bào)告、PDF報(bào)告和結(jié)果數(shù)據(jù)(尾款結(jié)清后)。HTML報(bào)告只包括分析報(bào)告的html文件及一個(gè)src文件夾,展示了部分結(jié)果;PDF報(bào)告是根據(jù)HTML報(bào)告轉(zhuǎn)換而來(lái),方便您進(jìn)行報(bào)告打??;結(jié)果數(shù)據(jù)包含了項(xiàng)目中所有結(jié)果文件,一般比較大,會(huì)通過(guò)FTP進(jìn)行下載
下載谷歌瀏覽器,輸入網(wǎng)址https://international.biocloud.net/zh/user/login?,進(jìn)入百邁客云平臺(tái)登錄界面,輸入賬號(hào)密碼登錄。賬號(hào)為手機(jī)號(hào)或者是郵箱,初始密碼為123.bmk.
百邁客云包含農(nóng)學(xué)和醫(yī)學(xué)兩大類分析平臺(tái),醫(yī)學(xué)分析平臺(tái)主要針對(duì)人、鼠數(shù)據(jù)的分析,包含:轉(zhuǎn)錄組、非編碼RNA、單基因病外顯子、腫瘤外顯子、重測(cè)序等數(shù)據(jù)分析,以及全轉(zhuǎn)錄組聯(lián)合分析;農(nóng)學(xué)分析平臺(tái)可以應(yīng)用到更多的物種,涵蓋轉(zhuǎn)錄組、非編碼RNA、微生物、蛋白、代謝等數(shù)據(jù)的分析,以及全轉(zhuǎn)錄組聯(lián)合分析等。點(diǎn)擊左側(cè)導(dǎo)航分析->農(nóng)學(xué)或者醫(yī)學(xué)打開(kāi)分析平臺(tái)列表頁(yè)面,點(diǎn)擊選擇您想要使用的分析平臺(tái),打開(kāi)其詳細(xì)介紹頁(yè)面,該頁(yè)面可以看到該平臺(tái)的應(yīng)用領(lǐng)域“平臺(tái)介紹“技術(shù)背景“案例“課堂“版本記錄,點(diǎn)擊打開(kāi)軟件即可進(jìn)入到參數(shù)頁(yè)面。
為了方便數(shù)據(jù)、任務(wù)和報(bào)告的管理,我們將同屬于一個(gè)項(xiàng)目的內(nèi)容會(huì)放到一個(gè)項(xiàng)目中,因此進(jìn)行基本分析時(shí)需要先選擇一個(gè)項(xiàng)目,如果沒(méi)有項(xiàng)目也可以點(diǎn)擊+新建先創(chuàng)建一個(gè)項(xiàng)目,見(jiàn)下圖。
根據(jù)實(shí)驗(yàn)方案設(shè)計(jì)以及樣品信息,進(jìn)行分組的設(shè)置,流程據(jù)此進(jìn)行差異比較分析,此處只支持兩組間比較,可添加多個(gè)差異分組。
根據(jù)實(shí)驗(yàn)方案設(shè)計(jì)以及樣品信息,進(jìn)行分組的設(shè)置,流程據(jù)此進(jìn)行差異比較分析,此處只支持兩組間比較,可添加多個(gè)差異分組。(此處的參數(shù)和差異分組在后期報(bào)告?zhèn)€性化中可再次進(jìn)行修改)
點(diǎn)擊報(bào)告右上角的項(xiàng)目結(jié)果下載,可以選擇下載HTML報(bào)告、PDF報(bào)告和結(jié)果數(shù)據(jù)(尾款結(jié)清后)。HTML報(bào)告只包括分析報(bào)告的html文件及一個(gè)src文件夾,展示了部分結(jié)果;PDF報(bào)告是根據(jù)HTML報(bào)告轉(zhuǎn)換而來(lái),方便您進(jìn)行報(bào)告打印;結(jié)果數(shù)據(jù)包含了項(xiàng)目中所有結(jié)果文件,一般比較大,會(huì)通過(guò)FTP進(jìn)行下載,請(qǐng)耐心等待下載。
]]>
下載谷歌瀏覽器,輸入網(wǎng)址https://international.biocloud.net/zh/user/login?,進(jìn)入百邁客云平臺(tái)登錄界面,輸入賬號(hào)密碼登錄。賬號(hào)為手機(jī)號(hào)或者是郵箱,初始密碼為123.bmk.
百邁客云包含農(nóng)學(xué)和醫(yī)學(xué)兩大類分析平臺(tái),醫(yī)學(xué)分析平臺(tái)主要針對(duì)人、鼠數(shù)據(jù)的分析,包含:轉(zhuǎn)錄組、非編碼RNA、單基因病外顯子、腫瘤外顯子、重測(cè)序等數(shù)據(jù)分析,以及全轉(zhuǎn)錄組聯(lián)合分析;農(nóng)學(xué)分析平臺(tái)可以應(yīng)用到更多的物種,涵蓋轉(zhuǎn)錄組、非編碼RNA、微生物、蛋白、代謝等數(shù)據(jù)的分析,以及全轉(zhuǎn)錄組聯(lián)合分析等。點(diǎn)擊左側(cè)導(dǎo)航分析->農(nóng)學(xué)或者醫(yī)學(xué)打開(kāi)分析平臺(tái)列表頁(yè)面,點(diǎn)擊選擇您想要使用的分析平臺(tái),打開(kāi)其詳細(xì)介紹頁(yè)面,該頁(yè)面可以看到該平臺(tái)的應(yīng)用領(lǐng)域“平臺(tái)介紹“技術(shù)背景“案例“課堂“版本記錄,點(diǎn)擊打開(kāi)軟件即可進(jìn)入到參數(shù)頁(yè)面。
為了方便數(shù)據(jù)、任務(wù)和報(bào)告的管理,我們將同屬于一個(gè)項(xiàng)目的內(nèi)容會(huì)放到一個(gè)項(xiàng)目中,因此進(jìn)行基本分析時(shí)需要先選擇一個(gè)項(xiàng)目,如果沒(méi)有項(xiàng)目也可以點(diǎn)擊+新建先創(chuàng)建一個(gè)項(xiàng)目,見(jiàn)下圖。
代謝定量文件:針對(duì)鑒定到的代謝物進(jìn)行定量的結(jié)果表格。制表符分隔的文本文件,第一列為代謝物ID,其他列為樣品的表達(dá)量。對(duì)格式不清楚的可點(diǎn)擊查看示例下載示例文件。(百邁客項(xiàng)目的結(jié)果文件會(huì)直接推送到客戶賬號(hào)下,文件夾名稱為合同編號(hào),可直接導(dǎo)入使用)
根據(jù)實(shí)驗(yàn)方案設(shè)計(jì)以及樣品信息,進(jìn)行分組的設(shè)置,流程據(jù)此進(jìn)行差異比較分析,此處只支持兩組間比較,可添加多個(gè)差異分組。
(其中vip值采用了正交偏最小二乘法判別分析(OPLS-DA),該分析會(huì)給每個(gè)代謝物一個(gè)變量投影重要度VIP值,值越大說(shuō)明代謝物的差異越顯著)
點(diǎn)擊報(bào)告右上角的項(xiàng)目結(jié)果下載,可以選擇下載HTML報(bào)告、PDF報(bào)告和結(jié)果數(shù)據(jù)(尾款結(jié)清后)。HTML報(bào)告只包括分析報(bào)告的html文件及一個(gè)src文件夾,展示了部分結(jié)果;PDF報(bào)告是根據(jù)HTML報(bào)告轉(zhuǎn)換而來(lái),方便您進(jìn)行報(bào)告打??;結(jié)果數(shù)據(jù)包含了項(xiàng)目中所有結(jié)果文件,一般比較大,會(huì)通過(guò)FTP進(jìn)行下載,請(qǐng)耐心等待下載。
]]>
Part 1?|?SRA數(shù)據(jù)庫(kù)介紹
SRA(Sequence Read Archive)是NCBI中專門用于存放原始高通量測(cè)序數(shù)據(jù)的一個(gè)子庫(kù),收錄了各種二代、三代測(cè)序儀產(chǎn)生的數(shù)據(jù),與ENA/EBI、DDBJ間共享原始測(cè)序數(shù)據(jù)。
INSDC(International Nucleotide Sequence Database Collaboration)成員間共享測(cè)序數(shù)據(jù)
有過(guò)數(shù)據(jù)上傳經(jīng)歷的童鞋應(yīng)該對(duì)SRA并不陌生,上傳數(shù)據(jù)前我們一般要?jiǎng)?chuàng)建BioProject、BioSample,用于詳細(xì)說(shuō)明項(xiàng)目信息、樣品信息;并通過(guò)SRA的Experiment、RUN描述建庫(kù)測(cè)序相關(guān)信息,如建庫(kù)類型、測(cè)序儀器、單雙端等;下圖概括出了幾者之間的關(guān)系。
https://www.ncbi.nlm.nih.gov/sra/docs/submitmeta/
SRA上傳和檢索數(shù)據(jù)時(shí),我們會(huì)遇到各種各樣的編號(hào),這些編號(hào)間的對(duì)應(yīng)關(guān)系通過(guò)下表我們可以理清。項(xiàng)目和樣品信息首先會(huì)存放在BioProject和BioSample數(shù)據(jù)庫(kù)中,得到類似PRJNA和SAMN的編號(hào);在SRA數(shù)據(jù)庫(kù)中也會(huì)對(duì)項(xiàng)目和樣品進(jìn)行編號(hào),分別以SRP和SRS作為前綴,并與BioProject和BioSample中對(duì)應(yīng);其余SR開(kāi)頭的編號(hào)都屬于SRA數(shù)據(jù)庫(kù)。
SRA數(shù)據(jù)庫(kù)中各種編號(hào)對(duì)應(yīng)表
SRA數(shù)據(jù)庫(kù)中存儲(chǔ)的是高度壓縮后的sra格式數(shù)據(jù),截止到目前,SRA中已經(jīng)累計(jì)存儲(chǔ)了超過(guò)20P堿基數(shù)據(jù),而且每年仍在以極快的速度增長(zhǎng)。
SRA數(shù)據(jù)量增長(zhǎng)圖(縱坐標(biāo)代表sra格式文件大小,單位TB;橫坐標(biāo)代表年;藍(lán)線代表總數(shù)據(jù)量)
Part 2?|?SRA數(shù)據(jù)庫(kù)中疾病相關(guān)數(shù)據(jù)統(tǒng)計(jì)
https://www.ncbi.nlm.nih.gov/sra/docs/
既然已經(jīng)有如此多的公共數(shù)據(jù),我們應(yīng)該充分挖掘,不僅可以產(chǎn)出新發(fā)現(xiàn),也可以有效降低科研成本。俗話說(shuō)的好,知己知彼,百戰(zhàn)不殆。要想充分利用這些公共數(shù)據(jù),我們首先需要對(duì)這些數(shù)據(jù)有更加深刻的認(rèn)識(shí),于是我們針對(duì)熱點(diǎn)研究疾病,統(tǒng)計(jì)了不同測(cè)序類型的數(shù)據(jù)量,以及項(xiàng)目數(shù)和樣品數(shù),想了解其他疾病數(shù)據(jù)量情況的童鞋可以文末留言,我們統(tǒng)計(jì)好之后發(fā)送給您。
熱點(diǎn)研究疾病數(shù)據(jù)統(tǒng)計(jì)(單位:Gbase)
熱點(diǎn)癌癥數(shù)據(jù)統(tǒng)計(jì)(單位:Gbase)
Part 3 |?公共數(shù)據(jù)使用策略
如此多的數(shù)據(jù),該怎樣去利用,我們整理了一些思路,供大家參考。
策略一:數(shù)據(jù)整合,增大樣本量
以研究疾病相關(guān)基因表達(dá)為例,可以整合多個(gè)項(xiàng)目中的RNA-Seq數(shù)據(jù)(也可以結(jié)合自己的數(shù)據(jù),增大樣本量),計(jì)算基因表達(dá)量,并篩選疾病組織和正常組織間差異表達(dá)的基因;
再針對(duì)差異表達(dá)基因進(jìn)行共表達(dá)分析,獲得共表達(dá)基因集;然后進(jìn)一步對(duì)這些基因的功能、所屬通路進(jìn)行分析,從而更完整的描述出疾病發(fā)生的機(jī)理。
策略二:多種疾病間橫向比較
以研究肺癌患者中S100A4基因的差異表達(dá)為例,通過(guò)下載其他類型癌癥如:胸腺癌、惡性間皮瘤的RNA-Seq數(shù)據(jù),并分析該基因在這兩種癌癥中的差異表達(dá)情況,如果與肺癌中有相同的差異表達(dá)趨勢(shì),則可以增強(qiáng)我們結(jié)論的說(shuō)服力。
策略三:不同水平間橫向比較
分析不同水平的數(shù)據(jù),如:細(xì)胞水平、組織水平、動(dòng)物模型上目標(biāo)基因的差異表達(dá)情況,增強(qiáng)分析結(jié)論的說(shuō)服力。
策略四:不同類型數(shù)據(jù)間聯(lián)合分析
我們只自測(cè)了mRNA數(shù)據(jù),但是想了解miRNA對(duì)于mRNA的調(diào)控,那我們可以下載對(duì)應(yīng)疾病的miRNA類型的數(shù)據(jù),通過(guò)兩者的聯(lián)合分析,更深入的了解疾病發(fā)生的機(jī)理。
Part 4 |?結(jié)語(yǔ)
公共數(shù)據(jù)使用看似很困難,需要下載、轉(zhuǎn)換格式、生信分析,目前百邁客云(www.dustyhill.net)已經(jīng)集成了SRA數(shù)據(jù)檢索、下載、轉(zhuǎn)換和分析,我們錄制了一個(gè)短視頻,展示了如何通過(guò)簡(jiǎn)單的鼠標(biāo)點(diǎn)擊高效完成以上所有工作,詳情:http://live.biocloud.net/open/course/10
參考文獻(xiàn):
[1]????Chun-Ping Yu et al.?Transcriptome dynamics of developing maize leaves andgenomewide prediction of cis elements and their cognate transcription factors.Proc Natl Acad Sci . 2015
[2]????Iyer MK et al. The landscape oflong noncoding RNAs in the human transcriptome. Nat Genet. 2015
[3]????Patil G. et al. Soybean(Glycine max) SWEET gene family: insights through comparative genomics,transcriptome profiling and whole genome re-sequence analysis. BMC Genomics.2015
[4]????Matthijs M. et al. Profiling ofthe Early Nitrogen Stress Response in the Diatom Phaeodactylum tricornutumReveals a Novel Family of RING-Domain Transcription Factors. Plant Physiol.2016
?
免費(fèi)贈(zèng)送云平臺(tái)使用權(quán)限
點(diǎn)擊下方按鈕,參與調(diào)查問(wèn)卷,獎(jiǎng)品可以任選其一:
獎(jiǎng)品一:免費(fèi)使用百邁客云專業(yè)版套餐中真核有參轉(zhuǎn)錄組分析平臺(tái)(單次可分析300Gbase)或小RNA分析平臺(tái)(單次可分析400Mreads)或外顯子分析平臺(tái)(單次可分析300Gbase)完成一次SRA數(shù)據(jù)分析。
獎(jiǎng)品二:開(kāi)通百邁客云所有工具(100+款)1個(gè)月免費(fèi)使用權(quán)限。
]]>
應(yīng)用場(chǎng)景:
使用矩陣數(shù)據(jù)文件進(jìn)行熱圖繪制,通常可以對(duì)矩陣數(shù)據(jù)進(jìn)行篩選,歸一化和聚類等處理,多用于不同樣品間基因表達(dá)水平聚類分析。主要應(yīng)用在真核有參轉(zhuǎn)錄組、真核無(wú)參轉(zhuǎn)錄組、微生物多樣性等數(shù)據(jù)分析中。
操作步驟:
登錄百邁客云首頁(yè)(www.dustyhill.net)——分析——工具——繪圖工具——熱圖
操作方法:
1. 輸入文件
(1)文件要求:文件內(nèi)容應(yīng)為制表符隔開(kāi)的文本文件,且大小不可超過(guò) 10M。默認(rèn)首行、首列為表頭,一般每列表示一個(gè)樣品,每行表示一個(gè)基因,也可統(tǒng)計(jì)其他含義的數(shù)據(jù)矩陣。除表頭外,參與統(tǒng)計(jì)繪圖的內(nèi)容應(yīng)為純數(shù)字,文件范例如下:
(2) 指定作圖列:可對(duì)指定列繪圖,如只對(duì)第 2 到第 5 列和第 10 列作圖,可輸入:“2-5,10”。若想按特定順序繪圖,需用逗號(hào)將繪圖列按序列出,并在下方參數(shù)中取消按列聚類,如“6,3,2,5,4”。
(3) 指定基因:可輸入基因列表文件,系統(tǒng)會(huì)自動(dòng)過(guò)濾空行或以#開(kāi)頭的行并提取第一列作為指定基因,結(jié)合上方輸入的矩陣文件進(jìn)行統(tǒng)計(jì)繪圖。
2. 參數(shù)設(shè)置
(1)配色方案:設(shè)置繪圖所采用的配色??梢赃x擇預(yù)制方案,也可以根據(jù)實(shí)際實(shí)際需要自定義配色方案。
(2) 對(duì)數(shù)取值:對(duì)文件數(shù)據(jù)取對(duì)數(shù)后再繪圖。取對(duì)數(shù)可以有效解決數(shù)據(jù)取值范圍過(guò)大導(dǎo)致的配色問(wèn)題。
(3) 歸一化:對(duì)行或列進(jìn)行歸一化處理??勺畲蟪潭鹊爻尸F(xiàn)每行或每列的變化信息,避免超高值掩蓋其他數(shù)據(jù)的變化。繪制基因表達(dá)量熱圖時(shí),常按基因歸一化。
(4) 聚類方案:可選擇是否按行、列聚類。若按特定樣本順序繪制熱圖,可取消按列聚類。
a行列顯示:可選擇是否顯示行、列 ID。
b 樣品、基因字號(hào):可調(diào)節(jié)行、列 ID 的字體大小。
3 注意事項(xiàng)
(1) 聚類分析涉及運(yùn)算分析,當(dāng)分析的基因數(shù)或樣品數(shù)較多時(shí),繪圖時(shí)間可能較長(zhǎng),請(qǐng)待任務(wù)完成后點(diǎn)擊預(yù)覽查看、調(diào)整圖片。
(2)如果選擇對(duì)數(shù)據(jù)取對(duì)數(shù),會(huì)自動(dòng)將取值為 0 的數(shù)據(jù)轉(zhuǎn)化為接近于 0 的小數(shù)。
4. 結(jié)果展示
(1) 繪圖結(jié)果:繪圖結(jié)果展示區(qū)為您展示初始或調(diào)整后的繪圖結(jié)果,同時(shí),可通過(guò)圖片區(qū)域的交互操作查看對(duì)應(yīng)的數(shù)據(jù)信息,如:
a 鼠標(biāo)懸停于圖中相應(yīng)數(shù)據(jù)格,可顯示其對(duì)應(yīng)的行名、列名和數(shù)值。
b 點(diǎn)擊圖中相應(yīng)的行名或列名,在“查看原數(shù)據(jù)”頁(yè)會(huì)高亮顯示對(duì)應(yīng)行或列。
c 選中行聚類樹(shù)某分枝后,可在“查看原數(shù)據(jù)”也篩選出對(duì)應(yīng)行并下載。
(2)全屏預(yù)覽:點(diǎn)擊圖片右上角的縮放按鈕,可全屏預(yù)覽繪圖結(jié)果。選中聚類樹(shù)某分枝后點(diǎn)擊縮放按鈕,可在全屏預(yù)覽時(shí)高亮對(duì)應(yīng)的分枝,以便盡快找到目標(biāo)區(qū)域。
(3)圖片下載:點(diǎn)擊預(yù)覽區(qū)右上角的“下載”按鈕,可保存 SVG 或 PNG 格式的繪圖結(jié)果
(4)調(diào)整圖片
a 配色方案:設(shè)置繪圖所采用的配色??梢赃x擇預(yù)制方案,也可以根據(jù)實(shí)際實(shí)際需要自定義配色方案。
b 對(duì)數(shù)取值:對(duì)文件數(shù)據(jù)取對(duì)數(shù)后再繪圖。取對(duì)數(shù)可以有效解決數(shù)據(jù)取值范圍過(guò)大導(dǎo)致的配色問(wèn)題。
c 歸一化:對(duì)行或列進(jìn)行歸一化處理。可最大程度地呈現(xiàn)每行或每列的變化信息,避免超高值掩蓋其他數(shù)據(jù)的變化。繪制基因表達(dá)量熱圖時(shí),常按基因歸一化。
d 聚類方案:可選擇是否按行、列聚類。若按特定樣本順序繪制熱圖,可取消按列聚類。
e 行列顯示:可選擇是否顯示行、列 ID。
f 樣品、基因字號(hào):可調(diào)節(jié)行、列 ID 的字體大小。
(5)查看數(shù)據(jù)
a聚類數(shù)據(jù):顯示聚類后數(shù)據(jù)矩陣的前100行,樣品和基因順序均與左側(cè)圖中一致。
b 搜索基因:可在搜索欄中輸入關(guān)鍵詞,搜索相應(yīng)基因或基因集。
5.案例展示
2017年,中國(guó)水產(chǎn)科學(xué)院喻達(dá)輝老師在百邁客云平臺(tái)上對(duì)合浦珠母貝免疫相關(guān)數(shù)據(jù)進(jìn)行分析,2篇文章先后分別發(fā)表于同一個(gè)雜志《Fish & Shell?sh Immunology》,這兩篇文章中都進(jìn)行了聚類熱圖分析。第一篇文章中研究人員將免疫相關(guān)差異表達(dá)基因按照不同時(shí)期進(jìn)行分層聚類分析,第二篇文章中研究人員將不同時(shí)期的unigene進(jìn)行了聚類熱圖分析。為后續(xù)的研究結(jié)果的呈現(xiàn)做了較好的鋪墊作用。
??免疫相關(guān)差異表達(dá)基因按照不同時(shí)期進(jìn)行分層聚類
不同時(shí)期unigene聚類熱圖
百邁客云平臺(tái)是由北京百邁客生物科技有限公司開(kāi)發(fā),集生物信息分析軟件、數(shù)據(jù)庫(kù)以及云計(jì)算為一體的生物大數(shù)據(jù)分析平臺(tái)。功能強(qiáng)大,操作簡(jiǎn)單的聚類熱圖就介紹到這里了,后期云平臺(tái)會(huì)為大家準(zhǔn)備更多實(shí)用小工具的操作指引,如果您在操作過(guò)程中遇到任何問(wèn)題都可以聯(lián)系咱們的云客服,歡迎點(diǎn)擊屏幕右下方客服圖像進(jìn)入咨詢環(huán)節(jié)。
參考文獻(xiàn)
1.Wei J, Liu B, Fan S, et al. Differentially expressed immune-related genes in hemocytes of the pearl oyster Pinctada fucata, against allograft identified by transcriptome analysis[J]. Fish & Shellfish Immunology, 2017, 62:247-256.
2.Wei J, Fan S, Liu B, et al. Transcriptome analysis of the immune reaction of the pearl oyster Pinctada fucata to xenograft from Pinctada maxima.[J]. Fish & Shellfish Immunology, 2017.
適用數(shù)據(jù)類型:轉(zhuǎn)錄組研究數(shù)據(jù)和基因組研究數(shù)據(jù)
軟件:R包(ggplot2)
操作步驟
登錄百邁客云首頁(yè)(www.dustyhill.net)——分析——工具——繪制GO和KEGG富集圖。
操作方法
1.輸入文件
Anno: 是所有基因功能注釋的結(jié)果總表,一般百邁客的有參、無(wú)參項(xiàng)目中會(huì)有這個(gè)數(shù)據(jù),通常的命名為All_Database_annotation.xls。
Genes_id: 指需要進(jìn)行分析的基因集文件,txt文本格式,每一行是一個(gè)基因的名字。
GO_top_lines:指定前多少行用于GO富集繪圖,在進(jìn)行GO富集分析的時(shí)候,會(huì)將結(jié)果按P值進(jìn)行排序,然后挑選前n行進(jìn)行繪圖,默認(rèn)為20。
2.注意事項(xiàng)
(1)注釋總表(All_Database_annotation.xls),該文件包含Integrated_Function.anno、Function_anno.stat、GO.list、GO_tree.stat、Kegg.pathway、Kegg.ko等6個(gè)工作表,其中GO.list、GO_tree.stat、Kegg.pathway、Kegg.ko這四個(gè)必須包含,且命名完全一致。
(2)Genes_id和注釋總表的基因ID相對(duì)應(yīng);
(3)文件名稱:包含字母數(shù)字以及下劃線,不能以數(shù)字開(kāi)頭,不能有空格,不能有特殊字符等。
(4)如果是在百邁客云上分析的結(jié)果,只需要在項(xiàng)目結(jié)果中找到All_Database_annotation.xls文件輸入即可。如果不是在百邁客做的項(xiàng)目,沒(méi)有這個(gè)文件,您需要先將FASTA格式的文件在云平臺(tái)的“基因功能注釋”小工具中得到All_Database_annotation.xls,如下示意圖。
3.結(jié)果說(shuō)明
該結(jié)果包含兩個(gè)文件GO和KEGG
GO包含以下文件:
其中g(shù)o_enrichment.png是GO富集結(jié)果圖,選擇置信度Pvalue最高的20個(gè)繪制通路富集圖;GO.Classification.png是GO分類圖。
KEGG包含以下文件:
KEGG.Classification.png是KEGG分類圖。
案例展示
百邁客云平臺(tái)的GO、KEGG分類富集圖繪制小工具得到了許多老師的認(rèn)可,目前已經(jīng)有一些老師運(yùn)用這款小工具發(fā)表了文章,比如鄭州大學(xué)安秀麗老師課題組對(duì)四倍體與二倍體蕪菁轉(zhuǎn)錄組比較分析的研究中運(yùn)用了GO、KEGG分類富集圖繪制工具,文章發(fā)表在《Frontiers in Plant Science》雜志上。
此外,中國(guó)農(nóng)業(yè)科學(xué)院油料作物研究所的胡瓊老師課題組對(duì)參與油菜分蘗調(diào)控相關(guān)信號(hào)通路的研究中也運(yùn)用了GO、KEGG分類富集圖繪制工具,文章發(fā)表在《Int J Mol Sci》雜志上。
百邁客云平臺(tái)是由北京百邁客生物科技有限公司開(kāi)發(fā),集生物信息分析軟件、數(shù)據(jù)庫(kù)以及云計(jì)算為一體的生物大數(shù)據(jù)分析平臺(tái)。GO、KEGG分類富集圖繪制小工具就介紹到這里了,請(qǐng)關(guān)注百邁客云微信公眾號(hào),后期會(huì)有更多小工具的介紹和操作指引,如果您在操作過(guò)程中遇到任何問(wèn)題都可以聯(lián)系咱們的云客服,歡迎點(diǎn)擊屏幕右下方客服圖像進(jìn)入咨詢環(huán)節(jié)。
參考文獻(xiàn):
1. Zhao R, Feng J, Yin X, et al. Antibiotic resistome in landfill leachate from different cities of China deciphered by metagenomic analysis.[J]. Water Research, 2018, 134:126–139.
2. Cheng H, Hao M, Wang W, et al. Integrative RNA- and miRNA-Profile Analysis Reveals a Likely Role of BR and Auxin Signaling in Branch Angle Regulation ofB. napus:[J]. International Journal of Molecular Sciences, 2017, 18(5):887.
]]>
01物種數(shù)據(jù)庫(kù)可作為系統(tǒng)性的展示、查詢、分析的平臺(tái):實(shí)現(xiàn)物種多組學(xué)數(shù)據(jù)的高效檢索、保存、調(diào)用、分析及深度挖掘。
02一些具備創(chuàng)新特性的數(shù)據(jù)庫(kù)也可單獨(dú)作為一項(xiàng)研究成果在SCI論文中進(jìn)行展示。
03通過(guò)共享云用戶的訪問(wèn),可提升第三方數(shù)據(jù)庫(kù)的知名度,部分重要物種信息、重要分析結(jié)果可以收費(fèi)下載,為進(jìn)一步維護(hù)數(shù)據(jù)庫(kù)和科研工作提供資金。
百邁客作為一家擁有深厚基因組學(xué)數(shù)據(jù)分析行業(yè)背景的大數(shù)據(jù)挖掘分析公司,致力于為用戶設(shè)計(jì)更貼合使用習(xí)慣的基因組學(xué)數(shù)據(jù)庫(kù)系統(tǒng),在2017年正式推出搭建百邁客云物種數(shù)據(jù)庫(kù)的服務(wù)。
簡(jiǎn)單來(lái)說(shuō),百邁客云物種數(shù)據(jù)庫(kù)是針對(duì)物種基因組學(xué)數(shù)據(jù)的存儲(chǔ)、管理、查詢、分析的數(shù)據(jù)庫(kù)系統(tǒng)。用戶基于Web操作界面即可實(shí)現(xiàn)數(shù)據(jù)的增刪改查等操作,還可以利用數(shù)據(jù)庫(kù)部署的簡(jiǎn)單分析工具或結(jié)合百邁客云賬號(hào)進(jìn)行數(shù)據(jù)挖掘分析。
說(shuō)了那么多是不是有些心動(dòng)了呢?
跟隨小編一起看下百邁客云物種數(shù)據(jù)庫(kù)核心優(yōu)勢(shì)有哪些。
操作更簡(jiǎn)單:后臺(tái)管理權(quán)限,甲方無(wú)需配備專業(yè)IT運(yùn)維和美工,在乙方培訓(xùn)后,即可完成后期的數(shù)據(jù)增加、刪除等更新操作
查詢調(diào)用更高效:代替原始的硬盤存儲(chǔ)+手動(dòng)查找的傳統(tǒng)數(shù)據(jù)管理模式,引入互聯(lián)網(wǎng)領(lǐng)域的數(shù)據(jù)庫(kù)技術(shù),可將各時(shí)間點(diǎn)、各空間點(diǎn)、各類型數(shù)據(jù)結(jié)構(gòu)化地存儲(chǔ)于統(tǒng)一的數(shù)據(jù)庫(kù)框架中,借助數(shù)據(jù)庫(kù)自動(dòng)查詢語(yǔ)言與web2.0網(wǎng)頁(yè)界面即可實(shí)現(xiàn)基因組學(xué)數(shù)據(jù)的高效查詢和調(diào)用。避免了傳統(tǒng)數(shù)據(jù)管理模式下數(shù)據(jù)丟失率高及檢索困難等問(wèn)題
數(shù)據(jù)挖掘更輕松:強(qiáng)大的云平臺(tái)支持,可連接百邁客云其他數(shù)據(jù)庫(kù)(八大數(shù)據(jù)庫(kù),如功能基因庫(kù)、參考文獻(xiàn)數(shù)據(jù)庫(kù)等),并可使用百邁客云分析工具(如幾十款分析APP、一百多款小工具),基于APP和小工具完成數(shù)據(jù)的深度挖掘
那么我們看下百邁客有哪些成功案例吧!
中國(guó)農(nóng)科院大豆數(shù)據(jù)庫(kù)(www.soybean-resources.cn)
包含了約1500種大豆種質(zhì)資源,382個(gè)品種的重測(cè)序,7套泛基因數(shù)據(jù)。
中科院植物所構(gòu)樹(shù)數(shù)據(jù)庫(kù)(papyrifera.biocloud.net)
包含了構(gòu)樹(shù)基因組序列及注釋信息,可進(jìn)行數(shù)據(jù)的瀏覽、使用、下載。
用戶設(shè)定模塊組合及各模塊對(duì)外權(quán)限,可選擇部署到本地服務(wù)器或托管于百邁客云數(shù)據(jù)庫(kù)專用集群;
乙方完成原型設(shè)計(jì),并與甲方確認(rèn)后核算搭建成本并報(bào)價(jià),乙方核算報(bào)價(jià),甲方支付20%的預(yù)付款。
基于數(shù)據(jù)庫(kù)原型,制定出數(shù)據(jù)標(biāo)準(zhǔn)化格式、文本需求信息,協(xié)助用戶數(shù)據(jù)準(zhǔn)備工作;
依次完成UI設(shè)計(jì)、前端架構(gòu)、后端完成底層數(shù)據(jù)的存儲(chǔ)與頁(yè)面相關(guān)交付;進(jìn)行測(cè)試驗(yàn)收。
雙方共同完成測(cè)試后,甲方需在驗(yàn)收合格10個(gè)工作日內(nèi)支付80%尾款,乙方交付數(shù)據(jù)庫(kù)并協(xié)助甲方進(jìn)行日常維護(hù)更新。
每日巡檢,檢查機(jī)房用電、溫濕度,服務(wù)器硬件報(bào)警及維修;
服務(wù)器操作系統(tǒng)狀態(tài)監(jiān)控與報(bào)警、日常維護(hù)、操作系統(tǒng)及軟件版本更新;
服務(wù)器生產(chǎn)服務(wù)與軟件的狀態(tài)監(jiān)控與報(bào)警、版本更新;
數(shù)據(jù)庫(kù)服務(wù)狀態(tài)監(jiān)控與報(bào)警,數(shù)據(jù)定期檢查與備份;
甲方在乙方協(xié)助下自主完成增刪改等操作。
百邁客云物種數(shù)據(jù)庫(kù)采用模塊化設(shè)計(jì),標(biāo)準(zhǔn)功能模塊主要有三大類
? ? ? ? 存儲(chǔ)&查詢模塊設(shè)置了種質(zhì)資源、突變體信息、性狀座位信息、分子標(biāo)記、基因功能信息、基因組數(shù)據(jù)、轉(zhuǎn)錄組數(shù)據(jù)的存儲(chǔ)和查詢模塊
種質(zhì)資源是一種遺傳資源。種質(zhì)系指農(nóng)作物親代傳遞給子代的遺傳物質(zhì),它往往存在于特定品種之中。如古老的地方品種、新培育的推廣品種、重要的遺傳材料以及野生近緣植物,都屬于種質(zhì)資源的范圍。用戶可在該模塊中按照物種的名稱、編號(hào)、父母本、省份、地理位置、表型查詢相關(guān)材料品種概況。
用戶在該模塊通過(guò)突變體名稱或表型檢索相關(guān)突變體,搜索結(jié)果可展示出突變體名稱、編號(hào)、突變基因信息等。其中,點(diǎn)擊突變基因可鏈接至“基因查詢模塊”查詢基因功能、序列、基因組位置等詳細(xì)信息。
在該模塊用戶通過(guò)輸入表型數(shù)據(jù)查詢?cè)撔誀羁刂谱辉诨蚪M上的定位結(jié)果,該結(jié)果整合自不同研究不同定位方法定位結(jié)果,并可視化展示相應(yīng)性狀座位對(duì)于于最新版本基因組上的位置及相關(guān)基因。其中,相關(guān)基因也可鏈接至“基因查詢模塊”查詢基因功能、序列、基因組位置等詳細(xì)信息。
用戶可按照精確編號(hào)、模糊編號(hào)(正則匹配)、或連鎖性狀搜索分子標(biāo)記,搜索結(jié)果含有標(biāo)記序列信息、標(biāo)記擴(kuò)增引物序列、標(biāo)記上下游基因(可鏈接至“基因查詢模塊”)、標(biāo)記相關(guān)性狀等。
在該模塊中,用戶可以基因名稱、基因ID、功能關(guān)鍵詞、物種基因組起始位置、轉(zhuǎn)錄本序列、是否定位、是否克隆為條件檢索目標(biāo)基因,檢索結(jié)果包括基因轉(zhuǎn)錄本序列(核苷酸or氨基酸序列)、染色體、起止位置、各功能數(shù)據(jù)庫(kù)注釋結(jié)果、相關(guān)文獻(xiàn)、相關(guān)性狀(可鏈接至“物種性狀座位信息存儲(chǔ)&查詢模塊”)。
1)使用基因組版本號(hào)檢索相關(guān)基因組信息,檢索結(jié)果包括該基因組序列組裝、結(jié)構(gòu)注釋、功能注釋、測(cè)序數(shù)據(jù)等,所有結(jié)果均支持本地下載;
2)可按照物種名檢索相關(guān)泛基因組信息,檢索結(jié)果包括各品種基因組序列組裝、結(jié)構(gòu)注釋、功能注釋、變異位點(diǎn)、測(cè)序數(shù)據(jù)等,所有結(jié)果均支持本地下載;
3)按品種名檢索該品種全基因組重測(cè)序、簡(jiǎn)化基因組重測(cè)序測(cè)序數(shù)據(jù)及變異位點(diǎn)檢測(cè)結(jié)果。
1)用戶可通過(guò)基因ID與基因name檢索相關(guān)基因下轉(zhuǎn)錄本序列、項(xiàng)目中的轉(zhuǎn)錄水平、差異表達(dá)、共表達(dá)、互作信息等,檢索結(jié)果支持本地下載。
2)按項(xiàng)目名稱檢索相關(guān)轉(zhuǎn)錄組學(xué)項(xiàng)目測(cè)序數(shù)據(jù)及完整分析結(jié)果,檢索結(jié)果支持本地下載。
分析工具均可從網(wǎng)頁(yè)調(diào)用,無(wú)需用戶掌握任何編程基礎(chǔ)。包含數(shù)據(jù)庫(kù)自帶分析工具,比如 blast、blat、引物設(shè)計(jì)、轉(zhuǎn)錄因子、metaQTL等;當(dāng)然也可調(diào)用部署在百邁客公有云計(jì)算平臺(tái)(www.dustyhill.net)的分析流程(APP)與生信軟件(Tools。APP包括有參/無(wú)參轉(zhuǎn)錄組分析APP、lncRNA分析APP、microRNA分析APP、circleRNA分析APP、重測(cè)序分析APP、GWAS個(gè)性化分析APP、BSA個(gè)性化分析APP、遺傳圖譜個(gè)性化分析APP、微生多樣性分析APP等;Tools模塊包含100余款各類生信分析軟件,涵蓋比對(duì)、注釋、繪圖、統(tǒng)計(jì)等;
?BMKCloud個(gè)性化分析示例
包含7大模塊:
? 該公共數(shù)據(jù)庫(kù)模塊同步NCBI維護(hù)的SRA、GEO兩大高通量測(cè)序數(shù)據(jù)庫(kù),目前該模塊12PBase,1100個(gè)屬的高通量測(cè)序數(shù)據(jù),數(shù)據(jù)類型涵蓋RNA-seq、全基因組重測(cè)序、WES、基因組denovo組裝、甲基化、ChIP-seq等。
? 用戶可按物種名稱、數(shù)據(jù)編號(hào)、研究方向檢索相關(guān)高通量測(cè)序公共數(shù)據(jù),檢索結(jié)果無(wú)需下載,一鍵導(dǎo)入數(shù)據(jù)庫(kù)自帶分析工具或百邁客公有云計(jì)算平臺(tái)(www.dustyhill.net)分析工具即可進(jìn)行數(shù)據(jù)分析。
該公共數(shù)據(jù)庫(kù)模塊整合包括GO、KEGG、miRbase、lncRNAdb、MiRTarBase、UniProt、genbank等在內(nèi)的30多個(gè)基因功能&序列類數(shù)據(jù)庫(kù),目前收錄了約1700萬(wàn)條基因相關(guān)信息,用戶輸入基因名稱、ID、功能關(guān)鍵詞后,一鍵即可獲取基因的功能、序列、同源基因、表達(dá)、相關(guān)ncRNA、變異、相關(guān)文獻(xiàn)等信息。
該數(shù)據(jù)庫(kù)收錄了所有公共的性狀相關(guān)數(shù)據(jù),目前已收錄11個(gè)物種347個(gè)性狀相關(guān)的QTL位點(diǎn)數(shù)據(jù),如QTL、eQTL、候選基因、關(guān)聯(lián)數(shù)據(jù)等信息,QTL性狀位置可視化展示以及物種間的比較,為各個(gè)物種間定位信息的比較提供重要的數(shù)據(jù)。
該公共數(shù)據(jù)庫(kù)模塊同步NCBI維護(hù)的PubMed文獻(xiàn)索引數(shù)據(jù)庫(kù),目前收錄2600萬(wàn)+文獻(xiàn)信息,該模塊支持按照發(fā)表日期、影響因子、文章類型、信息完整度(有無(wú)測(cè)序數(shù)據(jù)、有無(wú)全文等)進(jìn)行精確檢索,檢索結(jié)果包括文獻(xiàn)題目、摘要、全文鏈接、文獻(xiàn)所涉及測(cè)序數(shù)據(jù)等。
? 參考基因組數(shù)據(jù)庫(kù):包含有826個(gè)物種的924套參考基因組信息;
? 變異數(shù)據(jù)庫(kù):整合了dbSNP庫(kù)中的數(shù)據(jù)信息,目前收錄了8億+變異數(shù)據(jù),支持通過(guò)rs、ss號(hào)進(jìn)行信息的檢索,并且支持篩選特定物種的、特定染色體、特定區(qū)域的變異信息;
? 互作網(wǎng)絡(luò)數(shù)據(jù)庫(kù):整合了PPI、StarBase、LncRNADisease三個(gè)數(shù)據(jù)庫(kù)中的4類互作網(wǎng)絡(luò)信息,目前共收錄了306萬(wàn)互作網(wǎng)絡(luò)關(guān)系,包含了lncRNA、miRNA、mRNA、circRNA四類數(shù)據(jù)。