English | 中文版 | 手機(jī)版 企業(yè)登錄 | 個(gè)人登錄 | 郵件訂閱
當(dāng)前位置 > 首頁 > 技術(shù)文章 > 干貨分享--高通量測(cè)序原始數(shù)據(jù)上傳教程

干貨分享--高通量測(cè)序原始數(shù)據(jù)上傳教程

瀏覽次數(shù):2529 發(fā)布日期:2023-3-29  來源:中科新生命
 

必備軟件

Aspera 插件  下載網(wǎng)址 :https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi

 

每個(gè)過程對(duì)應(yīng)的網(wǎng)址:

NCBI注冊(cè)  網(wǎng)址:https://www.ncbi.nlm.nih.gov/account/

申請(qǐng)BioProject  網(wǎng)址:https://submit.ncbi.nlm.nih.gov/subs/bioproject/

申請(qǐng)BioSample  網(wǎng)址:https://submit.ncbi.nlm.nih.gov/subs/biosample/

上傳SRA  網(wǎng)址:https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi

 

數(shù)據(jù)整體上傳的流程圖如下:
 


1. 注冊(cè)NCBI

打開 NCBI,點(diǎn)擊右上角的“Log in”,如下圖:
 


 

很多同學(xué)現(xiàn)在打開NCBI想注冊(cè)/登錄的時(shí)候,會(huì)發(fā)現(xiàn)如下提示:強(qiáng)制性使用第三方進(jìn)行注冊(cè)/登錄。



 

繼續(xù)往下看就能找到解決辦法,NCBI支持用各種第三方賬戶:


 
根據(jù)經(jīng)驗(yàn),ORCID賬號(hào)和Microsoft注冊(cè)起來都很方便,只需要個(gè)人郵箱并按要求填寫信息后,點(diǎn)擊“Continue”完成注冊(cè)。

 

2 創(chuàng)建Bio-Project

01.

輸入BioProject網(wǎng)址,先進(jìn)行個(gè)人信息完善,以便成功申請(qǐng)到 Bio-Project。點(diǎn)擊“My profile”完善個(gè)人信息后并點(diǎn)擊“Save”,即可完成填寫。
 


 

02

點(diǎn)擊 BioProject,再點(diǎn)擊 New submission,進(jìn)入BioProject 的信息填寫頁面,按照步驟進(jìn)行填寫。
 


A

Submitter界面直接點(diǎn)擊continue;

B

Project Type 界面,選擇 Raw sequence reads,有組裝數(shù)據(jù)的也選擇 Genome sequencing and assembly;Sample scope 有 5 類選擇:?jiǎn)我粯颖,多個(gè)樣本,多物種,環(huán)境樣本,合成樣本等,可按照實(shí)際點(diǎn)擊,其中普通轉(zhuǎn)錄組選擇:Multiisolate;微生物多樣性或宏基因選擇Environment;
 


 

C
Target 界面,只需填寫研究物種拉丁文名即可;
 


D
General Info 界面,選擇數(shù)據(jù)釋放日期(可以立馬釋放,也可指定日期),Public description 部分對(duì)自己的研究簡(jiǎn)要描述即可
 


E
BIOSAMPLE、PUBLICATIONS 界面可直接跳過,最后點(diǎn)擊 Submit,等待 NCBI 審核通過,即可完成 Bio-Project 的創(chuàng)建。

3

創(chuàng)建Bio-Sample

01

輸入BioSample網(wǎng)址,點(diǎn)擊 New submission,即出現(xiàn) BioSample 界面,如下:



02
Submitter界面直接點(diǎn)擊Continue;

03

General Information 界面,選擇數(shù)據(jù)釋放日期和樣本個(gè)數(shù),點(diǎn)擊 Continue;
 


04
Sample Type 界面,有 10 種類型描述樣本,例如病原體、微生物、模式生物、無脊椎動(dòng)物、人、植物樣本等,這里我們選擇“Plant Sample”  ,點(diǎn)擊 Continue;


05
Attributes界面,可以上傳表格,也可以自行填寫表格,

 


這里我們推薦首次上傳原始數(shù)據(jù)的用戶選擇自行填寫表格;
 


其中,必填字段用*星號(hào)標(biāo)記;標(biāo)有**、††或†的字段為選填項(xiàng),但至少填寫一個(gè)。

如上傳表格數(shù)據(jù),以下載Excel表格為例進(jìn)行操作:
 


這里需要注意一下表頭的顏色,其中綠色為必填項(xiàng),藍(lán)色為選填項(xiàng),黃色為非填項(xiàng)。如果綠色的任何必填字段的信息不可用,可輸入“not collected”、“not applicable”或“missing”替代。藍(lán)色雖為選填項(xiàng),但至少填寫一個(gè),同樣出現(xiàn)何必填字段的信息不可用,請(qǐng)輸入“not collected”、“not applicable”或“missing”替代。黃色可以不予填寫。每一個(gè)單元格填寫是有格式要求的,可以點(diǎn)擊需要填寫的列名查看具體格式!


06


完成后,確認(rèn)信息無誤,點(diǎn)擊Submit,即完成BioSample的創(chuàng)建。

4 數(shù)據(jù)上傳SRA
SRA簡(jiǎn)介:SRA(Sequence Read Archieve)數(shù)據(jù)庫是NCBI搭建的存放原始測(cè)序數(shù)據(jù)的平臺(tái)。SRA能兼容不同測(cè)序平臺(tái)的數(shù)據(jù),比如Sanger測(cè)序、Illumina測(cè)序、PacBio測(cè)序等,所以無論是基因組、重測(cè)序、轉(zhuǎn)錄組、微生物擴(kuò)增子,還是宏基因組等組學(xué)分析,都可以將原始數(shù)據(jù)上傳SRA。

01 
點(diǎn)擊My submissions頁面中的“Sequence Read Archive”,之后點(diǎn)擊“New submissions”,即可進(jìn)入到SRA提交界面。

 


 
02 
A
 
Submitter 頁面點(diǎn)擊Continue;

B
進(jìn)入General Information頁面,填入Existing BioProject號(hào)碼,然后選擇數(shù)據(jù)釋放日期,需與前兩步數(shù)據(jù)釋放日期一致,之后點(diǎn)擊Continue;


 
C
進(jìn)入SRA metadata界頁面,填寫對(duì)應(yīng)表格信息,這里我們推薦直接在網(wǎng)頁版上填寫表格,需要注意的地方如下:

BioSample accession:注冊(cè)好的Biosample編號(hào)直接填寫;

Library ID:它是唯一的,我們可以使用物種拉丁文名命名。

Library strategy可以選擇WGS,Library source可以選擇Genomic,Library selection可以選擇size fractionation,Library layout可以選擇paired,Platform可以選擇illumina,instrument model可以選擇Illumina NovaSeq 6000;

Filetype可以選擇fastq;后面的Filename 可依次填寫M_sinensis_A_illumina_R1.fastq.gz、M_sinensis_A_illumina_R2.fastq.gz等,填寫完畢后點(diǎn)擊Continue。

D
Files界面:數(shù)據(jù)上傳的選擇方式,若單個(gè)文件數(shù)據(jù)量小于10G,樣本數(shù)小于300個(gè),我們推薦Aspera方式上傳(如下圖);

 


然后我們點(diǎn)擊choose files,選擇相應(yīng)的桌面文件,如下:
 


注意事項(xiàng):

(1)所有樣本的原始數(shù)據(jù)需放在同一目錄下;

(2)原始數(shù)據(jù)為 fastq 格式的壓縮文件;

(3)若為雙端測(cè)序,需要提供雙端的原始數(shù)據(jù),即 R1 端和 R2 端。

接著會(huì)顯示上傳界面,網(wǎng)頁版顯示如下:
 


Aspera軟件界面顯示如下:



03

待所有數(shù)據(jù)上傳成功后,我們就可以進(jìn)入確認(rèn)界面,點(diǎn)擊submit,即SRA數(shù)據(jù)上傳完成,我們只需等待NCBI審核通過,就可獲得對(duì)應(yīng)樣本的SRA編號(hào)。

來源:上海中科新生命生物科技有限公司
聯(lián)系電話:021-54665263
E-mail:marketing@aptbiotech.com

用戶名: 密碼: 匿名 快速注冊(cè) 忘記密碼
評(píng)論只代表網(wǎng)友觀點(diǎn),不代表本站觀點(diǎn)。 請(qǐng)輸入驗(yàn)證碼: 8795
Copyright(C) 1998-2024 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com