English | 中文版 | 手機版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
當(dāng)前位置 > 首頁 > 技術(shù)文章 > 干貨分享--高通量測序原始數(shù)據(jù)上傳教程

干貨分享--高通量測序原始數(shù)據(jù)上傳教程

瀏覽次數(shù):2339 發(fā)布日期:2023-3-29  來源:中科新生命
 

必備軟件

Aspera 插件  下載網(wǎng)址 :https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi

 

每個過程對應(yīng)的網(wǎng)址:

NCBI注冊  網(wǎng)址:https://www.ncbi.nlm.nih.gov/account/

申請BioProject  網(wǎng)址:https://submit.ncbi.nlm.nih.gov/subs/bioproject/

申請BioSample  網(wǎng)址:https://submit.ncbi.nlm.nih.gov/subs/biosample/

上傳SRA  網(wǎng)址:https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi

 

數(shù)據(jù)整體上傳的流程圖如下:
 


1. 注冊NCBI

打開 NCBI,點擊右上角的“Log in”,如下圖:
 


 

很多同學(xué)現(xiàn)在打開NCBI想注冊/登錄的時候,會發(fā)現(xiàn)如下提示:強制性使用第三方進行注冊/登錄。



 

繼續(xù)往下看就能找到解決辦法,NCBI支持用各種第三方賬戶:


 
根據(jù)經(jīng)驗,ORCID賬號和Microsoft注冊起來都很方便,只需要個人郵箱并按要求填寫信息后,點擊“Continue”完成注冊。

 

2 創(chuàng)建Bio-Project

01.

輸入BioProject網(wǎng)址,先進行個人信息完善,以便成功申請到 Bio-Project。點擊“My profile”完善個人信息后并點擊“Save”,即可完成填寫。
 


 

02

點擊 BioProject,再點擊 New submission,進入BioProject 的信息填寫頁面,按照步驟進行填寫。
 


A

Submitter界面直接點擊continue;

B

Project Type 界面,選擇 Raw sequence reads,有組裝數(shù)據(jù)的也選擇 Genome sequencing and assembly;Sample scope 有 5 類選擇:單一樣本,多個樣本,多物種,環(huán)境樣本,合成樣本等,可按照實際點擊,其中普通轉(zhuǎn)錄組選擇:Multiisolate;微生物多樣性或宏基因選擇Environment;
 


 

C
Target 界面,只需填寫研究物種拉丁文名即可;
 


D
General Info 界面,選擇數(shù)據(jù)釋放日期(可以立馬釋放,也可指定日期),Public description 部分對自己的研究簡要描述即可
 


E
BIOSAMPLE、PUBLICATIONS 界面可直接跳過,最后點擊 Submit,等待 NCBI 審核通過,即可完成 Bio-Project 的創(chuàng)建。

3

創(chuàng)建Bio-Sample

01

輸入BioSample網(wǎng)址,點擊 New submission,即出現(xiàn) BioSample 界面,如下:



02
Submitter界面直接點擊Continue;

03

General Information 界面,選擇數(shù)據(jù)釋放日期和樣本個數(shù),點擊 Continue;
 


04
Sample Type 界面,有 10 種類型描述樣本,例如病原體、微生物、模式生物、無脊椎動物、人、植物樣本等,這里我們選擇“Plant Sample”  ,點擊 Continue;


05
Attributes界面,可以上傳表格,也可以自行填寫表格,

 


這里我們推薦首次上傳原始數(shù)據(jù)的用戶選擇自行填寫表格;
 


其中,必填字段用*星號標(biāo)記;標(biāo)有**、††或†的字段為選填項,但至少填寫一個。

如上傳表格數(shù)據(jù),以下載Excel表格為例進行操作:
 


這里需要注意一下表頭的顏色,其中綠色為必填項,藍色為選填項,黃色為非填項。如果綠色的任何必填字段的信息不可用,可輸入“not collected”、“not applicable”或“missing”替代。藍色雖為選填項,但至少填寫一個,同樣出現(xiàn)何必填字段的信息不可用,請輸入“not collected”、“not applicable”或“missing”替代。黃色可以不予填寫。每一個單元格填寫是有格式要求的,可以點擊需要填寫的列名查看具體格式!


06


完成后,確認信息無誤,點擊Submit,即完成BioSample的創(chuàng)建。

4 數(shù)據(jù)上傳SRA
SRA簡介:SRA(Sequence Read Archieve)數(shù)據(jù)庫是NCBI搭建的存放原始測序數(shù)據(jù)的平臺。SRA能兼容不同測序平臺的數(shù)據(jù),比如Sanger測序、Illumina測序、PacBio測序等,所以無論是基因組、重測序、轉(zhuǎn)錄組、微生物擴增子,還是宏基因組等組學(xué)分析,都可以將原始數(shù)據(jù)上傳SRA。

01 
點擊My submissions頁面中的“Sequence Read Archive”,之后點擊“New submissions”,即可進入到SRA提交界面。

 


 
02 
A
 
Submitter 頁面點擊Continue;

B
進入General Information頁面,填入Existing BioProject號碼,然后選擇數(shù)據(jù)釋放日期,需與前兩步數(shù)據(jù)釋放日期一致,之后點擊Continue;


 
C
進入SRA metadata界頁面,填寫對應(yīng)表格信息,這里我們推薦直接在網(wǎng)頁版上填寫表格,需要注意的地方如下:

BioSample accession:注冊好的Biosample編號直接填寫;

Library ID:它是唯一的,我們可以使用物種拉丁文名命名。

Library strategy可以選擇WGS,Library source可以選擇Genomic,Library selection可以選擇size fractionation,Library layout可以選擇paired,Platform可以選擇illumina,instrument model可以選擇Illumina NovaSeq 6000;

Filetype可以選擇fastq;后面的Filename 可依次填寫M_sinensis_A_illumina_R1.fastq.gz、M_sinensis_A_illumina_R2.fastq.gz等,填寫完畢后點擊Continue。

D
Files界面:數(shù)據(jù)上傳的選擇方式,若單個文件數(shù)據(jù)量小于10G,樣本數(shù)小于300個,我們推薦Aspera方式上傳(如下圖);

 


然后我們點擊choose files,選擇相應(yīng)的桌面文件,如下:
 


注意事項:

(1)所有樣本的原始數(shù)據(jù)需放在同一目錄下;

(2)原始數(shù)據(jù)為 fastq 格式的壓縮文件;

(3)若為雙端測序,需要提供雙端的原始數(shù)據(jù),即 R1 端和 R2 端。

接著會顯示上傳界面,網(wǎng)頁版顯示如下:
 


Aspera軟件界面顯示如下:



03

待所有數(shù)據(jù)上傳成功后,我們就可以進入確認界面,點擊submit,即SRA數(shù)據(jù)上傳完成,我們只需等待NCBI審核通過,就可獲得對應(yīng)樣本的SRA編號。

來源:上海中科新生命生物科技有限公司
聯(lián)系電話:021-54665263
E-mail:marketing@aptbiotech.com

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網(wǎng)友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2024 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com