English | 中文版 | 手機版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術(shù)文章 > GenBank數(shù)據(jù)庫簡介

GenBank數(shù)據(jù)庫簡介

瀏覽次數(shù):10415 發(fā)布日期:2008-5-11  來源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負
1. GenBank屬于一個序列數(shù)據(jù)庫的國際合作組織,包括EMBL和DDBJ。是NIH遺傳序列數(shù)據(jù)庫,一個所有可以公開獲得的DNA序列的注釋過的收集。GenBank同日本和歐洲分子生物學(xué)實驗室的DNA數(shù)據(jù)庫共同構(gòu)成了國際核酸序列數(shù)據(jù)庫合作。唯一人類基因序列集合(UniGene),人類基因組基因圖譜,分類學(xué)瀏覽器,同國立癌癥研究所合作的癌癥基因組剖析計劃(CGAP)等數(shù)據(jù)庫。GenBank以指數(shù)形式增長,核酸堿基數(shù)目大概每14個月就翻一個倍。
2. 紀錄樣本 - 關(guān)于GenBank的各個字段的詳細描述,以及同Entrez搜索字段的交叉索引。
3. 訪問GenBank - 通過Entrez Nucleotides來查詢。用accession number,作者姓名,物種,基因/蛋白名字,還有許多其他的文本術(shù)語來查詢。關(guān)于Entrez更多的信息請看下文。用BLAST來在GenBank和其他數(shù)據(jù)庫中進行序列相似搜索。用E-mail來訪問Entrez和BLAST可以通過Query和BLAST服務(wù)器。另外一種選擇是可以用FTP下載整個的GenBank和更新數(shù)據(jù)。
4. 增長統(tǒng)計 - 參見公布通知的2.2.6(每個分類的統(tǒng)計),2.2.7(每個物種的統(tǒng)計),2.2.8(GenBank增長)小節(jié)。
5. 公布通知,最新 - 最近和即將有的變化,GenBank的分類,數(shù)據(jù)增長統(tǒng)計,GenBank的引用。
6. 公布通知,舊 - 同上相同,是過去公布的統(tǒng)計。
7. 遺傳密碼 - 15個遺傳密碼的概要。用來確保GenBank中紀錄的編碼序列被正確的翻譯。

向GenBank提交數(shù)據(jù) :
1. 關(guān)于提交序列數(shù)據(jù),收到accession number,和對紀錄作更新的一般信息。
2. BankIt - 用于一條或者少數(shù)條提交的基于WWW的提交工具軟件。(請在提交前用VecScreen去除載體)
3. Sequin - 提交軟件程序,用于一條或者很多條的提交,長序列,完整基因組,alignments,人群/種系/突變研究的提交?梢元毩⑹褂,或者用基于TCP/IP的“network aware”模式,可以鏈接到其他NCBI的資源和軟件比如Entrez和PowerBLAST。(請在提交前用VecScreen去除載體)
4. ESTs - 表達序列標簽,短的、單次(測序)閱讀的cDNA序列。也包括來自于差異顯示和RACE實驗的cDNA序列。
5. GSSs - 基因組調(diào)查序列,短的、單次(測序)閱讀的cDNA序列,exon trap獲得的序列,cosmid/BAC/YAC末端,及其他。
6. HTGs - 來自于大規(guī)模測序中心的高通量基因組序列,未完成的(階段0,1,2)和完成的(階段3)序列。(注意:完成的人類的HTG序列可以同時在GenBank和Human Genome Sequencing頁面上訪問。)
7. STSs - 序列標簽位點。短的在基因組上可以被唯一操作的序列,用于產(chǎn)生作圖位點。
8. 注:SNPs - 人類的和其他物種的遺傳變異數(shù)據(jù)可以提交到NCBI數(shù)據(jù)庫的單核苷酸多態(tài)性庫中(dbSNP)。

國際核苷酸序列數(shù)據(jù)庫合作組織 :
1. GenBank,DDBJ,EMBL - 合作計劃的概述,并鏈接到相應(yīng)的主頁。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)數(shù)據(jù)庫共享的數(shù)據(jù)是每天都交換的,因此他們是相等的。數(shù)據(jù)紀錄的格式和搜索方式可能會不一樣,但是accession number,序列數(shù)據(jù)和注解都是一模一樣的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相應(yīng)紀錄,得到的結(jié)果是完全一樣的序列數(shù)據(jù),參考內(nèi)容等等。?
2. DDBJ/EMBJ/GenBank特性表 — 特性表格式和標準被合作數(shù)據(jù)庫用在序列記錄的注釋上,使得數(shù)據(jù)共享成為可能,包括詳細的描述生物特性和特性限定語的附錄,以及IUPAC規(guī)定的核苷酸和氨基酸的代號。?

FTP GenBank and Daily Updates:
1. GenBank普通文件格式 — 參見GenBank記錄樣本和在GenBank公布通知中的詳細描述,下載大多數(shù)最近的完全公告和日常積累或非積累更新數(shù)據(jù)。
2. ASN.1格式 — 摘要句法記號1,國際標準組織(ISO)數(shù)據(jù)表示格式,下載大多數(shù)最近的完全公告和日常積累或非積累更新數(shù)據(jù)。
3. FASTA格式 — 定義行號后只跟隨序列數(shù)據(jù)(示例),參見描述數(shù)據(jù)庫的readme文件,包括nt.Z(每天更新的非冗余BLAST核酸數(shù)據(jù)庫,包括GenBank+EMBL+DDBJ+PDB序列,但是不包括EST, STS, GSS, or HTGS序列),nr.Z(每日更新的非冗余蛋白質(zhì)),est.Z, gss.Z, htg.Z, sts.Z,和其它文件。

分子數(shù)據(jù)庫:
1. 核酸序列
1、 Entrez核酸: 用accession number,作者姓名,物種,基因/蛋白名字,以及很多其它的文本術(shù)語來搜索核酸序列記錄(在GenBank + PDB中)。更多的關(guān)于Entrez的信息見下。如果要檢索大量數(shù)據(jù),也可使用Batch Entrez(批量Entrez)。
2、 RefSeq : NCBI數(shù)據(jù)庫的參考序列。校正的,非冗余集合,包括基因組DNA contigs,已知基因的mRNAs和蛋白,在將來,整個的染色體。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式來表示。
3、 dbEST :表達序列標簽數(shù)據(jù)庫,短的、單次(測序)閱讀的cDNA序列。也包括來自于差異顯示和RACE實驗的cDNA序列。
4、 dbGSS :基因組調(diào)查序列的數(shù)據(jù)庫,短的、單次(測序)閱讀的cDNA序列,exon trap獲得的序列,cosmid/BAC/YAC末端,及其他。
5、 dbSTS :序列標簽位點的數(shù)據(jù)庫,短的在基因組上可以被唯一操作的序列,用于產(chǎn)生作圖位點。
6、 dbSNP :單核苷酸多態(tài)性數(shù)據(jù)庫,包括SNPs,小范圍的插入/缺失,多態(tài)重復(fù)單元,和微衛(wèi)星變異。
2. 完整的基因組 :
1、 參見下面Genome和Maps部分,包括各種物種資源,人,小鼠,大鼠,酵母,線蟲,瘧原蟲,細菌,病毒,viroids,質(zhì)粒。
2、 發(fā)UniGene : 被整理成簇的EST和全長mRNA序列,每一個代表一種特定已知的或假設(shè)的人類基因,有定位圖和表達信息以及同其它資源的交叉參考。序列數(shù)據(jù)可以以cluster形式在Unigene網(wǎng)頁下載,完整的數(shù)據(jù)可以從FTP站點repository/UniGene目錄下下載。
1) 人類:UniGene
2) 小鼠:UniGene
3) 大鼠:UniGene
4) 斑馬魚:UniGene
3、 BLAST :將你的序列同核酸庫中的的序列比較,檢索相似的序列。(更詳細的信息見下面Tools/Sequence相似搜索部分)

蛋白序列 :
1、 Entrez蛋白 :用accession number,作者姓名,物種,基因/蛋白名字,以及很多其它的文本術(shù)語來搜索蛋白序列記錄(在GenPept + Swiss-Prot + PIR + RPF + PDB中)。更多的關(guān)于Entrez的信息見下。如果要檢索大量數(shù)據(jù),也可使用Batch Entrez(批量Entrez)。 RefSeq — NCBI數(shù)據(jù)庫的參考序列。Curated, 非冗余集合包括基因組DNA contigs,已知基因的mRNAs和蛋白,在將來,整個的染色體。Accession numbers用NT_xxxxxx, NM_xxxxxx, NP_xxxxxx, 和NC_xxxxxx的形式來表示。 FTPGenPept — 下載“genpept.fsa.Z”文件,這個文件包含了從GenBank/EMBL/DDBJ記錄中翻譯過來的FASTA格式的氨基酸序列,這些記錄都有一到兩個CDS特性的描述。
2、 完整基因組 :參見下面Genome和Maps部分,包括各種物種資源,人,小鼠,大鼠,酵母,線蟲,瘧原蟲,細菌,病毒,viroids,質(zhì)粒。
1) Entrez基因組 :提供了一個編碼區(qū)的概要和各種物種的分類表(TaxTable)。編碼區(qū)概要列出了在基因組中所有的的蛋白,并提供鏈接到FASTA文件和BLAST。分類表總結(jié)了蛋白BLAST分析的結(jié)果,建議他們的可能功能,并用顏色編碼的圖來顯示物種同其它物種之間的關(guān)系(參見下面''''Genomes和Maps,''''部分Entrez基因組的一般描述)
2) FTP基因組蛋白 :從ftp站點的genbank/genomes目錄下下載各種物種的FASTA格式的氨基酸序列*.faa和蛋白表文件*.ptt。參見readme文件。蛋白表也可以在Entrez基因組中看到。
3、 PROW : Web上的蛋白資源,關(guān)于大約200種人類的CD細胞表面分子的簡短官方向?qū)А;ハ鄼z索,為每個CD抗原提供大約20中標準信息的分類(生化功能,配體,等等)
4、 BLAST : 將你的序列同蛋白庫中的的序列比較,檢索相似的序列。(更詳細的信息見下面Tools/Sequence相似搜索部分)

結(jié)構(gòu):
1、 結(jié)構(gòu)主頁 — 關(guān)于NCBI結(jié)構(gòu)小組的一般信息和他們的研究計劃,另外也可以訪問分子模型數(shù)據(jù)庫(MMDB)和用來搜索和顯示結(jié)構(gòu)的相關(guān)工具。
2、 MMDB:分子模型數(shù)據(jù)庫 — 一個關(guān)于三維生物分子結(jié)構(gòu)的數(shù)據(jù)庫,結(jié)構(gòu)來自于X-ray晶體衍射和NMR色譜分析。MMDB是來源于Brookhaven蛋白數(shù)據(jù)庫(PDB)三維結(jié)構(gòu)的一部分,排除了那些理論模型。MMDB重新組織和驗證了這些信息,從而保證在化學(xué)和大分子三維結(jié)構(gòu)之間的交叉參考。數(shù)據(jù)的說明書包括生物多聚體的空間結(jié)構(gòu),這個分子在化學(xué)上是如何組織的,以及聯(lián)系兩者的一套指針。利用將化學(xué),序列,和結(jié)構(gòu)信息整合在一起,MMDB計劃成為基于結(jié)構(gòu)的同源模型化和蛋白結(jié)構(gòu)預(yù)測的資源服務(wù)。MMDB的記錄以ASN.1格式存儲,可以用Cn3D, Rasmol, 或 Kinemage來顯示。另外,數(shù)據(jù)庫中類似的結(jié)構(gòu)已經(jīng)被用VAST確認,新的結(jié)構(gòu)可以用VASTsearch來同數(shù)據(jù)庫進行比較。
3、 Cn3D — “See in 3-D”, 一個用于NCBI數(shù)據(jù)庫的結(jié)構(gòu)和序列相似顯示工具,它允許觀察3-D結(jié)構(gòu)和序列—結(jié)構(gòu)或結(jié)構(gòu)—結(jié)構(gòu)同源比較。Cn3D用起來就象你瀏覽器上的一個幫助工具。
4、 VAST — 矢量同源比較搜索工具—一個在NCBI開發(fā)的計算算法,用于確定相似的蛋白三維結(jié)構(gòu)。每一個結(jié)構(gòu)的“結(jié)構(gòu)鄰居”都是預(yù)先計算好的,而且可以通過MMDB的結(jié)構(gòu)概要頁面的鏈接訪問。這些鄰居可以用來確認那些不能被序列比較識別的遠的同源性。
5、 VAST 搜索 — 結(jié)構(gòu)—結(jié)構(gòu)相似搜索服務(wù)。比較一個新解出的蛋白結(jié)構(gòu)和在MMDB/PDB數(shù)據(jù)庫中的結(jié)構(gòu)的三維坐標。VAST搜索計算一系列可能會被交互瀏覽的結(jié)構(gòu)鄰居,用分子圖形來觀察重疊和同源相似。

分類學(xué) :
1、 NCBI的分類數(shù)據(jù)庫主頁 — 關(guān)于分類計劃的一般信息,包括分類資源和同NCBI分類學(xué)家合作的外部管理者的列表。
2、 分類瀏覽器 — 搜索NCBI的分類數(shù)據(jù)庫,包括大于70000個物種的名字和種系,這些物種都至少在遺傳數(shù)據(jù)庫中有一條核酸或蛋白序列。可以檢索一個特定種或者更高分類(如屬,科)的核酸,蛋白,和結(jié)構(gòu)記錄。如果有新物種的序列數(shù)據(jù)被放到數(shù)據(jù)庫中,這個物種就北加到(分類)數(shù)據(jù)庫中。NCBI的分類數(shù)據(jù)庫的目的是為序列數(shù)據(jù)庫建立一個一致的種系發(fā)生分類學(xué)。

文獻數(shù)據(jù)庫概要 :
1、 PubMed — 一個關(guān)于生物醫(yī)藥科學(xué)的檢索系統(tǒng),包括引用,摘要,和雜志的索引術(shù)語。它包括直接由出版商提供給NCBI的文獻引用以及鏈接到在出版商網(wǎng)址上的全文的URLs。PubMed包括MEDLINE和PREMEDLINE的完整內(nèi)容。它還包括一些被MEDLINE認為超出范圍的文章和雜志,(這些文章或雜志)由于內(nèi)容或在某一時期不在索引范圍內(nèi)。因此PubMed是比MEDLINE的更大的集合。
2、 雜志瀏覽器 — 允許你去查找收錄到PubMed系統(tǒng)的雜志的名字,MEDLINE的縮寫,或ISSN號碼。
3、 PubRef(開發(fā)中)— 一個關(guān)于來自于廣大范圍的科學(xué)雜志的數(shù)目記錄,和鏈接到出版商網(wǎng)址的全文。PubRef包含了PubMEd,加上了來自其它學(xué)科的雜志出版商提供的引用和摘要。因此它是比PubMed更大的集合。這個計劃的啟動是因為NAS要求為科學(xué)領(lǐng)域的核心刊物提供一個“白皮書”服務(wù)。
4、 PubMed中心(開發(fā)中) — PubMed中心是一個無障礙的NIH資源,用于在生命科學(xué)領(lǐng)域中同業(yè)互查的基礎(chǔ)研究報告。從2000年一月開始接受雜志文章。所有在PubMed中心的材料將由目前任一主要的摘要和索引服務(wù)中列出的雜志提供,或者在編輯委員會中擁有3個以上有主要資金機構(gòu)的研究經(jīng)費的擁有人的雜志提供。
5、 OMIM — 在線人類孟德爾遺傳—經(jīng)常更新的人類基因和遺傳失調(diào)的目錄,有鏈接到其它相關(guān)的文獻參考,序列記錄,和相關(guān)數(shù)據(jù)庫。
6、 書籍 — 同書籍出版商合作NCBI為網(wǎng)絡(luò)改編了教科書,并把他們鏈接到PubMed—生物醫(yī)藥書目數(shù)據(jù)庫。這是為了給PubMed提供背景信息,這樣使用者可以探究在PubMed搜索結(jié)果中不熟悉的概念。目前收錄的書有:
7、 Molecular Biology of the Cell, 3rd ed. Alberts B., Bray D., Lewis J., Raff M., Roberts K., Watson J.D., 1994, Garland Publishing.
8、 外部鏈接 — 一個登記服務(wù),用于建立從在Entrez中的特定的文章,雜志,或生物數(shù)據(jù)到外部網(wǎng)址的鏈接。第三方可以提供一個URL,資源名字,關(guān)于他們網(wǎng)址的簡要的描述,和關(guān)于從NCBI數(shù)據(jù)的哪里他們希望建立鏈接的詳細說明。這個詳細說明可以用對Entrez有效的布爾查詢來寫,也可以用特定的文章或序列的標志列表來寫。這樣NCBI PubMed的用戶將可以通過“NCBI小房間”服務(wù)(開發(fā)中)來選擇哪個外部鏈接在他們的搜索中是可見的。
9、 引用匹配 — 允許你找到任何一篇在PubMed數(shù)據(jù)庫中的文章的PubMed ID或MEDLINE UID,給出書目信息(雜志,卷,頁碼等)。
10、 單篇文章的引用匹配。
11、 許多文章的批量引用匹配。
12、 E-mail引用匹配也是可以的,也可以用于單篇或許多文章。如果要獲得幫助文件,給citation_matcher@ncbi.nlm.nih.gov寫一封只有內(nèi)容為HELP的E-Mail。
Genomes and Maps Overview:
1、 Entrez基因組:人,小鼠,大鼠,酵母,線蟲,瘧原蟲,細菌,病毒,viroids,質(zhì)粒,和真核細胞器。
2、 Entrez基因組(各種物種)
3、 Entrez基因組 — 超過800種在GenBank中被完整測序的物種,包括大于500種病毒,〉25種細菌,酵母,和許多viroids,質(zhì)粒,和細胞器。還包括正在進行中的基因組,比如人,小鼠,線蟲,瘧原蟲,果蠅,利什曼原蟲,水稻,和玉米。提供完成的基因組/染色體的圖形概覽,并可以探究那些逐步細化的區(qū)域。也提供那些已經(jīng)被NCBI工作人員分析過的物種的編碼區(qū)的摘要和TaxTables。另外,Entrez Map Viewer,Entrez基因組的一個軟件組成部分,提供整合的果蠅(細胞遺傳學(xué)和序列圖譜)和人類(細胞遺傳學(xué),遺傳連鎖,序列,放射雜交,和其它圖譜)的染色體圖譜的瀏覽。
4、 通過每個物種的Entrez基因組頁面來下載〈350kb的基因組。
5、 通過NCBI ftp站點來下載〉350kb的基因組—參見在genbank/genomes目錄下的readme文件,ftp鏈接在每個物種的Entrez基因組頁面上也有。

NCBI站點地圖---其他基因組數(shù)據(jù)介紹:
1、 小鼠基因組
1) 小鼠基因組資源向?qū)?:把從各個中心來的各種小鼠相關(guān)的資源整合在一起,包括序列,圖譜,和克隆信息以及指向小鼠種系和突變資源的指針。
2) 小鼠基因組測序:小鼠基因組計劃的測序進展,HTG序列contigs(可以用大小和染色體號來瀏覽)由測序中心的數(shù)據(jù)建立,可以contig或染色體的形式來下載。
3) 小鼠UniGene :被整理成簇的EST和全長mRNA序列,每一個代表一種特定已知的或假設(shè)的基因,有定位圖和表達信息以及同其它資源的交叉參考。序列數(shù)據(jù)可以以cluster形式在Unigene網(wǎng)頁下載,完整的數(shù)據(jù)可以從FTP站點repository/UniGene目錄下下載
4) 位點鏈接(LocusLink) :為校正過的序列和遺傳位點的描述信息提供一個單次查詢界面。LocusLink給每個位點發(fā)布一個穩(wěn)定的ID,并提供官方的命名,序列accesssion number, Unigene簇,圖譜信息,和相關(guān)的網(wǎng)址。LocusLink是NCBI,人類基因命名委員會,OMIM和其它組織的合作結(jié)果。LocusLink目前包含人類,小鼠,大鼠,斑馬魚,和果蠅的位點,物種可以被分開或合在一起查詢。
5) Entrez :包括了來自〉70000個物種的序列數(shù)據(jù),可以用物種字段來限制記錄只在小鼠搜索。
6) 人類/小鼠同源圖 :University of California at Davis的M. F. Seldin建立,一張比較人和老鼠在同源區(qū)段DNA上基因的表,按在每個基因組上的位置排列。
2、 大鼠基因組
1) 大鼠UniGene :被整理成簇的EST和全長mRNA序列,每一個代表一種特定已知的或假設(shè)的基因,有定位圖和表達信息以及同其它資源的交叉參考。序列數(shù)據(jù)可以以cluster形式在Unigene網(wǎng)頁下載,完整的數(shù)據(jù)可以從FTP站點repository/UniGene目錄下下載
2) 位點鏈接(LocusLink):為校正過的序列和遺傳位點的描述信息提供一個單次查詢界面。LocusLink給每個位點發(fā)布一個穩(wěn)定的ID,并提供官方的命名,序列accesssion number, Unigene簇,圖譜信息,和相關(guān)的網(wǎng)址。LocusLink是NCBI,人類基因命名委員會,OMIM和其它組織的合作結(jié)果。LocusLink目前包含人類,小鼠,大鼠,斑馬魚,和果蠅的位點,物種可以被分開或合在一起查詢。
3、 斑馬魚基因組
1) 斑馬魚UniGene :被整理成簇的EST和全長mRNA序列,每一個代表一種特定已知的或假設(shè)的基因,有定位圖和表達信息以及同其它資源的交叉參考。序列數(shù)據(jù)可以以cluster形式在Unigene網(wǎng)頁下載,完整的數(shù)據(jù)可以從FTP站點repository/UniGene目錄下下載
2) 位點鏈接(LocusLink) :為校正過的序列和遺傳位點的描述信息提供一個單次查詢界面。LocusLink給每個位點發(fā)布一個穩(wěn)定的ID,并提供官方的命名,序列accesssion number, Unigene簇,圖譜信息,和相關(guān)的網(wǎng)址。LocusLink是NCBI,人類基因命名委員會,OMIM和其它組織的合作結(jié)果。LocusLink目前包含人類,小鼠,大鼠,斑馬魚,和果蠅的位點,物種可以被分開或合在一起查詢。
4、 果蠅基因組
1) 黑腹果蠅主頁 : 提供所有可使用的果蠅資源的概要,用圖形的方式顯示了染色體,允許你通過Entrez基因組瀏覽器的方法來搜索整個基因組的細胞遺傳和序列信息。Entrez基因組提供了對于一個物種一致的遺傳,物理,和序列數(shù)據(jù)的圖形界面。當你用一個基因的代號來搜索時,它給出搜索結(jié)果的一個圖形的基因組視圖,從那你可以放大到你所感興趣的區(qū)域的更詳細的圖譜視圖,并且鏈接到序列數(shù)據(jù)和包含更多信息的相關(guān)資源。
2) 黑腹果蠅基因組測序的狀態(tài) :描述了目前在GenBank,Entrez Genomes,和FTP站點中的數(shù)據(jù)的范圍
3) Entrez圖譜瀏覽器 :整合的染色體圖譜—圖譜瀏覽器是Entrez基因組的一個軟件組成部分,用來顯示一個或多個用共同標記或基因名字互相align過的圖譜,以及用相同序列進行比較過的序列圖譜。在人類基因組數(shù)據(jù)和搜索技巧文件中有關(guān)于目前可以使用的果蠅的序列和細胞遺傳學(xué)圖譜。Entrez圖譜瀏覽器的幫助文件提供了關(guān)于如何使用這個工具的一般說明。
4) 位點鏈接(LocusLink): 為校正過的序列和遺傳位點的描述信息提供一個單次查詢界面。LocusLink給每個位點發(fā)布一個穩(wěn)定的ID,并提供官方的命名,序列accesssion number, Unigene簇,圖譜信息,和相關(guān)的網(wǎng)址。LocusLink是NCBI,人類基因命名委員會,OMIM和其它組織的合作結(jié)果。LocusLink目前包含人類,小鼠,大鼠,斑馬魚,和果蠅的位點,物種可以被分開或合在一起查詢。
5、 線蟲基因組
Entrez基因組:染色體的圖形表示,可以整個的查看,也可以逐步放大的看。鏈接到相關(guān)的序列數(shù)據(jù)。
6、 酵母基因組
1) Entrez基因組 :染色體的圖形表示,可以整個的查看,也可以逐步放大的看。鏈接到相關(guān)的序列數(shù)據(jù)。
2) COGs :相鄰類的聚簇 — 來自于完整基因組的基因家族自然系統(tǒng)。COGs用比較21種完整的基因組的編碼的蛋白序列描繪了17個主要的種系發(fā)生系統(tǒng)。每個COG包含至少來自3個世系的獨立蛋白或蛋白家族的相鄰體,所以對應(yīng)了一個古老的保守domain。
7、 瘧原蟲基因組
1) 瘧原蟲遺傳學(xué)和基因組:提供與瘧原蟲遺傳學(xué)和基因相關(guān)的數(shù)據(jù)和信息。資源包括物種特異的序列BLAST數(shù)據(jù)庫(惡性瘧原蟲,所有瘧原蟲,以及弓形蟲),基因組圖譜,連鎖標記,以及遺傳學(xué)研究信息。鏈接到其他的瘧原蟲網(wǎng)站和相關(guān)的寄生蟲遺傳學(xué)數(shù)據(jù)庫包括弓形蟲。
2) Entrez基因組 — 惡性瘧原蟲的染色體全長的圖形視圖,完整的染色體序列數(shù)據(jù)(2和3),鏈接到正在進行的染色體的分離數(shù)據(jù)表(來自于HB3 X Dd2雜交的染色體),鏈接到其他基因組測序中心。
3) FTP站點 (pub/Malaria目錄):用于查找在DNA序列中STS的電子PCR瘧原蟲版。
4) FTP站點 (genbank/genomes 目錄):下載各種格式的完整的染色體序列數(shù)據(jù)(2和3),包括GenBank的flat file (*.gbk),GenBank的概要文件(*.gbs),F(xiàn)ASTA核酸文件(*.fna),F(xiàn)ASTA氨基酸文件(*.faa),蛋白表(*.ptt)和其他。
8、 細菌基因組
1) Entrez基因組 — 完整細菌基因組的圖形表示,可以整個的查看,也可以逐步放大的看。鏈接到相關(guān)的序列數(shù)據(jù)。對每一個細菌都提供了一個編碼區(qū)域的概要和TaxTable。
2) 微生物基因組測序計劃:完成的和正在進行的測序計劃,鏈接到NCBI的圖形視圖和測序中心。
3) COGs :相鄰類的聚簇 — 來自于完整基因組的基因家族自然系統(tǒng)。COGs用比較21種完整的基因組的編碼的蛋白序列描繪了17個主要的種系發(fā)生系統(tǒng)。每個COG包含至少來自3個世系的獨立蛋白或蛋白家族的相鄰體,所以對應(yīng)了一個古老的保守domain。
4) FTP站點: 下載各種格式的完整的細菌染色體序列數(shù)據(jù),包括GenBank的flat file (*.gbk),GenBank的概要文件(*.gbs),F(xiàn)ASTA核酸文件(*.fna),F(xiàn)ASTA氨基酸文件(*.faa),蛋白表(*.ptt)和其他。
5) 微生物基因組BLAST數(shù)據(jù)庫 :與完成的和未完成的微生物基因組進行BLAST


用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網(wǎng)友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2024 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com