Domanda

Sto cercando di trovare il file Gene_Info con genenames e posizione cromosomica. Tuttavia, non riesco a localizzarlo sul sito FTP NCBI. Qualcuno può darmi un puntatore?

È stato utile?

Soluzione

Vedere: ftp://ftp.ncbi.nlm.nih.gov/gene/data/readme Per i dettagli di ciò che è in quali file nel sito FTP NCBI.

Se si desidera ottenere i dati dall'NCBI stesso, dovrai combinare più file, probabilmente un Gene2Accession (che include anche informazioni sulla posizione) e un file Gene_Info che mappa ID a simboli e nomi ecc.

Probabilmente è più conveniente andare al sito UCSC per queste informazioni, forniscono anche un database MySQL pubblico se si desidera esplorare ciò che è disponibile:http://workshops.arl.arizona.edu/sql1/sql_workshop/mysql/mysqlclient.html

Se vuoi solo dati umani, mouse o topi, allora il Database del genoma di ratto ha già compilato i dati desiderati (freschi dalle fonti NCBI e Ensembl):ftp://rgd.mcw.edu/pub/data_release

ad esempio per i dati umani guardare: ftp://rgd.mcw.edu/pub/data_release/genes_human.txt

Autorizzato sotto: CC-BY-SA insieme a attribuzione
Non affiliato a StackOverflow
scroll top