Domanda sul database del gene NCBI
-
27-10-2019 - |
Domanda
Sto cercando di trovare il file Gene_Info con genenames e posizione cromosomica. Tuttavia, non riesco a localizzarlo sul sito FTP NCBI. Qualcuno può darmi un puntatore?
Soluzione
Vedere: ftp://ftp.ncbi.nlm.nih.gov/gene/data/readme Per i dettagli di ciò che è in quali file nel sito FTP NCBI.
Se si desidera ottenere i dati dall'NCBI stesso, dovrai combinare più file, probabilmente un Gene2Accession (che include anche informazioni sulla posizione) e un file Gene_Info che mappa ID a simboli e nomi ecc.
Probabilmente è più conveniente andare al sito UCSC per queste informazioni, forniscono anche un database MySQL pubblico se si desidera esplorare ciò che è disponibile:http://workshops.arl.arizona.edu/sql1/sql_workshop/mysql/mysqlclient.html
Se vuoi solo dati umani, mouse o topi, allora il Database del genoma di ratto ha già compilato i dati desiderati (freschi dalle fonti NCBI e Ensembl):ftp://rgd.mcw.edu/pub/data_release
ad esempio per i dati umani guardare: ftp://rgd.mcw.edu/pub/data_release/genes_human.txt