Principales contenidos
- Formatos: FASTA, GFF, BED.
- Repositorios genéricos: GenBank, UniProt, GEO, PDB.
- Repositorios específicos de organismos: sgd, flybase, etc.
Detalles
Tipo: Obligatoria
ECTS: 3
Semestre (duración): 1º (septiembre)
Ficha en PDF: Descargar.
Docentes
Diego Alonso (diego.alonso@usal.es)
Descripción
Como resultados de aprendizaje el estudiante obtendrá un conocimiento básico de la estructura interna de las bases de
datos relacionales, así como algunos conceptos de otro tipo de bases de datos (no relacionales, orientadas a grafos, etc.). También obtendrá un conocimiento preciso de las diferentes bases de datos públicas que son referencia en cada ámbito de la biología molecular. Será capaz de efectuar consultas avanzadas en cada una de ellas y de manejar los diferentes tipos de resultados que se obtienen, tanto en pantalla como en ficheros. Además, podrá acceder de forma automatizada a aquellos sistemas que proporcionen servicios web, implementado dicho acceso en diferentes lenguajes de programación.
Contenidos
Para obtener los resultados de aprendizaje previstos, se planea impartir los siguiente contenidos:
- Bases de datos y sistemas de información: arquitectura de los sistemas de información, modelo relacional, SQL, otros paradigmas.
- Repositorios públicos: NCBI (Gene, Pubmed, GEO, SRA, etc.), EMBL-EBI (Ensembl, ArrayExpress, Reactome, PDB, Expression Atlas, etc.), UniProt (SwissProt, TrEMBL, Proteomes, etc.), KEGG, etc.
- Anotaciones y ontologías: estructuración del conocimiento, vocabularios controlados, Gene Ontology, OLS, OBO.
- Acceso automatizado: ficheros de datos, formatos, servicios web, acceso mediante lenguajes de programación.