Uso de bases de datos biológicas

Principales contenidos

  • Formatos: FASTA, GFF, BED.
  • Repositorios genéricos: GenBank, UniProt, GEO, PDB.
  • Repositorios específicos de organismos: sgd, flybase, etc.

Detalles

Tipo: Obligatoria
ECTS: 3
Semestre (duración): 1º (septiembre)
Ficha en PDF: Descargar.

Docentes

Diego Alonso (diego.alonso@usal.es)

Descripción

Como resultados de aprendizaje el estudiante obtendrá un conocimiento básico de la estructura interna de las bases de
datos relacionales, así como algunos conceptos de otro tipo de bases de datos (no relacionales, orientadas a grafos, etc.). También obtendrá un conocimiento preciso de las diferentes bases de datos públicas que son referencia en cada ámbito de la biología molecular. Será capaz de efectuar consultas avanzadas en cada una de ellas y de manejar los diferentes tipos de resultados que se obtienen, tanto en pantalla como en ficheros. Además, podrá acceder de forma automatizada a aquellos sistemas que proporcionen servicios web, implementado dicho acceso en diferentes lenguajes de programación.

Contenidos

Para obtener los resultados de aprendizaje previstos, se planea impartir los siguiente contenidos:

  1. Bases de datos y sistemas de información: arquitectura de los sistemas de información, modelo relacional, SQL, otros paradigmas.
  2. Repositorios públicos: NCBI (Gene, Pubmed, GEO, SRA, etc.), EMBL-EBI (Ensembl, ArrayExpress, Reactome, PDB, Expression Atlas, etc.), UniProt (SwissProt, TrEMBL, Proteomes, etc.), KEGG, etc.
  3. Anotaciones y ontologías: estructuración del conocimiento, vocabularios controlados, Gene Ontology, OLS, OBO.
  4. Acceso automatizado: ficheros de datos, formatos, servicios web, acceso mediante lenguajes de programación.