CIENCIA E INGENIERÍA DE DATOS


Se trata de un área de investigación en crecimiento y con perspectiva de futuro de generar nuevo conocimiento y aplicaciones para mejorar la calidad de vida de la sociedad. Los investigadores líderes que forman parte de esta área poseen una excelente y reconocida trayectoria reflejada tanto en publicaciones como en proyectos de ámbito nacional e internacional.

 

PRIORIDADES CIENTÍFICAS Y LÍNEAS DE INVESTIGACIÓN:

Big Data: se centra en resolver los problemas para la gestión de grandes volúmenes de datos que no pueden ser tratados de manera convencional por su gran volumen, la velocidad a la que deben ser gestionados y la variedad o complejidad en la que se requiere manejar con frecuencia datos estructurados y no estructurados. Existen otras dificultades que debe afrontar como la veracidad de los datos para asegurarse de que la información extraída es fiable, el valor o rendimiento que se puede obtener de su explotación, o la dificultad inherente en su visualización.

      Líneas de investigación:

  • Nuevos sistemas para el almacenamiento masivo y eficiente de datos mediante estructuras de datos compactas y autoindexadas y, más específicamente, en el diseño e implementación de algoritmos para la creación y explotación de estructuras de datos comprimidas para diferentes tipos de datos como textos, gráficos, mapas raster, trayectorias de objetos móviles y genoma, entre otras.

Recuperación de información: se trata de la recogida, almacenamiento, indexación y búsqueda de información. Son el conjunto de teorías, modelos, algoritmos y metodologías de evaluación de textos no estructurados en ámbitos como la web, textos médicos, jurídicos o científicos.

      Líneas de investigación:

  • Modelos de recuperación de información
  • Eficiencia de los sistemas de recuperación de información
  • Sistemas de recomendación
  • Metodologías de evaluación de sistemas de información
  • Minería de textos y recuperación de información para la detección temprana de trastornos psicológicos en Internet

Sistemas de información: Los sistemas de información facilitan la recopilación, almacenamiento, procesamiento y explotación de datos de cualquier tipo. La investigación se centra en los avances en la ingeniería del software para automatizar la creación de sistemas de información, garantizando su calidad y la gestión de datos masivos, complejos y heterogéneos.

      Líneas de investigación:

  • Desarrollo de herramientas para la producción automatizada de sistemas de información en web en general, y de sistemas de información geográfica en particular
  • Desarrollo de tecnologías para sistemas de información complejos, en particular bibliotecas digitales, sistemas multimedia y sistemas de información geográfica
  • Desarrollo de sistemas para la gestión de la mobilidad que permitan la representación de trayectorias de objetos móbiles sobre mapas y la realización de consultas y análisis de datos espacio-temporales de forma eficiente.

Análisis de datos: Se trata de técnicas para los análisis de datos según su naturaleza, tipo y objetivos. Se incluyen diferentes abordajes mediante técnicas estadísticas o de inteligencia artificial aplicados a una gran cantidad de sectores diversos: industrial, finanzas, astrofísica, biología, salud, etc.

      Líneas de investigación:

  • Análisis de datos dependientes, incluyendo el análisis clúster de series temporales, la clasificación de series temporales, los métodos bootstrap suavizados para dependencia serial y la estimación suavizada de funciones cópula
  • Análisis de datos espaciales
  • Análisis de datos funcionales
  • Análisis de sistemas biológicos complejos
  • Análisis de supervivencia
  • Explotación científica de datos satélite gaia
  • Inferencia estadística en áreas pequeñas
  • Optimización de imágenes mediante el empleo de técnicas deep learning
  • Regresión simbólica determinística
  • Machine Learning con ingeniería de características, usando teoría de pertubaciones en bioinformática y quimioinformática
  • Análisis de señales médicas
  • Minería de bases de datos astronómicas
  • Diseño de estructuras de datos comprimidas
  • Análisis de datos de mobilidad

Simulación y optimización: La modelización consiste básicamente en el estudio de los procesos y productos para su representación en términos de modelos matemáticos o estadísticos. La simulación numérica de los modelos comprende el estudio y selección de algoritmos numéricos para su resolución, así como su implementación en el ordenador para el cálculo y representación gráfica de la solución buscada. Los algoritmos de optimización numérica permiten ajustar los parámetros de los modelos a datos reales para predecir la evolución de procesos o el funcionamiento de los productos.

      Líneas de investigación:

  • Modelización y simulación de procesos producción industrial
  • Finanzas computacionales
  • Modelización y simulación numérica de redes genéticas y de procesos en biología computacional
  • Modelización y simulación numérica de flujos en el medio poroso, de procesos fluidomecánicos y de olas submarinas
  • Análisis y simulación de problemas de convección-difusión, de interacción fluído-estructura y de cuerpos flotantes 
  • Algoritmos numéricos híbridos de optimización
  • Paralelización de algoritmos en multi-CPU y GPUs
  • Análisis matemático de modelos de ecuaciones diferenciales ordinarias, parciales y estocásticas
  • Programación matemática
  • Metaheurísticas
  • Juegos cooperativos y no cooperativos
  • Aplicaciones: planificación, rutas, inventarios, etc...