Motor analítico para investigadores
Sector Salud & Farmacéutico
Cliente
Proyecto de investigación desarrollado en colaboración con entidades públicas. Financiación de la Unión Europea en el marco del programa H2020.
Descripción
Creación de un repositorio de datos relacionados por tiempo y localización geográfica, con especial foco en datos interesantes para investigadores de los sectores sanitario, farmacéutico y seguros.
Resultados
Se desarrolló un sistema basado en microservicios capaz de extraer información de diversas fuentes e integrarla usando un esquema común.
Se desarrollaron técnicas para normalizar y cruzar las diferentes fuentes de datos por fecha y localización.
Se desarrolló una herramienta interactiva que el usuario final puede usar para seleccionar y cruzar fuentes de datos.
Se desarrolló un algoritmo basado en Procesamiento del Lenguaje Natural capaz de identificar en un texto libre las diferentes fuentes de información y la relación entre las mismas, usado en el sistema de búsqueda ofrecido a los usuarios.
Tecnología
Extracción y limpieza de los datos usando pandas.
Almacenamiento en BB.DD relacionales como PostgreSQL y Oracle.
Procesamiento de Lenguaje Natural usando spaCy y NLTK.