Anonimización Automática de Formularios
El Ayuntamiento de Galapagar, en Madrid, asigna a dos de sus administrativos la tarea de anonimizar datos personales como nombres, apellidos, DNIs, direcciones y números de teléfono en documentos PDF. Este proceso es esencial para cumplir con las leyes de protección de datos.
En WhiteBox identificamos rápidamente la oportunidad de automatizar completamente este proceso. Utilizamos modelos de lenguaje de última generación (LLMs) que detectan y procesan los fragmentos de documentos que contienen información sensible. Combinamos esto con un eficiente sistema de manejo de archivos PDF, reemplazando los datos personales por marcas de anonimato, mientras que el resto del documento permanece inalterado. Implementamos herramientas de código abierto para la manipulación de PDFs y el desarrollo con LLMs, utilizando el framework Langchain. El resultado fue el desarrollo de un herramienta web, que integraba los modelos encargados de la tarea de anonimización, que permitía la subida de archivos PDF y los devolvía anonimizados en escasos minutos.
La automatización ha liberado tiempo valioso del personal administrativo del Ayuntamiento de Galapagar, permitiéndoles enfocarse en mejorar la eficiencia burocrática y la atención ciudadana. Este proyecto posiciona al ayuntamiento entre las administraciones pioneras en el uso exitoso de la inteligencia artificial, destacando su compromiso con la innovación y el avance tecnológico en un municipio de tamaño modesto.