Extracción Automática de Métricas de Startups
KFund, un destacado fondo de capital de riesgo en España, invierte en startups innovadoras en su fase inicial, como por ejemplo Factorial y Graphext. Dada su estrategia de inversión en empresas con gran potencial disruptivo y de crecimiento, enfrenta el desafío de gestionar un elevado número de propuestas de inversión en formato de presentaciones (.pdf). Estas presentaciones varían significativamente y contienen datos cruciales, como ingresos mensuales recurrentes (MRR), número de fundadores y proyecciones financieras a cinco años, que necesitan ser analizados de manera estructurada para tomar decisiones de inversión informadas.
En respuesta a este desafío, desde WhiteBox desarrollamos un sistema de procesamiento automatizado. Comenzamos transformando los archivos PDF a texto mediante tecnologías de visión por computadora, incluidos los Vision Transformers. Luego, implementamos una aplicación con LLMs (modelos de lenguaje de última generación de OpenAI), utilizando el framework Langchain para extraer datos relevantes de los textos de los pitches. Finalmente, almacenamos los KPIs de cada startup en una base de datos relacional, facilitando así la consulta y comparación rápida y eficiente de las métricas de diversas empresas.
Este enfoque transformó el proceso de evaluación de KFund de uno manual y laborioso, que requería la dedicación exclusiva de un empleado a tiempo completo, a un método automatizado y eficaz. Ahora, KFund puede concentrarse en evaluar sólo aquellas startups cuyos indicadores claves cumplen con los criterios preestablecidos para la inversión. Este sistema no solo optimiza el tiempo sino que también permite a KFund acceder a métricas consolidadas e insights valiosos sobre las startups que solicitan financiación, mejorando la selección y el análisis de posibles inversiones.