Argilla obtiene 1,5M€ en una ronda para impulsar su plataforma de Procesamiento del Lenguaje Natural
Argilla, creadora de la primera plataforma que permite crear soluciones de Procesamiento del Lenguaje Natural (PLN) con una plataforma única de etiquetado de datos para empresas, ha cerrado una ronda de financiación semilla de cerca de 1,5 millones de euros (1,6 millones de dólares). La ronda ha sido co-liderada por la primera firma de capital riesgo centrada exclusivamente en invertir en Inteligencia Artificial (IA), Zetta Venture Partners, y la española de capital riesgo deeptech centrada en infraestructura de datos y herramientas de desarrollo Caixa Capital Risc.
El PLN es un componente de la Inteligencia Artificial ampliamente utilizado en asistentes digitales y chatbots, así como en aplicaciones de análisis de sentimientos, textual y del habla. La adopción de tecnologías PNL por parte de empresas está en auge gracias a que cada vez existen opciones más asequibles y escalables, así como al aumento del procesamiento y la digitalización de datos, y a la convergencia del PNL con el deep learning y el machine learning.
A medida que los modelos de machine learning se vuelven más potentes, estándares y accesibles a través de hubs de código abierto como Hugging Face, el entrenamiento de datos de alta calidad se ha convertido en el factor más importante para que las empresas implementen con éxito las tecnologías PLN.
DATA Y MACHINE LEARNING
"Un estudio reciente de Meta y la UCL de Londres descubrió que añadir unos pocos ejemplos de entrenamiento de datos de alta calidad es más beneficioso para la calidad del modelo que aumentar el tamaño del modelo en miles de millones de parámetros, dado que tiene un gran impacto en el coste ", afirma Francisco Aranda, cofundador de Argilla. "Como resultado, estamos viendo un cambio de dirección de la IA centrada en el modelo a la IA centrada en los datos o, dicho de otro modo, un giro de la cantidad a la calidad de los datos".
Para abordar este problema, los co-fundadores de Argilla, Daniel Vila Suero y Francisco Aranda, desarrollaron la primera plataforma PLN centrada en datos para que los equipos de data y machine learning construyan y supervisen entrenamiento de datos de alta calidad, con sólo una fracción del tiempo y del coste de las otras herramientas. Las empresas pueden utilizar Argilla para implicar a los especialistas en su ciclo de vida de PLN, lo que mejora la calidad de los datos y les permite utilizar los métodos de etiquetado más sofisticados del mundo académico, lo que también reduce los costes de etiquetado. Argilla representa una potente alternativa al etiquetado manual de miles de ejemplos de entrenamiento.
Según Roma Jelinskaite, responsable de Inversiones de Caixa Capital Risc, "enseñar a un modelo de machine learning es un proceso tedioso; el etiquetado de datos es un gran reto y un obstáculo porque es lento, costoso y laborioso. Argilla desempeñará un papel clave en el campo del PLN al no tener que elegir entre ser precisos o eficientes".
PLATAFORMA DE ETIQUETADO CENTRADA EN DATOS DE ARGILLA
Argilla es la primera plataforma de etiquetado de datos de código abierto que ofrece las prácticas más sofisticadas del mercado y, al mismo tiempo, es lo suficientemente sencilla como para integrarse con otras herramientas de PLN y Machine Learning. La plataforma permite implicar a los perfiles empresariales en el proceso, garantizando que los modelos cumplen todos los requisitos de la empresa. Al facilitar la adaptación de modelos preentrenados a casos de uso específicos, Argilla ayuda a las empresas a sacar el máximo partido de sus soluciones PLN.
Otras ventajas clave son:
- Reduce el tiempo y aumenta la calidad: Las empresas pueden reducir el tiempo de producción y mejorar la calidad de los modelos sin realizar un extenso etiquetado manual.
- Desbloquea el valor de los datos: Argilla facilita la creación y el despliegue de modelos PLN de alta calidad y desbloquea el valor de los datos.
- Para equipos de datos: Argilla simplifica el proceso de construcción de complejos flujos de trabajo human-in-the-loop (HITL), los integra con una pila existente y mejora los modelos con el tiempo. También permite a los equipos ajustar cualquier modelo lingüístico preentrenado para satisfacer las necesidades específicas de su negocio.
- Para empresas y expertos: Argilla facilita la contribución a la calidad de los datos y los modelos sin requerir conocimientos de programación ni cientos de horas de etiquetado y revisión manual.
PIONEROS EN EL ENFOQUE DE PNL EMPRESARIAL
James Alcorn, socio de Zetta Venture Partners, afirma que "Dani, Francis y el equipo de Argilla han sido pioneros en el nuevo enfoque de PNL empresarial. Su objetivo de llevar al mercado las funciones más sofisticadas de data curation, etiquetado programático y human-in-the-loop ha sido recompensado por miles de usuarios que usan Argilla para generar valor a partir de la PLN en su organización. Zetta está encantado de asociarse con Dani, Francis, y el líder español de capital riesgo Caixa Capital Risc para ayudar a Argilla a abordar su próxima fase de crecimiento."
Por su parte, el cofundador de Argilla, Daniel Vila Suero, ha asegurado: "Estamos encantados de contar con el respaldo y la orientación de dos empresas de capital riesgo líderes que invierten en tecnologías de vanguardia y que creen en las posibilidades que aporta Argilla". "Sabemos que las grandes tecnológicas mundiales están buscando soluciones por el aumento de sus presupuestos para PLN. Desde 2020, el 60% ha aumentado su presupuesto un 10%, el 33% indicó que creció al menos un 30% y el 15% dijo que se ha más que duplicado. Seguimos invirtiendo en nuestra plataforma con el objetivo de capacitar a las empresas para crear productos PLN sólidos a través de un etiquetado y una conservación de datos más rápidos y con las funciones más fáciles de usar."
Argilla ya cuenta con miles de usuarios en Estados Unidos, India, Europa, Sudamérica y Asia. Entre sus clientes actuales se encuentran Reale Seguros (Italia), Airbus (Alemania), y Red Eléctrica de España e Idealista (España). La oferta en la nube de Argilla (actualmente en fase alfa) estará disponible en EE.UU. y en todo el mundo en el primer trimestre de 2023.
Número de empresas tech e innovadoras en España
Fuente de datos: Ecosistema Startup, la mayor plataforma de empresas españolas.