Datumo de Séoul lève 15,5 M$ pour la sécurité et l'évaluation de l'IA
La prolifération rapide de l’intelligence artificielle générative a apporté avec elle un défi pressant : s’assurer que ces modèles puissants fonctionnent de manière sûre et responsable. Un récent rapport de McKinsey a souligné cette préoccupation, révélant que si 40 % des organisations considèrent l’explicabilité de l’IA — comprendre comment et pourquoi l’IA prend des décisions spécifiques — comme un risque significatif, seulement 17 % y remédient activement. C’est dans cette lacune critique que s’inscrit Datumo, basée à Séoul, une entreprise qui a commencé son parcours dans l’étiquetage de données d’IA et qui s’est maintenant orientée vers l’offre d’outils et de données pour tester, surveiller et améliorer les modèles d’IA, le tout sans nécessiter une expertise technique approfondie. La startup a récemment annoncé une levée de fonds de 15,5 millions de dollars, portant son capital total levé à environ 28 millions de dollars auprès d’investisseurs tels que Salesforce Ventures, KB Investment et SBI Investment.
L’histoire d’origine de Datumo remonte à son PDG, David Kim, ancien chercheur en IA à l’Agence coréenne pour le développement de la défense. Frustré par la nature laborieuse de l’étiquetage de données, Kim a conçu une solution novatrice : une application mobile basée sur les récompenses qui permettait aux individus d’étiqueter des données pendant leur temps libre en échange d’une compensation. Ce concept innovant a été validé pour la première fois lors d’un concours de startups organisé à l’Institut supérieur coréen des sciences et technologies (KAIST), où Kim, aux côtés de cinq autres anciens élèves du KAIST, a cofondé Datumo (initialement connue sous le nom de SelectStar) en 2018. Avant même que l’application ne soit entièrement développée, Datumo a sécurisé des dizaines de milliers de dollars en ventes pré-contractuelles pendant la phase de découverte de clients du concours, principalement auprès d’entreprises et de startups dirigées par des anciens élèves du KAIST.
L’entreprise a rapidement gagné du terrain, dépassant 1 million de dollars de revenus au cours de sa première année et obtenant des contrats cruciaux avec de grands conglomérats sud-coréens tels que Samsung, Samsung SDS, LG Electronics, LG CNS, Hyundai, Naver et le géant des télécommunications SK Telecom. Avec plus de 300 clients en Corée du Sud, Datumo a déclaré environ 6 millions de dollars de revenus en 2024. Cependant, il y a plusieurs années, la demande des clients a commencé à évoluer au-delà du simple étiquetage de données. “Ils voulaient que nous évaluions les sorties de leurs modèles d’IA ou que nous les comparions à d’autres sorties”, a expliqué Michael Hwang, cofondateur de Datumo. “C’est à ce moment-là que nous avons réalisé : nous faisions déjà de l’évaluation de modèles d’IA — sans même le savoir.” Cette prise de conscience a incité Datumo à redoubler d’efforts en matière d’évaluation de l’IA, ce qui a conduit à la publication du premier jeu de données de référence de Corée spécifiquement axé sur la confiance et la sécurité de l’IA. Comme l’a précisé Kim, “Nous avons commencé par l’annotation de données, puis nous nous sommes étendus aux jeux de données de pré-entraînement et à l’évaluation à mesure que l’écosystème des grands modèles linguistiques mûrissait.”
L’importance croissante des données d’entraînement et de l’évaluation de l’IA est soulignée par les récentes initiatives de l’industrie, telles que l’investissement significatif de 14,3 milliards de dollars de Meta, s’apparentant à une acquisition, dans la société d’étiquetage de données Scale AI. Cet accord a non seulement mis en évidence la valeur du marché, mais a également intensifié la concurrence, notamment lorsque le concurrent de Meta, OpenAI, a par la suite cessé d’utiliser les services de Scale AI. Datumo navigue dans ce paysage concurrentiel avec une approche distinctive. Tout en partageant des similitudes avec des entreprises comme Scale AI dans la fourniture de jeux de données de pré-entraînement, et avec des plateformes d’évaluation et de surveillance de l’IA telles que Galileo et Arize AI, Datumo se distingue. Elle exploite des jeux de données sous licence uniques, en particulier des données méticuleusement extraites de livres publiés, qui, selon le PDG Kim, offrent un raisonnement humain riche et structuré, mais sont notoirement difficiles à nettoyer.
De plus, Datumo propose une plateforme d’évaluation complète et “full-stack” appelée Datumo Eval. Cette plateforme génère automatiquement des données de test et des évaluations pour identifier les réponses d’IA dangereuses, biaisées ou incorrectes sans nécessiter de script manuel. Surtout, son produit phare est un outil d’évaluation sans code, le rendant accessible aux non-développeurs, y compris les professionnels des équipes de politique, de confiance et de sécurité, et de conformité. Le chemin pour obtenir l’investissement de Salesforce Ventures a été particulièrement stratégique. Kim a raconté comment une publication LinkedIn partageant une discussion informelle avec Andrew Ng, fondateur de DeepLearning.AI, lors d’un événement en Corée du Sud, a attiré l’attention de Salesforce Ventures, menant finalement à de multiples réunions et à un engagement informel après un processus de financement de huit mois.
Le capital nouvellement sécurisé sera essentiel pour accélérer les efforts de recherche et développement de Datumo, en particulier dans la création d’outils d’évaluation automatisés avancés pour les solutions d’IA d’entreprise. Il alimentera également l’expansion de leurs opérations mondiales de mise sur le marché en Corée du Sud, au Japon et aux États-Unis. Avec une équipe de 150 employés à Séoul, Datumo a déjà établi une présence dans la Silicon Valley depuis mars, signalant ses ambitions de devenir un leader mondial de la confiance et de la sécurité de l’IA.