Vearsa

Livre, automatisation, crawling
Détection de couvertures de livres en ligne

Problématique

La plateforme de ebook Vearsa cherche à étendre la diffusion et les opportunités de ventes de livres électroniques sur des marketplaces en ligne. La société veut s’assurer que les images des livres mis en avant sur ces sites de distributeurs représentent bien les bonnes couvertures de livres (de la bonne maison d’édition, avec bon décor de couverture, et de la bonne année). Pour cela, Vearsa a besoin d’optimiser son processus de vérification et la ressource dédiée à régulièrement superviser et valider les couvertures en ligne, pour un volume de plus de 500 000 ebooks enregistrés dans sa base de données.

Briques technologiques mises en œuvre

Matching
Faire une recherche de contenu (partiel, transformé) dans une base de données pré-remplie

Résultats

Vearsa a déployé un système automatisé intégrant l’API de reconnaissance visuelle LTU.

Dans un premier temps, il s’agit de collecter à l’aide d’un outil de crawling, les images et métadonnées des livres présentes dans les fiches produits des marketplaces ciblées. Et dans un second temps, d’opérer un matching à l’aide de notre API de reconnaissance d’images pour identifier parmi les couvertures de livres collectées celles qui correspondent bien aux images de références dans la base de données de Vearsa. Et ainsi détecter les images de couvertures qui n’obtiennent pas de correspondances avec les images dans la base de Vearsa, ce qui indique que l’image affichée sur la fiche produit n’est pas conforme.

Les bénéfices pour Vearsa est une économie considérable, en temps et en force humaine, grâce à un processus automatisé capable d’obtenir des résultats fiables en quelques secondes pour plusieurs centaines de milliers d’images traitées.