Intelligence artificielle et prévention du vol

24 juin 2022

Contexte : Prévention du vol

En France, les vols dans les magasins représentent plusieurs milliards d’euros de pertes chaque année. 

Monitorer le risque de vol et donc donner aux enseignes les clefs pour minimiser le risque est l’objectif de cette étude.  

Dans le cadre du déploiement de l’outil SEMAPHORE Risk Monitoring® pour une grande enseigne, une analyse des articles de presse traitant des cambriolages a été mise en place.  L’objectif ? Identifier des signaux faibles de vols et autres cambriolages sur internet permettant de déterminer les enseignes visées, la localisation du délit etc.. et ainsi optimiser la prévention du risque de vol.  

SEMAPHORE Risk Monitoring®

Le Sémaphore est un outil digital qui consolide les données des points de ventes avec celle de leur environnement (localisation, presse quotidienne régionale…). Experts de la datascience, SixFoisSept a conçu un outil d’aide à la décision qui cartographie les risque de démarque inconnue pour tous types d’enseignes. Cette cartographie des risques de vol combine les expertises métiers (retail) et datascience (intelligence artificielle et tableau de bord digital). En croisant des indicateurs de probabilité (est-ce que j’ai une « chance » de me faire voler ?) avec la sévérité de l’événement (le vol aura-t-il de lourdes conséquences ?) nous sommes en mesure de proposer des leviers d’actions et d’identifier les axes d’améliorations !

Sémaphore Risk Monitoring® aspire en temps réel les données des points de ventes et de l’opendata !

Identification et scrapping des articles

L’utilisation de l’API Google et de mots-clés adaptés au sujet a permis d’extraire les sites web les plus appropriés à l’étude. Les données des sites ont également pu être récoltées, notamment la date de publication et un résumé de leur contenu : informations utiles pour la suite de l’étude. 

Plusieurs critères ont été définis pour identifier les articles appropriés. Seules les publications claires et fiables sont prises en compte : pas d’articles de blogs, forum… Les résumés des sites sont passés au peigne fin pour ne garder que ceux contenant un certain nombre de mots clefs par rapport à la thématique analysée. Ces mots ont été choisis en fonction de leur occurrence régulière dans l’ensemble des sites et ont été affinés par un avis d’expert

Les différentes règles de sélection établies permettent de ne garder que les articles concernant des cambriolages dans des enseignes d’électroménager. Les textes des articles identifiés sont alors scrappés dans leur entièreté, dans le but d’en extraire des informations clé. 

Extraction des informations des publications

Calcul de la similarité entre les articles de presse

L’objectif ? Mesurer le degré de proximité entre deux articles de presse et pouvoir identifier et ordonner, la liste des documents les plus pertinents à offrir une réponse à l’étude sur le web. 

Comment ?  

  1. Comptabilité du nombre d’occurrences des mots dans les textes  
  1. Calcul de la similarité entre les différents articles de presse 
  1. Choix d’une valeur seuil à partir de laquelle les articles de presse sont considérés identiques. 

Grâce à ce calcul, il est possible par la suite de compléter les informations manquantes d’une publication à partir d’une deuxième publication.  

Restitution des informations

Les informations extraites des sites web sont intégrées dans la data visualisation de l’outil  SÉMAPHORE Risk Monitoring®. Elles viennent compléter les principales caractéristiques des points de vente et leur mesure de risque de vol associée. 

Rendez-vous sur notre démo 👉🏻https://www.semaphore-retail.com/

Pour plus d'informations sur notre outil SÉMAPHORE Risk Monitoring® rendez-vous sur notre page dédiée 👉🏻 Sémaphore Risk Monitoring - DataScience smart data |