Blog ENI : Toute la veille numérique !
🎃 Jusqu'à -30% sur les livres en ligne, vidéos et e-formations.
Code : GHOST30.
Cliquez ici !
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
  1. Livres et vidéos
  2. Marketing prédictif
  3. Anticiper les effets de réputation en ligne
Extrait - Marketing prédictif Data, machine learning et statistiques appliqués au marketing
Extraits du livre
Marketing prédictif Data, machine learning et statistiques appliqués au marketing Revenir à la page d'achat du livre

Anticiper les effets de réputation en ligne

L’analyse de données textuelles

Avec le développement des réseaux sociaux et d’Internet, les données textuelles sont devenues très nombreuses et peuvent apporter des informations intéressantes aux marques.

Elles font partie de la famille des données non structurées et sont donc, parfois, un peu plus difficiles à appréhender. Le texte peut sembler plus familier et plus accessible à toutes et tous mais il devient également difficile à traiter quand il est en grande quantité. Que faire des échanges sur les réseaux sociaux au sujet de notre marque ? Que faire des avis en ligne déposés par de nombreux clients ? Dans une certaine mesure, vous pourrez les traiter un par un mais, rapidement, cette tâche peut s’avérer fastidieuse. De même, vérifier chaque jour ce qui se dit sur votre marque ou votre entreprise en ligne peut vous éloigner de votre cœur de métier.

Des outils commerciaux (et payants donc) permettent de mener cette surveillance. Certains vont même jusqu’à identifier les trolls ou les commentaires négatifs pour qu’ils n’apparaissent pas dans les commentaires sur votre site (Google travaille sur ce type d’outils avec Perspective). Les bots, eux, sont « nourris » avec des données textuelles pour pouvoir...

Extraire des tweets

Twitter est un réseau social intéressant pour suivre les tendances et les échanges sur votre marque. Vous pouvez y organiser une veille régulière ou une veille plus ciblée en lien avec un événement positif ou négatif lié à votre entreprise. Le lancement d’un produit, l’organisation d’un événement, une célébration de l’anniversaire de votre entreprise sont autant d’événements positifs à suivre. Au contraire, un problème sanitaire, un scandale ou un bad buzz sont autant d’événements négatifs à surveiller pour pouvoir mieux réagir et ne pas perdre la confiance de votre communauté.

Notre exemple portera sur les cas de salmonelles découverts dans les chocolats de la marque Kinder juste avant Pâques 2022. Nous souhaitons voir, d’une part, l’évolution du nombre de tweets et, d’autre part, les thèmes abordés.

Dans un premier temps, nous allons charger dans R des packages nécessaires (au préalable, il faudra les avoir installés comme expliqué dans le chapitre Augmenter la valeur de ses clients).

library(dplyr) 
library(NLP) 
library(twitteR) 
library(stringr) 
library(tm) 
library(RColorBrewer) 
library(wordcloud) 
library(SnowballC) 
library(openxlsx) 
library(cluster) 
library(FactoMineR) 
library(ggplot2) 
library(syuzhet) 
library(stringi) 
library(topicmodels) 
library(rtweet) 
library(here) 
library(forcats) 
library(purrr) 

Nous allons ensuite « appeler » les tweets qui nous intéressent avec le code suivant :

##recherche des 10000 derniers tweets avec le hashtag Kinder, 
en excluant les retweets 
 
tweet_kinder<-search_tweets("#kinder",n=10000,lang="fr", 
include_rts = FALSE) 

Dans ce code, nous avons demandé une recherche de tweets comprenant #Kinder, nous en avons demandé 10 000 en langue française. Nous avons également demandé d’exclure les retweets.

Nous allons maintenant visualiser les données :

tweet_kinder 

Cette visualisation n’est toutefois pas la plus pratique car la base de données apparaît dans les résultats...

Analyser ce que votre communauté dit

À certains moments clés de la vie de votre entreprise, il vous sera nécessaire d’observer ce qui se dit sur elle. Par exemple, lorsque la SNCF a lancé sa nouvelle application SNCF Connect, elle a dû observer les réactions de sa clientèle en ligne. Un autre exemple est celui des scandales, en 2022, des marques Buitoni et Kinder. Une observation des contenus à intervalles réguliers permet de connaître la tendance positive ou négative des commentaires mais aussi les thèmes de ces commentaires.

Pour faire ces analyses, plusieurs familles de méthodes existent, nous vous en proposons un aperçu.

Les méthodes d’analyse

L’analyse de données textuelle s’organise en trois grandes catégories : les analyses basées sur des dictionnaires, les analyses par classification (supervisées ou non) et les analyses de topic discovery. La première méthode est le plus souvent employée par les chercheurs en sciences sociales lorsqu’ils souhaitent confirmer une théorie, la deuxième méthode sert à la prédiction et la troisième à l’identification de grands thèmes.

Au cours des dernières années, les chercheurs en marketing ont utilisé de nombreuses méthodes différentes en quête de celle qui sera la plus efficace. D’autres mériteraient d’être testées car elles ont montré leur efficacité dans d’autres domaines. Comme souvent, il n’y a pas une méthode qui domine les autres mais des méthodes plus ou moins efficaces selon ce que nous souhaitons faire. Ainsi, la classification est idéale pour prédire. Par exemple, à partir des textes des avis en ligne, on cherchera à prédire la satisfaction des consommateurs et consommatrices. Les données d’apprentissage pour ces méthodes sont les avis en ligne et la note qui va avec (combien d’étoiles sur cinq ?). Les méthodes d’identification de thèmes sont particulièrement utiles pour faire des diagnostics, comprendre les motivations et sources de satisfaction et prendre ensuite des décisions. Par exemple, en explorant les discours...