Leçon 2 - Qu’est-ce que l’analyse du contenu?

De : Bureau du Conseil privé

Introduction

Cette leçon porte sur l’analyse du contenu en tant que solution possible au problème que pose l’analyse de grandes quantités de données issues d’une consultation. L’analyse du contenu est une technique de recherche qualitative utilisée pour identifier de façon systématique les tendances dans les communications.

Bien des techniques peuvent servir pour l’analyse du contenu, notamment :

Collectivement, ces techniques permettent d’explorer de grands corpus et d’y reconnaître certaines tendances et vues d’ensemble. En examinant ainsi les données, vous pourriez en tirer des renseignements nouveaux et utiles.

Comptage des mots

En analyse du contenu, le comptage des mots permet de rechercher des thèmes et des tendances ou des mots-clés qu’il serait intéressant d’explorer. Une fois éliminés les mots sans importance tels que les articles définis (« le », « la » ou « les ») ou « mais », vous pouvez apprendre quelque chose des mots qui se trouvent le plus fréquemment dans votre jeu de données. Par exemple, dans la leçon précédente, les trois mots les plus fréquents sont :

  1. données (11);
  2. consultation (10);
  3. qualitative (6).

Ce résultat semble cohérent, étant donné que l’objectif de la leçon était d’aborder l’utilisation de données qualitatives issues d’une consultation. Pourtant, il arrive souvent que l’on s’étonne des mots qui reviennent le plus souvent dans un jeu de données. Ainsi, trouver cette information et se demander ce qu’elle pourrait signifier sont deux éléments clés de l’analyse du contenu.

Modélisation thématique

La modélisation thématique est un processus exploratoire, une façon de repérer dans un texte des tendances et des thèmes qui pourraient orienter la recherche. Les êtres humains sont capables de lire un texte et d’en comprendre le sens naturellement. Vous voyez les liens entre les mots et en tirez des conclusions. Vous arrivez à établir ces liens parce que vous avez une connaissance du monde.

Les ordinateurs n’ont pas cette connaissance. Lorsqu’on leur donne une liste de mots, ils ne peuvent pas raisonner comme vous le faites pour reconnaître des catégories thématiques. Ils ne savent que ce que vous leur dites.

La modélisation thématique ne consiste pas à établir des liens à la manière des êtres humains, mais plutôt à faire appel à des modèles statistiques pour chercher des « parties » similaires dans un jeu de données. L’objectif de la modélisation thématique est donc de trouver des « parties » que les humains peuvent interpréter comme étant des « sujets » logiques. Vous ne saurez pas dès le départ combien de « sujets » différents renferme un jeu de données, ni combien de mots correspondent à chacun d’eux. Pour le savoir, il n’y a pas d’autre moyen que d’essayer différentes options.

Analyse des sentiments

L’analyse des sentiments permet de cerner le contenu émotionnel des mots. Il s’agit essentiellement de compter les mots négatifs et les mots positifs pour savoir si le jeu de données va plutôt dans un sens ou dans l’autre. Les résultats sont subjectifs, étant donné que l’attribution d’une étiquette positive ou négative aux mots repose sur une interprétation faite par l’être humain. Pour réaliser cette analyse, il convient de fournir à l’ordinateur une liste des mots positifs et négatifs.

L’analyse des sentiments est un domaine qui évolue constamment. Il existe des outils plus élaborés, particulièrement pour la compréhension des médias sociaux et des mégadonnées.

Conclusion

Vous venez de voir quelques-unes des techniques que vous pouvez utiliser pour l’analyse du contenu. Dans les leçons qui suivent, vous apprendrez comment vous en servir et en quoi elles interviennent dans le processus d’élaboration des politiques.

Détails de la page

Date de modification :