Compréhension approfondie du contenu des medias sociaux
Projets compétitifs
Jusqu’à 1,2 million de dollars en financement progressif destiné au développement pour faire avancer une technologie
Le ministère de la Défense nationale (MDN) et la communauté des renseignements pour la sécurité sont confrontés au défi de donner un sens aux données en provenance des médias sociaux, dont le volume, la diversité et à la vitesse augmentent sans cesse, afin de produire des renseignements exploitables à l’appui de la prise de décisions stratégiques, opérationnelles et tactiques.
Résultats
| web_id | Titre du projet | Innovateur | Montant | Étape |
|---|
Énoncé du défi
Le ministère de la Défense nationale (MDN) et la communauté des renseignements pour la sécurité sont confrontés au défi de donner un sens aux données en provenance des médias sociaux, dont le volume, la diversité et à la vitesse augmentent sans cesse, afin de produire des renseignements exploitables à l’appui de la prise de décisions stratégiques, opérationnelles et tactiques. Nous avons besoin de nouvelles approches, technologies, méthodes et de processus originaux pour appuyer les analystes dans la collecte, la gestion et l’analyse des données de sources ouvertes des utilisateurs dans le domaine public. L’objectif consiste à améliorer la connaissance de la situation et de prévoir les menaces potentielles, la nature des événements et les tendances.
Afin d’améliorer cette capacité, le MDN s'intéresse particulièrement aux développements, avec divers degrés d’automatisation, des éléments suivants :
- analyse et l’extraction du contenu;
- fusion des données;
- approches de sciences sociales pour déterminer l’intention;
- traitement de plusieurs langues et l’utilisation culturelle des langues (p. ex. une sémantique particulière);
- validation et l’évaluation des niveaux de confiance (fiabilité et inférence des sources);
- affichage des résultats (analyse visuelle, établissement de rapports);
- recherche, filtrage et harmonisation des données; et
- établissement d’alertes et de notifications (p. ex. signalisation réciproque d'objectifs).
Contexte
En raison de la complexité croissante et de la pertinence variable des données du domaine des sources ouvertes, il n’est pas possible de filtrer, d’identifier et de donner un sens à toutes les données qui pourraient être pertinentes pour la mission de défense et de sécurité. Les données sont présentes sur des centaines de différentes plateformes de médias sociaux, dans plusieurs formats et langages; elles ne sont pas structurées et sont fortement dynamiques. Les analystes souffrent de plus en plus de surcharge cognitive et de fatigue, en essayant de donner un sens à ces données complexes. Ajouter des analystes pour traiter manuellement et interpréter les données n’est pas une solution durable. Au cours du regroupement des renseignements provenant de diverses sources de données et couvrant parfois des périodes et des publics différents, des erreurs contextuelles et d’interprétation peuvent facilement se produire.
La puissance informatique sans cesse croissante permet d’améliorer la capacité de déterminer les tendances et de distinguer les schémas pertinents habituellement cachés dans d’énormes ensembles de données. Ceci est possible en partie grâce aux récents progrès en intelligence artificielle et aux nouvelles méthodes d’exploration de données et de texte.
Résultats et considérations
Le résultat escompté de ces efforts de recherche consiste à développer des processus plus efficaces et efficients pour l’analyse du contenu, capables de comprendre et de prévoir le comportement humain sur la base des activités et des communications en ligne. Les résultats particuliers de cet effort comprennent notamment ce qui suit :
- l’amélioration des processus pour les analystes;
- la réalisation d’un avantage stratégique et tactique;
- le développement d’une protection des biens; et/ou
- une puissance analytique prédictive.
Les concepts et les technologies peuvent notamment porter sur les éléments suivants, mais sans s’y limiter :
- le traitement du langage naturel;
- L’intelligence artificielle, l’analyse de textes et la reconnaissance des habitudes;
- la détection des tentatives de « fuzzing » et de fraude;
- la modélisation comportementale fondée sur les sciences sociales;
- l’analyse des sentiments;
- le marquage intelligent des données (exportable dans des formats normalisés et structurés); et/ou
- le regroupement et la visualisation des données.
Le MDN ne s’intéresse pas à l’entreposage de données, aux technologies de l’information liées au matériel pour le calcul, aux techniques de compression pour la gestion de la bande passante, à l’analyse et l’extraction de vidéo plein écran, et à d’autres mécanismes de collecte de renseignements. Ces éléments seront entièrement évalués dans le cadre d’étapes ultérieures du développement.>/p>
Nous nous intéressons aux capacités et aux concepts novateurs, mais également aux solutions pratiques qui pourraient être testées, déployées et mises en œuvre rapidement au cours des prochaines années.