Pour combattre le spam, Google se munit de la technologie de l’intelligence artificielle. Le but est d’éradiquer les contenus malveillants qui pullulent sur Internet. En effet, le moteur de recherche affirme la découverte quotidienne de 40 milliards de pages de spam parmi les milliards de sites ou mails explorés et indexés. L’année dernière, Google indique son utilisation des techniques appuyées par l’intelligence artificielle dans son combat, en annonçant que l’IA est en mesure de faire ses preuves, avec un taux de succès estimé à 99%.
L’indexation au centre des procédés employés pour combattre le spam
La détection
Les méthodes d’intelligence artificielle permettent de faire une détection des contenus indésirables depuis la navigation des utilisateurs sur les sites ou la réception des e-mails. Une fois détecté, le site en question devient exclu de l’index avec lequel Google fournit des résultats de recherche.
L’analyse
Ces procédés effectuent une analyse des données des sites qui sont indexés au préalable dans le moteur de recherche. S’il s’avère qu’un site soit soupçonné de contenir du spam, il n’apparaîtra pas dans les résultats de recherche ou dans la boîte mail de l’utilisateur.
Le filtrage
C’est en utilisant crawler GoogleBot pour l’épuration des contenus indésirables. Il prend forme d’un robot qui ratisse les sites web lien par lien, à des fins d’indexation. Ce filtrage divise le contenu trouvé sur Internet en « spam exploré » à « spam indexé ».
Sur les boîtes email, Google utilise TensorFlow pour bloquer 100 millions de spams par jour. L’utilisation de l’apprentissage automatique signifie que l’on passe de la reconnaissance des formes dans les spams à des systèmes d’auto-apprentissage et d’optimisation.
Selon Google, les progrès de l’IA ont permis de réduire de plus de 80 % le nombre de sites dont le contenu est généré automatiquement ou récupéré dans les résultats de recherche. Alors que le spam de piratage était « toujours répandu en 2020 », Google a déclaré avoir amélioré « la capacité de détection de plus de 50 % », ce qui lui a permis de supprimer la plupart des spams de ses résultats de recherche.
Vers une consolidation des protocoles de sécurité ?
Dans le domaine de la protection des données de l’utilisateur, Google ambitionne d’éliminer l’escroquerie et les fraudes signalées par les internautes. Grâce à ces signalements, les systèmes développés par Google ont pu d’abord s’entraîner à détecter les sites malveillants pour ensuite analyser leur véritable nature. Cette méthode a pour but d’éliminer le risque pour les utilisateurs de tomber sur un contenu indésirable ou arnaqueur.