Podcast : Télécharger
Abonnez-vous : Podcasts Apple | Android |
Pour l’épisode 195 de The Search Engine Journal Show, j’ai eu l’occasion d’interviewer Hamlet BatistaIl est le directeur général de RankSense et un expert technique respecté en matière de référencement.
Batista explique comment l’apprentissage approfondi transforme la façon dont les tâches d’optimisation des moteurs de recherche sont automatisées et pourquoi l’apprentissage et l’utilisation de Python est une compétence précieuse pour les professionnels de l’optimisation des moteurs de recherche.
Qu’est-ce qui, dans l’automatisation, la rend meilleure et plus efficace aujourd’hui qu’auparavant ?
Hamlet Batista (HB) : Beaucoup de choses qui n’étaient pas possibles il y a quatre ou cinq ans, que nous voulions vraiment voir se produire, maintenant les éléments de base se mettent en place.
Pour nous, le plus grand changement est que nous avions le désir de voir tout cela se produire.
Les spécialistes du marketing vont toujours produire du contenu. C’est une chose passionnante.
PUBLICITÉ
CONTINUER LA LECTURE CI-DESSOUS
Le marquage automatisé, une tâche subalterne qui consiste à faire ceci et cela, ce n’est jamais quelque chose d’amusant, mais il faut le faire.
Et quand je dis que les éléments de base se mettent en place, je le vois à deux niveaux.
- La capacité des spécialistes du marketing.
- La capacité des machines.
Les spécialistes du marketing acquièrent de plus en plus de compétences techniques.
Certains ont commencé par utiliser des tableurs et faire des formules simples, maintenant vous voyez un travail incroyable juste dans les formules, dans les feuilles.
Les spécialistes du marketing sont de plus en plus sophistiqués. Ils utilisent Google Data Studio, et il y a beaucoup de travail technique, d’expressions régulières [involved].
Beaucoup des outils que nous utilisons, Google Analytics, Google Data Studio, Chrome, ajoutent tous des façons plus avancées de faire les choses, sur le plan programmatique.
Ainsi, vous avez cette piste du marketeur qui devient plus sophistiqué en apprenant à scripter beaucoup de tâches avec certains des outils les plus simples tels que les feuilles de calcul.
PUBLICITÉ
CONTINUER LA LECTURE CI-DESSOUS
À l’autre bout, vous avez aussi les machines qui deviennent plus sophistiquées et plus performantes.
Et ils ne vont pas remplacer le commercialisateur, mais ils sont capables de faire des choses qui n’étaient même pas possibles il y a deux ans.
L’un des plus grands changements, je dirais, est l’apprentissage profond.
Nous avons commencé par l’apprentissage machine, les modèles statistiques, et des choses comme ça. Mais l’apprentissage approfondi porte davantage sur les capacités de perception.
Les machines ont maintenant la capacité de voir les choses, la capacité de comprendre ou d’extraire des informations à partir de textes, de données non structurées.
Depuis un an ou deux, la communauté de la PNL a été très active dans ce domaine.
Et j’espère que j’ai pu faire connaître ces dernières recherches à la communauté.
Quels sont les exemples de tâches pouvant être automatisées et avec lesquelles les OSE pourraient trouver un écho ?
HB : L’agrégation des données avec les bases de données et l’établissement des rapports, je dirais que c’est la première phase de l’automatisation. Cela fait gagner beaucoup de temps…
Vous tirez tous ces rapports de ces différents outils, et vous devez effectuer une analyse sur cela, vous devez écrire un rapport à partir de cela.
Et il y a aussi la phase deux. C’est là que nous en sommes.
Nous ne parlons pas seulement de l’agrégation ou de la collecte d’informations, qui est la première phase de l’automatisation, [but] De plus, la partie analyse du travail a été automatisée.
Il est également possible d’automatiser la rédaction et le compte rendu.
Examinons un article que j’ai écrit et que j’ai récemment publié sur Search Engine Journal à propos de la génération automatique de titres et de descriptions.
L’ordinateur lira un article. Il rédigera un résumé de l’article de manière abstraite.
Il ne s’agit donc pas de copier le contenu de l’article, mais de résumer le contenu de l’article d’une manière parfaitement logique pour l’utilisateur final, ce qui lui prendra généralement quelques minutes.
PUBLICITÉ
CONTINUER LA LECTURE CI-DESSOUS
Et cet ordinateur peut le faire à l’échelle automatiquement.
Il s’agit d’un pas de géant qui permet de passer d’une simple automatisation des rapports, de la collecte et de l’agrégation des données à une véritable utilisation de l’ordinateur pour travailler et écrire, ce qui est une tâche compliquée pour l’homme. C’est incroyable.
J’ai aussi un autre article, Comment générer du texte à partir d’images avec Python, qui vous montre aussi avec du code comment l’ordinateur peut maintenant aussi prendre une image sans texte nulle part et générer une description d’une image.
Vous pouvez imaginer, c’est juste une séquence d’images, donc vous pouvez prendre une image de la vidéo, et la faire légender automatiquement par l’ordinateur.
C’est ce que je disais, la deuxième phase de l’automatisation est basée sur des tâches perceptives. Il s’agit de tâches où l’ordinateur doit avoir des sens similaires à ceux de l’homme.
Brent Csutoras (BC) : Mais c’est là qu’intervient la grande mise en garde pour beaucoup de gens qui écoutent probablement, à savoir qu’il y a eu beaucoup d’outils, beaucoup de scripts, beaucoup de choses qui ont essayé de le faire.
PUBLICITÉ
CONTINUER LA LECTURE CI-DESSOUS
Ils ont dit : « Oh, nous pouvons améliorer vos paragraphes » ou « Nous pouvons écrire un texte pour vous ».
Et bien sûr, cela s’est accompagné d’un grand nombre de mauvaises utilisations, comme le spamming ou la tentative d’écraser des choses. Mais ce que nous avons toujours constaté, c’est que la qualité manquait.
Parce que si vous m’aviez dit que vous pouviez aller lire un article et écrire un synopsis, je vous aurais dit : « Bien sûr, mais ce n’est pas comme si je l’avais écrit moi-même. Ce ne sera pas de la même qualité ».
Alors, avons-nous simplement évolué en matière de technologie, d’apprentissage et de capacités d’IA pour pouvoir vraiment mieux écrire ? Est-ce là le grand facteur qui a changé entre il y a sept ans et aujourd’hui ?
HB : C’est le cas, mais je vais vous dire pourquoi.
La raison en est que vous avez les plus grandes entreprises du monde, avec les plus gros investissements dans cette technologie.
Vous parlez de Google, Facebook, DeepMind, Microsoft.
PUBLICITÉ
CONTINUER LA LECTURE CI-DESSOUS
Et puis, ils ne font pas que mettre beaucoup d’argent, vous parlez de talent – les chercheurs en IA, les meilleurs chercheurs peuvent gagner un million de dollars par an en salaire, alors pensez à cela.
C’est le genre d’investissement que font ces entreprises.
Maintenant, laissez-moi vous donner la meilleure partie.
Ils font ces investissements énormes et ils ont les meilleurs chercheurs, puis ils sont en concurrence les uns avec les autres, et ils rendent leur travail libre et ouvert. Alors, pensez à quel point c’est fou.
Brent Csutoras (BC) : Tout cela semble vraiment passionnant, et je suis sûr que les gens écoutent. Ils sont comme, « Ouais, c’est génial ».
Mais, à quel point faut-il être technique pour pouvoir le faire ?
Que dois-je savoir sur Python, JavaScript et les API pour que tout cela fonctionne réellement pour moi ?
HB : Une autre bonne nouvelle à ce sujet est qu’il y a aussi un effort massif sur ce qu’ils appellent la démocratisation de l’IA.
PUBLICITÉ
CONTINUER LA LECTURE CI-DESSOUS
Cela dépend donc de l’usage que vous en faites. Si votre cas d’utilisation est courant, vous trouverez probablement quelque chose pour lequel vous n’aurez même pas besoin d’écrire de code pour l’utiliser.
Ainsi, tous les principaux fournisseurs de CloudForm ont des outils qu’ils appellent AutoML.
Google, Microsoft et Amazon ont des outils qui vous permettent de fournir simplement votre jeu de données. Il y a plusieurs façons différentes de le faire.
Vous pouvez utiliser un ensemble de données préformées qui existe déjà, et cela résoudra votre problème.
Il existe également des outils de la boîte noire comme MonkeyLearn ou BigML que vous pouvez utiliser dès maintenant. Et vous dites : « OK, voilà mon problème. Passez-le dans l’outil. Donnez-moi les prédictions dont j’ai besoin. »
Et les prédictions peuvent être des images, des classifications de chiffres, n’importe quoi.
Cela dépend de la façon dont votre cas d’utilisation est personnalisé. Et puis, vous avez différentes couches entre les deux.
J’aime la possibilité de personnaliser parce qu’elle me permet de m’éloigner des cas d’usage courant, afin de trouver des solutions plus originales.
PUBLICITÉ
CONTINUER LA LECTURE CI-DESSOUS
Et c’est pourquoi mon approche nécessite un peu plus de codage que la normale, mais même avec cela, et certains des exemples que j’ai utilisés, ils n’ont pas besoin de codage du tout.
Si vous utilisez un outil d’Uber appelé Ludwig, il vous suffit de fournir un fichier de configuration, et vous n’avez même pas besoin d’apprendre le codage.
Mais, plus le cas d’utilisation est unique, plus vous voulez être spécifique et plus vous voulez être original sur une solution particulière, plus vous avez besoin de connaissances en termes de script, et en termes de connaissances d’IA dont vous avez besoin pour cela.
Quels sont les principes fondamentaux que les personnes intéressées devraient apprendre ?
HB : Je pense que l’un des fondamentaux s’appelle ETL, qui signifie « Extraire, Transformer, Charger ».
Ce sont des principes qui seront toujours applicables.
Dans l’apprentissage machine, vous avez ce que l’on appelle des pipelines. Ainsi, quel que soit le mode, la plate-forme ou la technologie que vous utilisez, vous devez préparer les données pour faire les prévisions.
PUBLICITÉ
CONTINUER LA LECTURE CI-DESSOUS
Quel que soit votre problème, vous tirez les données de Google Analytics ou Search. Vous allez les télécharger dans différents formats.
Le modèle d’apprentissage machine, ils en ont besoin d’une manière différente de celle dans laquelle vous l’extrayez.
Vous devez donc être en mesure de transformer toute source ou donnée propriétaire dont vous disposez dans le format que vous pouvez intégrer dans les modèles.
Je pense qu’à un niveau élémentaire, c’est quelque chose sur lequel vous devriez investir votre temps parce que même si vous allez utiliser un outil de la boîte noire, quel que soit l’outil que vous utilisez, ils ont tous besoin de cet objectif. Ils sont avides de données.
Et les données ne sont pas une marchandise. Il est difficile de les trouver. Donc, si vous êtes dans un créneau très spécifique, trouver un mot-clé dans 10 ensembles de données, cela va être très difficile.
Il est très important d’apprendre à produire ces ensembles de données soi-même.
Ainsi, l’apprentissage d’un langage de script ou d’un outil de transformation des données ou d’un langage qui vous permet de prendre des données brutes, quel que soit leur format, et de les reformater de manière à ce que l’outil que vous allez utiliser pour vous entraîner et produire les prévisions soit le fondement que vous pouvez apprendre.
PUBLICITÉ
CONTINUER LA LECTURE CI-DESSOUS
Et l’un des langages les plus faciles à utiliser pour les transformations de données est Python, et c’est ce que je pense en ayant également une introduction à Python.
J’ai un article sur le Search Engine Journal, c’est un guide pour l’analyse des données SEO, qui fournit de nombreux extraits de code que vous pouvez utiliser.
Quelle est la différence entre Python et JavaScript ?
HB : Ce sont deux langues d’usage général. En théorie, les choses que vous faites en Python, vous pouvez les réaliser en JavaScript.
C’est comme si vous appreniez l’espagnol et l’anglais. Vous allez donc pouvoir communiquer les mêmes choses, mais la syntaxe des langues est différente. C’est en théorie.
Maintenant, en pratique, vous allez trouver des différences dans les bibliothèques préemballées. Les bibliothèques sont les éléments de base.
Ainsi, lorsque vous allez résoudre un problème, vous ne le construirez pas à partir de zéro. Vous allez vous appuyer sur des outils tiers pour résoudre différentes parties du problème.
PUBLICITÉ
CONTINUER LA LECTURE CI-DESSOUS
Et vous allez trouver cette langue qui a plus de capacités ou qui dispose d’un support tiers plus important pour certains types de problèmes que l’autre.
En pratique, lorsque je fais de l’analyse de données, lorsque je fais de l’apprentissage machine ou de l’apprentissage approfondi, je trouve que Python est un bien meilleur choix en raison de l’important support tiers.
Les chercheurs écrivent en Python. Facebook, Google, tout cela a des trucs incroyables. C’est d’abord en Python.
Je ne vais pas le trouver en JavaScript, c’est donc une évidence.
D’un autre côté, si je fais de l’analyse en amont, ou si je fais du rendu, ou si j’essaie simplement de comprendre pourquoi une page qui est en JavaScript n’est pas rendue, alors, Python n’a pas sa place.
Beaucoup de systèmes frontaux sont dynamiques et sont construits en JavaScript.
Si je fais du travail de service ou d’autres choses vraiment cool qui se passent en ligne, c’est tout en JavaScript.
PUBLICITÉ
CONTINUER LA LECTURE CI-DESSOUS
Si j’automatise le navigateur, c’est du JavaScript.
Il s’agit donc davantage de savoir quelle langue est la mieux adaptée à certains types de problèmes que les autres. C’est pourquoi je choisirais l’une avant l’autre.
Ce podcast vous est proposé par Ahrefs et Opteo.
Pour écouter ce podcast du Search Engine Show avec Hamlet Batista :
Visitez nos archives de podcasts pour écouter d’autres émissions sur les moteurs de recherche podcasts !
Crédits image
Image en vedette : Paulo Bobita
Podcast : Télécharger
Abonnez-vous : Podcasts Apple | Android |