G
deux.io/
news
/
comment-predire-les-classements-google-avec-une-plateforme-de-data-science-dataiku

Comment prédire les classements Google avec une plateforme de science des données

Résumé de l'article :
SEO

Découvrez comment prédire les classements Google avec une plateforme de Data Science ! L'auteur partage son expérience de prédiction des classements sur Google avec une précision de 92% grâce à l'algorithme Xgboost. Utilisant Dataiku, une plateforme accessible même sans connaissances en R, il décrit les étapes pour installer le logiciel, créer un projet, préparer un dataset et effectuer une première analyse. L'article fournit un guide pas à pas, montrant comment personnaliser et entraîner un modèle de prédiction, et comment analyser les résultats obtenus. Cette introduction claire à la Data Science appliquée au SEO est idéale pour ceux qui veulent optimiser leur présence sur Google. Rejoignez l'auteur pour en savoir plus sur la collecte et la fusion de données à partir de diverses sources dans le prochain article !

Tout lire

Découvrez comment anticiper les positions sur Google grâce à une plateforme de Data Science! Cet article vous guide à travers l'expérience de prédire les classements Google avec une précision de 92% en utilisant l'algorithme Xgboost sur Dataiku, une plateforme accessible même sans maîtrise de R. Voici un guide pas à pas pour installer ce logiciel, créer un projet, préparer un dataset et réaliser une première analyse.

Six mois auparavant, j'ai publié un article intitulé "Comment prédire les classements Google" en français. Prédire la position exacte d'un site web pour un terme de recherche sur Google n'est pas possible. Pour simplifier cela, nous avons visé à prédire la présence d'un site sur la première page des résultats Google pour un terme donné. Après de nombreuses discussions SEO avec Rémi Bacha et sa précieuse contribution, nous avons atteint des résultats impressionnants avec une précision de 92%.

J'ai lancé un projet Open Source et partagé le code source en R, cependant, il nécessitait des connaissances en R pour être utilisé. Récemment, j'ai trouvé une solution simplifiant l'utilisation de cet algorithme prédictif via “Dataiku”, une plateforme de data science open source. En reproduisant mon cas d'utilisation, tout a fonctionné avec quelques clics et une configuration minimale.

Je vais créer deux articles pour expliquer comment automatiser ce processus et permettre à chacun de découvrir ses facteurs SEO. Ce premier article décrit l'utilisation de XgBoost ou d'un autre algorithme avec mon dataset préparé pour le sommet OVH. J'ai utilisé un dataset de 200,000 enregistrements incluant 2,000 mots-clés distincts (merci à Visiblis, Rankplorer, Majestic pour leur aide). Mon second article se concentrera sur la collecte et la fusion des données.

Étape 1 : Installer Dataiku

Vous devez installer Dataiku sur votre plateforme. Suivez simplement le tutoriel disponible sur leur site. Pour cet article, j'ai utilisé l'édition gratuite de Dataiku pour Virtualbox; quelle que soit la version, vos données restent sur votre infrastructure sans aucune limitation de taille ou de volume. Après installation, accédez à la page de connexion.

Étape 2 : Créer votre projet

Choisissez un nom pour votre projet. Vous êtes maintenant prêt à importer des fichiers. Cliquez sur le lien de votre projet et sélectionnez “Importer un dataset”.

Étape 3 : Préparer un nouveau dataset

Téléchargez mon dataset préparé et uploadez-le pour créer votre premier dataset. Cliquez sur le lien “Uploader vos fichiers”. Dans le prochain article, je vous montrerai comment créer votre propre dataset. Nommez-le par exemple : datasetgardenqueries.

Étape 4 : Créer votre première analyse

Cliquez sur la roue verte dans le menu puis sur “Nouvelle analyse”. Sélectionnez le dataset précédent et cliquez sur “Créer une analyse”. Pour supprimer une colonne, cliquez sur son nom et appuyez sur “Supprimer”. Pour les colonnes concernant Visiblis, enlevez les lignes invalides en sélectionnant la colonne “Visiblis_Title” et en choisissant cette fonction.

Choisissez la colonne “isTopTen” que vous voulez prédire et cliquez sur “Créer un modèle prédictif”. Optez pour le modèle Performance et l'algorithme “Xgboost”. Personnalisez le modèle en cliquant sur “Paramètres”. Dans la colonne de gauche, sous “Algorithme”, désélectionnez les autres algorithmes. Pour Xgboost, changez le nombre maximum d'arbres à 1000 pour de meilleurs résultats.

Cliquez ensuite sur “Caractéristiques” et supprimez les attributs inutiles comme URL, TextRatio, ExtBackLinks et Keyword. Sélectionnez “Rejeter” pour ignorer une caractéristique et concentrez-vous sur les données pertinentes. Enfin, cliquez sur le bouton vert “Entraîner”. Soyez patient, Xgboost est efficace mais long à exécuter.

Étape 5 : Vérifier les résultats

Analysez les résultats en tenant compte qu'ils sont valables uniquement pour le dataset et la thématique spécifiés. Google personnalise les pages de résultats de recherche avec plus de 300 facteurs. Mais cela vous donne une bonne idée de ce qui fonctionne. Ayez une approche pour obtenir les meilleurs et les pires termes/keywords afin que l’algorithme puisse confirmer ou rejeter une caractéristique.

Vous avez maintenant votre précision pour chaque algorithme et pouvez voir l'importance des variables. Cliquez sur le lien de votre algorithme pour accéder à un menu où vous découvrirez vos variables importantes et pourrez mesurer les performances de votre algorithme avec de nombreuses méthodes (courbe roc, matrice de confusion, diagramme de décision).

Conclusion

Voilà vos premiers pas sur cette plateforme où vous pouvez importer et manipuler un dataset rapidement et utiliser des algorithmes de prédiction en quelques clics. Pour tester votre modèle prédictif sur une nouvelle page ou une page mise à jour, suivez ce super tutoriel sur le site de Dataiku. La prochaine fois, je vous montrerai comment obtenir des données via les APIs de Majestic, Visiblis, SemRush ou Yooda et les fusionner en un seul dataset.

Dataiku permet de coder en R ou Python, mais plus important encore, vous pouvez partager tout le workflow rapidement avec le code source dans un fichier zip. Bien sûr, je vais préparer un zip pour déployer tous les processus en un seul import.

Un immense merci à Aysun Akarsu et Rémi Bacha pour la relecture.

D'autres articles qui devraient vous plaire

SEO

Réévaluation critique : les dangers de l'usage intensif des publicités pour les entreprises levant des fonds

Stéphanie Docher, associée chez DEUX.IO, partage une réflexion importante suite à un échange avec un prospect : les startups qui lèvent des fonds gaspillent souvent ces ressources en publicité payante, dans l'espoir d'obtenir un retour sur investissement rapide. Toutefois, cette stratégie peut s'avérer risquée et coûteuse à moyen terme. Selon Stéphanie, il est essentiel d'adopter une approche plus diversifiée et durable en matière d'acquisition de clients, notamment via le SEO, l'emailing et d'autres canaux. Elle met également l'accent sur l'importance de l'optimisation des dépenses publicitaires et des stratégies de rétention post-acquisition. Cette analyse est enrichie par des retours d'expérience de professionnels du secteur, apportant des perspectives variées et pertinentes.

Lire l'article
SEO

Guide en 5 étapes pour construire l'identité de votre marque en SEO

L'article explique l'importance de créer une entité de marque solide pour améliorer la visibilité organique dans les moteurs de recherche. Avec l'évolution des modèles de langages et des expériences génératives comme SGE et Bard, le SEO ne se limite plus à uniquement cibler les utilisateurs humains, mais inclut également les machines. Une entité de marque bien définie et fiable est cruciale pour s'assurer d'être considéré dans les résultats de recherche. L'article propose un guide en cinq étapes pour établir une telle entité : 1. Obtenir le soutien de la direction, particulièrement du directeur marketing. 2. Définir et aligner la biographie de l'entité de marque pour qu'elle soit cohérente. 3. Corroborer la pertinence thématique par des répétitions sur des plateformes autorisées. 4. Utiliser des balises structurées pour toutes les informations pertinentes sur la marque. 5. Établir des relations avec d'autres entités pertinentes pour renforcer la notoriété et la pertinence de la marque. En fin de compte, l'article souligne que construire une entité de marque forte est essentiel pour apparaître dans les résultats générés par l'IA et sur les différentes surfaces de Google, car cela augmente les chances que votre marque soit visible et présentée de manière cohérente et positive aux utilisateurs.

Lire l'article
SEO

Quand Faut-il Utiliser ChatGPT et Quand Privilégier Google ?

**Quand Utiliser ChatGPT et Quand Utiliser Google : Guide pour les Pros du Marketing Digital** Avec l'essor des technologies d'IA, les professionnels du marketing digital ont désormais accès à des outils novateurs comme ChatGPT. Cependant, il est essentiel de savoir quand utiliser ce modèle de langage avancé et quand privilégier les moteurs de recherche traditionnels comme Google. ChatGPT se distingue par sa capacité à répondre aux requêtes informationnelles de manière conversationnelle et précise, ce qui en fait une ressource inestimable pour des questions ouvertes telles que "Quelle est la capitale de la France ?" ou "Quels sont les symptômes du COVID-19?". Toutefois, pour les requêtes transactionnelles telles que "acheter des chaussures en ligne" ou "réserver un vol pour New York", Google reste la meilleure option. L'article explique également comment optimiser votre site web pour tirer parti des deux technologies, en décrivant les stratégies pour les requêtes informationnelles et transactionnelles. En intégrant ChatGPT, les entreprises peuvent améliorer l'engagement client, offrir un support en temps réel et personnaliser leurs campagnes marketing. En conclusion, ChatGPT et Google occupent des rôles complémentaires dans le paysage digital actuel. Comprendre les forces et les limites de chacun peut aider les professionnels du marketing à maximiser leurs résultats. Pour un aperçu complet et détaillé, ne manquez pas de lire l'article!

Lire l'article
Agence TheTribe - Florent Lucas
Florent Lucas
Directeur Marketring & Commecial @TheTribe

J'ai bossé 6 mois avec Deux.io sur 4 thématiques : SEO, SEA, Outreach et Social Selling. Hasard ou non, on ne sait jamais vraiment ce qu'il se passe côté growth ;), notre nombre de demandes entrantes est nettement reparti à la hausse en ce début d'année.Nous avons notamment pu cranter sur 2 sujets : le SEA, on en faisait un peu auparavant, mais on jetait surtout de l'argent par les fenêtres, et l'outreach, où nous avons nettement progressé sur les séquences, avec des bons taux de retour.Je suis particulièrement satisfait du fait que nous ayons pu se réapproprier l'ensemble des travaux réalisés et diffuser une culture Growth au sein de l'équipe acquisition.Côté Deux.io, Steph a une approche commerciale top, et j'ai apprécié son soucis de nous proposer un accompagnement sur-mesure nécessaire à notre contexte, et John un entrepreneur, hacker, magicien du web avec pleins de bonnes idées faciles à implémenter. Le reste de l'équipe, Emilie, Guillaume notamment nous ont également parfaitement accompagné.Bref, je suis fan, et je recommande ++

adelaide Aujay - Directrice Marketing
Adelaide Aujay
Directrice Marketing @horiz

Agence growth hacking ayant à coeur d’accompagner efficacement ses clients pour qu’ils atteignent leurs objectifs de croissance et de rentabilité. J’ai réellement apprécié leur écoute et leur capacité à mettre en place des plans d’actions à court terme et plus long terme; et aussi à revoir leur copie en fonction des 1er résultats ou des changements de priorités business. Mention spéciale à Jonathan, expert SEO, qui en plus prend le temps de former sur son métier.

laura Lhoiry - Directrice Marketing
Laura Lhoiry
Directrice Marketing @Nomadia

Très bonne expérience avec l'équipe de Jonathan, des conseils avisés et un partage de best practices. Nul doutes que les résultats de la prestation seront au rendez-vous !

Co-fondateur @HelloZack - Pierre-Emmanuel Saint-Esprit
Pierre-Emmanuel Saint-Esprit
Co-fondateur @HelloZack

Focus execution, Boost efficacement votre acquisitionÉcoute et compréhension, au top.

Samuel
Gabriel Roucel - Volum
Gabriel Roucel
CEO @Volum

Nous avions déjà une bonne croissance, mais souhaitions mieux comprendre ce qui marche, pour qui et pourquoi afin de rapidement déployer les stratégies growth les plus efficaces sur la bonne cible.

CEO @CocoonSpace - Sylvain Chevet
Sylvain Chevet
CEO @CocoonSpace

J’avais déjà une petite idée de mes cibles, canaux and co. deux.io a testé une dizaine de stratégies growth sur mesure. Nous avons identifiés 3 stratégies qui fonctionnent super bien qu'ils sont entrain de scaler !

Vincent Gouedard - Fincome
Vincent Gouedard
CEO & Co-founder @Fincome

Très bon accompagnement. Nous avons apprécié la rigueur et l’expertise des équipes deux.io. En 3 mois, nous avons collecté suffisamment de données pour mieux comprendre et appréhender notre nouveau marché.

Directeur @Wacano Paris - Vivian Bertin
Vivian Bertin
Directeur @Wacano Paris

Avant j’avais un bagage théorique en Growth maintenant je sais scraper méthodiquement n’importe quel site.Non seulement la team Deuxio vous pousse sur chaque jour de formation à exécuter des actions  concrètes mais elle livre également toutes ses techniques secrètes pour avoir plus d’impact.A conseiller chaudement à tout acteur de l’écosystème startup !

Matthieu BURIN - CEO & Co-founder
Matthieu Burin
CEO & Co-founder @Hemea

Super agence, très bon conseil dans l'air du temps, testée et approuvée plusieurs fois, merci !

Edouard Thieuleux - Abc
Edouard Thieuleux
Founder @AbcSupplyChain

Super agence de growth marketing. Ils vont à l'essentiel, maîtrise toutes les plateformes et ajuste très rapidement en fonction des prix et tendances. Merci à Jonathan et Brice pour le suivi de qualité.

Raphael Siciliani -
Raphael Siciliani
Business Development Manager @Scribe

Après avoir travaillé avec de nombreuses agences growth, Deux.io est de loin la plus professionnelle et compétente. Un plaisir de travailler avec une équipe humaine et accessible vraiment impliqué dans la reussite de notre entreprise.

Arthur
3 articles et 1 outil Growth chaque semaine

Inscrivez-vous à La Growth News dès maintenant et débloquez un accès exclusif à des outils développés par l'équipe de deux.io !

100% concrêt, 0% spam, 1x semaine
Merci, vous allez recevoir un e-mail de confirmation.
Oops! Something went wrong while submitting the form.