Faire plus avec moins: génération de contenu automatisée et de haute qualité

Comment pouvez-vous continuer à fournir des résultats étonnants avec un temps et des ressources limités? La rédaction d'un contenu de qualité qui éduque et persuade reste un moyen infaillible d'atteindre vos objectifs de trafic et de conversion.Mais le processus est un travail manuel ardu et qui ne s'adapte pas., les dernières avancées en matière de compréhension et de génération du langage naturel offrent des résultats prometteurs et passionnants.Pour sa session SEJ eSummit, Hamlet Batista a discuté de ce qui est possible actuellement en utilisant des exemples pratiques (et du code) que les professionnels du référencement technique peuvent suivre et adapter pour leur entreprise. Voici un récapitulatif de sa présentation.

Suggestions de saisie semi-automatique

Combien de fois avez-vous rencontré ce problème? Suis-je le seul à avoir parfois peur de la précision et de la pertinence des suggestions Google Doc et Gmail? Vous rédigez un texte et [this whole part can be suggested]. Je veux dire, c'est génial. Mais c'est effrayant. 🤪😱 - Kristina Azarenko 📈 (@azarchick) 11 mai 2020 .Vous utilisez peut-être déjà la technologie de l'IA dans votre travail sans même que vous vous en rendiez compte.Si vous utilisez la fonction de composition intelligente de Google Docs, Gmail ou même Microsoft Word et Outlook, vous exploitez déjà cette technologie. votre journée en tant que spécialiste du marketing lorsque vous communiquez avec les clients.La grande chose est que cette technologie n'est pas seulement accessible à Google.Vérifiez le site Web Write With Transformer, commencez à taper et appuyez sur la touche de tabulation pour des idées de phrases complètes.Batista a démontré comment après avoir branché le titre et une phrase d'un article récent de SEJ, la machine peut commencer à générer des lignes - il vous suffit d'appuyer sur la commande de saisie semi-automatique.PublicitéContinuer la lecture ci-dessousTout le texte en surbrillance ci-dessus était complètement Ce qui est cool à ce sujet, c'est que la technologie qui rend cela possible est librement disponible et accessible à quiconque souhaite l'utiliser.

Faire plus avec moins: génération de contenu automatisée et de haute qualité

Recherches basées sur l'intention

L'un des changements que nous constatons actuellement dans le domaine du référencement est la transition vers les recherches basées sur l'intention. Comme Mindy Weinstein le dit dans son article du Search Engine Journal, How to Go Deeper with Keyword Research: «Nous sommes à l'ère où l'intention- les recherches basées sur le volume sont plus importantes pour nous que le volume pur. " " Vous devez faire un pas supplémentaire pour connaître les questions que les clients se posent et comment ils décrivent leurs problèmes. " " Passer des mots clés aux questions "Ce changement nous offre une opportunité lorsque nous écrivons du contenu.

L'opportunité

Les moteurs de recherche répondent aux moteurs de nos jours. Et un moyen efficace d'écrire du contenu original et populaire est de répondre aux questions les plus importantes de votre public cible. Jetez un œil à cet exemple pour la requête «python for seo». Le premier résultat montre que nous pouvons tirer parti du contenu qui répond aux questions, dans ce cas en utilisant le schéma de la FAQ.Les extraits de recherche FAQ prennent plus de place dans les SERP.Cependant, faire cela manuellement pour chaque élément de contenu que vous allez créer peut être coûteux et prendre du temps. si nous pouvons l'automatiser en tirant parti de l'IA et des ressources de contenu existantes?

Tirer parti des connaissances existantes

La plupart des entreprises bien établies disposent déjà de bases de connaissances précieuses et exclusives qu'elles ont développées au fil du temps uniquement par des interactions normales avec les clients, qui ne sont souvent pas encore accessibles au public (e-mails d'assistance, chats, wikis internes).

IA Open Source + connaissances exclusives

Grâce à une technique appelée «Transfer Learning», nous pouvons produire un contenu original et de qualité en combinant des bases de connaissances propriétaires et des modèles et des ensembles de données publics d'apprentissage en profondeur.PublicitéContinuer la lecture ci-dessousIl existe des différences entre l'apprentissage automatique traditionnel (ML) et l'apprentissage en profondeur. vous faites principalement des classifications et tirez parti des connaissances existantes pour établir des prédictions.Maintenant, avec l'apprentissage en profondeur, vous êtes en mesure d'exploiter les connaissances de bon sens qui ont été développées au fil du temps par de grandes entreprises comme Google, Facebook, Microsoft et d'autres. Au cours de la session, Batista a montré comment cela pouvait être fait.

Comment automatiser la génération de contenu

Vous trouverez ci-dessous les étapes à suivre lors de l'examen des approches de génération automatisée de questions et de réponses.

  • Trouvez des questions populaires à l'aide d'outils en ligne
  • Répondez-y en utilisant deux approches NLG:
    • Une approche de recherche d'envergure
    • Une approche «livre fermé»
  • Ajoutez le schéma FAQ et validez à l'aide du SDTT

Continuer la lecture ci-dessous

Recherche de questions populaires

Trouver des questions populaires basées sur vos mots clés n'est pas un gros défi car il existe des outils gratuits que vous pouvez utiliser pour ce faire.

Répondre au public

Tapez simplement un mot-clé et vous pouvez obtenir de nombreuses questions que les utilisateurs se posent.

Analyseur de questions par BuzzSumo

Ils regroupent des informations provenant de forums et d'autres lieux. Vous pouvez également trouver d'autres types de questions à longue traîne.

AlsoAsked.com

Cet outil gratte les questions de Google.

Système de questions et réponses

L'algorithme

Papers With Codes est une excellente source de recherche de pointe sur la réponse aux questions.Il vous permet de puiser librement dans les dernières recherches publiées.Les universitaires et les chercheurs publient leurs recherches afin qu'ils puissent obtenir les commentaires de leurs pairs. Le plus intéressant, c'est que même des gens comme nous peuvent accéder au code dont nous allons avoir besoin pour répondre aux questions.Pour cette tâche, nous allons utiliser T5, ou Transformateur de transfert de texte en texte.

L'ensemble de données

Nous avons également besoin des données d'entraînement que le système va utiliser pour apprendre à répondre aux questions.Le Stanford Question Answering Dataset 2.0 (SQuAD 2.0) est l'ensemble de données de compréhension en lecture le plus populaire.Maintenant que nous avons à la fois l'ensemble de données et le code, nous allons parler des deux approches que nous pouvons utiliser.

  • Réponse aux questions à livre ouvert: Vous savez où est la réponse
  • Réponse aux questions à livre fermé: Vous ne savez pas où est la réponse

Continuer la lecture ci-dessous

Approche n ° 1: une approche de recherche de portée (livre ouvert)

Avec trois lignes de code simples, nous pouvons faire en sorte que le système réponde à nos questions.C'est quelque chose que vous pouvez faire dans Google Colab.Créez un notebook Colab et tapez ce qui suit: ! Pip install transformers
session = HTMLSession ()

url = "https://www.searchenginejournal.com/uncover-powerful-data-stories-phyton/328471/"

selector = "# post-328471> div: nth-child (2)> div> div> div.sej-article-content.gototop-pos"

avec session.get (url) comme r:

post = r.html.find (sélecteur, premier = Vrai)

text = post.text En utilisant la bibliothèque HTML de requête, vous pouvez extraire l'URL - ce qui équivaut à naviguer dans le navigateur vers l'URL - et fournir un sélecteur (qui est le chemin de l'élément du bloc de texte sur la page.) Je devrais simplement faire un appel pour extraire le contenu et l'ajouter au texte - et cela devient mon contexte.Dans ce cas, nous allons poser une question qui est incluse dans un article SEJ.Cela signifie que nous savons où le la réponse est. Nous fournissons l'article qui a la réponse. Mais que se passe-t-il si nous ne savons pas quel article contient la réponse, alors que nous essayons de demander?

Approche n ° 2: Explorer les limites de la NLG avec T5 et Turing-NLG (livre fermé)

Le T5 de Google (modèle à 11 milliards de paramètres) et le TuringNG de Microsoft (modèle à 17 milliards de paramètres) sont capables de répondre aux questions sans fournir de contexte, ils sont si massifs qu'ils sont capables de garder un souvenir de beaucoup de choses quand ils l'étaient. L'équipe T5 de Google s'est affrontée avec le modèle de 11 milliards de paramètres dans un jeu-questionnaire de pub et a perdu.Voyons à quel point il est simple de former T5 à répondre à nos propres questions arbitraires.PublicitéContinuer la lecture ci-dessousDans cet exemple, un des questions posées par Batista est «Qui est le meilleur référencement au monde?» T5 répondant à des questions arbitraires. Le meilleur référencement au monde, selon un modèle qui a été formé, par Google est SEOmoz.

Comment former, ajuster et tirer parti de T5

Formation T5Nous allons former le modèle de 3 milliards de paramètres à l'aide d'un TPU Google Colab gratuit.Voici le plan technique d'utilisation de T5:

  • Modifiez l'environnement d'exécution en Cloud TPU
  • Fournissez le chemin d'accès du compartiment au bloc-notes
  • Sélectionnez le modèle de 3 milliards de paramètres
  • Exécutez les cellules restantes jusqu'à l'étape de prédiction

Et maintenant, vous avez un modèle qui peut réellement répondre aux questions. Mais comment pouvons-nous ajouter vos connaissances exclusives afin qu'il puisse répondre aux questions de votre domaine ou de votre secteur à partir de votre site Web?Ajout de nouveaux ensembles de données de formation propriétairesC'est là que nous entrons dans l'étape de mise au point.Il vous suffit de cliquer sur l'option Ajuster dans le modèle.Et il y a quelques exemples dans le code de la façon de créer de nouvelles fonctionnalités et de donner de nouvelles capacités au modèle. N'oubliez pas de:

  • Prétraitez votre base de connaissances propriétaire dans un format compatible avec T5
  • Adaptez le code existant à cet effet (Natural Questions, TriviaQA)

Pour découvrir le processus d’extraction, de transformation et de chargement pour le machine learning, lisez l’article du Search Engine Journal de Batista, A Practical Introduction to Machine Learning for SEO Professionals.

Ajout d'un schéma de FAQ

Cette étape est simple, il vous suffit d'aller dans la documentation Google pour la FAQ: baliser votre FAQ avec des données structurées.Ajouter la structure JSON-LD pour cela.Voulez-vous le faire automatiquement? Continuer la lecture ci-dessousBatista a également écrit un article à ce sujet : Une introduction pratique au JavaScript moderne pour le référencement. Avec JavaScript, vous devriez être en mesure de générer ce JSON-LD.

Ressources pour en savoir plus:

Regardez cette présentation

Vous pouvez désormais regarder la présentation complète de Batista à partir de SEJ eSummit le 2 juin.Crédits d'imageImage en vedette: Paulo Bobita

Toutes les captures d'écran prises par l'auteur, juillet 2020

Tags: , , ,