Reddit suit l'exemple de Twitter et annonce un accès payant à l'API de données

Reddit a annoncé cette semaine des conditions mises à jour pour les outils et services de développement, un accès payant à l’API Reddit Data et davantage d’outils de modération natifs. Alors que le blog Reddit expliquait les changements dans le cadre de la création d’un écosystème sain, le New York Times a rapporté que l’accès payant à l’API empêcherait les grandes entreprises d’utiliser le contenu Reddit pour former gratuitement de grands modèles linguistiques (LLM). La documentation mise à jour confirme que les développeurs ne peuvent utiliser le contenu Reddit pour la formation LLM qu’avec l’approbation préalable de Reddit et qu’il constitue un accès commercial. Bard ne peut pas confirmer si Google a inclus le contenu Reddit dans ses données de formation dans le cadre des ensembles de données accessibles au public « probablement utilisés ». Capture d’écran de Google Bard, avril 2023 ChatGPT ne peut pas partager une liste spécifique de sources, mais Reddit peut en faire partie. Capture d’écran de ChatGPT, avril 2023 Bing AI confirme que Microsoft utilise plusieurs sources de données, y compris l’index et l’algorithme Bing avec les modèles OpenAI GPT. Capture d’écran de Bing, avril 2023 Considérant que ChatGPT a peut-être utilisé les données de Reddit, on pourrait supposer que Microsoft en a peut-être aussi, via son partenariat avec OpenAI.

Quel sera l’accès à l’API de données Reddit ?

Selon les conditions du développeur mises à jour – en vigueur le 19 juin 2023 – Reddit facturera ce qu’il considère comme un accès et une utilisation commerciaux de l’API  :

  • Si une entreprise ou un service monétisé se connecte à l’API, il s’agit d’un accès commercial
  • Si une entreprise ou un service génère des revenus, directement ou indirectement, à partir de données Reddit ou de données dérivées

Voici des exemples spécifiques de services monétisés de la page de la plate-forme de développement de Reddit  :

  • Services qui génèrent des revenus à partir des publicités et des paywalls
  • Les moteurs de recherche qui génèrent des revenus à partir des publicités
  • Services qui facturent aux utilisateurs l’accès à la recherche ou aux données
  • Services pour lesquels les utilisateurs paient des frais d’abonnement
  • Services inclus dans la vente incitative d’un autre produit
  • Services qui publient du contenu Reddit sur des sites Web et des applications monétisés
  • Services qui utilisent les données Reddit pour les modèles de formation

Reddit s’efforcerait de maintenir une modération communautaire plus stricte pour satisfaire les annonceurs.

Est-ce que les outils de gestion des médias sociaux de l’API Reddit Data ?

rechercher des publications sur Reddit ou créer des rapports d’analyse pour votre compte Reddit, cela pourrait vous affecter de trois manières.

  • Vous aurez peut-être besoin d’un accès accru aux fonctionnalités de Reddit via certains services tiers
  • Vous devrez peut-être commencer à payer pour certains services tiers qui offraient autrefois des plans tarifaires gratuits pour absorber l’augmentation du coût d’accès à l’API Reddit Data
  • Vous devrez peut-être payer plus que ce que vous payez déjà pour certains services tiers

Nous verrons l’impact une fois que Reddit publiera les détails des prix de l’API. Les plates-formes qui s’intègrent à Reddit incluent Zapier, HootSuite, IFTTT, Feedly, Vista Social, Tray.io et Social Rise. Ces plates-formes permettent aux utilisateurs d’obtenir des informations précieuses sur l’engagement Reddit. Capture d’écran de Social Rise, avril 2023 Quant au type d’augmentation auquel vous pourriez vous attendre si votre outil de gestion des médias sociaux répercutait le coût sur ses utilisateurs  : pour les services tiers avec plus d’un million d’utilisateurs, cela pourrait être aussi peu qu’un dollar supplémentaire par mois par utilisateur. Pour les services avec moins d’utilisateurs, cela pourrait être beaucoup plus.

Nouvelles connexes: Comment les modifications apportées à l’API Twitter ont perturbé les services populaires

co/RfGyWqpIgF

  • Les alertes météorologiques vitales de plusieurs comptes du National Weather Service étaient limitées
  • IFTTT, un service d’automatisation avec 18 millions d’utilisateurs, a rencontré des problèmes avec les modifications de l’API effectuées début avril
  • Feedly, un service de lecture de nouvelles qui a intégré des fonctionnalités d’IA en 2020 pour plus de 18 millions d’utilisateurs, a retiré les fonctionnalités de Twitter et a commencé à explorer les intégrations avec Mastodon
  • Flipboard, un service d’agrégation de nouvelles avec 145 millions d’utilisateurs, a annoncé que les flux Twitter resteraient cassés et que Mastodon serait dans son avenir
  • HootSuite, un outil de gestion des médias sociaux avec 18 millions d’utilisateurs, a cessé d’offrir des forfaits gratuits aux utilisateurs qui gèrent Twitter et d’autres profils sociaux

Nous avons contacté les créateurs de plusieurs outils de gestion de médias sociaux populaires pour commentaires. Jusqu’à présent, ils ont hésité à commenter car ils travaillent avec Twitter sur des solutions personnalisées. Elon Musk, PDG de Twitter (Now X Corp), a déclaré que l’accès payant à l’API réduirait les abus de robots. Il a également suggéré que le refus de Microsoft de payer les frais de l’API Twitter pourrait entraîner une action en justice pour avoir prétendument « arraché la base de données Twitter » et « vendu notre données à d’autres. GitHub, Microsoft et OpenAI font face à un recours collectif à San Francisco, en Californie, pour avoir prétendument tiré parti du contenu généré par les utilisateurs soumis, en violation de plusieurs directives de licence open source. Microsoft, GitHub et OpenAI ont demandé le rejet de la poursuite. La même entreprise a également déposé un recours collectif contre Stability AI, DeviantArt et Midjourney pour avoir utilisé Stable Diffusion, accusé d’utiliser des œuvres d’art protégées par le droit d’auteur dans ses données de formation. SEJ suivra les développements comme d’autres entreprises disposant de grands référentiels de données publiques et de conversations le feront à l’avenir en réponse aux entreprises d’IA qui les utilisent pour les données de formation. Image en vedette : Dennis Diatel/Shutterstock