Brave, un navigateur Web axé sur la confidentialité, a été critiqué pour avoir soi-disant vendu des données protégées par le droit d’auteur pour former des modèles d’intelligence artificielle. Cela a suscité des débats autour de l’utilisation éthique des données et du besoin de transparence. Un article d’Alex Ivanovs de Stack Diary a mis en lumière les allégations contre Brave. Ivanovs a fait part de ses inquiétudes quant au fait que Brave pourrait collecter et vendre des données d’utilisateurs sans autorisation à des entreprises développant des systèmes d’IA. Bien que Brave vante de solides protections de la vie privée, sa vente présumée de matériel protégé par le droit d’auteur pour la formation à l’IA soulève des questions sur les pratiques en matière de données qui peuvent violer la confiance des utilisateurs et les attentes en matière de confidentialité. La controverse qui se prépare met en évidence les tensions autour de l’utilisation des données personnelles pour faire progresser les capacités de l’IA par rapport au respect de la confidentialité des données et des droits de propriété. Cela souligne la nécessité d’une communication claire et du consentement des utilisateurs concernant le partage de leurs informations. La situation remet en question si Brave accorde vraiment la priorité à la confidentialité des utilisateurs et au contrôle des données, comme le prétend.
Déballer les allégations
Ivanovs a affirmé que Brave permet l’accès au contenu protégé par le droit d’auteur via son API Brave Search, permettant à des tiers d’utiliser ces données pour la formation à l’IA sans licence appropriée. Il a fait valoir que le manque de respect de Brave pour les droits d’auteur et la monétisation de l’accès aux données sont des pratiques éthiquement discutables. Ivanovs écrit : « Brave vous permet d’ingérer du matériel protégé par le droit d’auteur via son API Brave Search, sur laquelle ils vous attribuent également des « droits ».
La réponse de Brave
Les accusations ont conduit Josep M. Pujol, responsable de la recherche chez Brave, à défendre les actions de l’entreprise. Pujol a déclaré que les problèmes de droits étaient liés aux résultats du moteur de recherche de Brave, et non au contenu lui-même. Pujol explique : « Brave Search a le droit de monétiser et de mettre des conditions de service sur la sortie de son moteur de recherche. » Pujol a également déclaré que toutes les données fournies sont toujours attribuées à l’URL du contenu.
L’enquête
Ivanovs a noté que Brave Search fournit de longs « extraits alternatifs supplémentaires » similaires aux extraits en vedette de Google. Il s’est demandé si ces longs extraits, allant de 150 à 260 mots, étaient conformes aux principes d’utilisation équitable du droit d’auteur. De plus, Ivanovs a critiqué Brave pour ne pas avoir révélé de détails sur son robot d’indexation, qui indexe le contenu du site Web. Il a fait valoir que cela empêchait les propriétaires de sites Web d’empêcher Brave de vendre potentiellement leur contenu. Brave a rétorqué que son robot d’exploration respecte les sites Web standard robots.txt utilisés pour contrôler les robots d’exploration.
Les implications
En terminant son rapport, Ivanovs a noté que les conséquences des pratiques de Brave s’étendent au-delà du moteur de recherche lui-même. Il a exprimé ses inquiétudes quant à la possibilité que le système puisse être utilisé à mauvais escient et l’ambiguïté entourant la légalité des méthodes de Brave. De plus, il a contesté la position de Brave selon laquelle, en tant que moteur de recherche, il a le droit de récupérer et de revendre les données textuellement. Ivanovs avertit : « Je ne vois pas un monde dans lequel cela ne puisse pas être abusé. » Pour l’instant, le débat continue. Ce problème soulève des questions importantes concernant l’application éthique des données, la rentabilité du contenu des autres et le niveau d’ouverture affiché par les grandes entreprises technologiques. L’industrie de la technologie suivra de près ces conversations à mesure qu’elles évoluent.