Home Divertissement Reddit poursuit Perplexity pour vol de contenu

Reddit poursuit Perplexity pour vol de contenu

0 comments 93 views

Publié le 23 octobre 2025. Reddit lance une offensive juridique contre des entreprises d’IA, dont Perplexity, les accusant de voler illégalement le contenu de ses utilisateurs pour alimenter leurs propres modèles économiques. La plateforme communautaire entend ainsi protéger ses données et affirmer sa souveraineté numérique.

  • Reddit accuse plusieurs sociétés, dont Perplexity, SerpApi, Oxylabs UAB et AWMProxy, de « grattage » de données et de contournement de ses systèmes de sécurité pour accéder au contenu utilisateur.
  • Ces données seraient ensuite utilisées par les entreprises d’IA pour former leurs modèles, générer des réponses et enrichir leurs offres commerciales, sans accord préalable avec Reddit.
  • La plateforme dénonce une violation de ses droits et demande l’arrêt de ces pratiques, ainsi qu’une compensation financière pour les données déjà exploitées.

Reddit, cette vaste communauté en ligne rassemblant plus de 100 millions d’utilisateurs actifs quotidiennement et foisonnant de discussions authentiques, se retrouve au cœur d’une bataille juridique majeure. Dans un document judiciaire qualifié de « pertinent » pour l’écosystème numérique, la société dénonce le comportement de plusieurs acteurs de l’intelligence artificielle (IA), les comparant à des « braqueurs de banque potentiels ». Ils auraient méthodiquement contourné les protections mises en place par Reddit et Google afin de s’approprier le contenu des utilisateurs, non sans en exploiter les données pour leurs propres modèles économiques, notamment la vente à des tiers.

Au centre des accusations, Perplexity, une startup valorisée à plusieurs milliards de dollars et présentée comme un concurrent émergent de Google et Bing. Reddit la dépeint comme un « hacker nord-coréen » collectant des données sans discernement pour le seul bénéfice de son propre service de réponse IA. Le lien entre Perplexity et SerpApi est explicitement mentionné, suggérant une collaboration étroite dans l’acquisition de ces contenus. Des allégations similaires, portant sur l’appropriation de contenu, ont déjà visé Perplexity par le passé, notamment par des médias comme Forbes, qui l’accusait en 2024 de copier directement des articles sans autorisation.

Le cœur du litige réside dans la monétisation du contenu utilisateur. Si Reddit a conclu des accords juteux avec des géants comme Google et OpenAI pour l’utilisation de ses données dans la formation à l’IA, elle entend que ces accès soient encadrés et rémunérés. La plainte souligne que le « vaste corpus de discours humains authentiques » que représente Reddit est une manne inestimable pour les entreprises d’IA en quête de données toujours plus qualitatives pour dominer le marché. Reddit se considère comme une « source de données la plus citée » par ces sociétés, qui pèsent pourtant des milliards.

Face à cette situation, Reddit réclame des injonctions pour cesser ces pratiques, ainsi que des dédommagements. Perplexity, quant à elle, réfute fermement ces accusations, arguant dans une déclaration par la voix de son porte-parole, Jesse Dwyer, vouloir « lutter vigoureusement pour le droit des utilisateurs à accéder librement et équitablement à la connaissance publique ». Néanmoins, l’entreprise ne dément pas explicitement l’utilisation des données de Reddit pour ses réponses.

Ce conflit juridique pourrait faire jurisprudence dans un secteur en pleine effervescence, où la question de l’accès légal et éthique aux données pour l’entraînement des IA reste épineuse. L’enjeu dépasse le simple cadre de Perplexity et touche à l’ensemble de l’industrie numérique, des entreprises d’IA aux annonceurs, soulevant la question de la protection du droit d’auteur et de la juste rémunération des créateurs de contenu.

Au-delà des aspects juridiques, Reddit semble avoir une stratégie claire : devenir une destination de recherche à part entière. La plateforme renforce activement ses fonctionnalités de recherche, rendant la barre de recherche plus visible et intégrant des réponses associées directement sous les publications. Le PDG Steve Huffman voit d’ailleurs Reddit comme un moteur de recherche potentiel, promettant des revenus substantiels grâce aux futures intégrations publicitaires. « Reddit est l’une des rares plateformes positionnées pour devenir une véritable destination de recherche. Nous offrons quelque chose de spécial : une diversité de conversations et de connaissances que vous ne trouverez nulle part ailleurs », a-t-il déclaré.

L’affaire pourrait avoir des répercussions significatives sur la manière dont les données en ligne sont collectées et utilisées par les entreprises d’IA, redéfinissant potentiellement les règles du jeu pour l’ensemble du paysage numérique.

Un présentoir à journaux avec des exemplaires du Financial Times et du Wall Street Journal au premier plan. Cette image symbolise le rôle des médias traditionnels dans les tensions avec les fournisseurs d'IA tels qu'OpenAI et Perplexity.
© Hüma H. Aide – Unsplash

Leave a Comment

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.