Le message est clair, si vous utilisez mes données sans payer, préparez vos avocats

Publié le 2025-10-23 23:09:00. Reddit lance une offensive juridique contre plusieurs entreprises d’intelligence artificielle, qu’il accuse d’exploiter illégalement son contenu. Cette démarche marque un tournant dans la monétisation des données générées par les utilisateurs, à l’heure où l’IA devient une consommatrice vorace d’informations.

Reddit accuse Perplexity AI et trois fournisseurs de services de « scraping » de données d’avoir contourné ses protections pour s’approprier des contenus protégés.
La plateforme dénonce un « scraping à l’échelle industrielle » visant à alimenter des modèles d’intelligence artificielle sans autorisation ni rémunération.
Cette action s’inscrit dans une stratégie plus large de Reddit visant à contrôler et monétiser l’utilisation de ses données, contrastant avec ses accords avec Google et OpenAI.

Le modèle économique d’Internet, longtemps basé sur l’idée que si un service est gratuit, l’utilisateur en est le produit, est aujourd’hui bousculé par l’essor de l’intelligence artificielle. Les conversations humaines, abondamment stockées sur des plateformes comme Reddit, sont devenues des mines d’or pour l’entraînement des IA, soulevant la question de la juste valeur des données. Dans ce contexte, Reddit adopte une posture résolument ferme : hors de question que son contenu soit exploité gratuitement.

La plateforme a ainsi déposé une plainte devant la justice américaine, ciblant spécifiquement le moteur de recherche conversationnel Perplexity AI ainsi que les sociétés SerpApi, Oxylabs et AWMProxy, qualifiées d’intermédiaires de « grattage » de données. Reddit les dépeint comme des « braqueurs de banque en herbe », tentant d’accéder à son contenu par des voies détournées, sans passer par les accords de licence. Selon la plainte, Perplexity AI serait client d’au moins un de ces fournisseurs.

Le document judiciaire détaille une méthode de collecte automatisée d’informations, conçue pour contourner les restrictions mises en place par Reddit. L’entreprise dénonce un flux constant de publications et de commentaires, intégrés illicitement aux modèles d’IA des accusés à une échelle « industrielle » et dans un but commercial manifeste.

Un test révélateur. Ce qui a particulièrement motivé l’action en justice est une expérience menée par Reddit en mai 2024. Après avoir demandé à Perplexity AI de cesser toute collecte de données, la plateforme a constaté une augmentation des mentions de Reddit dans les réponses du moteur. Pour en avoir le cœur net, Reddit a publié un texte spécifiquement destiné à n’être visible que par Google. Quelques heures plus tard, le contenu intégral de cette publication apparaissait dans les résultats générés par Perplexity.

La défense de Perplexity. De son côté, Perplexity AI a réagi via sa propre plateforme, affirmant agir en tant que « couche applicative » et niant formellement entraîner ses modèles d’IA avec du contenu Reddit. « Nous ne l’avons jamais fait », assure l’entreprise, arguant que cette distinction rend les accords de licence de Reddit caducs. Perplexity affirme avoir expliqué sa position à Reddit il y a un an, mais que la plateforme aurait persisté dans sa demande de rémunération, ce que Perplexity refuse de satisfaire : « Céder à ce type de tactiques n’est pas notre façon de faire des affaires. »

Une stratégie de monétisation sélective. Cette position conflictuelle contraste avec les accords de licence conclus par Reddit avec d’autres géants de la tech. En février 2024, la plateforme a renforcé sa collaboration avec Google pour un accès structuré et sous licence à ses données. Quelques mois plus tard, une alliance similaire a été annoncée avec OpenAI, permettant aux produits comme ChatGPT d’intégrer des publications récentes de Reddit dans leurs réponses.

Ce que les utilisateurs acceptent sans le lire. Au cœur de cette controverse se trouve un élément souvent négligé : les Conditions d’utilisation de Reddit. En créant un compte, chaque utilisateur accorde à la plateforme une licence mondiale, perpétuelle et irrévocable, leur permettant d’utiliser, de copier, modifier, distribuer ou publier le contenu généré. Ces conditions précisent explicitement que Reddit peut employer ce matériel pour « former des modèles d’intelligence artificielle et d’apprentissage automatique », offrant ainsi une autorisation préalable.

Alors qu'OpenAI s'empare de toute la gloire médiatique avec ChatGPT, Alibaba gagne déjà des clients importants avec Qwen. Le dernier en date : Airbnb

Un précédent en gestation. Cette affaire s’inscrit dans une logique déjà observée. En 2023, Reddit avait déjà durci l’accès à son API, provoquant une vague de protestations et la fermeture temporaire de nombreuses communautés. L’action contre Perplexity, après une lettre de mise en demeure similaire adressée à Anthropic, confirme la volonté de la plateforme de protéger la valeur de son contenu et de reprendre la main sur son exploitation. L’issue de ce litige, encore à ses débuts, pourrait établir un précédent déterminant pour les futures relations entre les plateformes en ligne et les développeurs d’intelligence artificielle, confrontant la défense du libre accès à l’information au droit des entreprises de protéger leur propriété intellectuelle.

Le message est clair, si vous utilisez mes données sans payer, préparez vos avocats

Related

Leave a Comment Cancel Reply

À propos de nous

Le message est clair, si vous utilisez mes données sans payer, préparez vos avocats

Partager :

Related

Leave a Comment Cancel Reply

Le Macbook Pro M5 chauffe plus que son prédécesseur M4

Un superbe que j’ai vu briller depuis que je suis enfant

Tu pourrais aussi aimer

À propos de nous