Je ne pourrai plus jamais parler anonymement à une IA

Une IA n’a besoin que de 150 mots pour m’identifier. Qu’est-ce que ça implique pour vous ?

Par Kelsey Piper

Plusieurs modèles d’IA avancés — en particulier Claude Opus 4.7 — ont démontré leur capacité à déduire l’auteur d’extraits de texte relativement courts.

Récemment, Matt Yglesias et Jerusalem Demsas se sont affrontés dans le podcast The Argument au sujet de l’anonymat en ligne.

Personnellement, je suis farouchement — presque obsessionnellement — favorable à l’anonymat. Il suffit d’observer le fonctionnement des sociétés pour constater à quel point elles peuvent rapidement rendre certaines opinions impossibles à exprimer, ou certaines vies impossibles à vivre ouvertement. Et, dans ces cas-là, l’anonymat reste souvent la seule protection des marginaux.

Cela concerne des personnes homosexuelles comme moi, qui, pendant une grande partie de l’histoire américaine, n’auraient jamais pu parler publiquement de leur vie sous leur vrai nom. Mais aussi tous ceux qui vivent selon des croyances ou des modes de vie minoritaires. Oui, parmi eux se trouvent aussi des gens profondément dans l’erreur — mais je préfère malgré tout un monde où ils peuvent parler.

Je suis prête à supporter les marécages de commentaires que génère Twitter — néonazis assumés, professionnels du ragebait, propagandistes tankies — tous cachés derrière des pseudonymes pour dire des horreurs qu’ils n’assumeraient jamais sous leur identité réelle… si cela signifie vivre dans un monde où quelqu’un peut encore dire une vérité importante sans perdre son emploi.

Mais bientôt, tout ce débat sur l’anonymat sur Internet paraîtra aussi daté qu’un iPod Touch.

Parce que Claude Opus 4.7 est arrivé. Et la semaine dernière, j’ai découvert qu’il pouvait m’identifier à partir de textes que je n’avais jamais publiés : des écrits du lycée, des brouillons privés, voire des genres littéraires dans lesquels je n’ai jamais écrit publiquement. Et s’il peut me reconnaître, il pourra bientôt reconnaître beaucoup d’entre vous.

Opus 4.7 connaît la « vraie » Kelsey

Récemment, Anthropic a publié une nouvelle version de Claude : Opus 4.7.

Comme à chaque sortie d’un nouveau modèle chez Google, OpenAI ou Anthropic, j’ai lancé toute une batterie de tests pour voir ce qu’il savait faire.

L’un de ces tests consiste à lui soumettre des brouillons inédits et à lui demander d’en deviner l’auteur.

Voici un extrait :

« Il y a toujours quelque chose de salutaire à regarder les émissions politiques d’un autre pays. Un peu comme regarder The West Wing en 2026 : les obsessions étranges de cette époque ne sont plus les nôtres… »

À partir de ce seul passage — 125 mots — Claude Opus 4.7 a conclu que l’autrice la plus probable était… Kelsey Piper.

Ce pouvoir semble spécifique à Opus 4.7 : ChatGPT a deviné Matt Yglesias, tandis que Gemini a proposé Scott Alexander.

Je n’avais ni mémoire activée, ni informations personnelles liées à mon compte. Tous les tests ont été réalisés en navigation privée.

Pour vérifier que Claude ne trichait pas en utilisant des données de session, j’ai demandé à un ami d’effectuer les mêmes essais depuis son propre ordinateur : il a obtenu exactement le même résultat. Même chose via l’API.

Évidemment, ce n’est pas un exploit totalement impossible : une grande partie de mes écrits est publique, et ce texte ressemblait clairement à l’introduction d’une chronique politique, ce qui réduit énormément le nombre de candidats plausibles.

Mais ce qui devient franchement troublant, c’est qu’Opus 4.7 réussit aussi avec des textes très éloignés de mon registre habituel.

Par exemple, un brouillon inédit de rapport scolaire :

« Ce travail d’élève est partagé avec son autorisation… Ces trois exercices montrent l’évolution de l’élève sur deux mois après que nous avons décidé de travailler spécifiquement l’expression écrite… »

Réponse de Claude : « Kelsey Piper. »

(ChatGPT a proposé Freddie deBoer. Gemini a répondu Duncan Sabien.)

Pourtant, ce texte parlait d’éducation — un sujet sur lequel j’ai déjà écrit. Alors j’ai essayé autre chose : des critiques de cinéma, un domaine où je n’ai jamais publié.

Réponse de Claude et ChatGPT : « Kelsey Piper. »

Même chose avec un roman de fantasy — bien qu’il ait fallu environ 500 mots pour que Claude m’identifie. (ChatGPT, au passage, m’a flattée en pensant que j’étais K. J. Parker.)

Et quand j’ai ressorti une lettre de candidature universitaire écrite il y a quinze ans, dans un style franchement médiocre et embarrassant à relire aujourd’hui ?

Encore une fois : « Kelsey Piper. »

Les IA ne savent pas expliquer comment elles font

Le plus étrange, c’est que les explications fournies par l’IA étaient souvent complètement absurdes.

Claude a essayé de me convaincre que les altruistes efficaces adorent le film To Be or Not to Be — ce qui, à ma connaissance, est faux.

À un autre moment, ChatGPT a affirmé que ma dissertation universitaire révélait forcément quelqu’un destiné à vulgariser des politiques publiques complexes, ce qui l’aurait conduit à penser à moi.

Je soupçonne fortement que ces justifications soient fabriquées après coup.

Les IA repèrent probablement des tics d’écriture invisibles à l’œil humain, puis improvisent une explication pseudo-détective façon Sherlock Holmes.

Elles ne comprennent pas réellement ce qu’elles font — pas plus que moi.

Les hallucinations restent un problème non résolu de l’IA.

Mais cela ne doit pas faire oublier l’essentiel : même si leurs explications sont incohérentes, elles sont extraordinairement efficaces pour identifier les auteurs.

La fin de l’anonymat en ligne

Aujourd’hui déjà, les outils d’IA peuvent probablement désanonymiser n’importe quel auteur possédant un important historique d’écriture publique sous son vrai nom — surtout s’il écrit aussi anonymement ailleurs sans avoir soigneusement modifié son style.

Des universitaires et chercheurs ont d’ailleurs raconté avoir été reconnus à partir d’un simple brouillon ou même au cours d’une conversation.

En revanche, l’IA ne peut pas encore identifier n’importe qui à partir d’un unique passage.

J’ai aussi testé cela avec des amis qui n’ont quasiment aucune présence publique en ligne sous leur vrai nom : l’IA n’a pas réussi à les reconnaître.

Donc, si vous n’avez pas de corpus public significatif, vous êtes encore relativement protégé.

Mais les résultats restent troublants.

J’ai demandé à une amie proche — sans réseaux sociaux publics ni véritable présence en ligne — l’autorisation de tester quelques messages qu’elle avait écrits sur Discord.

Claude 4.7 n’a pas trouvé son identité… mais il a proposé deux de ses amis proches présents sur le serveur — moi comprise — simplement parce que nous partageons des habitudes stylistiques issues du même milieu social.

Nos sous-cultures façonnent notre manière d’écrire. Et cette empreinte devient profondément identifiable sans que nous nous en rendions compte.

Le plus inquiétant ? Les modèles actuels sont les moins puissants qu’on connaîtra jamais.

Je pense que la quantité de texte nécessaire pour ce genre de désanonymisation va continuer à diminuer.

Dans un ou deux ans, si vous laissez un avis anonyme détaillé sur Glassdoor après avoir quitté votre entreprise, il sera probablement possible pour votre employeur de coller ce texte dans une IA et d’identifier précisément son auteur.

Le délai dépendra surtout de la quantité de données publiques disponibles sur vous… et du volume de textes anonymes que vous avez produits.

Pour éviter cela, il faudra sans doute apprendre à écrire délibérément dans un style totalement différent du sien.

Ou laisser des IA réécrire tous nos textes à notre place.

Et franchement, ce n’est pas un futur qui me réjouit.

Je ne pense pas que ce soit une bonne évolution. Mais je pense qu’elle était prévisible.

Cela m’est arrivé un peu plus tôt qu’aux autres simplement parce que je passe ma vie adulte à écrire compulsivement sur Internet.

Mais cela finira probablement par vous arriver aussi.

Quels que soient les avantages qu’offrait autrefois l’anonymat, il faudra sans doute apprendre à vivre sans eux.

Je n’ai pas envie que tous les anonymes disparaissent d’Internet, ni que chacun se mette à effacer frénétiquement ses anciennes traces numériques.

Mais surtout, je ne veux pas que les gens soient pris par surprise.

Ma meilleure estimation aujourd’hui est simple :

si vous écrivez beaucoup, votre anonymat a probablement une date d’expiration.

MESMAR

Je ne pourrai plus jamais parler anonymement à une IA

Opus 4.7 connaît la « vraie » Kelsey

Les IA ne savent pas expliquer comment elles font

La fin de l’anonymat en ligne

Enregistrer un commentaire

Le Terme du Jour

Chargement...

Le plus grand stratège de guerre de tous les temps, Khalid Ibn El-Walid

Quand la curiosité d’un enfant rejoint les grandes questions de la science

Louis XVI précurseur dans l’abolition de l’esclavage.

WinRAR : La fenêtre la plus ignorée de l’histoire d’Internet