Premières impressions comme contributeur à Wikipédia

29 avril 2024 ∙ Retour à l'accueil du blog

Comme sans doute beaucoup de gens, j'utilise de manière intensive Wikipédia pour me renseigner sur toutes sortes de sujets, au point que je vais souvent consulter la page Wikipédia, par exemple, d'un outil informatique quelconque pour comprendre à quoi il sert avant de me farcir son marketing parfois insupportable. Au-delà de rechercher des informations sur des sujets dont j'avais déjà entendu parler, je m'en sers aussi pour combler comme je peux les trous béants de ma piètre culture scientifique, notamment dans mon domaine d'études qui est l'informatique théorique. En suivant les liens de page en page, on peut découvrir des pans entiers de la science dont on ne soupçonnait même pas l'existence.

Vers décembre 2023, suite à une question de Bastien Laboureix (et après m'être cassé la tête un bon moment sur le problème sans succès), j'ai trouvé sur Wikipédia que si dans un ensemble ordonné, toutes les chaînes non-vides ont une borne supérieure, alors toutes les familles dirigées ont une borne supérieure (le poset est donc un dcpo), avec une référence à un article de 1976 d'un certain George Markowsky, Chain-complete posets and directed sets with applications, publié dans Algebra Universalis. L'article en question coûte 40€, somme que je n'allais certainement pas dépenser juste pour lire cette preuve (et qui est assez scandaleuse pour 16 pages même si on pense que l'accès payant aux articles scientifiques se justifie, ce qui n'est pas mon cas). J'ai failli en rester là… jusqu'à ce que j'ouvre de grands yeux en tombant sur un billet de blog à propos de ce théorème exact par l'inénarrable Jean Goubault-Larrecq, dont j'ai suivi n cours. Quand je lui en ai parlé, il m'a même pointé vers un deuxième billet avec une preuve différente, tout ceci librement accessible sur le Web. Le premier effet est que j'ai compris ces deux preuves très jolies et non-triviales, le deuxième est que je me suis mis en tête d'apprendre plus sérieusement à éditer Wikipédia pour rajouter ces billets comme références.

Dans les quatre mois depuis cet épisode, sur la Wikipédia anglophone, j'ai fusionné les pages Complete partial order et Chain-complete partial order — qui étaient séparées alors que le théorème dit exactement que les deux notions coïncident ! —, donné une preuve détaillée dans la page sur le théorème d'Immerman-Szelepcsényi, taillé dans les nombreuses redondances sur le théorème de Rice, ajouté le théorème de Kreisel-Lacombe-Shoenfield-Tseitin à la page sur le théorème de Rice-Shapiro, rédigé les preuves de ces deux théorèmes1, et créé une courte page sur le problème des matrices mortelles. Sur la francophone, j'ai détaillé quelques passages de divers articles sur les 𝑛 millions de notions différentes de compacité2, recentré la page du théorème de Bolzano-Weierstrass sur le cas réel, créé une liste sommaire de problèmes indécidables largement traduite de l'anglais, et également traduit ma page anglaise sur le problème des matrices mortelles. Des deux côtés, j'ai fait des modifications mineures éparses, comme ajouter des {{citation needed}} ou {{référence nécessaire}}.

Donc, comme plusieurs personnes m'ont interrogé à ce sujet, petit bilan de mon expérience de nouveau contributeur.

D'abord, c'est plus facile que je ne l'imaginais. Bien sûr, il y a des principes de base à apprendre, comme les éléments de l'interface Web, ou les syntaxes les plus courantes dans le code de l'article comme ''italique'', '''gras''' et [[lien vers un autre article]]. Globalement, on s'en sort assez rapidement en regardant comment les articles existants sont faits.

Pour moi, la barrière initiale était surtout psychologique, celle de me dire que si je faisais une erreur, je serais la risée des lecteurs du monde entier. On comprend très vite, en lisant les pages de discussion, que les autres contributeurs sont aussi des êtres humains, que des erreurs sont faites régulièrement, et qu'elles sont souvent rectifiées par d'autres (je l'ai fait récemment pour une faute grossière dans la Wikipédia francophone, l'article affirmait que le dernier théorème de Fermat était un problème de décision !).

Malgré tout, on se sent bien petit dans cette encyclopédie, qui est vaste au-delà des limites de l'imagination, ou en tous cas de la mienne. La version anglaise, par exemple, compte actuellement presque 6,8 millions d'articles, nombre qui croît à une vitesse de plus de 500 articles créés par jour, soit environ un nouvel article toutes les 3 minutes. Les statistiques détaillées sont ici. Moi qui ne suis déjà plus tout à fait à l'aise dès que je suis dans un groupe de plus de 40 personnes, je suis intimidé. (Évidemment, si on ne regardait que les articles que je serais susceptible d'éditer, les statistiques seraient beaucoup plus faibles.)

Il y a beaucoup de pages pour les nouveaux. La principale est A primer for newcomers, qui fait dans les 8 000 mots (soit environ 15 pages sur du papier), et il y a aussi Your first article, Plain and simple, Tutorial, Wikipedia: The Missing Manual (en 21 chapitres), et toutes les autres pages listées sur A primer for newcomers # Other helpful pages, ainsi qu'un site entier (je ne sais plus où j'ai trouvé le lien). Ça vaut mieux que trop peu, mais la profusion n'aide pas à s'y retrouver. Une autre illustration est la catégorie Basic information on Wikipedia, qui au moment où j'écris ressemble à ceci :

Longue liste de pages Wikipédia sur Wikipédia elle-même, par exemple « Dos and dont's », « Etiquette », « Five pillars », etc.

Pour ne rien arranger, il y a vraiment beaucoup (beaucoup beaucoup) de pages « méta » comme les guides de style, les conditions pour qu'un article soit admissible, les règles pour fusionner des articles, etc., etc., etc. La liste complète est sur Help:Directory. Jetez par exemple un œil au guide de style, qui fait environ 28 000 mots, soit à peu près 70 pages imprimées, et cela ne compte pas les nombreux guides de style spécifiques pour les maths, l'art, les religions, etc.

C'est d'ailleurs reconnu :

Image d'un homme retirant des livres sur les étagères d'une bibliothèque à l'aide d'une échelle, avec la légende : « An editor in the process of reading every single one of Wikipedia's Policies, Guidelines and Essays. He was only twelve years old when he started!

Je crois qu'il faut le prendre un peu comme le droit. Nul n'est censé ignorer la loi, pourtant nul ne peut l'avoir lue entièrement, encore moins la retenir… et pourtant nous nous débrouillons. Ici, j'ai appliqué une combinaison de « lire les informations les plus importantes en diagonale » et « lire quelques pages qui m'intéressaient particulièrement à un moment précis ». C'est juste un peu déroutant au début.

Je trouve que le plus délicat au niveau technique, c'est la manière d'écrire les références. Voir Citing sources, Citation Style 1 et toutes les pages de modèles de citation comme pour {{cite journal}}, qui sont toutes des pages-fleuve avec une quantité incroyable de règles, de paramètres, et bien sûr de liens vers mille autre pages sur les références. C'est dommage, vu l'insistance omniprésente sur le fait de citer ses sources, que les règles soient aussi compliquées.

Il y a aussi quelques points qui m'ont surpris.

D'abord, le fonctionnement des pages de discussion sur chaque article. En fait, ce sont comme des pages normales de l'encyclopédie, avec juste quelques boutons en plus. En particulier, on peut éditer un commentaire posté par quelqu'un d'autre. Je ne sais pas si j'apprécie ; il y a peut-être des cas où c'est utile, mais je n'aimerais certainement pas qu'on édite un message de moi, sauf peut-être pour corriger une faute de frappe.

Autre point qui me chagrine : comment écrire des formules mathématiques. Il y a trois syntaxes différentes, chacune avec ses avantages et ses inconvénients, et pas de consensus entre elles, donc les articles utilisent des syntaxes différentes. Et le pire, c'est que je n'ai trouvé aucune d'entre elles acceptablement concise. Si je veux écrire y = P(x), je veux que ce soit raisonnablement facile avec quelque chose comme $y = P(x)$, ou bien avec les caractères adéquats, 𝑦 = 𝑃(𝑥) (je fais le deuxième sur ce blog, mais je reconnais que l'Universel Nommage Immatériel des Caractères et Orthographe Dyadique d'Échange n'est pas encore assez popularisé pour que cela ne rebute pas 99% des gens). Les trois options sur Wikipédia donnent

Le <math> permet en gros ce que permet LaTeX, le {{nowrap}} ne permet rien de particulier (il empêche juste un saut de ligne à l'intérieur de la formule, il faut mettre les variables en italique à la main avec les doubles apostrophes), et le {{math}} a l'air d'être une sorte d'intermédiaire. Le plus simple pour parler d'une variable x est ''x'', c'est vraiment lourd d'écrire <math>x</math> dix fois par phrase, mais d'un autre côté, si la variable apparaît dans une intégrale, on n'a pas le choix, il faut faire cette formule avec <math>, or le x a un aspect différent dans le <math>, ce qui est moche, donc il faut passer les ''x'' adjacents en <math>x</math>. Bref, c'est le bazar.

À part ces petits malheurs techniques, j'avais aussi peur de la bureaucratie, et notamment qu'on me reproche de ne pas respecter le guide de style (non, je n'ai pas lu ses 70 pages, et je ne compte pas le faire). Heureusement, je n'en ai pas vraiment rencontré jusqu'ici. Il est vrai qu'en fait, je n'ai eu quasiment aucune interaction avec les autres contributeurs (juste avec quelqu'un qui m'a signalé une erreur de syntaxe dans une page que j'avais écrite). Je ne sais pas si c'est général, ou si c'est simplement parce qu'il y a beaucoup moins de gens qui s'intéressent à un article sur le théorème de Rice-Shapiro qu'à un article sur le PSG. En revanche, quelques modifications que je trouve contestables ont été faites par dessus les miennes, par exemple celle-ci (je ne comprends pas pourquoi il faudrait mettre le </ref> à un niveau d'indentation différent du <ref>). Je ne les ai pas annulées, je n'ai vraiment pas envie de jouer au bikeshedding, il y a des façons plus intéressantes d'occuper la vie. Finalement, le plus encourageant dans l'affaire est la recommandation Be bold, qui incite à ne pas trop se prendre la tête, et à ne pas se formaliser si d'autres font des changements qu'on aurait faits différemment.

Voilà tout pour mes premières impressions à chaud. Si je me mets à contribuer plus régulièrement, je ferai peut-être un nouveau billet avec ce que j'aurai appris.


1

À nouveau pour des raisons de coût, ces preuves sont issues non pas des livres classiques sur la calculabilité d'ordre supérieur, mais d'un article assez illisible, et d'une feuille de TD du master LMFI que j'ai résolue sur le tas. Je trouve que cela dit quelque chose sur les absurdités du système de publication qui empêchent la diffusion des idées scientifiques. Par la suite, certains m'ont conseillé de passer par des sites pirates comme l'archive d'Anna pour accéder à ces livres gratuitement et de façon illégale mais peut-être morale.

2

Sans blague, il y a les espaces compacts, quasi-compacts, séquentiellement compacts, dénombrablement compacts, Lindelöf, para-compacts, pré-compacts, pseudo-compacts, méta-compacts, ortho-compacts, réel-compacts, et sûrement d'autres…


Commentaires sur Mastodon