Sociologie de Wikipedia

 Q ui aura exploré ce site le sait déjà, je ne suis pas sociologue en titre ; mais je réfléchis à la société de diverses manières et notamment sous un angle sociologique. Donc, ne faut pas prendre au pied de la lettre de titre de cette page.

Internet change considérablement les rapports entre les humains, il est la première réalisation fiable pour parvenir à l'avènement d'un projet ancien, la société humaine. Je nomme ça Internet mais c'est assez inexact si l'on considère ce qu'est proprement ledit Internet, le terme approprié serait plutôt «système intégré mondial de communication à distance» ou en plus bref «télécommunications globales», où Internet n'est qu'un des éléments, et pas le plus important d'un point de vue technique ou même d'usage. Pour faire encore plus bref, par la suite je parlerai d'«intercom» pour le système global et d'«Internet» pour l'ensemble des réseaux interconnextés que l'usage nomme «Internet» ou «la toile» / «le Web» ou «le réseau global» / «le World Wide Web» et dans lequel une partie du réseau internet stricto sensu n'est qu'un élément, mais le plus visible.

Pour reprendre ma première proposition, Intercom change considérablement les rapports entre les humains : à l'heure actuelle tout être humain peut entrer en relation avec tout autre instantanément[1] cela en quelque lieu qu'il se trouve, y compris loin là-bas dans les cieux, quelque part entre la Terre et la Lune. Quand on enverra des humains sur Mars (vers 2015-2020 paraît-il mais vraiment ça m'étonnerait…) ça ne sera plus instantané mais encore assez rapide (de 3 à 22 minutes, selon les positions relatives des deux astres). Et cette relation peut prendre toutes les formes : voix, image (webcams), écrit (email). Internet apporte un complément à cette capacité, la possibilité d'accéder instantanément à toute information mise à disposition sur les «mémoires de masse» du système (disques durs, CDs et DVDs, bandes, mémoire vives non volatiles et autre moyen de stockage électronique). On peut se figurer ce système comme un immense cerveau dont les points de connexion seraient les neurones, les circuits de transmission les synapses, où les instruments de stockage jouent le rôle de la mémoire et les logiciels celui de l'activité neuronale (pensée et réflexes). On peut donc dire mais j'insiste, de manière figurée, que l'humanité entière à désormais un cerveau unique, toujurs actif et toujours disponible.

Cette situation implique un saut qualitatif pour ce qui concerne la constitution et la diffusion du savoir et, corrélativement, la capacité créatrice de l'humanité. Un saut qui est certes encore largement virtuel, mais de moins en moins; selon moi le système devrait trouver sa stabilité d'ici une générations, pas avant. Et dans cette évolution, un outil comme Wikipedia est très représentatif d'une certaine orientation, celle de la «libre collaboration».

Qu'est-ce que Wikipedia ? Un site comme un autre. Et comme pour tout autre site il y a dans celui-ci une conception implicite de ce qu'est la société, et de vers quoi elle doit se diriger. En outre, Wikipedia est une sorte de société et, comme pour toute autre société, ses membres n'ont pas une conception univoque de ce qu'elle est, ce qui me semble heureux. Avant de discuter plus avant de la sociologie de Wikipedia, une brève analyse de ce qu'est Internet, donc la société.


Internet est la société. Ou pour être plus exact, Internet est un objet social parmi bien d'autres et, comme tout autre objet social, est représentatif de la société. Pour être plus exact encore, pour Internet comme pour tout autre objet social où le discours est un élément primordial, les diverses conceptions de «ce que doit être» une société s'y font place. Comme c'est un objet social assez nouveau et perturbant pour les partisans d'autres objets sociaux comparables (presse, télévision, radio, cinéma, etc.), ceux-ci tendent à mettre en avant les aspects les plus problématiques d'Internet, mais si l'on y réfléchit un peu, il ne diffère pas beaucoup de ces autres objets, sauf sur deux points : il est beaucoup plus récent et il est beaucoup plus exact que les autres (dans leur état actuel et celui de la société, du moins) en tant que «reflet de la société».

Le second point découle du premier : le cœur de la société est la communication; dans une circonstance donnée cette communication est le plus souvent, sinon toujours, en-deça de l'optimum que peut souhaiter une société donnée; une des tâches qu'elle se fixe est donc d'améliorer cette communication; cela prend du temps, et lorsqu'une nouvelle modélisation plus efficace de communication se met en place et vient perturber le système en cours, moins efficace mais dont les utilisateurs ont une meilleur maîtrise du fait même qu'il est en cours, donc a acquis une certaine stabilité, elle rencontre beaucoup d'oppositions. Nul être humain, je crois, n'apprécie de se retrouver dans une situation instable, en tout premier les membres d'une société donnée ayant la meilleure maîtrise des instruments actuels les plus efficaces. Ceci est notable par exemple pour l'industrie mais pas moins vrai pour la communication. Le problème est précisément que la communication est entre les mains de ceux qui, à un moment donné, la maîtrisent. Une analyse objective indique qu'un outil tel qu'Intercom / Internet est plus efficace que ses prédécesseurs mais une analyse socio-politique montre que les tenants des autres systèmes de communication ont un poids plus fort à tous niveaux que ceux favorables au nouveau système.

Cela ne peut avoir qu'un temps, mais un temps assez long, deux générations environ, la première pour que l'outil s'adapte à la société, la seconde pour que la société s'adapte à l'outil. Dans le cas d'Intercom / Internet, la partie matérielle de l'ensemble, Intercom, commença de se mettre en place vers 1970, à un lustre près, son adaptation à la société est réalisée vers 1995 et d'ici une dizaine d'années (soit vers 2015) la plus grande partie de la population mondiale aura un rapport immédiat, «naturel», à cet outil – c'est déjà le cas pour la majorité des habitants des pays les plus développés, pour lesquels l'intecommunication globale est de l'ordre de l'évidence. Le développement de la partie immatérielle, Internet dans le sens indiqué plus haut, commence dans les années 1980 pour se conclure à la toute fin de la décennie avec l'invention du système qui sera la base de cette partie, le World Wide Web. Cette partie n'a donc qu'un peu plus de 15 ans d'existence à la date où je commence ce texte, mais son adaptation au système matériel et sa – relative – simplicité de mise en œuvre a contribué à son rapide développement. Cependant nous n'en sommes pas tout-à-fait encore au second moment, celui de l'adaptation de la société à l'outil.

Pour l'heure, même si des systèmes de prise en main rapide (SPIP, MediaWiki, BlogSpot, etc.) existent, se diffusent et le temps passant, ont une utilisation de plus en plus intuitive, ça n'a pas encore le niveau d'évidence d'usage de la part matérielle, de plus en plus de gens se servant de leur ordinateur comme téléphone, visiophone et boîte aux lettres, de leur téléphone comme ordinateur, boîte aux lettres, caméra, appareil photo, de leur appareil photo comme caméra, visiophone, de… Bref, utilisent ordinairement ces instruments de manière toujours plus évidente et simple.

Une fois ce rapide tableau dressé, passons au sujet même de ce texte, MediaWiki comme représentatif d'une certaine «philosopie du Web» dont le principe de base est le travail collaboratif et anonyme en vue de la réalisation d'une œuvre collective, en s'attachant à une mise en œuvre particulière du système, celle de Wikipedia et de son complément multimédia, ''Wikimedia Commons''. Comme ce n'est pas ici le sujet, je ne traiterai pas plus que nécessaire des aspects techniques ou pratiques de MediaWiki. Un brin d'histoire et quelques faits ne me semblent cependant pas inutiles à énoncer.


Comme beaucoup d'autres inventions, et notamment en informatique (cas en particulier du HTML et du World Wide Web justement), le premier «wiki» est né d'un besoin ponctuel, celui de permettre aux usagers / contributeurs d'un certain site d'y intervenir directement, sans avoir à concevoir leur page puis la télécharger («uploader») vers le site, aux autres contributeurs de pouvoir modifier ces pages, et aux visiteurs d'accéder très rapidement à une information. Le concepteur de ce système, Ward Cunningham, avait une idée claire de ce qu'il désirait obtenir et une grande compétence en programmation, raisons pour lesquelles dès l'origine son système fut robuste, efficace et d'une prise en main simple et rapide.

Ce n'est que plus tard que cette manière de contribuer à des pages Internet se diffusa auprès d'un plus large public, spécialement avec la création de la Wikipedia en 2001, puis de la ''Wikimedia Foundation'' en 2003, qui élargissait son activité «au développement et à la maintenance de ressources libres et gratuites, disponibles en ligne, tels que encyclopédies, liste de citations, livres en texte intégral ou toute collection de documents, d'informations, et autres bases de données informationnelles, dans toutes les langues de la planète, et qui puissent être distribués sans frais auprès du public», en précisant le moyen qu'elle utiliserait pour parvenir à ce but : «Les objectifs de la fondation sont d'encourager la croissance et le développement de projets libres basés sur l'utilisation de logiciels collaboratifs de type WikiWiki, et de mettre gratuitement à la disposition du public le contenu intégral de ces projets». On voit ici que la philosophie est différente, il ne s'agit plus de faciliter techniquement la création de contenus, le travail collaboratif étant alors un moyen, mais de se fixer comme fin ce travail collaboratif, le «wiki» n'étant alors que le moyen de mettre cela en œuvre.

Cela s'inscrit dans une certaine conception de la manière dont le savoir doit se créer et se diffuser. En France on oppose souvent une approche censément «américaine» (ce qui signifie, «étatsunienne») ou pour ne pas viser un État particulier, «anglo-saxonne», et une autre, pas spécialement qualifiée sinon, par certains, «française» ou «continentale» (ledit continent étant l'Europe occidentale et centrale, îles britanniques exceptées). Ce n'est pas si simple : la Wikimedia Foundation est d'origine nord-américaine, donc «anglo-saxonne» et ses concepteurs ne sont pas spécialement atypiques, ni spécialement réfractaires au «libéralisme» tel qu'on le voit en France, mais aux États-Unis comme en France ou dans d'autres pays européens, quelles que soient leurs options politiques ou leur point de vue sur la meilleure organisation souhaitable de la société, beaucoup de personnes considèrent que le savoir est un bien commun dont, idéalement, l'accès et la mise à disposition sont gratuits.

De ce point de vue, le système Wikipedia appuyé sur l'outil MediaWiki est proche de cet idéal : le coût de fonctionnement est assez modique, environ trois millions de dollars en 2007, l'essentiel (2,5M$) étant consacré au matériel et aux coûts de communication (location de «bande passante») ce qui, évalué au nombre de pages créées, modifiées, consultées et réutilisées par ailleurs, est très peu. Pour actualiser cette information, en 2008 les dépenses ont progressé relativement peu, considérant la progression parallèle du nombre de pages, de contributions et de visites, à 3,5M$, et si pour l'année fiscale 2008-2009 la projection tablait sur une plus forte augmentation à près de 6M$, la plus grande part de cette dépense nouvelle était exceptionnelle (achat de nouveaux bureaux, augmentation du nombre de serveurs et des liaisons à large bande…) la progression des dépenses ordinaires est du même ordre que précédemment, à environ 4,5M$.

Ces chiffres font du projet Wikimedia un instrument proche de la gratuité si on les rapporte au nombre de pages lues et de visiteurs concernés. Pour l'année 2007-2008, le nombre de visiteurs sur l'ensemble des wikipédias est de l'ordre de 250 millions, et le nombre de pages consultées avoisine les 4 milliards, soit en moyenne seize pages par visiteur; le «coût par page consultée» est donc de l'ordre de 0,000875$, soit 0,014$ par visiteur. Dit autrement, 1.200 pages consultées «coûtent» 1$, et une «dépense» de 1$ couvre l'activité de 700 visiteurs. En outre, de par sa structure et sa technologie l'augmentation de diffusion d'un site Internet induit une forte réduction du «coût par page», bien plus importante que pour les médias sur support physique puisque'une fois atteint un certain volume de diffusion la baisse du coût par unité devient marginale puis nulle. Bien sûr, ça finira aussi par arriver pour Internet, mais dans encore assez longtemps.

Wikipedia tel qu'il existe actuellement a été mis en place en juillet 2002, après une première évolution en janvier 2002, mais le projet se développa dès janvier 2001 pour sa version anglaise et connut rapidement des versions dans d'autres langues avec la création de structures germanophone, catalane et francophone dès mars 2001 puis de diverses autres (chinoise, néerlandaise, espéranto, hébraïque, etc.) en mai 2001. Au moment où, en juillet 2002 donc, Wikipedia évolue vers sa forme actuelle, environ 35.000 articles ont déjà été créés, pour l'essentiel en anglais. Depuis lors, pour diverses raisons, notamment le fait du grand nombre d'internautes anglophones à date ancienne, une certaine propension des anglophones à créer des articles sur des sujets que dans d'autres versions on jugerait hors des critères d'admissibilité des articles et une propension tout aussi grande à traiter séparément ce qu'on tendrait ailleurs à rassembler, cette version a gardé sa prééminence.

Au 21 mai 2009 avec 2,89 millions d'articles sur un total de 19,45 millions, tous projets confondus (outre Wikipedia existent Wikilivre, Wiktionnaire, Wikiquote, etc.) dont 13 millions pour Wikipedia, assez loin devant les versions germanophone (907 milliers) et francophone (806 milliers). Ensuite figure un petit groupe de huit versions très actives, entre 300.000 et 600.000 articles, puis 14 versions entre 100.000 et 250.000 articles. Les 25 principales versions de Wikipedia regroupent 10,6 millions d'articles sur un total de 13 millions, les 3,4 millions restant se répartissant sur environ 125 langues (il existe officiellement des versions en 265 langues ou dialectes mais la moitié au plus ont une activité significative à cette date). La prééminence de la version anglophone est cependant relative si l'on considère le ratio entre le nombre de contributeurs inscrits et le nombre d'articles : il y a pour cette version 9,7 millions d'inscrits contre 759 milliers pour la version germanophone et 603 milliers pour la francophone, ce qui donne respectivement 0,3 articles, 1,2 articles et 1,34 articles en moyenne par inscrit.


En théorie Wikipedia est une encyclopédie en ligne. Dans les faits ce n'est pas aussi évident ni simple. Sur l'ensemble des Wikipedias il y a, au 20 mai 2009 pour le redire, 46.857.692 pages dont 13.051.333 pages d'articles, soit 28% du total, avec de fortes disparités cependant. Pour reprendre les trois premières versions, dans l'anglophone les articles représentent 17% de l'ensemble des pages, 35% dans la germanophone et 25% dans la francophone, et parmi les 25 comptant plus de 100.000 articles, ce ratio varie de 17% à 57%, la moyenne pondérée s'établissant à 36% (contre 27% en moyenne brute, toujours en rapport à la prééminence de la partie anglophone). Autre rapport intéressant, celui entre le nombre de contributeurs et de pages : toujours parmi les 25 premières version il varie de 1,3 à 52,4, avec une moyenne pondérée de 7,1 et brute de 2,5. Le plus haut ratio est cependant un cas particulier concernant une langue peu répandue mais soutenue par des militants, le volapük, la seconde langue ayant un ratio de 13,6. À remarquer d'ailleurs que les cinq langues qui ont le meilleur ratio font l'objet d'une militance forte, soit internationaliste (le volapük est suivi par l'espéranto) soit au contraire nationaliste (les suivantes sont le catalan, l'ukrainien et le slovaque, langues qui pour des raisons diverses ont une nécessité forte de s'affirmer). En sens inverse d'ailleurs, les trois langues qui ont le plus bas ratio (entre 1 et 2 articles par contributeur inscrit) sont celles qui ont aussi la meilleure position au plan international, par leur diffusion ou par la position du principal pays la parlant ou pour ces deux raisons : le chinois (celui dit simplifié), l'anglais et l'espagnol.

Même si elles en apprennent beaucoup sur le fonctionnement des groupes sociaux et des sociétés, les données brutes non éclairées par une étude des pratiques de leurs membres sont souvent trompeuses, une compréhension «de l'intérieur» du fonctionnement de Wikipedia est donc nécessaire avant d'aller plus loin sur ces données statistiques. Je voulais en premier mettre en évidence cet élément : sur toutes les pages que comporte le projet, les articles représentent en moyenne 28% de l'ensemble, et pour les 16 versions comptant plus de 500.000 pages, 26% de l'ensemble. Ce qui signifie que la plus grande part des pages de ce projet encyclopédique… n'est pas encyclopédique. Ou du moins, ne l'est pas directement.


J'évoquais les contributeurs inscrits, qui sont au total 17,5 millions. En réalité, le nombre réel doit plutôt être de l'ordre de 12 à 13 millions, du fait qu'un certain nombre de ces contributeurs sont inscrits dans plusieurs projets, certains même dans tous depuis qu'un système d'«unification» a été mis en place, et qu'encore un certain nombre ont créé plusieurs comptes dans un même projet, pour des raisons diverses, les deux cas les plus courants étant une cause fonctionnelle (séparer deux activités distinctes) et le désir de «masquer son identité» pour intervenir de manière destructive. Pour exemple, en tant que contributeur plus ou moins régulier je participe ordinairement à trois ou quatre projets ou sous-projets, occassionnellement à cinq ou six autres, très ponctuellement à cinq ou six autres encore, mais après activation de ce système j'ai un «compte utilisateur» dans 40 projets et sous-projets, dont un bon nombre concernant des langues que je ne connais que par leur nom. Mais comme parmi les inscrits il y en a somme toute fort peu intéressés suffisamment par les arcanes du fonctionnement de Wikipedia ou participant effectivement à plusieurs projets, ces inscriptions multiples restent encore assez rares.

Donc, j'évoquais les contributeurs inscrits, mais il y a bien plus de contributeurs à l'encyclopédie puisque, dans la situation actuelle, n'importe qui peut modifier n'importe quelle page, sinon pour certaines d'entre elles – j'y reviendrai. En sens inverse, les contributeurs inscrits ne sont pas nécessairement des contributeurs réels, certains même n'ayant rien fait de plus au sein du projet que de créer leur compte, une large part des inscrits ayant participé brièvement et pour peu de pages, puis ayant par la suite cessé d'y contribuer, sinon peut-être de manière anonyme, soit qu'ils aient oublié avoir créé un compte, soit qu'ils ne voient pas l'intérêt de se connecter à ce compte quand ils font une modification. Pour la partie francophone de l'encyclopédie par exemple, les inscrits ont procédé à 61% des modifications, contre 24% pour les «bots» (j'en parlerai plus loin) et 15% pour les «IP» (les contributeurs non connectés à un compte). Dans le cadre de ce sous-projet, le ratio entre inscrits et IPs est donc de 4 pour 1 ou si l'on préfère, de 75% contre 25%. On a un rapport comparable dans la version anglophone avec 69% d'inscrits contre 31% d'anonymes. En revanche, l'intervention des «bots» est très inférieure avec 4% des modifications même si, au cours de l'année 2008, il y eut une progression à 7%, avec aussi (hors bots) une petite progression des anonymes à 33%.

Sur l'ensemble des versions, la grande part et dans certains la quasi-totalité des modifications est due aux contributeurs inscrits ou aux «bots», lesquels sont (de par la politique de sécurité du projet) par nécessité activés par des inscrits. Ceci ne signifie pas que les contributions les plus importantes sont dues aux inscrits, certaines «IP» fournissant, souvent mais pas toujours pour un seul article ou une poignée d'articles liés entre eux, des ajouts encyclopédiques notables, souvent aussi dans des domaines assez pointues dont ils sont spécialistes ou qui ont leur intérêt.

Cela dit, les plus gros contributeurs, tant en nombre de contributions qu'en quantité d'ajouts, sont des contributeurs inscrits


[1] Tenant compte du léger décalage que crée la transmission, le signal de connexion pouvant parcourir parfois plusieurs centaines de milliers de kilomètres et que souvent le signal et «traité» (compressé puis décompressé), ce qui crée alors un délai de quelques secondes : vous l'aurez remarqué par exemple quand un reporter distant communique avec un présentateur de journal télévisé et que, à la fin de la question du second, un silence plus ou moins long illustre que ce signal met «un certain temps» à lui parvenir.