OWNI http://owni.fr News, Augmented Tue, 17 Sep 2013 12:04:49 +0000 http://wordpress.org/?v=2.9.2 fr hourly 1 Twitter: l’impossible archivage ? http://owni.fr/2010/05/12/twitter-limpossible-archivage/ http://owni.fr/2010/05/12/twitter-limpossible-archivage/#comments Wed, 12 May 2010 12:45:19 +0000 Lionel Maurel (Calimaq) http://owni.fr/?p=15397 La nouvelle avait fait sensation, il y a quinze jours : Twitter annonçait faire don de l’intégralité de ses archives à la Bibliothèque du Congrès à des fins de conservation et de recherche et c’est, comme il se doit, par un tweet que la LoC (Library of Congress) célébrait l’entrée du rétrospectif de Twitter dans ses collections.

Soit quand même plus de dix milliards de gazouillis !

Le même jour, Twitter et Google annonçaient le lancement d’un nouveau service du moteur de recherche – Google Replay – qui permettra d’effectuer des recherches chronologiques au sein du contenu de Twitter, avec à terme l’intention de balayer l’intégralité des archives, depuis son lancement en 2006.

Cette “patrimonialisation éclair” de Twitter, consacrée par son entrée à la Bibliothèque, a quelque chose qui peut surprendre, même si elle s’accorde bien avec le tempo ultra-rapide du microblogging. On peut aussi penser que Twitter contient déjà de vrais petits morceaux d’histoire, comme les tweets liés au hashtag #iranelections, le pépiement de la victoire électorale de Barack Obama ou encore le premier tweet envoyé depuis l’espace ! La globalité des tweets forme aussi une formidable archive du quotidien, ouvrant de nouveaux champs à la recherche historique, par le biais du data mining.

Pour autant, les commentaires français n’ont pas manqué de relever que ce transfert des archives de Twitter à la Bibliothèque du Congrès soulevait également des questions, à propos du respect de la vie privée ou du droit d’auteur. Et de l’autre côté de l’Atlantique, où l’on ne plaisante pas avec la protection de la privacy, c’est une véritable polémique qui s’est déclenchée, plaçant la LoC dans une position assez délicate (vous en trouverez quelques échos ici, rassemblés par le blog ArchivesNext).

À tel point que la responsable de l’archivage numérique de la LoC a donné une interview pour apporter des précisions sur le partenariat avec Twitter. La Bibliothèque a également publié cette semaine une FAQ, accompagnée (et c’est là que ça devient intéressant !) de l’accord par lequel Twitter a fait don de ses archives (ici).

L’analyse de ce document soulève des questions assez troublantes, qui me laissent penser que la constitution de la mémoire numérique, dans le cadre de partenariats  public-privé, est loin encore d’avoir trouvé son assiette juridique.

Le petit oiseau bleu est entré à la bibliothèque... et on a pas fini d'en parler ! (Library Bird. Par C.O.D Library. CC-BY-NC-SA. Source : Flickr)

Il faut en effet garder à l’esprit que Twitter est l’exemple type d’un service web 2.0, dont le contenu est produit par ses utilisateurs (User Generated Content). La question de la propriété de ces contenus est loin d’être aisée à appréhender, surtout que les micromessages de Twitter possèdent une nature assez particulière.

Copyright or not ?

L’été dernier, j’avais écrit une série de billets dans lesquels j’avais essayé de montrer que les tweets échappent dans leur immense majorité à la propriété intellectuelle, par manque d’originalité ou de mise en forme (ici ou ). Dès lors, ils relèvent plutôt du statut de l’information brute ou des données, et ne devraient pas pouvoir faire l’objet d’une appropriation (y compris d’ailleurs par leurs propres “auteurs” !).

Pourtant, quand on lit le Gift Agreement publié par la Bibliothèque du Congrès, on se rend compte que c’est sur le copyright que Twitter s’appuie pour délivrer à la LoC une licence d’utilisation de ses contenus :

2) Copyright : Donor grant an irrevocable nonexclusive licence to the library for such rights as the Donor has the right to transfer or licence under the Twitter Terms of Service in place at the time of the gift or before. The current, as of the effective date, and previous Terms of Service are appended.

Twitter utilise en effet ses CGU (Conditions Générales d’Utilisation) pour revendiquer un droit d’auteur (copyright) sur les contenus produits par ses usagers :

You retain your rights to any Content you submit, post or display on or through the Services. By submitting, posting or displaying Content on or through the Services, you grant us a worldwide, non-exclusive, royalty-free license (with the right to sublicense) to use, copy, reproduce, process, adapt, modify, publish, transmit, display and distribute such Content in any and all media or distribution methods (now known or later developed).

C’est cette licence  – royalty-free license (with the right to sublicence) – que Twitter met en œuvre dans sa convention de don à la LoC et qui lui confère juridiquement sa qualité de Donor.

Le problème, c’est qu’on peut sérieusement se demander si cette chaîne de concessions est valide et comment Twitter peut revendiquer un droit sur ses contenus, si les utilisateurs eux-mêmes ne possèdent pas réellement de droit d’auteur sur leurs propres tweets…

C’est une aporie que j’avais déjà relevée l’année dernière, lorsque les CGU de Twitter ont changé et que le petit oiseau bleu est subitement devenu plus agressif vis-à-vis de ses utilisateurs.

En effet, à l’origine (souvenez-vous !), Twitter ne revendiquait aucun droit de propriété intellectuelle sur ses contenus et incitait même ses utilisateurs à les verser dans le domaine public :

Copyright (What’s Yours is Yours)

1. We claim no intellectual property rights over the material you provide to the Twitter service. Your profile and materials uploaded remain yours. You can remove your profile at any time by deleting your account. This will also remove any text and images you have stored in the system.

2. We encourage users to contribute their creations to the public domain or consider progressive licensing terms.

J’estime pour ma part que les nouvelles CGU de Twitter n’ont pu avoir pour effet de changer la nature de son contenu, et que celui appartenait et appartient toujours, dans sa plus grande partie, au domaine public.

Dès lors, le fondement même de la convention de don à la LoC me paraît douteux, et même préjudiciable, puisqu’il entérine le geste d’appropriation que Twitter a opéré vis-à-vis des contenus produits par ses utilisateurs, avec l’aval de la Bibliothèque.

Certaines analyses estiment que Twitter a manqué aux obligations qui le liaient avec ses utilisateurs, mais que la Bibliothèque, de son côté, n’avait nullement besoin de cette convention de don pour archiver le contenu de Twitter. La loi américaine sur le dépôt légal permet en effet à la LoC de collecter toutes les formes de publication. Elle dispose déjà d’ailleurs d’une archive du web, constituée par des captures de sites.

Patrimoine public contre vie privée ?

D’autres voix se sont élevées aux États-Unis pour contester à Twitter la faculté de donner ainsi ses archives à la Bibliothèque, mais cette fois au nom du respect de la vie privée (ici, ou ).

L'archive de Twitter est une véritable mosaïque de données à caractère personnel (Twitter Follower Mosaic. Par Jeolaz. CC-By-NC-ND. Source : Flickr)

Fred Stutzman, sur son blog, se livre ainsi à une intéressante interprétation restrictive des CGU de Twitter :

[...] as long as your content is on Twitter, Twitter can do what they want with it. Fine. But what if you remove your content from Twitter? Wouldn’t Twitter’s licensing of your content to the LoC also expire? Twitter needs to address exactly how we can pull our content out of the archive when we want.

A broader question is why Twitter didn’t just build this as an opt-in service. Or even, less preferably, an opt-out service. Is the collection so important that it is worth compromising user privacy ? I’ve got a feeling that there are certain assumptions around “public” content and the feel-good vibe of the Library of Congress that led to a lack of critical thinking about the implications of this move.

On touche ici à des questions qui mêlent à la fois la propriété sur les contenus et le respect de la vie privée, d’une manière qui fait penser au débat sur le droit à l’oubli ayant lieu actuellement en France.

Beaucoup d’utilisateurs américains se sont inquiétés par exemple que les tweets de comptes privés puissent être consultables à la LoC, de la même façon que les Direct Messages, qui ne sont pas réellement “publiés sur Twitter”, au sens de “rendus publics”. La question reste entière également pour les données de géolocalisation. Il semblerait par contre que les informations des profils personnels, ainsi que les tweets annulés ne feront pas partie de l’archive.

La question de l’opt-out est aussi déterminante : les utilisateurs qui annulent leurs comptes sur Twitter pourront-ils aussi exiger le retrait de leur message de l’archive consultable à la LoC ? Pourront-ils effectuer des retraits ciblés de certains de leurs messages seulement et comment ?

Dans son interview, la responsable de l’archivage numérique de la Bibliothèque laisse entendre que cet opt-out est une question qui concerne Twitter et ses usagers et pour laquelle la Bibliothèque ne souhaite pas jouer le rôle d’un intermédiaire. Elle indique également que la Bibliothèque envisage d’anonymiser les contenus pour éviter toute atteinte au respect de la vie privée, travail que l’on imagine titanesque sur 10 milliards de tweets !

Un don asymétrique

Un autre aspect de la convention de don qui me paraît encore plus contestable est celui des conditions d’accès qui ont été imposées par Twitter à la LoC.

Une période d’embargo de six mois a été instaurée avant que la Bibliothèque puisse donner accès aux contenus déposés par Twitter. La justification de ce délai n’est pas des plus claires. On imagine peut-être que Twitter ne souhaite pas que l’archive de la LoC devienne un Twitter bis. Cela dit, il y a tellement de services tiers qui reprennent ses contenus par le biais de son API que cette précaution paraît un peu dérisoire. On peut lire ailleurs que ces six mois permettraient aux utilisateurs de procéder au retrait de certains de leurs tweets sur leurs comptes, pour mettre en œuvre une forme d’opt-out.

Des restrictions d’usages assez fortes figurent également dans la convention : l’archive pourra être utilisée en interne par la Bibliothèque pour ses propres besoins et un accès pourra être donné dans ses emprises aux chercheurs habilités, après avoir signé un engagement de ne pas faire un usage commercial des contenus. La LoC ne pourra pas redistribuer l’archive à des tiers dans sa totalité ou une partie substantielle de celle-ci (même pas à Hathi Trust ?).

L’accord permet cependant à la LoC de diffuser sur son site, au terme des six mois d’embargo, des éléments de l’archive, à condition de bloquer l’indexation par les moteurs de recherche (robots.text file) et d’empêcher le téléchargement substantiel de contenus.

À lecture de ces conditions, j’ai éprouvé une sensation très désagréable, car elle me rappelle beaucoup celles que Google impose à ses bibliothèques partenaires dans le cadre du programme Google Books, notamment l’exclusivité d’indexation. Cela signifie que, même accessible en ligne, cette archive de la Bibliothèque restera quasiment invisible sur le web.

Et le parallèle est d’autant plus saisissant que dans le même temps, Google a effectivement mis en place, certainement au terme d’un accord avec Twitter,  son propre service de recherche dans les archives des tweets, Google Replay. Celui-ci sera entièrement accessible en ligne, sans la restriction des six mois d’embargo, et bien entendu, il figurera dans les résultats du moteur (et dans ceux de ses concurrents ?). Sans compter que Google n’a pas l’air de beaucoup s’embarrasser de son côté des questions de protection des données personnelles…

Encore une fois, on voit naître une situation asymétrique entre l’usage que les institutions publiques pourront faire des contenus, alors même qu’elles en assureront la préservation à très long terme, et l’usage (devrais-je dire l’exploitation…) que pourront en faire les acteurs privés. Ici encore, j’ai envie de parler d’une forme d’eugénisme documentaire qui s’organise par le biais de telles restrictions contractuelles, et ce (et c’est le plus grave !) avec l’accord des bibliothèques.

Oeuvres de l'esprit, informations, UGC, données personnelles, domaine public... le contenu de Twitter échappe aux catégories établies (Twitter. Par respres. CC-BY. Source : Flickr)

Encore et toujours, le véritable enjeu, c’est l’accès à l’information et la préservation du domaine public. Comme je l’ai dit, les tweets ne sont pas dans leur immense majorité des contenus protégés par le droit d’auteur. Il s’agit d’informations et de données qui ne devraient pas faire l’objet de telles restrictions. Twitter d’ailleurs ne possède certainement pas de titre valide pour imposer ces limitations à la LoC, si ce n’est celui qu’il tire, de manière fort douteuse, de ses CGU.

Et le pire, c’est que les restrictions imposées par la convention de don sont valables perpétuellement, sans limitation de durée…

Rien n’est plus faux que de dire que cet accord entre Twitter et la LoC permet de constituer ses archives en un patrimoine qui pourra être préservé pour le futur.

C’est tout le contraire qui se produit : ce qui est préservé pour l’éternité, c’est l’acte d’appropriation que Twitter a accompli l’année dernière sur les contenus produits par ses usagers. Ces contenus seront peut-être conservés dans leur intégrité par la LoC, mais ils ne pourront jamais regagner le domaine public.

C’est exactement la même contradiction qui entache les accords signés entre les bibliothèques et Google à propos de la numérisation du patrimoine écrit.

Pour ma part, j’avais choisi de placer tous mes tweets sous la licence Creative Commons Zéro (CC0), grâce à l’application TweetCC. Cette licence me permet de certifier que je renonce à tous mes droits sur mes tweets et que je les verse au domaine public, sans aucune restriction.

C’est par un tweet que j’ai manifestée cette volonté, à laquelle j’accorde beaucoup d’importance.

Ce tweet est désormais quelque part enfoui dans l’archive de la LoC… éternelle lettre morte…

Billet initialement publié sur :: S.I.Lex :: sous le titre “Twitter archivé à la Bibliothèque du Congrès : un patrimoine impossible ?”

Photo CC Flickr bbluesman

]]>
http://owni.fr/2010/05/12/twitter-limpossible-archivage/feed/ 8
Twitter: un patrimoine superflu(x) ? http://owni.fr/2010/05/12/twitter-un-patrimoine-superflux/ http://owni.fr/2010/05/12/twitter-un-patrimoine-superflux/#comments Wed, 12 May 2010 12:44:25 +0000 Olivier Ertzscheid http://owni.fr/?p=15354 Ce billet – un peu long – vise à étudier une actualité, l’annonce de l’archivage de l’intégralité du service Twitter par la bibliothèque du Congrès (LoC), et à poser un questionnement sur ce que la nature même de ce type d’archivage change dans notre rapport à une mémoire “collective” et peut être même à la mémoire … tout court. Le lecteur est averti que les questions soulevées sont beaucoup plus nombreuses que les réponses apportées. C’est parti :-)

1537. Par un édit en date du 28 décembre 1537, François 1er “invente” le dépôt légal, qui permettra – beaucoup plus tard tout de même – d’assurer un contrôle bibliographique universel.

1996. Les pionniers. Une fondation américaine, l’Internet Archive se lance la première dans une tâche d’allure sysiphéenne, l’archivage d’Internet. Un archivage accessible via la machine à remonter le temps du site, la “wayback machine“. Des milliards de pages web et des millions de documents multi-supports y sont accessibles.

2001. L’éveil. Dans un texte de 2001 lors d’un colloque à la BPI**, alors que l’on évoquait le rôle des bibliothèques à l’heure d’une numérisation dépassant à peine le stade de l’artisanat, on posa l’expression et la problématique de la conservation d’un “patrimoine du temporaire”. Expression à bien y regarder pas si oxymorique que cela.

**Bibliothèque publique d’information (texte collectif), « Babel ou le choix du caviste : la bibliothèque à l’heure du numérique. », in Colloque virtuel « Text-e » de la BPI Georges Pompidou. Année 2001. Hélas plus en ligne … http://www.text-e.org/

============T=W=I=T=T=E=R=============
==> Mars 2006. Lancement d’un site de micro-blogging baptisé Twitter. Son principe : la diffusion de messages de 140 caractères. Il rencontrera le succès qu’on lui connaît aujourd’hui.

==> Février 2010. Twitter “publie” chaque jour plus de 50 millions de “messages”.

==> 4 Mars 2010. Le cap des 10 milliards de tweets est franchi.
===========T=W=I=T=T=E=R=============

1er août 2006. Le – tardif – réveil. La loi française étend à Internet le principe du dépôt légal. Toutes les bibliothèques s’y mettent avec plus ou moins de bonheur, plus ou moins de transparence.

23 juin 2009 : La BnF donne quelques chiffres sur le dépôt légal Internet depuis 1996 : plus de 13 milliards de fichiers sont disponibles, organisés en collections mais hélas uniquement consultables sur place et avec une accréditation … alors qu’au moins une partie du dépôt légal Internet de la bibliothèque du Congrès est librement accessible et consultable en ligne.

“PATRIMOINE DU TEMPORAIRE”. La mission et le réflexe patrimonial des bibliothèques ou des archives a donc permis de relever le défi posé par le passage massif au numérique. Au-delà des seuls “documents numériques”, la “sphère Internet” est également entrée dans un cycle de préservation à long terme. Il semble aujourd’hui évident pour tout le monde que la préservation d’une “archive de l’Internet” est au moins aussi importante que celle de manuscrits anciens ou des premières traces d’écriture. Il n’est pas inutile de rappeler qu’au tout début des années 2000, en France, ce combat là paraissait encore… très loin d’être gagné ! Mais à l’échelle de l’histoire de la conservation des supports et des savoirs, le patrimoine du temporaire évoqué en 2001 n’aura mis que quelques années à trouver sa justification et son ancrage dans les pratiques de conservation de notre civilisation.

14 avril 2010 : une dépêche AFP tombe, indiquant que la bibliothèque du Congrès (LoC) “accueillerait les milliards de messages postés sur le site de microblogs Twitter depuis son lancement en mars 2006.” L’annonce est simultanément faite sur le blog de la LoC.

PATRIMOINE DU SUPERFLU. Pourquoi archiver la totalité de Twitter ???

Les raisons de cet archivage peuvent être résumées en une phrase, extraite de la Foire Aux Questions mise en ligne très peu de temps après cette annonce par la LoC :

  • The Library of Congress collections include items such as the very first telegram ever sent, by telegraph inventor Samuel F.B. Morse, oral histories from veterans and ordinary citizens, and many other firsthand accounts of history.

Du côté du premier public de cette nouvelle archive numérique, on trouve naturellement des historiens. Historiens pour lesquels :

  • “Most of our sources are written after the fact, mediated by memory — sometimes false memory,” Ms. Taylor said. “And newspapers are mediated by editors. Tweets take you right into the moment in a way that no other sources do. That’s what is so exciting.”

L’article du NYTimes d’où est extraite la citation précédente fait également remonter des avis plus nuancés, notamment au regard des questions de “vie privée”. Pour évacuer d’un seul trait l’ensemble des aspects polémiques autour de cette annonce, précisons que :

  • la LoC n’a rien payé (il s’agit d’un don de la société Twitter)
  • que ne seront légués que les tweets des comptes publics
  • qu’il y aura une barrière de six mois (minimum) entre la date de publication du tweet et son “versement” dans les archives de la LoC pour une exploitation ultérieure.

Sur l’ensemble des questions précédentes, il vous faut à tout prix lire le billet de Lionel Maurel sur le “patrimoine impossible” que représente cet archivage de Twitter.

Mémoires documentaires externalisées. Depuis qu’elles existent, l’ensemble des techniques de “la documentation” ont eu pour objet de rendre d’abord plus efficace/efficiente puis plus massive, systématique et transparente l’externalisation de nos mémoires documentaires. En décidant d’archiver l’ensemble de ce flot conversationnel qu’il faut bien qualifier de mémoire immédiate, la bibliothèque du Congrès fait faire un pas de plus à l’archivistique dans son ensemble. À tout le moins elle en étend le périmètre. A moins qu’elle ne le redéfinisse entièrement.

Pour bien comprendre les “vraies” raisons de cette conservation patrimoniale d’un nouvel ordre, d’une nouvelle nature, il faut lire le rapport final du “Blue Ribbon Task Force on Sustainable Digital Preservation and Access” (= groupe de travail sur les politiques publiques de conservation et d’accès numérique), groupe de travail à l’initiative duquel on trouve la NSF et la fondation Mellon en collaboration avec la Bibliothèque du Congrès, JISC, le CLIR et les Archives nationales US. Je m’en tiendrai aux passages synthétisés et traduits par Jean-Michel Salaün dans son billet “Économie de la conservation numérique” :

  • 1. La demande pour une conservation numérique est une demande dérivée. Autrement dit, la demande n’est pas directe, on ne conserve pas pour conserver, mais pour donner accès à l’avenir à des informations numériques.

C’est bien ce qui s’est produit avec Twitter. La demande n’émane pas des créateurs du service, pas davantage que des usagers de la bibliothèque du Congrès.

  • 2. Les matériaux numériques sont des biens durables dépréciables. Un bien durable dépréciable est quelque chose qui dure longtemps en produisant de la valeur continuellement, mais la qualité et la quantité de cette production peut décliner si des actions ne sont pas engagées pour maintenir la viabilité ou la productivité du bien. (..)

Twitter est certes un bien durable dépréciable… les deux derniers qualificatifs étant directement indexés sur sa capacité à trouver un modèle économique dans les prochains mois.

  • 3. Les biens numériques sont des biens non-rivaux et autorisent les passagers clandestins. Les biens numériques sont des biens non-rivaux, car il suffit qu’un acteur conserve un bien, il l’est pour toute intention ou objectifs conservé pour tous. Dans ces circonstances, l’incitation pour un seul acteur à assumer les coûts de la conservation est affaiblie, puisque les autres pourront profiter gratuitement des bénéfices.

Twitter (la société) peut dès lors légitimement jouer les “passagers clandestins” puisqu’il n’aura pas à assumer le coût de la conservation …

  • 4. La conservation numérique est un processus dynamique qui dépend du chemin suivi. Cette caractéristique est la plus originale et la plus spécifique au numérique et donc la plus intéressante. Dans l’analogique, le processus de conservation venait en fin du cycle de vie du bien, c’est-à-dire à la dernière étape du circuit classique de création-production-diffusion. Dans le numérique, chaque étape peut influer sur le processus de conservation et celui-ci implique des décisions à chaque stade.

Revenons-en maintenant à la question initialement posée : pourquoi archiver la totalité de Twitter ? Aucune bibliothèque n’archive la totalité des sites web produits. Elle effectue un nécessaire travail de sélection : sites des événements sociaux ou politiques marquants (élections par exemple), sites de personnalités publiques importantes, etc., avec une difficulté supplémentaire dès que l’on sort de l’information “institutionnelle” : quels blogs archiver ? Selon quels critères ? En fonction de quels paramètres de choix ?

Il est deux raisons d’être à la science de l’archivistique : l’obligation et le choix. L’obligation d’archiver des supports arrivés à la fin de leur cycle de vie et le choix des “items documentaires” qui, parmi l’ensemble de ces supports en fin de cycle, sont dignes d’intérêt ou recouvrent une certaine “valeur”.

Alors pourquoi archiver la totalité de Twitter quand on peut, dans les blogs, les forums, les sites web individuels, les “murs” Facebook, etc., quand on peut, disais-je, aller puiser partout ailleurs des éléments qui, pour reprendre l’argumentaire de la tribune des historiens dans le NYTimes, ne sont pas encore “médiés” par une activité mémorielle ?

Les trois (vraies ?) raisons. Il y a – à mon avis – trois raisons profondes à l’archivage de la totalité de Twitter ; trois raisons qui ne sont pas inscrites dans la foire aux questions dédiée. Trois raisons auxquelles j’en ajoute subrepticement une quatrième : le buzz :-) La LoC est passée maître dans les stratégies de communication en tout genre et il est clair que cet archivage du service médiatiquement le plus en vue actuellement aura, en termes d’image, de substantielles retombées.

Primo : la simplicité. Il est beaucoup plus simple de prendre, en vrac, la totalité de l’archive twitterienne que de l’investiguer pour y effectuer un travail de sélection en amont. On prend tout et on effectuera plus tard l’indispensable travail de tri pour isoler – par exemple – les tweets des personnalités politiques, tel ce Tweet d’Obama au soir de son élection historique.

Deuxio : le graphe social. L’archive de Twitter ainsi constituée permettra  – à des chercheurs, sociologues, historiens – de reconstituer le graphe relationnel de chaque individu choisi. Ainsi on peut lire dans l’article du NYTimes que :

  • Each message is accompanied by some tidbits of supplemental information, like the number of followers that the author had at the time and how many users the author was following. While Mr. Cohen said it would be useful for a historian to know who the followers and the followed are, this information is not included in the Tweet itself.

Il ne serait donc possible que de compter le nombre de comptes suivis (“following”) ou de comptes suiveurs (“followers”) pour un utilisateur donné. Sauf que. Sauf que c’est oublier un peu vite que le “vrai” graphe relationnel d’un utilisateur est également matérialisé à l’intérieur même de ses tweets, notamment grâce au symbole “@” qui, lorsqu’il est suivi d’un nom d’utilisateur de Twitter, permet de s’adresser à lui directement. Ainsi, en épluchant à l’aide d’un algorithme les “@” de n’importe quel compte Twitter archivé, il est très facile de reconstituer son réseau relationnel, au moins dans son premier cercle de proximité (les gens auxquels on s’adresse le plus et/ou qui s’adressent le plus à nous). Donc c’est bien l’archivage “d’un” graphe social d’une petite partie de l’humanité connectée qui sera ainsi “en mémoire” à la bibliothèque du Congrès. Si ce n’est déjà fait, j’insiste une nouvelle fois pour que vous alliez lire le billet de Lionel Maurel, eu égard aux considérables questions de vie privée ainsi posés … Par ailleurs, comme le démontre ReadWriteWeb, le nombre d’informations “embarquées” dans un tweet n’est pas, loin s’en faut, réductible à une chaîne de 140 caractères …

Tertio : l’archive elle-même. Si la LoC s’intéresse à Twitter, un service qui, à l’échelle du web et indépendamment de son incontestable succès reste encore très jeune (moins de quatre ans d’existence) et dont rien ne permet de dire qu’il sera ou non pérenne sous sa forme actuelle (il peut être racheté, absorbé, décliné de manière radicalement différente à ce qu’il est actuellement, ou bien encore disparaître), si la LoC s’intéresse à Twitter, à la totalité de Twitter, c’est parce dans cette totalité transparaît l’essence même de l’objet documentaire idéal. Twitter comme un parangon de la documentation et de l’archivistique numérique. Voici pourquoi. Twitter a valeur de contexte et d’illustration. Contexte et illustration du monde (réel) dans lequel il s’inscrit et qu’il vient précisément documenter, dont il atteste de chacun des mouvements importants ou accessoires, un monde dont il est le témoignage, la valeur de preuve, la trace mémorielle immédiate. Il est en même temps un objet documentaire suffisant (il se suffit à lui-même, il peut-être analysé pour lui-même) et épuisant (le nombre de possibilités d’exploitations qu’il autorise ne peut être rapidement “épuisé”). Enfin, il est porteur de ramifications identifiables et externalisées : les liens contenus dans les tweets, qui, à leur tour, permettent de documenter à nouveau le cadre énonciatif dans lequel ils s’inscrivent.

Et donc ? Et donc il y a quelque chose que je n’arrive pas exactement à cerner – sinon j’aurai fait un billet beaucoup plus court ;-) -  mais qui me gêne profondément dans cet archivage de Twitter, au-delà même du débat – déjà assez gênant – sur la notion de confidentialité, de vie privée et de droit à l’oubli. “Les collections de la bibliothèque du Congrès regroupent des documents comme le tout premier télégramme envoyé, par l’inventeur du télégraphe Samuel F.B. Morse (…) et plein d’autres documents de première main“. Oui mais le premier télégramme de Samuel Morse n’a rien à voir avec le premier tweet d’Obama. D’abord parce qu’à la différence de l’invention du télégraphe, Twitter n’est pas une rupture technologique. Ensuite parce que la valeur historique du premier télégramme de Samuel Morse lui a été conférée… par l’histoire ! (même s’il est effectivement permis de supposer que Samuel Morse, en l’envoyant, avait conscience du moment historique, mais bon on va pas non plus chipoter, sinon j’arriverai pas à finir ce billet)

CGU du 3ème type. Ne faudrait-il pas désormais modifier en conséquence les CGU (conditions générales d’utilisation) de Twitter ? Mis à part des comptes “privés” (qui ne seront donc pas archivés), la nature d’un compte “public” me semble radicalement changer selon qu’il a vocation à être diffusé “publiquement sur le web” ou bien “conservé six mois après sa publication et accédé indéfiniment dans le cadre des archives de la bibliothèque nationale des États-Unis à des fins d’étude et de recherche“. Si c’est pour être disséqués dans les prochains siècles par des sociologues et historiens en tout genre, je vais peut-être hésiter à deux fois avant de poster des tweets sarcastiques ou graveleux sur l’actualité du Top 14 ou de la coupe d’Europe de rugby …

Par-delà. Imaginez un instant les annonces suivantes. “La bibliothèque du Congrès annonce qu’elle archivera l’intégralité des comptes Facebook”. Ou alors celle là : “La Bibliothèque nationale de France annonce qu’elle archivera l’intégralité des comptes publics FlickR et l’ensemble des photos qui y sont jointes.” Et expliquez-moi en quoi des photos en disent plus sur nous que nos conversations sur Twitter ? Pourtant on peut aisément deviner le tollé que susciteraient de telles annonces.

Avons-nous encore besoin d’archives publiques ? Dans un monde ou le cloud computing grignote le périmètre de l’archivistique, la réponse est naturellement oui. Oui parce que les archives publiques ont une vocation patrimoniale et pérenne qu’aucune société commerciale présente dans les nuages n’acceptera jamais d’assumer et/ou de porter. Oui mais non. Non si l’on se place un instant du côté de l’usager lambda lequel est en permanence connecté à des archives, en permanence connecté à l’archive perpétuelle de sa propre documentation, de ses propres documents, et de ceux des autres, de tous les autres. La question doit peut-être être posée autrement.

Avons-nous encore besoin de construire des archives alors même que nous sommes en permanence immergés dans une archive immédiate, co-construite et suffisamment pérenne à notre échelle individuelle ? :

  • Par archive, j’entends d’abord la masse des choses dites dans une culture, conservées, valorisées, réutilisées, répétées et transformées. Bref toute cette masse verbale qui a été fabriquée par les hommes, investie dans leurs techniques et leurs institutions, et qui est tissée avec leur existence et leur histoire.” Michel Foucault, Sur l’archéologie des sciences (1968)

Mémoires. Cycles courts contre temps longs. Avant, on “déclenchait” un processus d’archivistique documentaire soit au moment ou un document parvenait en fin de cycle de vie, soit au moment ou sa valeur historique était attestée ou signalée comme valant la peine d’être conservée. Avec l’archivage de Twitter, aucune de ces deux conditions n’est remplie. Or si l’on entreprend d’archiver de manière systématique, globale, des silos documentaires avant même qu’ils ne remplissent l’une ou l’autre de ces deux conditions, on risque d’entrer dans un cycle de (re)production mémorielle inédit.

On va produire de la mémoire sur de l’excès au lieu d’en produire pour répondre à un manque. On va créer de la mémoire sur de la mémoire. Alors que depuis des siècles, on avait appris à créer de la mémoire sur de l’oubli. Plus précisément, on avait appris à créer de la mémoire pour pallier l’oubli.

Destin funeste de Funès. Cette mémoire qui n’alimente qu’elle-même, cette hypermnésie dont souffrait le Funès de Borges, à l’échelle des institutions par nature dépositaire de notre mémoire commune, se double d’une autre course folle : celle des individus eux mêmes englués dans des cycles mémoriels à la fois de plus en plus courts, de plus en plus instantanés, mais aussi de plus en plus denses, de plus en plus externalisés, de plus en plus rémanents. Après avoir inventé le droit à l’oubli numérique, le devoir d’inventaire de notre génération d’hypermnésiques compulsifs devra-t-il instaurer un simple droit au vide, un simple droit au non-dit, au non-inscrit, au non-rémanent ? Une législation de l’éphémère pour s’éviter les affres d’un patrimoine du temporaire ?

  • J’ai à moi seul plus de souvenirs que n’en peuvent avoir eu tous les hommes depuis que le monde est monde. Mes rêves sont comme votre veille. Ma mémoire, monsieur, est comme un tas d’ordure. (…) Il avait appris sans effort l’anglais, le français, le portugais, le latin. Je soupçonne cependant qu’il n’était pas très capable de penser. Penser c’est oublier des différences, c’est généraliser, abstraire. Dans le monde surchargé de Funes il n’y avait que des détails, presque immédiats.” Jorge-Luis Borges, Fictions – Funes ou la mémoire – Traduction P. Verdevoye ; Folio.

Le palimpseste interdit. Après les technologies du faire, après celles de l’intelligence, après celles de l’accès, la période actuelle est celle des industries de la capillarité et de la percolation. Industries dont l’archive est le nouveau cheval vapeur. Au-delà même de l’archivage de Twitter par la LoC, l’engrammation permanente risque d’empêcher à terme, le travail mémoriel authentique, lequel s’inscrit nécessairement dans la distance, dans le manque, et, pour partie, dans l’oubli préalable.

Le web se constitue est d’ores et déjà constitué comme un immense paratexte mémoriel que rien n’enfreint et que nul n’autorise ; un immense paratexte mémoriel que rien n’autorise et que nul n’enfreint ; et qui se déroule simplement. Un palimpseste sur lequel tout recouvrement est illusoire tant chaque strate reste indéfiniment accessible à qui le souhaite. La négation même du palimpseste comme recommencement possible.

A cela il me semble qu’il faut être vigilants. Non pour l’interdire, le dénoncer ou alimenter le courant d’un nouveau luddisme mémoriel. Mais pour… s’en souvenir le temps venu. Nos vies, notre mémoire.

Billet initialement publié sur Affordance.info

Illustrations CC Flickr edu_fon ; The Wren Design ; Desmond Kavanaghjurvetson ; grande une Trois Têtes (TT)



]]>
http://owni.fr/2010/05/12/twitter-un-patrimoine-superflux/feed/ 3