A walk with Whittemore

  • Année : 2021
    • Édition
    • css print

Il y a près d’un an, je découvrais la plateforme Salamandre fond d’archives en ligne du Collège de France. Aspiré de page en page, un corpus attira mon attention par son histoire, son volume, mais surtout par son potentiel poétique. L’occasion d’une nouvelle auto-édition et un petit defi personnel en programmation.

Le fond Whittemore appartient aujourd’hui à la bibliothèque byzantine. Constitué par Thomas Whittemore, professeur de littérature, de 1890 à 1950, ce fond contient entres autres 558 photographies. Ces documents suivent les voyages de l’érudit américain sur les traces de la civilisation byzantine (pays slaves, Géorgie, Arménie, Proche-Orient … ).

Le projet débuta par un brin de scrapping 1. Cela a pu se faire aisément en observant les miniatures d’images chargées par la plateforme de consultation, puis par quelques regex 2 remplaçant les mentions “SMALL” par “LARGE”, pour en définitive disposer d’une liste d’url pointant vers les versions haute définition de ces ressources iconographiques. Avec un terminal et la commande wget -i liste_url.txt, une version locale du corpus est alors constituée en un rien de temps.

Je précise que la légalité d’une telle démarche, sans autorisation de la plateforme, est sujette à débat. Cet exercice restera donc de l’ordre de l’experimentation personnelle.

L’acquisition de ce corpus nous ammène à la question de l’organisation de notre projet. Je l’ai choisi comme suit :

  • Artefact
  • Book
  • Export

Artefact regroupe les photographies du corpus Whittemore classées par localisation (Egypt, Greece, Balkan,…). Un fichier index.json complète ces dossiers afin de garder trace de données annexes à chaque photographie (unité, date, localisation, commentaire).

{
  "Egypt":{
    "CDF_BYZWHI_06_376":{
      "location": "Aswan Low Dam",
      "date":  "",
      "comment": "",
      "long": "24.029",
      "lat": "32.8658"      
    },
    "CDF_BYZWHI_06_307":{
    "location": "Allegedly Abu Simbel coast ",
    "date":  "",
    "comment": "",
    "long": "28.731046",
    "lat": "34.624223"
    },
    "CDF_BYZWHI_06_287":{
      "location": "Madrasa of Al-Kamil Ayyub",
      "date":  "",
      "comment": "",
      "long": "30.049455",
      "lat": "31.261121"
    }
  }
}

Book est la chaudronnerie en action. On retrouve les ressources necessaires à la mise en page du livre mais aussi les fichiers de travail de certaines ressources créés spécifiquement pour ce volume. L’idée étant de traiter ce repertoire comme consommable. Export accueille enfin le livre exporté en PDF.

Revenons sur le repertoire Artefact. Les données annexes mentionnées sont d’abord définies par lot (les dates sont appliquées par fourchette et par lot), puis raffinées manuelement. C’est là un travail de detective qui s’est ouvert, photographie par photographie, avec son lot d’indices et de déductions. Je n’ai jamais mis les pieds en Egypte, mes connaissances en géographie, histoire et archéologie ne répondent à aucune exigence scientifique. Seuls la triangulation d’indices entre la photographie source de 1920 et les prises de vue satellite, les services de navigation virtuelle comme Streetview ou les notices wikipedia me furent accessibles.

Nous arrivons ici à un tournant dans la philosophie de ce projet. Tenir une posture universitaire, ou d’autorité, aurait relevé au mieux de la blague, au pire de la malhonnêteté. La seule direction éditoriale valable fut donc celle de la lecture personnelle, de l’appropriation et du déplacement de ce corpus vers une vision fictionnelle, poétique.

C’est sous cet égide que s’est déroulé l’acte de curation. La selection des photographies, leurs ordres d’apparition ou leurs concomitances furent commandés par leurs seules puissances narratives, évocatrices.

Ainsi, si le corpus source fait la part belle à l’architecture antique, les photographies selectionnées sont dévoyées de sorte à se concentrer sur les figures humaines — anonymes le plus souvent. Présences éblouissantes à l’ombre des ruines passées.

Le seul souci de véracité se trouve dans l’unité spatiale et temporelle des photographies regroupées dans ce livre. Le reste est interprétation.

Un travail cartographique accompagne ce projet. Initialement destiné à synthétiser avec acuité l’ensemble des étapes du voyage de Whittemore, cette ambition a été minoré devant le peu de localisation trouvé. C’est une frustration. Les données annexes aux photographies, regroupées en un fichier structuré, permettaient une puissante interopérabilité. D’un même fichier, il etait possible de créer une cartographie (coordonnées geographiques) ou afficher la légende d’un visuel.

Sur ce même thème le livre est conçu avec les technologies du web afin de manipuler le corpus avec aisance et versatilité. La selection d’image désirée est appelée automatiquement dans un gabarit HTML grâce à un simple script PHP, la mise en page étant assurée par la librairie PagedJs et quelques règles CSS.

Concevoir ce livre par les languages de programmation était une évidence après une précédente experience traumatique il y a quelques années sur un corpus d’égale envergure.La garantie d’une canonisation du corpus source (dans le repertoire artefact) facilite les experimentations. De plus, le déploiement automatique du corpus dans les gabarits de mise en page induit un confort de travail et une sérenité d’esprit accrus.

Enfin le format et la couleur sont des clins d’œil aux attributs d’un célèbre guide touristique français (dans sa forme longiligne année 1970, imprimé à Strasbourg s’il vous plait !).


Ce projet a vécu une gestation prolongée et plusieurs versions, apportant leurs lot d’apprentissage, de satisfaction. Il reste toutefois perfectible en bien des points. J’ai fait mon temps avec toi Thomas. À charge de revanche !


  1. Soit l’action d’extraire un contenu en ligne afin d’en disposer en local ↩︎

  2. Les expressions régulières sont des outils pour extraire, selectionner et manipuler du texte. ↩︎

Image ou vidéos associées au projet

Crédit et remerciement