La mise en valeur du patrimoine culturel passe aujourdâhui entre autres par le numĂ©rique. Dans cette dĂ©marche a Ă©tĂ© lancĂ© le projet de valorisation de photographies dâarchĂ©ologie classique conservĂ©es par lâUniversitĂ© de Strasbourg.
En intĂ©grant ces images dans la mĂ©diathĂšque libre Wikimedia Commons, lâobjectif est double : offrir un accĂšs Ă ces ressources sur l’encyclopĂ©die WikipĂ©dia et faire le lien vers la bibliothĂšque Numistral et valoriser les mĂ©tadonnĂ©es associĂ©es en prĂ©sentant des fiches d’une grande richesse.
Numistral et fond d’archĂ©ologie classique
Numistral est « la bibliothÚque numérique patrimoniale du site universitaire alsacien et de ses partenaires ».

Ouvert en octobre 2013 comme bibliothĂšque numĂ©rique patrimoniale de la BibliothĂšque nationale et universitaire de Strasbourg (Bnu), il a Ă©voluĂ© pour devenir, dans le cadre du contrat de site alsacien 2013-2017, le portail dâaccĂšs aux collections documentaires numĂ©risĂ©es des Ă©tablissements dâenseignement supĂ©rieur et de recherche alsaciens (Bnu, UniversitĂ© de Haute Alsace et UniversitĂ© de Strasbourg), ainsi que de leurs partenaires. Depuis 2022, il s’Ă©largit Ă de nouveaux partenaires relevant de collectivitĂ©s territoriales, parmi lesquels la BibliothĂšque municipale classĂ©e de Mulhouse.
La collection de photographies anciennes dâarchĂ©ologie classique de lâUniversitĂ© de Strasbourg comprend plus de 12 500 tirages papiers dont 1800 environ proviennent de la collection personnelle du fondateur et premier directeur de lâInstitut dâArchĂ©ologie classique (KunstarchĂ€ologisches Institut) Adolf Michaelis (1835-1910) qui fut acquise par lâuniversitĂ© au lendemain de sa mort.
â Extrait de la page « Histoire » du site internet de Numistral.
Impulsion
Lâinitiative de valorisation a Ă©tĂ© prise par le service de la bibliothĂšque numĂ©rique patrimoniale de Strasbourg. L’idĂ©e est d’intĂ©grer ces photographies â qui sont maintenant dans le domaine public â sur Wikimedia Commons, afin de les rendre accessibles Ă un large public et de pouvoir les ajouter sur WikipĂ©dia.
Le projet a nĂ©cessitĂ© un choix mĂ©thodologique afin de le rendre viable dans le temps. Lâoutil retenu pour lâimportation des fichiers en masse est Pattypan, une application open source conçue pour faciliter le transfert dâimages vers Wikimedia Commons.
Une fois les fichiers rĂ©cupĂ©rĂ©s auprĂšs du service, il a fallu complĂ©ter et structurer les mĂ©tadonnĂ©es en amont de lâimportation, sous forme de tableurs. Pour garantir une qualitĂ© optimale, lâensemble du processus sâest dĂ©roulĂ© par vagues successives, permettant des ajustements en cours de route.
ConcrĂštement ?
ConcrĂštement, les Ă©tapes semblent simples. Il suffit de gĂ©nĂ©rer avec Pattypan les tables d’import Ă partir des fichiers. Ensuite, il faut complĂ©ter toutes les colonnes de mĂ©tadonnĂ©es : auteur·e ; date ; technique ; catĂ©gories Commons…
Les catégories Commons
Oui, il faut Ă©galement complĂ©ter les catĂ©gories Commons pour que les fichiers ne soient pas perdus dans la mĂ©diathĂšque. Le fameux F du principe FAIR : findable. Pour celles et ceux qui ne connaissent pas Wikimedia Commons, disons que les catĂ©gories sont comme des poupĂ©es russes. Une catĂ©gorie peut elle-mĂȘme ĂȘtre rangĂ©e dans une autre, et ainsi de suite, pour former des arborescences de rangement, Ă l’instar de dossiers sur un ordinateur.
Prenons un exemple, avec cette image d’un forum romain.

Cette image est placĂ©e dans deux catĂ©gories, « Rome dans le fond Adolf Michaelis sur Numistral » et « Historical images of Tabularium (Rome) ». Mais ces catĂ©gories sont placĂ©es dans d’autres catĂ©gories. On se retrouve rapidement avec un arbre de ce type :

Concentrons-nous rapidement sur les catĂ©gories en gras pour constater que, pour chaque branche, c’est un enchainement de dizaines, voire de centaines de catĂ©gories. Voici le schĂ©ma d’une branche de catĂ©gories Commons, allant de « Works of art » à « Historical images of Tabularium (Rome) ».

La rĂšgle pour rendre les fichiers trouvables est d’ajouter toujours la catĂ©gorie la plus prĂ©cise Ă l’image. En effet, on ne va pas catĂ©goriser cette image avec « Architecture », concept qui est bien trop large.
Il apparaĂźt donc la premiĂšre difficultĂ© de ce projet : trouver les catĂ©gories optimales pour les 500 images concernĂ©es, sans passer manuellement sur chacune d’entre elles.
Complétion des catégories
Ainsi, j’ai utilisĂ© les mĂ©tadonnĂ©es existantes pour en extraire des “sujets”. Pour cette image par exemple, voici un extrait des donnĂ©es dont je disposais :
Titre en français | Sujet | Subject |
Forum Romain : vue gĂ©nĂ©rale depuis le Palatin | Rome (Italie) — Foro romano | Roman Forum (Rome, Italy) |
L’idĂ©e Ă©tait alors d’utiliser le logiciel OpenRefine pour rĂ©concilier les sujets avec Wikidata. Ici, « Foro romano » est rĂ©conciliĂ©. Et depuis Wikidata, il est possible de rĂ©cupĂ©rer les catĂ©gories Wikimedia Commons correspondantes.
Il faut tout de mĂȘme garder Ă l’esprit que cette technique n’est pas infaillible et que la prĂ©cision peut ĂȘtre inexacte. Alors, il faut rester sur l’idĂ©e qu’un passage manuel sera nĂ©cessaire, et que ce travail peut ĂȘtre laissĂ© Ă la communautĂ© bĂ©nĂ©vole Wikimedia Commons.
Import des images
Les tableaux Ă©tant maintenant complets, l’import peut commencer ! Pour cela, rien de plus simple, il suffit de donner Ă Pattypan les chemins d’accĂšs aux fichiers et le tableau, et il s’occupe de tout.
Une fois les premiĂšres images importĂ©es, une nouvelle rĂ©union a eu lieu pour faire le point. Une chose Ă©tait manquante : les liens directs vers les images dans la bibliothĂšque numĂ©rique Numistral. Un autre dĂ©fi, puisque les liens ne font aucune correspondance avec le numĂ©ro d’inventaire de l’image.
Pour rester sur le mĂȘme exemple, notre image de forum romain est accessible au lien http://cdm21057.contentdm.oclc.org/cdm/ref/collection/coll4/id/493. La structure du lien est toujours la mĂȘme, mais le nombre de fin, ici « 493 » change et ne peut pas ĂȘtre devinĂ© Ă partir des mĂ©tadonnĂ©es. Un vrai casse-tĂȘte !
Récupération des liens et alignement
Alors pour rĂ©soudre ce problĂšme, j’ai tentĂ© un petit coup de magie. AprĂšs avoir listĂ© les liens « probables », c’est Ă dire tous les liens avec des numĂ©ros qui se suivent, j’ai rĂ©cupĂ©rĂ© les pages web associĂ©es, en faisant un moissonnage informatique Ă l’aide de OpenRefine.
Une fois tous les codes sources rĂ©cupĂ©rĂ©s depuis les liens, j’ai isolĂ© la partie qui comporte le numĂ©ro d’inventaire. Dans le code, on retrouve le numĂ©ro d’inventaire (en gras ci-dessous) comme ceci :
{\"key\":\"titlea\",\"label\":\"Num\u00E9ros d'inventaire\",\"controlledVocab\":false,\"searchable\":true,\"value\":\"It.I.A.a.3\",\"controlledVocabList\":null}
Avec un coup de baguette magique (toujours grĂące Ă OpenRefine) pour isoler les numĂ©ros, il a ensuite Ă©tĂ© possible de mettre en parallĂšle les liens directs avec les numĂ©ros d’inventaire.
Comme on aime le dire dans la communauté wikimédienne : « OpenRefine is magic » !

Ne reste ensuite plus qu’Ă ajouter ces liens sur les fiches dĂ©jĂ importĂ©es grĂące Ă Pattypan et les intĂ©grer aux imports suivants.
Finalité et accueil de la communauté
Au final, ce sont plus de 500 photographies d’archĂ©ologie classique qui ont Ă©tĂ© importĂ©es sur Wikimedia Commons, pour un projet ayant durĂ© plus de 6 mois, entre toutes les rĂ©unions, le traitement des donnĂ©es et la vĂ©rification manuelle des liens directs.
La communautĂ© wikimĂ©dienne a Ă©tĂ© informĂ©e par une publication sur Le Bistro de WikipĂ©dia le 10 mars 2025, les invitant Ă s’approprier le fond pour illustrer l’encyclopĂ©die.
L’accueil de ce projet par les bĂ©nĂ©voles fait du bien !
