Home > À propos > Les projets de numérisation

Les projets de numérisation

Le projet de numérisation des manuscrits orientaux

Objectifs du projet

La BULAC a pris la décision de signaler et de numériser les manuscrits proche-orientaux qui constituent le « noyau historique » de la bibliothèque et couvrent la période du XVIe au XIXe siècle. Cette collection, composée de trois fonds (arabe, persan et ottoman) est liée étroitement à l’histoire de l’École des Jeunes de langues1 puis de l’École des langues orientales2.

C’est un riche corpus d’archives consulaires, précieuses pour l’étude des relations commerciales, diplomatiques et politiques ; un ensemble de textes pour analyser et décrire la morphologie des langues, la constitution des lexiques et comprendre l’histoire de l’enseignement des langues du Levant et du Proche-Orient ; une collection de sources sur la philosophie et la médecine et de textes rares relatifs à l’histoire et à la géographie. Ces documents sont donc précieux pour l’ensemble des disciplines des sciences humaines et sociales, les études littéraires et linguistiques.

En numérisant ces documents, la BULAC a pour ambition de diffuser et valoriser sa collection de manuscrits proche-orientaux afin de constituer une bibliothèque numérique de référence dans le domaine. Cette numérisation s'inscrit également dans une logique de conservation, la consultation en ligne offrant le plus souvent une alternative à la consultation de documents papier fragiles et précieux.

Historique du projet

Le projet de signalement et de numérisation des manuscrits proche-orientaux de la BULAC a été entamé fin 2013, grâce au soutien de la Région Île-de-France dans le cadre du dispositif de « soutien à la diffusion des usages, services et contenus pédagogiques et patrimoniaux ».

Le chantier consiste en un traitement systématique du corpus, les manuscrits étant traités par ordre de leur cote avec l'objectif de parvenir à traiter la totalité du corpus. Le plan de travail repose sur un récolement préalable, une reprise des catalogues historiques, une description en ligne sous la forme de notices codicologiques en double écriture (écriture originale du document, transcription en alphabet latin) versées au catalogue collectif des archives et manuscrits de l'enseignement supérieur (Calames), la numérisation puis la mise en ligne des documents et l'archivage pérenne des fichiers numérisés auprès d'un tiers-archiveur. L'intervention de la Région, sous la forme d'une subvention d'investissement, concerne les dernières étapes du chantier : numérisation et archivage numérique pérenne.

État d'avancement du projet

Les collections de manuscrits proche-orientaux de la BULAC sont organisés en trois sous-collections, correspondant à trois racines de cotes linguistiques (manuscrits persans, turc-ottomans et arabes). Le récolement a fait apparaître un nombre de cotes intermédiaires et de sous-cotes beaucoup plus important qu'escompté. Un grand nombre de fragments non identifiés et non cotés ont également été localisés, rassemblés et identifiés.

En outre, le récolement a permis d'établir une fiche sommaire de l'état de conservation et de dresser une typologie des difficultés à traiter (papiers abîmés, reliures à faible degré d'ouverture, fragiles ou absentes, enluminures et dorures exigeant un traitement numérique spécifique, encres corrosives, ventilation par format des documents, etc.).

Le travail de signalement au format XML-EAD dans le catalogue collectif des archives et manuscrits de l'enseignement supérieur a fait apparaître des lacunes dans le schéma de données descriptives (Document type definition) pour la nature des documents décrits par la BULAC : absence de prise en compte du caractère multi-lingue et multi-écriture d'un corpus, pas de possibilité de description parallèle du titre, des auteurs et des autorités en écriture originale et en translittération latine, pratiques hétérogènes de translittération du turc-ottoman... Un important travail d'échanges avec l'Agence bibliographique de l'enseignement supérieur (ABES) et avec les bibliothèques conservant des collections similaires ont permis d'effectuer des ajustements dans le manuel de catalogage des manuscrits pour l'enrichir au sujet de ces différents points.

Le signalement en double écriture (écriture originale et transcription latine) est, depuis l'origine du projet BULAC, un axe fort du signalement de nos collections, sur lequel l'établissement joue un rôle pilote. Il permet d'assurer l'intelligibilité du signalement des documents en écriture non latine – les pratiques de transcriptions phonétiques étant limitées à une sphère linguistique et fortement variables dans le temps. La BULAC est ainsi le premier établissement à verser une description codicologique en bi-écriture de manuscrits proche-orientaux dans le catalogue Calames. Par ailleurs, les autorités (noms d'auteur, de copiste, de possesseur, de dédicataire, sujet du document, etc.) sont systématiquement liées avec les index du catalogue collectif SUDOC de l'enseignement supérieur, lui-même connecté aux référentiels nationaux et internationaux (base IDref). Ces autorités sont également traitées en double écriture, un chantier indispensable compte tenu des particularités et des complexités de l'onomastique arabe.

La phase de numérisation a été entamée en 2016. Compte tenu de l'ampleur du chantier, de son impact dans l'organisation interne de l'établissement et de la complexité du cahier des charges à établir, il a été choisi de lancer un premier marché test sur un nombre limité de documents, sélectionnés en raison de leurs particularités de format et de volumétrie ou de leur état de conservation (papier dégradé par des galeries d'insectes, tâches) ou de réalisation (enluminures).

Des marchés courants ont ensuite été lancés pour permettre la numérisation des manuscrits au fur et à mesure de leur traitement intellectuel. Le prestataire choisi s’installe dans les murs de la bibliothèque ce qui permet un meilleur suivi.

En 2017-2018, 150 manuscrits persans et arabes ont été numérisés.  

En 2018-2019, un premier chantier se tiendra jusqu'au printems et permettra la numérisation du corpus de manuscrits turcs-ottomans dans son intégralité (250 volumes). Un deuxième chantier dont le périmètre est en cours de définition sera organisé du printemps à l'automne 2019.

Communication et actions de valorisation autour du projet

Pour en savoir plus, vous pouvez consulter les différents documents décrivant les collections concernées et les actions menées en amont et en aval de la numérisation :

Ce programme ambitieux subventionné par la région Ile-De-France complète des numérisations antérieures de manuscrits persans et arabes réalisées grâce à des subventions TIMA (The Islamic Manuscripts Association).

Les projets de numérisation antérieurs

La BiNA sera enrichie au cours de l’année 2019 par la mise en ligne des documents numérisés avant 2016.

Fonds ancien japonais numérisé de 2009 et 2011

La BULAC possède un fonds ancien japonais important dont certains documents sont numérisés ici. Quelques manuscrits, des xylographies et des impressions anciennes, parfois illustrées, notamment le périodique Nisshin senshi retraçant les évènements de la guerre sino-japonaise, valent au fonds japonais un renom international.

Fort William College

Institution de premier ordre mais néanmoins peu connue, le College of Fort William a occupé une place centrale dans l’étude des langues et cultures de l’Inde dans la première moitié du XIXè siècle. Née de besoins aussi bien politiques que culturels, l’institution reste avant tout une structure de formation pour les jeunes cadres de la Compagnie britannique des Indes orientales arrivant au Bengale avec pour objectif de pouvoir sécuriser la présence britannique aux Indes.

La Bulac possède treize ouvrages ayant appartenu à la bibliothèque du collège de Fort William qui en portent l’ex-libris, l’inscription et le sceau. Viennent s’y ajouter un livre persan dont l’auteur a enseigné à Fort William et quatre autres consacrés au collège et à la collection de sa bibliothèque.

Numérisation à la demande

Les usagers de la bibliothèque ont la possibilité de demander la numérisation totale ou partielle de documents hors droits possédés par la Bulac. Si les conditions juridiques et matérielles sont réunies, les numérisations intégrales réalisées en interne sont versées dans la BiNA. Elles concernent des documents très variés : imprimés, brochures, fascicules, manuscrits, tirés à part...

Virtualisation des expositions proposées par la BULAC

La BULAC organise régulièrement, dans ses murs, des expositions autour de ses collections. Les documents présentés et les contenus produits par la bibliothèque sont réutilisés à travers des expositions virtuelles qui leur offrent une seconde vie. Les expositions rejoignent la bibliothèque numérique si au moins un document est numérisé intégralement. Une sélection des expositions à virtualiser est opérée par le personnel scientifique de la bibliothèque au moment de la programmation de l'action culturelle.