Les autorités auteurs arabes dans l’environnement informatisé d’aujourd’hui : options et implications

 

Martha Speirs Plettner

Directrice des services techniques

American University in Cairo Library

plettner@aucegypt.edu

 

 

Traduction : Annick Bernard

Pour la version intégrale y compris la bibliographie, voir le texte original.

 

Longtemps pratiquée par les bibliothèques, la rédaction manuscrite des notices d’autorité des noms arabes établies avec une double vedette, en caractères arabes et translittérée, a fait place à d’autres techniques qui n’ont pas toujours accepté les caractères originaux. Le traitement des autorités auteurs est dans une large mesure tributaire des progrès de la technologie, et même avec l’informatisation des catalogues, la situation n’a pas encore atteint un degré satisfaisant.

 

Cette notice d’autorité établie localement indique, en même temps que la forme originale de la vedette d’autorité et ses renvois,  une forme romanisée selon  la translittération ALA/Library of Congress

 

(Figure 1)  Extrait du fichier d’autorité de la

Bibliothèque de l’Université américaine du Caire

 

            Formats et règles élaborés pour établir les vedettes d’autorité ont été rendus disponibles dans plusieurs instruments de référence tels que les AACR2 Names of Persons, Guidelines for Authority and Reference Entries (GARE), ISBDs, MARC etc. Il existe aussi d’autres formats et d’autres manuels conçus pour répondre à des besoins locaux spécifiques, mais qui, à l’heure du Contrôle bibliographique universel, mettent ceux qui les pratiquent à l’écart de toute entreprise de coopération respectant la normalisation internationale.

Grâce aux jeux de fiches diffusées par la Library of Congress de 1902 à 1997 qu’elles utilisaient pour alimenter leur propre catalogue, les bibliothèques pouvaient facilement créer une vedette auteur dans chacun des deux alphabets. Mais le débat sur le classement de l’entrée auteur à la forme en caractères arabes ou à la forme translittérée ne s’est pas éteint avec les catalogues sur fiches, et devra trouver la solution la plus conforme aux besoins de tous les usagers. Faut-il passer, pour les vedettes d’autorité, de deux catalogues sur fiches distincts, cas le plus fréquent dans les bibliothèques, à deux index séparés en ligne, un pour chaque alphabet, ce qui oblige à faire une double recherche pour être sûr d’obtenir une liste exhaustive des œuvres d’un auteur ? L’IFLA, dans la série des Guides UNIMARC (UNIMARC Guidelines)  donne la préférence à la forme originale pour établir la vedette d’autorité. Cette recommandation est encore peu appliquée, et la Library of Congress, du fait de son système actuel, utilise toujours la vedette romanisée.

A l ‘avenir, et bien que la plupart des catalogues en ligne d’aujourd’hui soient contraints de donner la priorité à l’une des formes de la vedette pour rassembler toutes les notices bibliographiques liées, la question ne devraient plus se poser, et des outils intelligents devraient permettre à chacun d’accéder au catalogue par la forme qui lui convient.

C’est le format des notices d’autorité au sein du fichier d’autorité que nous nous proposons d’examiner ci-après, sans nous attacher particulièrement au contenu des champs, bien qu’il soit parfois difficile d’isoler l’un de l’autre.

Depuis le début de l’informatisation des catalogues, les notices d’autorité ont été, par tradition et par la force des choses – le jeu de caractères ASCII étant seul disponible -, enregistrées en caractères latins. L’existence de plusieurs modèles de translittération n’étant pas un facteur de cohérence, des travaux sur l’intégration des caractères non latins dans les catalogues informatisés ont été menés dès les années 1980, sous-tendus par la conviction que rechercher par la forme en alphabet original était la meilleure façon d’arriver à la bonne vedette d’autorité.

Aux Etats-Unis, les caractères non latins ont commencé à être saisis dans les notices bibliographiques à partir des années 1990 : ainsi, le catalogage en caractères arabes est opérationnel depuis 1991 dans RLIN [1], où le nombre de notices bibliographiques portant les caractères originaux dépasse aujourd’hui 140 000 ; la base WorldCat d’OCLC [2], dont le module de catalogage en arabe a été lancé début 2001, en contient environ 38 000. Cependant, les notices d’autorité créées dans ces deux réseaux continuent à être saisies en caractères latins, et le système qui supporte le United States Name Authority File (USNAF) du Cooperative Cataloging Program piloté par la Library of Congress n’autorise que la saisie et l’affichage en caractères latins.

L’informatisation des catalogues et le catalogage dans les grands réservoirs bibliographiques RLIN et OCLC, dont les participants doivent nécessairement suivre les règles, basées sur le format MARC et les AACR 2, ont largement contribué à répandre la normalisation en vigueur. Pour le catalogage en langue arabe, dans le monde entier, des professionnels se conforment aux manuels en usage dans ces deux réseaux.

L’introduction des caractères non latins dans les formats MARC a rendu possible la création de notices bibliographiques contenant plusieurs alphabets. Pour l’arabe, il fallait disposer de jeux de caractères spécifiques, ISO 11822 ou Arabic MS1256. L’arrivée d’UNICODE en 1993 a étendu cette possibilité à tous les alphabets existants, sous réserve que le système de gestion du catalogue soit capable de les traiter, et d’offrir les fonctionnalités indispensables aux langues qui s’écrivent de droite à gauche, comme l’arabe. Cependant, ces progrès notables sont restés quasi-exclusivement limités aux notices bibliographiques.

Des travaux ont pourtant été consacrés à la recherche de solutions permettant d’introduire la vedette en écriture arabe et en caractères latins dans les notices d’autorité : en raison du peu de temps consacré dans les bibliothèques à une tâche aussi absorbante, les expériences significatives de production de notices d’autorité dans les deux écritures sont peu nombreuses.  C’est le cas en France et au Maghreb, où le catalogage bi-alphabétique latin/arabe est encore peu répandu. Dans le monde arabe, de nombreuses bibliothèques effectuent tout leur catalogage en alphabet arabe, sans translittération, mais dans la plupart des cas sans utiliser un format MARC, condition pourtant nécessaire à l’utilisation de bases normalisées comme les réservoirs OCLC et RLIN et l’échange se limite donc à des bases de données similaires. Il est clair qu’il existe un fort besoin de partager les leçons des expériences qui ont pu être menées dans d’autres régions du monde en matière d’autorités auteurs en écritures non latines.

La réflexion sur l’extension de la structure des notices d’autorité pour y introduire des alphabets originaux tels que l’arabe a commencé en 1993 à l’apparition d’UNICODE. Personne ne remet en question la nécessité de se conformer à un standard de translittération quand on ne peut rendre un nom dans l’alphabet original. Mais puisque l’alphabet latin est d’un usage exclusif dans moins de la moitié du monde seulement, tout plan de développement doit désormais inclure les alphabets non latins. Le défi d’aujourd’hui est d’introduire le codage des caractères sous une forme parfaitement normalisée et cohérente, puis d’encourager les bibliothèques à l’adopter.

Ce qui suit porte essentiellement sur le format MARC21 et les travaux menés aux Etats-Unis, et ne fera qu’évoquer seulement les apports et les travaux d’autres instances. La réflexion est à poursuivre au niveau international, en commençant par passer en revue les formats et les modèles aujourd’hui utilisés pour l’échange.

MARBI (Machine-Readable Bibliographic Information), comité de l’American Library Association chargé de l’évolution et de la maintenance du format MARC21, a enrichi celui-ci pour que les jeux de caractères non latins puissent être introduits dans la notice d’autorité. Le programme coopératif NACO (National Name Authority Cooperative), qui inclut depuis longtemps les notices d’autorité de la Library of Congress pour les noms arabes dans le National Authority File (USNAF), n’a jusqu’à présent rien spécifié pour permettre d’intégrer l’alphabet original dans les notices. La décision est subordonnée à l’adoption d’UNICODE par la Library of Congress dans son nouveau système.

Le United States Name Authority File (USNAF), référence incontestée aux Etats-Unis en matière de notices d’autorité est l’œuvre des membres du programme NACO, qui ont assuré la mise en cohérence de millions de notices. La décision aboutissant à la fusion du British Library Name Authority File (BLNAF) avec l’USNAF pour former l’Anglo-American Authority File (AAAF) rend encore plus grand l’intérêt de cet ensemble. Cependant, puisqu’il est produit par la seule partie anglo-américaine du monde, et donc coupé du monde des alphabets non latins, une instance supra-nationale semble nécessaire. L’idéal serait d’arriver à un consensus international sur les autorités auteurs, ce qui semble beaucoup plus réalisable aujourd’hui, grâce aux technologies du web et à l’usage répandu de la norme de communication Z39.50. L’IFLA, comme nœud de réseau, a un rôle clé à jouer dans la conception des formes d’autorité mises à disposition par les agences bibliographiques nationales. Il y aura toujours à résoudre en priorité par tout candidat à l’échange, l’hésitation entre respecter les usages du pays d’origine de la vedette et se conformer aux conventions en vigueur dans son propre pays et auxquelles sont habitués les usagers de son propre catalogue.

 

Toute évolution ayant des conséquences sur la cinétique des fichiers et le mode d’indexation des bases de données, les formats et modèles conçus pour la production des notices d’autorité doivent impérativement rester compatibles avec les systèmes destinés à les manipuler : aussi les grands réseaux de catalogage RLG [3] et OCLC, ainsi que de nombreux producteurs de systèmes intégrés de gestion de bibliothèque, ont-ils été associés aux travaux du groupe MARBI.

Deux modèles de notices d’autorité multilingues et/ou multi-alphabétiques, appelés Model A et Model B, sont proposés dans les MARC21 Concise Formats. Un troisième modèle (Model C) est recommandé dans un document émis en 2001 encore soumis à discussion : Multilingual Authority Records in the MARC21 Authority Format. Ce document fait apparaître le concept d’un marqueur de contexte inclus dans la notice d’autorité. Celle-ci devient modulable en ce sens que l’on pourra y puiser les éléments réclamés par un contexte spécifique, et ceux-là seuls. On voit donc poindre ici une solution rendant possible l’échange des notices d’autorité à l’échelle planétaire. Le modèle B, plus simple que le A, est utilisé par le catalogue de la bibliothèque de l’Université américaine du Caire. Les entrées du modèle C sont caractérisées par l’indication du contexte du catalogue, à l’aide de plusieurs éléments dont le premier indique le corpus de règles selon lesquelles la vedette a été établie (par exemple, AACR2, LCSH, RAK, RAMEAU, etc.). Peuvent y être ajoutés d’autres éléments tels que la langue de catalogage à laquelle correspond la vedette, le public pour lequel la vedette doit être utilisée (par exemple, enfants, grand public …). Le  modèle C a été conçu pour un public anglophone habitué aux règles de catalogage anglo-américaines et se servant à utiliser les Library of Congress Subject Headings pour la recherche par sujet. Mais il serait facile de permuter les entrées pour faire passer, à l’intention d’un public arabophone par exemple, la forme rejetée arabe (zone 700 en MARC21) en vedette d’autorité (zone 100) dans le catalogue local. Les notices d’autorité n’apparaissent plus comme des entités figées, mais comme des sources d’information dont chacun peut tirer les éléments utiles à son propre catalogue.

Les étiquettes MARC utilisées dans les exemples ci-après sont : 100 pour la vedette d’autorité ; 400 pour les formes rejetées ou renvois Voir, 880 pour les mentions en d’autres alphabets, 700 pour les mentions correspondant à d’autres contextes et 670 pour les notes.

___________________________________________________________________________

 

  001     n 79058331
  003   DLC
  008     790706n$acannaab$    $a aaa   cz n
  100  10 Moses$c(Biblical leader)
  400  00 Musá$c(Biblical leader)
  400  10 Mosheh$c(Biblical leader)
  400  00 Moise$c(Biblical leader)
  880  10 $6100-02(3/r$aمؤسى$c(Biblical leader)
 
 

(Figure 2)  Modèle A—modèle multi-écriture du format MARC21

Notice d’autorité établie selon le modèle A du MARC21 Concise Authority Format, avec la forme originale en zone 880. Ce modèle s’inspire du traitement des écritures non latines dans les notices bibliographiques établies en MARC21, mais deviendra de plus en plus complexe au fur et à mesure de l’ajout en zone 880 de formes correspondant à divers alphabets. Puisqu’il n’y a pas correspondance entre les zones en caractères latins et les zones en écritures non latines, il devient plus simple d’utiliser la zone 400 pour les formes en autres écritures. Cette solution est illustrée dans l’exemple ci-dessous (Modèle B).

___________________________________________________________________________

  

___________________________________________________________________________

  001     n  50014331
  003     DLC
  005     19950123115723.1
  008     800410n$ acannaab$a aaa ||| cz n
  010     n  50014331 $zn  89119817
  040     DLC$cDLC$dDLC
  053     PJ7864.A35
  100  10 Husayn, Taha,$d1889-1973
  400  00 Taha Hussein,$d1889-1973
  400  10 Hussein, Taha,$d1889-1973
  400  00 |wnna$aTaha Husayn,$d1889-1973
  400  10 Husain, Taha,$d1889-1973
  400  10 Huseyn, Taha,$d1889-1973
  400  10 حسين, طه,$d1889-1973
  670     His Kudama ibn Jafar, Abu al-Faraj, al-Katib
             al-Baghdadi,$bNakd an-Nathr ... 1933.
 
(Figure 3)  Modèle B proposé par MARBI(Machine-Readable Bibliographic Information),  comité de l’Association des bibliothécaires américains (ALA) pour l’évolution et la maintenance de MARC21

___________________________________________________________________________


Le modèle C, modèle marqueur de contexte, permet d'assurer le lien entre les différentes vedettes d'autorité créées pour une entité donnée et correspondant à des contextes différents.

___________________________________________________________________________

 

Model C
 
001     ea55555
008/10 (Cataloging rules): c (AACR2)
008/11 (Subject system/thesaurus rules): a (LCSH)
040    $b (Language of cataloging): eng (English)
100 0# $a Cleopatra, $c Queen of Egypt, $d d. 30 B.C.
400 0# $a Cleopatre, $c Queen of Egypt, $d d. 30 B.C.
400 0# $a Kilyubatra, $c Queen of Egypt, $d d. 30 B.C.
400 0# $a Kleopatra, $c Queen of Egypt, $d d. 30 B.C.
400 0# $a Kliyubatra, $c Queen of Egypt, $d d. 30 B.C.
700 04 $a Cleopatre $b VII $c (reine d'Egypte ; $d 0069-0030 av. J.-C.) 
       $? <context: French language catalog> $0 fa44444
700 04 $a Kleopatra, $c Agypten, Konigin, $b VII $d av69-v30 
        $?<context: German language catalog> $0 ga33333
700 04 $a $? كليوبترة <context: Arabic language catalog> $0 aa66666
 
 
 
(Figure 4) Modèle C  proposé par le document de travail « Multilingual Authority Records in the MARC21 Authority Format » du comité MARBI (2001-DP05)
 

Les entrées du modèle C se caractérisent par l’indication du contexte du catalogue, à l’aide de plusieurs éléments dont le premier indique le corpus de règles selon lesquelles la vedette a été établie (par exemple, AACR2, LCSH, RAK, RAMEAU, etc.).

En l’état, la notice d’autorité ci-dessus est destinée à un public anglophone, habitué aux normes de catalogage anglo-américaines et aux vedettes-matière de la Bibliothèque du Congrès. Il serait facile, pour un public arabophone, d’intervertir les zones 100 et 700 dans le catalogue local.

Les notices d’autorité n’apparaissent plus comme des entités figées, mais comme des sources d’information dont chacun peut tirer les éléments utiles à son propre catalogue.

______________________________________________________________________________

 

La coopération entre des instances telles que la Foreign MARC Coalition (FMC) - constituée par RLG, OCLC et la Library of Congress pour favoriser la diffusion aux Etats-Unis des notices étrangères en format MARC -, le groupe de travail FRANAR (Functional Requirements and Numbering of Authority Records / Spécifications fonctionnelles et numérotation des notices d’autorité) de l’IFLA, le projet européen LEAF (Linking and Exploring Authority Files), et d’autres, est indispensable afin de constituer une base centralisée, exhaustive, de notices d’autorité auteurs déchargeables localement selon des critères de langue et de contexte. Un modèle consistant à créer une agence internationale d’aiguillage (« clearing-house ») des autorités auteurs, seule habilitée à autoriser le chargement des notices d’autorité des agences bibliographiques nationales et le déchargement à la carte, par les bibliothèques, d’un ensemble de zones déterminé en fonction du contexte de la base de données destinataire, est une solution dont l’intérêt saute aux yeux.

 

D’autres idées propres à favoriser l’échange international ne doivent pas être oubliées non plus :

-         la numérotation internationale des vedettes d’autorité (numéro ISADN) proposée pour faciliter le lien entre notices MARC et leur traitement ;

-         la mise en concordance des formats MARC21 et UNIMARC, pour rendre la conversion  automatique ;

-         l’idée de super-notices d’autorité dans lesquelles l’utilisateur pourrait choisir la forme à afficher par défaut ;

-         le travail en coopération : la base de données partagée apporte avec elle normes, usages et procédures, qui doivent être d’une clarté rigoureuse ;

-         la facilité d’utilisation : une base de données facile à utiliser, permettant la translittération automatique et la création de vedettes parallèles en écriture originale, justifiera l’effort nécessaire à la création partagée de notices d’autorité normalisées.

 

Je suis persuadée qu’un modèle constitué d’une centrale internationale de notices d’autorité auteurs tel qu’envisagé plus haut est une solution évidente au niveau international. Toutefois, une solution spécifique aux auteurs et titres arabes pourrait utilement être adoptée, pourvu qu’elle offre toute garantie de pouvoir s’intégrer dans un ensemble plus vaste.

 

A mesure que le monde devient plus petit, et que les progrès technologiques accroissent considérablement les possibilités de partage, une centrale de notices d’autorité auteurs multilingues et multi-écritures semble la voie la plus sûre pour réduire à l’échelon local la duplication des efforts et les coûts qu’elle entraîne. Cette réalisation doit autoriser la recomposition de la notice d’autorité en fonction des besoins du contexte local, tout en maintenant l’obligation de se conformer aux normes internationales en vigueur. La possibilité d’introduire un contenu arabe spécifique dans les zones appropriées de la notice d’autorité doit être traitée comme une question à part entière, s’intégrant toutefois dans celle d’une structure universelle du fichier d’autorité des noms : c’est la condition nécessaire de l’échange international de notices d’autorité auteurs et titres arabes en écriture originale. Ce passage radical à une structure de notices adaptée au contexte entraînera immanquablement une économie considérable de temps et d’efforts, tant pour le catalogueur que pour l’utilisateur du catalogue. Le travail d’autorité tel que nous le connaissons est appelé à changer, puisque l’essentiel de l’effort portera désormais sur la fourniture d’accès et d’affichages appropriés aux besoins du public local.

 

 



[1] RLIN [Reserch Libraries Information Network] : interface du RLG [Research Library Group] Union Catalogue réservée aux professionnels (http://www.rlg.org ).

[2] OCLC : réservoir bibliographique de 51 millions de titres (http://www.oclc.org ).

[3] RLG : Research Library Group.

[an error occurred while processing this directive]