Consultation nationale sur l'archivage et l'accessibilité des données de recherches
(Conseil de recherches en sciences humaines du Canada et Archives nationales du Canada)
Mémoire de l'Institut d'histoire de l'Amérique française soumis au "Groupe de travail sur la Consultation d'archives nationales de données"
Novembre 2000
Ce mémoire a été préparé par Donald Fyson, membre du Conseil d'administration de l'Institut d'histoire de l'Amérique française et responsable de son comité des archives, en consultation avec Evelyn Kolish et Brian Young, aussi membres du Conseil d'administration de l'Institut et du comité des archives, et Joanne Burgess, ancienne présidente de l'Institut.
Introduction
L'Institut d'histoire de l'Amérique française est la principale association des historiennes et des historiens professionnels du Québec et des spécialistes de l'Amérique française. Il compte près de 1 000 membres, individus ou institutions, dont la majorité réside au Québec. Il regroupe des professeurs de tous les niveaux d'enseignement, des historiens professionnels à l'emploi d'institutions publiques et privées ou agissant comme consultants. L'Institut rassemble également des étudiants de deuxième et troisième cycles, des chercheurs provenant des autres disciplines en sciences humaines, ainsi que des amis de l'histoire. Outre la publication d'une revue trimestrielle ( la Revue d'histoire de l'Amérique française, éditée sans interruption depuis sa création en 1947 ) et l'organisation d'un congrès scientifique annuel, l'Institut est le porte-parole de la communauté historienne dans de nombreux dossiers d'intérêt public. Il se préoccupe entre autres de la préservation et de l'accessibilité du patrimoine historique.
Le présent mémoire réagit à deux documents datés du 23 août 2000, soit "Une consultation nationale sur l'archivage et l'accessibilité des données de recherches" et "Groupe de travail sur la Consultation d'archives nationales de données: Paramètres", produits par les Archives nationales du Canada (ANC) et le Conseil de recherches en sciences humaines du Canada (CRSH)), de même qu' à un courriel en date de 30 août intitulé "Feedback on electronic archiving / Consultation sur l'archivage électronique". Mme Joanne Burgess nous a également représentés à la "Réunion générale des intervenants sur les archives de données, leur gestion et leur accès" tenue le 2 octobre 2000 (1).
L'objet du Groupe de recherche: les "données de recherche"
Avant même de commencer la réflexion, il nous semble essentiel que le Groupe de travail clarifie la définition même de son objet, les "données de recherche".
D'abord, le Groupe de travail devrait préciser le format des données visées. Dans le courriel du 30 août, il n'est question que des "données de recherche numérisées". Par contre, dans les paramètres du Groupe de travail, le caractère numérique des données de recherche en question n'est jamais indiqué. Le document "Une consultation nationale sur l'archivage et l'accessibilité des données de recherches" n'est pas clair à cet égard, faisant parfois référence au numérique ou à l'électronique (ce qui n'est d'ailleurs pas la même chose, compte tenu de l'existence de données électroniques analogues), parfois à la "collecte et gestion des données" tout court. Nous croyons comprendre que le mandat du Groupe de travail ne s'étend qu'aux données de recherche numériques et notre mémoire prend cela pour acquis, bien que la terminologie devrait être précisée. Si tel n'est pas le cas, alors est soulevé toute la question de la saisie ou la numérisation des données de recherche déjà existantes sur support traditionnel, ce qui nous semble une problématique beaucoup plus vaste que celle du Groupe de travail.
De plus, "données de recherche" peut signifier soit les données recueillies et traitées par les chercheurs dans le cadre d'un projet de recherche (par exemple, les banques de données analytiques ou descriptives, fruits d'un grand nombre de projets), soit les données potentiellement utiles pour les chercheurs mais qui ne sont pas produites par eux (notamment, en ce qui concerne les historiens, les sources historiques). Nous croyons que ces deux types de "données de recherche" impliquent des problématiques très différentes par rapport aux questions de préservation et d'accès:
Certaines questions sont communes aux deux grands types de "données de recherche", par exemple celles de la confidentialité et du respect de la vie privée. Mais même ces questions peuvent être abordées sous des angles très différents. Par exemple, le chercheur qui produit une banque de données a souvent déjà passé par un processus d'acquisition de droits d'accès à l'information, mais d'habitude seulement pour ses propres recherches; par contre, tout chercheur voulant consulter des données de recherche du deuxième type sera soumis aux mêmes règles d'accès et d'utilisation que pour n'importe quel document d'archives. En fin de compte, nous croyons qu'il n'est pas souhaitable de confondre ces deux types de "données de recherche".
Notons toutefois que ces deux catégories ne sont pas étanches. Pensons, par exemple, aux données de recherche produites par des chercheurs uvrant en milieu gouvernemental. Elles sont en quelque sorte une catégorie mixte: elles répondent souvent à des problématiques particulières, mais très souvent ces données n'appartiennent pas aux chercheurs qui les produisent et plusieurs chercheurs successifs peuvent uvrer à leur production. Malgré tout, à notre avis, il demeure plus logique de considérer ces types de données sur le même plan que les celles qui sont produites par les chercheurs en général, étant tous les deux le fruit de projets de recherche ciblés.
La consultation et le travail du Groupe de travail devraient donc porter essentiellement sur les "données de recherche" déjà disponibles sous forme numérique, produites par des chercheurs (uvrant aussi bien à l'intérieur des institutions gouvernementales qu'à l'extérieur) dans le cadre de leurs projets de recherche. Le traitement de la question des données potentiellement utiles pour les chercheurs mais pas produites par eux, qu'elles soient numériques ou non, est un domaine tellement vaste qu'il devrait plutôt faire l'objet de consultations plus ciblées, comme c'est actuellement le cas aux ANC en ce qui a trait à leurs projets de numérisation.
Cela dit, même en adoptant cette définition plus
restreinte de "données de recherche", d'autres
clarifications restent à apporter. Tout chercheur en histoire,
par exemple, rassemble et traite d'innombrables éléments
d'information au cours de ses recherches, ce qui constitue une
production aux formes diverses: petites banques de données,
résumés de textes, tableaux statistiques, etc. Ce
sont sans aucun doute des "données de recherche",
mais est-ce pour autant pertinent d'obliger les chercheurs à
les déposer ou de prévoir qu'elles soient conservées
et rendues accessibles aux frais du public? Le problème
sera d'autant plus grand si la définition de "données
de recherche" ne vise pas uniquement le numérique:
un chercheur devrait-il verser tous ses recueils de photocopies,
ses notes manuscrites, etc.? Sur un autre plan, même les
banques de données d'une très grande envergure ont
parfois un créneau si pointu que leur utilité plus
large est très limitée. Il sera donc essentiel d'établir
dès maintenant quels types de données de recherche
sont visés par la consultation actuelle.
Réactions spécifiques aux questions posées
pour la phase I du travail
"Dans quelle mesure a-t-on besoin d'une fonction d'archivage de données unifiée et coordonnée ? Est-ce qu'on pourrait répondre aux besoins actuels et futurs en apportant de légères modifications aux politiques et aux mécanismes existants ?"
Sur le premier volet de la question, il est évident que la situation actuelle est inacceptable. Pour le moment, la préservation des données de recherche dépend entièrement de la bonne volonté, de la capacité technique et souvent du financement des chercheurs individuels et des équipes de recherche. Il n'y a aucun moyen facile d'accéder aux données déjà recueillies, sauf par des contacts personnels avec les créateurs et il n'y a aucune liste unifiée de ces données. Si les ANC et le CRSH sont capables et veulent assumer une telle tâche, cela serait sans doute bénéfique. Cependant, l'idée de mettre sur pied une fonction d'archivage unifiée et coordonnée mérite une attention beaucoup plus critique.
D'abord, d'une perspective québécoise, il faudrait absolument qu'une telle fonction d'archivage soit élaborée en coordination avec le Fonds pour la formation de chercheurs et l'aide à la recherche (FCAR) et les Archives nationales du Québec (ANQ). S'il est vrai que "Le CRSH est l'agence publique du Canada que le Parlement a expressément chargée d'appuyer et de promouvoir la recherche en sciences sociales et humaines", il en est de même pour le FCAR au Québec. Un grand nombre de projets de chercheurs québécois sont financés à la fois par des subventions CRSH et FCAR; si les deux organismes imposent des normes différentes quant à la conservation et à l'accessibilité des données qui proviennent de ces projets, d'énormes difficultés s'ensuivront, pour ne rien dire du problème lié au choix de l'organisme qui détiendra la copie maîtresse des données. Plus encore, les chercheurs du Québec doivent aussi composer avec la spécificité du Code civil et les différentes lois sur l'accès à l'information et la protection de la vie privée qui ont des impacts considérables sur la gestion des données de recherche - entre autres, l'obligation souvent imposée par la Commission d'accès à l'information de détruire les données une fois la recherche accomplie.
Sur un autre plan, une fonction d'archivage unifiée peut impliquer l'imposition de certains standards uniformisant, non seulement dans le format des données versées et dans la documentation qui les accompagne mais même dans la stratégie initiale de la collecte des données. Le document de consultation déclare que "Les stratégies canadiennes actuelles de collecte et de gestion des données peuvent se caractériser comme localisées et confuses. La collecte, la gestion, l'accès et la préservation des données, sont dirigés par les besoins des diverses disciplines, des établissements et des projets. Il n'existe aucune stratégie nationale de gestion des données pour garantir un plan rationnel de collecte des données [nos italiques], des normes de gestion des données, un accès équitable aux données, ni la préservation à long terme des données recueillies." Pour ce qui est de la collecte des données, il y a une mise en garde importante à émettre. S'il s'agit d'une planification qui encadre ou normalise la collecte des données que le chercheur est appelé à effectuer (choix des données, méthode utilisée, etc.), il est tout à fait impératif qu'il n'y ait aucune stratégie nationale, du moins en dehors des instances du gouvernement fédéral. La grande diversité dans les habitudes de collecte, d'analyse et de stockage de données utilisées par les chercheurs est tout à fait souhaitable et liée de façon intime à la liberté académique et au processus créatif. En revanche, pour ce qui est de la collecte de données déjà crées par des instances d'archivage, de même que leur préservation et leur accès à long terme, l'unification et la coordination est beaucoup plus souhaitable.
Sur le deuxième volet de la question, nous ne croyons pas que de légères modifications aux mécanismes existants régleront le problème, car il est évident que les mécanismes existants ne portent presque aucun fruit. Entre autres, dans la foulée des premiers commentaires de ce mémoire, il faudrait établir un mécanisme d'évaluation des données de recherche numériques pour déterminer si celles-ci méritent ou non un archivage permanent et une accessibilité plus large. Parmi les critères qui pourraient être considérés dans une telle évaluation:
Il faudrait évidemment aussi assurer le financement nécessaire pour permettre la préparation des données de recherche pour le dépôt. On pourrait envisager, par exemple, que les subventions de recherche du CRSH et du FCAR comprennent un volet budgétaire dédié aux fins du traitement des données de recherche en vue de leur dépôt (systématisation des données, transfert vers un format standardisé, documentation, etc.) Par contre, ces montants ne devraient pas être pris à même les budgets généraux de recherche des organismes subventionnaires. En d'autres termes, si de telles ressources sont allouées, les organismes subventionnaires devront assurer le financement supplémentaire qui permette un tel traitement des données sans nuire au financement de base.
"Quelles sont les lacunes dans les mandats et les structures des établissements existants pour ce qui concerne la gestion des données de recherche ?"
Nous aborderons d'abord la situation québécoise. Au Québec, les ANQ ont comme mandat d'acquérir des archives quel que soit leur support. En réalité, elles n'acquièrent pas encore d'archives numériques, même celles provenant des ministères et organismes publics qui, normalement, doivent maintenir eux-mêmes les bases de données de valeur permanente versées aux ANQ et en assurer la conversion et la veille technologique. L'état actuel des choses en est un d'attente, pour voir quelles solutions seront privilégiées par le chantier de l'ingénierie électronique mené par le Conseil du trésor. En outre, considérant l'absence d'équipements, de ressources humaines et financières, les ANQ n'envisagent aucunement l'acquisition d'archives numériques privées, même si elles ont été produites à l'aide de subventions provinciales comme celles du FCAR. D'ailleurs, les archives privées des universitaires en général sont perçues aux ANQ comme des archives que les universités devraient acquérir et non pas comme des archives dans les créneaux d'acquisition des ANQ. Il est donc très improbable que les ANQ acquièrent de telles archives dans le contexte actuel. Pour le restant, la tâche revient essentiellement aux universités.
De façon plus générale, nous regrettons qu'il n'existe aucune liste unifiée des données de recherche numériques canadiennes, même pour celles crées dans le cadre de projets de grande envergure ou par des chercheurs uvrant en milieu gouvernemental. Un historien cherchant à établir quelles banques de données existent sur un sujet donné ne peut souvent accomplir cette tâche autrement que sur la base de ses connaissances personnelles. La création d'une telle liste pourrait certainement améliorer considérablement l'efficacité de la recherche.
"Qui bénéficiera de l'amélioration
de la gestion des données de recherche et dans quelle mesure
?"
"Comment l'efficacité de la gestion, la conservation
et la consultation des données de recherche favorisera-t-elle
la capacité de recherche du Canada ?"
Ces deux questions étant sensiblement les mêmes, nous les traiterons ensemble en guise de conclusion. Dans la mesure où les données préservées et rendues accessibles ont un intérêt d'une grande portée et sont fiables, bien documentées, facilement et gratuitement accessibles, polyvalentes et difficiles à recréer, dans la mesure aussi où le financement des opérations nécessaires est assuré, il est évident que personne ne pourra s'y objecter et que la recherche ne s'en portera que mieux. La difficulté vient dans la mise en uvre d'un tel projet.
Nous invitons donc le Groupe de travail à réfléchir sur:
(1) Nous devons noter qu'aucun des documents ne fait référence à une consultation formelle (outre la rencontre du début d'octobre) ou à un échéancier (outre les 14 mois alloués pour le travail du Groupe de travail) et que l'Institut n'a jamais été formellement invité à soumettre un mémoire. Le présent mémoire a donc dû être rédigé dans des délais très courts, d'où son caractère sommaire et partiel. Nous invitons les responsables de la consultation à entreprendre une démarche plus structurée à l'avenir.