Entre 2011 et 2019, j’ai travaillé sur un doctorat interuniversitaire en histoire de l’art. Je place ici le brouillon de ma thèse. Vous pouvez consulter le plan complet du projet et une description de mon parcours. N’oubliez pas qu’il s’agit d’un brouillon.


1.4 Méthodologie – Recours aux humanités numériques

La recherche sur cette thèse a débuté en 2010 au moment où nous travaillions sur notre mémoire de maîtrise. À ce moment, en nous appuyant sur notre expérience en informatique et, spécifiquement, notre aisance envers les bases de données numériques, nous avons construit un outil sur mesure afin de compiler les nombreuses informations croisées. Entre ce moment et la rédaction de ce paragraphe, le champ des humanités numériques a connu une croissance importante, en particulier en histoire de l’art. Cette thèse a accompagné ces développements, s’en est nourrie et elle en a profité, sans s’inscrire directement dans ce champ en émergence. Toutefois, à cause de l’importance de l’outil numérique développé dans le cadre de cette recherche, quelques précisions doivent être apportées sur la méthodologie l’entourant.

La compilation des données et leur analyse quantitative s’inscrivent dans une certaine tradition méthodologique en histoire de l’art. Organisé en décembre 2008 à l’École normale supérieure (ENS) de Paris, le colloque « Art et mesure » et les actes publiés à sa suite identifient les interrogations essentielles liées à cette approche1. En ouverture, la question du rapport parfois malaisé avec les disciplines quantitatives est posée par la directrice Béatrice Joyeux-Prunel : « Pourquoi les statistiques, les graphiques et les cartes ne sont-ils par aimés en histoire de l’art ?2 ». Selon l’auteure, il est indéniable que l’approche quantitative enrichit la compréhension historique des phénomènes artistiques. En l’utilisant, l’historienne de l’art a permis de jeter un regard neuf sur la circulation des avant-gardes artistiques3. Le travail d’Eva Bouillo sur le Salon de 1827 emploie une méthodologie similaire4. Dans cette perspective, l’utilisation d’une base de données informatisée doit faciliter la compilation et l’agrégation des informations brutes. La lecture du texte « Créer une base de données en histoire de l’art : comment s’y prendre ? » de Béatrice Joyeux-Prunel et Claire Lemercier doit être mesurée à l’aulne de ce choix méthodologique5. Pour les auteures, il s’agit de donner des pistes de solution sur l’encodage des données historiques afin de permettre leur lecture quantitative. Leur approche permet de croiser les spécificités du travail en histoire de l’art avec les principes généraux de normalisation guidant l’implantation de toute base de données relationnelle6.

Les récents développements en humanités numériques ont permis d’enrichir ce point de départ. Débutée en juin 2015, la publication de la première revue scientifique consacrée à cette problématique, l’International Journal for Digital Art History, offre un cadre dépassant ces simples considérations méthodologiques. Dirigé par Harald Klinke de la Ludwig Maximiliam University et Liska Surkemper de la Technical University, deux institutions basées à Munich, ce journal permet de faire le point sur la place qu’occupe l’histoire de l’art dans les humanités numériques. En particulier, plusieurs pistes de réflexion sur l’intégration de l’informatique dans la méthodologie de la discipline sont proposées.

Puisque nous centrons notre thèse sur notre objet de recherche et que le recours à l’informatique a une influence sur les résultats que nous présentons, il convient de décrire certaines voies ouvertes dans ce journal pour montrer la spécificité de notre démarche. Le premier texte dans le premier numéro de l’International Journal for Digital Art History identifie l’essentiel du problème auquel est confrontée l’histoire de l’art dans l’emploi des nouvelles technologies. Lev Manovich l’exprime en ces termes : « Will art history fully adapt quantitative and computational techniques as part of its methodology ?7 » Dit autrement, l’auteur se demande si la méthodologie développée par l’histoire de l’art sera capable d’intégrer les outils quantitatifs que permettent les nouvelles technologies. La même interrogation traverse le texte d’Anna Bentkowska-Kafel sur l’autonomie disciplinaire de l’histoire de l’art numérique. Dans « Debating Digital Art History », elle se demande si l’intégration des technologies informatiques permet l’émergence d’une nouvelle discipline ou s’il s’agit, plus prosaïquement, d’un simple enrichissement méthodologique8. Reconnaissant l’ampleur de cette interrogation, ces deux auteurs n’offrent pas de réponse tranchée et préfèrent laisser la question ouverte. Pour sa part, Elli Doulkaridou défend l’idée que la discipline a toujours modifié sa méthodologie au gré des avancées technologiques9. Citant l’utilisation par Erwin Panofsky de projections de diapositives les unes à côté des autres afin de faciliter les comparaisons formelles, l’auteur se concentre sur l’importance de la présentation numérique des œuvres afin d’enrichir leur compréhension.

On le voit, le recours à l’informatique afin d’étudier un corpus en histoire de l’art soulève de nombreuses questions méthodologiques. S’y ajoutent la distinction entre le numérique et la numérisation. Johanna Drucker l’exprime en ces termes : « But a clear distinction has to be made between the use of online repositories and images, which is digitized art history, and the use of analytic techniques enabled by computational technology that is the proper domain of digital art history.10 » Dans « Forgotten Genealogies : Brief Reflections on the History of Digital Art History », Benjamin Zweig reprend à son compte cette distinction11. Inscrivant l’adoption de l’informatique dans une perspective historique, il défend l’idée selon laquelle la discipline utilise depuis longtemps la numérisation informatique. Pour lui également, il s’agit d’un prolongement de la méthodologie employée depuis l’introduction des diapositives à la manière d’Erwin Panofsky.

Ces interrogations trouvent un aboutissement dans l’analyse des données massives. Dans cette perspective, Lev Manovich propose de transformer le monde réel en monde numérique12 . Cette représentation en structures informatisées implique trois étapes fondamentales : cerner les limites du phénomène, identifier les objets représentés et relever les caractéristiques qui seront incluses pour chacun d’entre eux. Ce mariage entre objet et caractéristique constitue la donnée informatique. En modélisant le monde réel de cette manière, l’auteur soutient qu’il crée un espace mathématique sur lequel les règles d’analyse peuvent s’appliquer. L’utilité de cette approche est indéniable dans le traitement des grands nombres (« big data »). À titre d’exemple, l’auteur analyse les photographies publiées sur Internet durant cinq mois à partir de New York. Son corpus est composé de 10,5 millions d’images. Il est aisé de comprendre que la compréhension de cet ensemble dépasse les capacités cognitives humaines. Sa modélisation et le recours aux techniques d’analyse mathématiques permettent d’arriver à des conclusions inatteignables en employant la méthodologie traditionnelle de l’histoire de l’art.

Ce survol identifie certains des enjeux cadrant le développement de la base de données associée à cette thèse. D’emblée, notre corpus ne se situe pas dans les données massives. Bien qu’important, il se situe dans un ordre de grandeur composé de milliers d’objets, non de millions. En conséquence, tel que le relève Johanna Drucker et l’emploie Lev Manovich, le recours aux techniques d’analyse mathématique n’a pas paru approprié dans le cadre de cette thèse. S’il le fallait, nous introduirions un nouveau terme pour décrire notre corpus, soit les données de taille moyenne (« middle data »). Par cette expression, nous désirons nous distinguer de deux entités bien identifiées. D’un côté, nous nous éloignons de l’œuvre d’art considérée dans son unicité. Cet objet traditionnel de l’histoire de l’art ne peut être au centre d’une étude comme la nôtre centrée sur les expositions. De l’autre côté, nous désirons nous distinguer des données massives qui se comptabilisent par millions puisque cet ensemble ne peut être abordé que d’une manière mathématique. Plutôt, nous indiquons les corpus trop importants pour être mémorisés par un individu, trop petits pour y appliquer l’analyse mathématique.

De la même manière que nous avons placé les trente-et-une expositions au centre de notre bilan historiographique, nous les avons situées au cœur de notre méthodologie informatique. Concrètement, la modélisation s’est réalisée autour de quatre notions : œuvre, artiste, prêteur, exposition. Le nœud de notre interrogation est formé par l’œuvre d’art. Entre 1860 et 1914, elle se définit d’une manière traditionnelle. Elle est composée des peintures, aquarelles, sculptures, photographies, dessins et objets issus des arts décoratifs que nous avons croisés. Son titre et ses variantes, son support, son genre et son année de création en constituent les principales caractéristiques. À chaque œuvre est associée un artiste tel qu’il est fourni par les catalogues, les registres et les autres sources déjà citées. Les problèmes méthodologiques liés à l’attribution sont présentés un peu plus loin. Les objets sont également attachés à un prêteur ou à une prêteuse au moment étudié. Chaque individu est identifié par quelques données biographiques (prénom, nom, dates de naissance et de décès, lieu de résidence). Aussi, dans le cadre de cette thèse, nous avons tenté de les rattacher à une profession ou à un domaine d’activité. Cette information sera exploitée dans le chapitre consacré au prêteur afin de défendre l’idée d’une certaine diversité au sein de ce groupe. Enfin, les objets sont regroupés au sein d’une exposition, définie comme un regroupement d’œuvres durant une certaine durée dans le temps.

Sur le plan méthodologique, nous considérons que ce recours à l’informatisation possède une faille importante dans le cadre de cette thèse. En effet, dans l’état actuel des avancées technologiques et de nos connaissances, les outils ne permettent pas de coder adéquatement les imprécisions inhérentes au travail de l’historien de l’art. Afin d’illustrer ce point, rappelons l’approche prudente que nous avons adoptée dans le dépouillement des sources primaires. À cause de contre-exemples importants, rappelons également que nous avons choisi de considérer les œuvres exposées de manière indépendante à moins d’une documentation probante les liant entre elles. Pour cette raison, lorsque notre travail croise celui de Janet M. Brooke, notre inventaire est plus volumineux que le sien. Il en découle une considération importante sur les nombres présentés dans cette thèse. Ce défi méthodologique a toutefois permis le développement d’une approche que nous croyons novatrice. Sur le premier point, nous insistons sur le fait que les nombres à partir desquels nous tirons nos conclusions doivent être considérés comme des ordres de grandeur. Il est évident que nous ne nous situons pas dans le cas trivial où chaque œuvre recensée aurait une fiche informatisée. Toutefois, lorsque nous avançons que 3547 œuvres ont été exposées lors des trente-et-un événements étudiés, il est clair que certains cas peuvent être rapprochés. Pour cette raison, nous citerons souvent des nombres précis, mais ils doivent être compris comme des approximations. Ce type de considération sera primordial lorsque nous présenterons les œuvres selon leur genre ou leur type. Dans ce contexte, nous éviterons de nous attarder sur le fait que notre recensement relève 1791 paysages et 140 architectures. Plutôt, nous préférerons nous attarder sur les ordres de grandeur afin de signaler que les paysages ont été exposés d’une manière beaucoup plus significative que les architectures.

Cette limite nous a amené à développer un outil méthodologique qui mérite quelques précisions. Illustrons-les à l’aide d’un exemple. Le banquier et administrateur de chemins de fer Richard Bladworth Angus (1831-1922) est un important collectionneur d’art actif au sein de l’AAM. Durant la période étudiée, nous avons recensé 241 œuvres exposées à différents moments dans la métropole. Or, ce prêteur a eu une importante postérité composée de six filles et de trois garçons. À certains moments, ces enfants ont également prêté des œuvres d’art afin de les exposer. À titre d’exemple, son fils D. Forbes Angus participe à l’exposition de 1898. Son épouse doit également être considérée dans toute analyse de prêt de cette collection. Rapidement, l’analyse des « Loan Exhibitions » devient complexe puisqu’il est possible d’y ajouter les expositions posthumes. Dans ce contexte, comment rendre compte de la stratégie d’exposition de la collection Angus ? Pire, en nous centrant sur notre corpus, comment comprendre le rôle de la famille Angus y joue ? Puisque nous avons inscrit cette thèse sous le signe de la nuance et que nous tentons de faire émerger les subtilités résultant de ce choix, il nous paraissait inadéquat de traiter l’exposition de cet ensemble comme le fruit des actions d’un seul individu. En conséquence, nous avons traité chacun des membres de la famille Angus individuellement.

Notre apport méthodologique ne se situe pas à ce niveau. Plutôt, il se trouve dans la constitution de groupes associant des données selon une construction logique. Ainsi, concernant la famille Angus, nous avons séparé le collectionneur des figures de l’épouse et des enfants. Toutefois, afin d’en tirer le plus grand profit dans la compréhension de notre corpus, nous avons créé un groupe intitulé « Famille Angus ». Ce groupe permet de mettre ensemble tous les objets exposés par les membres de ce noyau familial. Cette mise au pas de la technologie aux interrogations soulevées par l’histoire de l’art nous paraît fructueuse. Elle permet, entre autres, d’identifier certains rapports différenciés aux œuvres d’art au sein d’une même famille. À titre d’exemple, elle révèle que la collection de sir George A. Drummond comportait deux œuvres par Francesco José de Goya y Lucientes, mais que celles-ci n’ont jamais été associées au collectionneur. Plutôt, elles n’ont été prêtées que par son épouse. S’agissait-il d’un rapport différencié à cet artiste ? Pourrait-on considérer qu’elles étaient préférées par Lady Drummond plutôt que son époux ? Notre méthodologie permettra d’aborder ce type de questions dans le chapitre consacré aux prêteurs.


1 Béatrice Joyeux-Prunel (dir.) et Luc Sigalo Santos (coll.), L’Art et la mesure. Histoire de l’art et méthodes quantitatives, collection « Actes de la recherche à l’ENS », no. 5, Paris, éditions rue d’Ulm, 2010.

2 Id., « L’histoire de l’art et le quantitatif. Une querelle dépassée » dans op. cit., p. 3.

3 Id., Les avant-gardes artistiques (1918-1945). Une histoire transnationale, Paris, Gallimard, 2017.

4 Eva Bouillo, Le Salon de 1827. Classique ou Romantique? Rennes, Presses universitaires de Rennes, 2009.

5 Claire Lemercier et Béatrice Joyeux-Prunel, « Créer une base de données en histoire de l’art : comment s’y prendre ? » dans Béatrice Joyeux-Prunel, L’Art et la Mesure. Histoire de l’art et méthodes quantitatives, Paris, éditions rue d’Ulm, 2010, p. 165-180.

6 La normalisation des données est décrite dans Thomas Connolly et Carolyn Begg, Database Systems : A Practical Approach to Desing, Implementation, and Management, sixième édition, Londres, Pearson, 2015.

7 Lev Manovich, « Data Science and Digital Art History », International Journal for Digital Art History, no. 1 (juin 2015), p.12-35.

8 Anna Bentkowska-Kafel, « Debating Digital Art History », International Journal for Digital Art History, no. 1 (juin 2015), p. 51-64.

9 Elli Doulkaridou, « Reframing Art History », International Journal for Digital Art History, no. 1 (juin 2015), p. 67-83.

10 Johanna Drucker, « Is there a « Digital » Art History ? », Visual Resources, vol. 29, no. 1-2 (2013), p. 5-13.

11 Benjamin Zweig, « Forgotten Genealogies : Brief Reflections on the History of Digital Art History ». International Journal for Digital Art History, no. 1 (juin 2015), p. 39-49.

12 Lev Manovich, op. cit.