Si l’usage du numérique a mis du temps à s’implanter dans les recherches en lettres, de plus en plus de projets voient actuellement le jour qui visent à créer des données par l’annotation de corpus divers, souvent multimodaux, et à les explorer au moyen de technologies digitales et de visualisations sur écran. Dans le domaine des études théâtrales, on dispose de nombreuses bibliothèques numériques en format XML, même si les titres qui y sont représentés sont encore très inégalement distribués au regard des patrimoines littéraires hébergés par les bibliothèques ou autres institutions de conservation1 .
Conçues dans une perspective philologique, génétique ou éditoriale, les recommandations de la TEI, qui sont fréquemment – quoique pas systématiquement – suivies dans ces projets de numérisation, sont massivement façonnées par cette intention des origines. La plus grande partie des articles publiés par le journal du consortium concerne soit la gestion de la « mouvance » du texte, soit les solutions de publication via Internet de textes préparés en format XML. Même si un usage analytique de la TEI est prévu par les Guidelines2, et a fait l’objet de diverses réflexions3, l’approche « par données » continue à se heurter à toute sorte de problèmes liés à la conception plutôt « présentative » qu’analytique des jeux d’éléments et attributs. De ces problèmes, l’annotation des didascalies constitue un éclairant cas d’étude, un laboratoire où l’on peut réfléchir plus largement à ce que peut être un balisage sémantique du (texte de) théâtre.
En effet, tout travail d’annotation des didascalies en vue de leur exploration numérique se heurte rapidement à des difficultés liées au fait qu’elles ont été abordées sous l’angle de leur statut textuel4, et non pas sous celui de leur apport informationnel. D’une part, l’annotateur ne dispose que d’un jeu limité et peu adapté d’attributs et de valeurs, comme on le verra plus amplement dans ce qui suit. D’autre part, on constate l’absence d’un élément spécifique pour la prise en charge des « didascalies internes ». Pourtant, toutes les histoires du théâtre rappellent leur rôle fondamental pour assurer la fonction de régie, au moins jusqu’au XIXe siècle, ainsi que le statut discutable des didascalies « externes » ou « explicites », qui sont – pour une grande partie des textes théâtraux antiques, médiévaux, voire de la Renaissance – le fruit d’interpolations et d’une tradition scripturale tardive. Si les incertitudes pesant sur leur identification et leur décryptage expliquent que les didascalies internes n’aient pas fait l’objet d’une élaboration typographique, la souplesse même du médium numérique invite à dépasser cette position de prudence et à proposer des solutions pour leur identification, leur caractérisation, leur classification, et leur lecture.
Après une critique des balises actuellement mises à la disposition de l’annotateur, et surtout des valeurs des attributs que suggèrent les Guidelines de la TEI, les pages qui suivent proposeront un survol des travaux sur les didascalies, particulièrement fournis au cours des trente dernières années, pour finir par une série de propositions pratiques permettant de répondre aux besoins ainsi identifiés – ou du moins permettant de poser les bases d’une réponse plus complète que celle fournie actuellement.
Soulignons également que l’objectif de cet article est moins d’analyser les questions techniques posées par l’annotation en TEI – même s’il en sera nécessairement question –, que d’explorer les dimensions scientifiques de la mise en évidence, par le moyen d’un langage structuré, d’éléments constitutifs et de dispositifs propres au texte de théâtre. Trop souvent la réflexion sur l’encodage, sur la production concrète de versions numériques des œuvres, est reléguée en dehors des canaux habituels où a lieu la discussion sur le théâtre et le spectacle, avec leurs multiples formes et fonctions. On se posera moins la question « comment faire », même si elle est légitime et conditionne en grande partie l’entreprise, que l’on ne s’interrogera sur « quoi faire » pour mettre en évidence le fonctionnement complexe, entre fiction et régie, des indications scéniques, prises ici comme un cas d’étude emblématique.
L’annotation des didascalies en XML/TEI
Les didascalies sont définies, dans les Guidelines citées plus haut, comme des « descriptive directions to indicate non-verbal action », à annoter avec l’élément ‹stage›
. L’acception TEI de la didascalie apparaît ainsi plus large que les définitions usuelles, qui font des didascalies un texte à part, destiné à ne pas être oralisé5. La formulation des Guidelines autorise dès lors, en principe, l’utilisation de ‹stage›
aussi bien pour les didascalies internes que pour les didascalies explicites, puisque dans les deux cas il s’agit de « descriptions », d’« indications » à propos d’une action non-verbale prenant place pendant le dialogue, ou susceptible de s’y insérer. Dans la pratique, aucun projet d’annotation du théâtre dont j’ai connaissance n’utilise la balise ‹stage›
pour autre chose que les didascalies déjà identifiées en tant que telles par quelque procédé (typo)graphique ou de mise en page utilisé dans un ou plusieurs témoins du texte.
Outre la balise ‹stage›
, les Guidelines mettent à disposition de l’annotateur la balise auto-fermante ‹move/›
. Comme le remarquent les Guidelines, et comme tout lecteur de pièces de théâtre le sait, des personnages entrent et sortent parfois sans que ces mouvements soient explicitement signalés par des didascalies traditionnelles. ‹move/›
permet de remédier à ces lacunes, en s’appuyant sur une remarque d’un personnage (« voici venir untel ») ou à partir du constat que tel acteur intervient à tel moment de la pièce, sans que son entrée ait été préalablement précisée au moyen de la liste d’entreparleurs ou par un autre type de signalement. ‹move/›
témoigne ainsi d’une reconnaissance implicite, par les rédacteurs des Guidelines, de l’insuffisance des didascalies traditionnelles pour identifier la multiplicité d’indications qu’une pièce de théâtre donne à propos du non-verbal, et invite de manière sous-jacente à perfectionner le système.
L’élément ‹stage›
peut recevoir, dans la spécification TEI, toute une série d’attributs, dont le plus saillant dans les Guidelines est balisé comme code. Prudemment, les rédacteurs du chapitre sur les représentations (« Performance texts ») affirment qu’il est difficile de fournir une typologie satisfaisante des indications scéniques, mais évoquent tout de même quelques « types basiques » qui seraient faciles à identifier : « entrance », « exit », « setting », « costume » et « delivery ». Lorsqu’on travaille sous oXygen, l’éditeur d’XML le plus populaire parmi les humanistes numériques, et qui intègre les spécifications de la TEI, on dispose d’encore cinq autres valeurs : « modifier », « business », « location », « mixed », « novelistic ». Assez courte, cette liste de valeurs présente l’avantage d’être très maniable, et les éditeurs des Guidelines recommandent d’en fiabiliser l’utilisation soit en déclarant dans l’en-tête du document des règles d’usage, soit en la retravaillant et en la restreignant via un XML Schema associé au document annoté.
Un survol sans doute incomplet des projets numériques sur le théâtre effectué à partir du site même de la TEI6, du répositoire CAHIER7 et de Nakala n’a permis d’identifier aucune customisation des valeurs de ‹stage›
. Dans les faits, la plus grande partie des projets ne s’engage pas dans la spécification des types de didascalies, que l’on se contente simplement d’identifier : c’est le cas de la collection « Molière » d’OBVIL, des pièces figurant sur le site Théâtre classique, ou encore des œuvres d’Ibsen publiées par l’université d’Oslo8. Lorsqu’un travail plus fin d’analyse des didascalies est mené, celui-ci se fonde sur la liste mentionnée plus haut, sans aucune adaptation, et les pratiques adoptées laissent entrevoir les difficultés auxquelles les annotateurs ont dû se heurter en la manipulant. Ainsi, dans Peines d’amour perdues de Shakespeare, qui fait partie de la complète (et complexe !) collection Folger9, « delivery » sert à annoter « to the King », « to Costar », « to Amado », « aside », mais aussi de multiples « reads » ou bien « sings », à propos desquels on peut se demander s’il s’agit encore de « deliveries », censées « décrire la façon dont parle un personnage ». En France, dans le cadre des projets SEM10 et Boissy11, c’est le classement des « rires » qui a posé particulièrement question : s’agit-il de « business » ? de « delivery » ? de « modifier » ? Dans les Guidelines mêmes, un exemple comme ‹stage type=‘delivery’›
Not knowing what to say ‹/stage›
, laisse songeur : s’agit-il vraiment de « delivery » dans le cas d’une absence de parole ?
Plus fondamentalement, à regarder de plus près les valeurs mentionnées plus haut, on ne peut pas s’empêcher d’éprouver le sentiment qu’on a à faire à une sorte de liste « à la Prévert », mettant sur le même plan des éléments de nature et fonctionnement très différent, et sans tenir compte de leur importance relative. Ainsi, les entrées et les sorties, qui peuvent être annotées à la fois par des valeurs d’attribut et par une balise dédiée (‹move/›
), semblent privilégiées par rapport à la multiplicité de déplacements sur scène, de gestes divers, auxquels on réfère avec l’élastique valeur « business ». « Setting », « location » et « novelistic » semblent renvoyer à des réalités proches, à en juger par les exemples fournis, et on peut se demander si on ne pourrait pas les regrouper dans une méta-catégorie. Enfin, notons la présence dans les Guidelines d’une valeur « costume », que oXygen (et donc le schéma TEI-All.rng par rapport auquel il valide) ne reprend pas – sans que l’on sache s’il s’agit d’un oubli, ou d’une disqualification argumentée de cette valeur. Tout en étant potentiellement inadaptée à la multiplicité des traditions et des pratiques dramaturgiques, la typologie proposée actuellement n’est donc ni cohérente, ni précise, et elle appelle à concevoir une alternative qui présente un certain degré d’universalité – si difficile que soit une telle entreprise.
Une autre insuffisance des ‹stage›
que peut ressentir l’annotateur du théâtre est l’inadaptation des attributs pour manifester une série de traits caractérisant tel ou tel usage didascalique. Qu’elles soient explicites ou internes, les didascalies peuvent avoir différents degrés de « contrainte », selon la terminologie de Th. Gallèpe (Gallèpe 1997, 320 et sq.) ; celle-ci peut être « absolue », « forte », « de simple cohérence », ou « faible ». Dans un autre ordre d’idées, Sanda Golopentia (Golopentia et Martinez-Thomas 1994) donne l’exemple de la célèbre En attendant Godot de Becket, où à la dernière scène les personnages s’invitent réciproquement à partir, tandis que la didascalie précise qu’« Ils ne bougent pas ». L’analyse des accords ou des contradictions entre verbal et non-verbal serait grandement facilitée si on pouvait indiquer celles-ci par un mécanisme. Or, dans l’état actuel des Guidelines, on ne dispose que de l’attribut cert, avec quatre valeurs (« high », « low », « medium », « unknown »), dont l’utilisation peut éventuellement convenir à cette tâche – non sans une dose de « tag abuse ». Des observations similaires peuvent être faites à propos d’autres critères descriptifs des didascalies, dont il sera question plus amplement dans la section suivante de cet article, et qui semblent appeler à la création de nouveau attributs.
Observons enfin que les Guidelines ne documentent pas l’usage de toute une série d’attributs déjà autorisés avec ‹stage›
, ce qui mène d’une part à des interrogations au sujet de l’utilité de certains, et à un certain flottement dans l’emploi des autres. Dans quel cas pourrait-on avoir besoin de l’attribut select (« selects one or more alternants »), de exclude (« points to elements that are in exclusive alternation with the current element ») ou même de style (« contains an expression in some formal style definition language ») dans l’annotation des ‹stage›
? Les exemples ne viennent pas facilement à l’esprit, et se laissent encore moins facilement traquer sur la toile. Pour revenir à la collection Folger, on constate que les attributs who y apparaissent uniquement dans les didascalies caractérisées comme des « entrance », « exit » ou « business », alors que les « delivery » pourraient aussi bien en recevoir. Toutes ces didascalies pourraient également recevoir un attribut toWhom, dont l’utilité serait des plus grandes pour la construction de graphes d’interaction, qui se fondent actuellement sur le critère plus discutable des co-présences12. Une proposition plus complète et plus cohérente d’annotation des didascalies semble décidément nécessaire.
Des typologies instables
Depuis les années 1990, l’étude des didascalies a connu un véritable renouvellement, ayant mené à un changement assez radical de la perspective sur ce type de texte, qui n’est plus vu comme un élément marginal, voire « étranger », par rapport au dialogue, et dont la participation à la construction de la fiction, dans le théâtre contemporain mais pas seulement, a été maintes fois soulignée. Cette riche discussion forme ainsi un point de départ approprié pour repenser l’annotation des didascalies en régime numérique.
Force est toutefois de constater que, lorsqu’on se place dans une perspective d’annotation numérique, les besoins que l’on peut dégager à partir de la littérature et les classifications qui y sont proposées sont souvent peu clairs, incomplets et même contradictoires. Les approches sont rarement systématiques et semblent parfois s’ignorer les unes les autres, avec les plus récentes ne capitalisant pas toujours sur les acquis des plus anciennes. Plus que d’un bilan, il s’agit donc dans ce qui suit de prolonger des suggestions et de compléter l’expression des besoins, tout en essayant d’assigner à ces derniers un degré de nécessité à partir de leur fertilité pour les études littéraires, telle qu’on peut la constater sur la base de la bibliographie parcourue. Dans un premier temps, on tentera de faire le bilan des différents angles, ou aspects, sous lesquels on peut décrire les didascalies ; dans un second, on reviendra sur les différentes typologies proposées pour essayer de dégager des constantes et de poser les bases d’un schéma d’annotation.
Si de nombreux auteurs ont travaillé sur les didascalies au cours des dernières décennies, la plupart se concentre sur un aspect de ce dispositif, qu’ils explorent à l’aide de corpus plus ou moins étendus. On trouve en revanche, chez Thierry Gallèpe puis Marie Bernanoce des propositions globales de description des didascalies. (Gallèpe 1997) propose d’analyser les didascalies selon leur place en texte, leur scope (la portion de dialogue avec laquelle la didascalie est en rapport), leur incidence (le type d’information qu’elles apportent), leur fonction, le degré de contrainte qui les caractérise, leur objectivité et leur participation (ou non) à la diégèse. De son côté, (Bernanoce 2007) invite, dix ans plus tard, à se pencher sur ce qu’elle appelle « les constituants de la voix didascalique » : le paratexte, le découpage, le co-texte, le rapport entre le texte didascalique et le texte dialogique, le rapport régie/ fiction, l’énonciation didascalique, l’intertextualité et la métatextualité didascalique.
Comme on le voit, les deux listes ne sont que partiellement superposables, sans doute parce qu’elles ont été constituées avec des objectifs différents – l’approche de Th. Gallèpe s’avérant plus fonctionnelle, tandis que M. Bernanoce semble plus intéressée par les aspects méta- et para-textuels. Dans la perspective de la construction d’un schéma d’annotation des didascalies, le problème posé par ces deux approches est toutefois moins celui de leurs divergences, que celui de leur inégale opérationalisation dans un environnement numérique (Moretti 2014). On peut y distinguer trois types de difficultés. La première est que la manipulation de certains de ces descriptifs suppose de confondre dans un même geste la création des observables et leur analyse, mode de fonctionnement tout à fait courant dans les études littéraires, mais étranger aux études numériques, où les deux étapes sont, autant que faire se peut, soigneusement séparées. Évaluer le rapport entre le texte didascalique et le texte dialogal, ou plus globalement la « place en texte » de la didascalie, s’interroger sur l’intertextualité et la métatextualité des didascalies suppose ainsi toute une série d’opérations préalables de découpage et de mise en lien, sans principes très clairs pour guider cette entreprise. En second lieu, certains de ces descriptifs sont, comme l’indiquent leurs concepteurs mêmes, difficiles à manipuler. La caractérisation des « contenus véhiculés dans la didascalie » comme faisant partie du monde des personnages ou du monde des spectateurs et des acteurs est complexe et sujette à interprétation13 – interprétation qui intervient sans doute dans l’établissement d’un « scope » ou d’une « incidence » de la didascalie, mais pas de la même manière, puisque l’on peut envisager des listes d’indices permettant de classer une unité dans une des catégories fondées sur ces descripteurs. Enfin, certaines de ces catégories posent la question de l’utilité d’une annotation qui leur serait consacrée. Si on veut étudier l’énonciation didascalique, il semble ainsi plus économique, plutôt que de demander à un annotateur humain de distinguer entre didascalies où la subjectivité du dramaturge se manifeste, et didascalies « neutres », de se contenter d’abord d’un simple découpage des didascalies, et d’un étiquetage morpho-syntaxique ultérieur de leurs contenus, au moyen d’un des nombreux outils disponibles sur la toile.
Compte tenu de ces observations, il semble ainsi pertinent de se concentrer avant tout, dans le cadre d’une campagne d’annotation, sur la description fonctionnelle des didascalies, soit de leur rôle (ou « incidence »), de leur scope et du degré de contrainte qui les caractérise. Ceci n’interdit pas une analyse linguistique des didascalies, qui s’intéresserait au temps des didascalies (Gerbe 2007), aux intonations, aux effets lyriques (Sort 2009), et à de multiples autres aspects qui ont donné lieu à la riche littérature mentionnée plus haut. Quant à l’analyse de la place des didascalies et des rapports avec leur contexte et leur co-texte, celle-ci est possible dans le format numérique du fait même que les unités y sont soigneusement identifiées et placées à un niveau précis de « l’arbre » textuel.
La description fonctionnelle des didascalies appelle, en revanche, à établir des classes fermées pour chacun des aspects d’analyse retenus. Pour certains de ces aspects, des listes consensuelles ont déjà été suggérées. On peut ainsi caractériser les didascalies, en fonction de leur scope, comme portant sur l’interaction en général, sur la réplique subséquente, sur la réplique en cours, ou sur la réplique précédente (Gallèpe 1997, 156 et sq.). En ce qui concerne la contrainte, les didascalies sont, comme il a été mentionné plus haut, à contrainte absolue, forte, de simple cohérence ou faible. En revanche, la caractérisation de l’apport des didascalies à la mécanique du drame, leur rôle de régie, si on veut, a donné lieu à des propositions plus hétérogènes. En analysant les didascalies chez Molière, (Tadier 2009) propose ainsi d’observer les positions (insolites ou civile), la localisation dans l’espace, les déplacements, les grimaces, gestes (banals ou signifiants), la parole (cri, intonations, tempo, rythme). (Gallèpe 1997) parle d’« incidence » à ce sujet, répartit les didascalies en méta-énonciatives, méta-interractionnelles, méta-situationnelles et techniques. Witold Wolowski (Wolowski 2007) et (Wolowski 2009) parle de didascalies internes, de paradidascalies et de didascalies proscéniques. Pour (Dompeyre 1992), les didascalies interstitielles se répartissent en didascalies de tour de parole, d’indentification du locuteur et de l’allocutaire, précisant des objets et des décors, kinésiques, proxémiques, gestuelles, mimétiques, sonores, de situation d’énonciation, de situation particulière, psychologiques. Et on pourrait continuer, en accumulant les exemples et les propositions !
Plutôt que de tenter d’ajuster ces différentes catégorisations entre lesquelles on identifie des similitudes, mais aussi de nombreuses disparités, et à peu près le même type de problèmes que ceux posés par la liste de valeurs de la TEI, on peut repartir du cadre théorique rapidement brossé plus haut, qui pose, comme on l’a vu, le rôle fondamental des didascalies non seulement pour la communication entre le dramaturge et les acteurs, mais plus globalement dans la création de la double interaction, fictionnelle et réelle, qui forme la spécificité du théâtre. Dès lors, on peut s’appuyer sur les questions clés liées à toute interaction linguistique afin de construire une typologie des didascalies. Qui, quand, où, comment, pourquoi et dans quel contexte sont des questions auxquelles les didascalies contribuent à répondre, au même titre que le dialogue. Sans doute certaines didascalies donnent-elles des indications sur plusieurs de ces aspects à la fois : celles que S. Golopentia (Golopentia et Martinez-Thomas 1994) appelle « didascalies de la source locutoire » sont à la fois un moyen de répondre à la question « qui » et à la question « quand », puisqu’elles instituent un ordre de prise de parole. De même, une didascalie qui précise une modulation de la voix (« en colère », « tendrement ») est à la fois une réponse à la question « comment », et à la question « pourquoi ». Plus globalement, rappelons que pour les théoriciens du théâtre classique français, « comment » et « pourquoi » conditionnent « qui », « quand » et « où », tandis que ces trois autres aspects participent à l’élucidation des deux premiers. Mais, en dépit de ces superpositions, l’approche par questions semble à la fois suffisamment robuste et suffisamment souple pour former la base d’un exercice d’annotation à la fois cohérent et (relativement) objectif.
Reste enfin à aborder la question de l’étendue de l’annotation. Le renouvellement des cadres théoriques mentionné plus haut a souligné à plusieurs reprises l’importance conjointe des didascalies dites « internes » et externes pour la mise en œuvre de l’interaction dramatique. L’identification et analyse des premières semble cependant n’intervenir que lorsque les secondes font défaut, ou sont peu nombreuses. À lire les contributions qui se sont succédées, on a le sentiment que l’étude des didascalies s’est élargi en incluant ce que Sanda Golopentia, dans l’ouvrage déjà cité, appelle les macrodiscalies et les mésodidascalies, mais que l’on n’est pas allé plus loin en-deçà, au niveau microdidascalique, malgré le fait que le texte en italiques, détaché ou entre parenthèses, n’est pas le seul à donner des indications sur le jeu. Sans revenir sur le statut problématique des « didascalies externes », qui a été mentionné en introduction, remarquons seulement qu’à se priver du relevé des énoncés assurant une fonction de régie à l’intérieur du dialogue on ne se donne pas les moyens d’observer et de comprendre tout un pan de la redondance du signe théâtral, dont les modalités peuvent poser les bases de nouvelles analyses stylistiques et dramaturgiques. Notons, en outre, que les aspects discutés plus haut à partir de Th. Gallèpe et de M. Bernanoce peuvent s’appliquer aussi bien aux didascalies explicites qu’internes, assurant ainsi leur comparabilité.
Propositions d’annotation
Sur la base des observations faites plus haut, il est possible à présent de proposer un schéma d’annotation des didascalies, aussi bien internes qu’internes, et quelle que soit leur place dans le texte ou leur portée. Dans un premier moment, il s’agira d’énumérer les éléments et les attributs de la TEI à utiliser, en proposant, le cas échéant, de nouvelles listes de valeurs. Précisons d’emblée qu’il n’est pas question d’entrer dans le détail d’un guide d’annotation, que chaque projet doit construire pour ses propres besoins et à partir des cas typiques et litigieux identifiés dans la phase préliminaire. Dans un second temps, quelques difficultés d’ordre général posées par ce schéma seront rapidement discutées.
L’ambition étant d’annoter aussi bien les didascalies explicites que les internes, il est proposé d’utiliser le même élément ‹stage›
pour les deux. La distinction entre les deux catégories peut être effectuée, si besoin, au moyen de l’attribut type
, qui aurait deux valeurs exclusives l’une de l’autre : « DI » et « DE ». L’alternative serait d’annoter les didascalies internes avec ‹seg›
, conservant l’élément ‹stage›
pour les segments textuels non-oralisés. Cette solution présente toutefois plusieurs désavantages, le premier étant qu’il augmente l’hétérogénéité de l’appareil didascalique numérique, que l’on ne pourra de toute façon pas unifier14. En outre, les attributs permis avec ‹seg›
ne sont pas les mêmes que l’on peut trouver avec ‹stage›
, et réciproquement ; si ceci n’est pas en soi un obstacle, puisque la TEI donne la possibilité de customiser un schéma et donc de modifier les attributs autorisés dans un certain contexte, il s’agit malgré tout d’une solution plus lourde et supposant un degré plus important d’écart par rapport aux Guidelines. Si l’évolution par rapport à ces derniers est nécessaire, pour toutes les raisons exposées dans la première partie, il ne reste pas moins important de maîtriser l’éloignement, autant que faire se peut. L’utilisation de ‹stage›
pour des didascalies internes est inhabituelle, mais pas contraire à l’esprit de la TEI, et dramaturgiquement parlant rien ne semble l’interdire.
Outre l’attribut type
, il est proposé d’équiper les didascalies avec un attribut d’identification non-ambiguë (xml :id) et un autre analytique (ana). Ce dernier pourrait prendre les valeurs suivantes, éventuellement complémentaires, et non plus exclusives les unes des autres :
- SPC : la didascalie intervient dans la gestion de la parole, en précisant surtout à qui on s’adresse (« à Mme la Comtesse », « Madame », etc.). Elle peut également servir pour marquer les demandes de prise de parole, les reprises de locution, etc. (« Écoutez-moi » ; « Il reprend », etc.).
- ASP : la didascalie signale un costume ou un autre élément permettant de comprendre l’aspect du personnage (« porte une épée », « un bouquet de fleurs à la main », etc.).
- TMP : la didascalie ancre l’action dans une époque, un moment plus ou moins précis, ou intervient dans la précision de l’ordre des tours de parole et des événements (« De nos jours », « c’est aujourd’hui votre fête » ; « après avoir réfléchi », etc.). Les informations d’ancrage temporel sont, il est vrai, souvent agglutinées avec les informations de localisation, formant un ensemble espace-temps, et de ce fait leur séparation peut être considérée artificielle. Il ne s’agit toutefois pas d’une innovation : l’élément
‹set›
actuellement disponible dans la TEI, ainsi que la valeur « setting » mentionnée plus haut font exactement la même chose, favorisant seulement l’espace au détriment du temps. En proposant une valeur spécifiquement dédiée au temps, et une autre à l’espace (v. infra), je ne fais qu’équilibrer le système. - EVT : la didascalie indique l’occurrence d’un événement non-verbal, qui vient interrompre ou accompagner l’interaction. Cet événement peut être une entrée ou une sortie, un mouvement d’un personnage, mais aussi un geste, un son, ou un changement de décor. On peut objecter qu’il s’agit là de phénomènes fort différents, et que l’on pourrait souhaiter isoler par sous-catégorie pour pouvoir analyser le fonctionnement de la pièce. En pratique, cela mène à une multiplication des catégories qui rend difficiles les comparaisons, dans la mesure où chaque classe est illustrée finalement par un très petit nombre d’unités.
- SET : la didascalie indique une liste de participants à l’interaction et/ ou des éléments de décor, ancre l’action dans un espace géographique plus ou moins réaliste, précise des accessoires.
- PROX : la didascalie précise le positionnement des personnages les uns par rapport aux autres, ou en fonction d’éléments du décor.
- ATT : la didascalie précise une intonation ou autre modalisation du dire, elle indique une mimique ou une attitude qui donnent une information à propos des sentiments, des motivations, des intentions du personnage.
- VOI : la didascalie précise une particularité sociolinguistique (accent, débit), ou signale une activité para-verbale (soupir, chant, rire, lecture, scansion, etc.).
Les deux premières valeurs (SPC et ASP) permettent d’analyser comment les didascalies aident à répondre à la question « qui interagit ». TMP et EVT répondent à la question « quand ». SET et PROX se rattachent à l’élucidation du « où ». Enfin, ATT et VOI tentent de capter la façon dont les didascalies convoient à la fois des éléments qui sont de l’ordre du « pourquoi » et des éléments qui sont de l’ordre du « comment ».
Toute didascalie, sauf TMP et SET dans certains cas, doit être, en outre, annotée avec l’attribut who, permettant de savoir qui réalise l’acte de parole, le déplacement ou l’autre type d’évènement annoté. Si celui-ci n’est pas attribué à un acteur précis, on peut envisager la création d’une valeur « on », ou « inconnu » (p. ex., pour « On apporte une table »). Par ailleurs, les didascalies marquées comme participant à la gestion de la parole ou marquant un événement peuvent recevoir l’attribut toWhom, permettant de préciser la direction du dialogue, ou le patient du geste effectué par un acteur.
Quatre autres attributs, déjà existants dans la spécification TEI, peuvent enfin être utilisés pour l’annotation :
- sync : peut permettre d’annoter le « scope », tel que défini par Thierry Gallèpe. Cet attribut peut être implicite, et avoir par convention la valeur CONC (pour « concomitant »), indiquant que la didascalie porte sur la réplique en cours. On ne signalerait donc que les valeurs exceptionnelles, comme PAST (didascalie portant sur une réplique précédente), FUTR (didascalie portant sur le futur), ou GLOB (didascalie portant globalement sur l’interaction).
- corresp : à utiliser avec les didascalies internes afin de signaler leur correspondance avec une didascalie explicite. Une sortie annoncée par les propos des personnages, puis suivie de « Il sort » serait dans ce cas, mais aussi bien la situation de contradiction citée dans la première partie de cet article, où les personnages de Becket s’exhortent à sortir, tandis que la didascalie précise qu’il n’en est rien. Une telle annotation permettrait d’observer le taux de redondance entre DE et DI, ainsi que d’analyser plus globalement leurs rapports.
- cert : à défaut d’inventer un attribut ad hoc, il permettrait d’annoter le degré de « contrainte », puisqu’il est doté de quatre valeurs (« high », « low », « medium », « unknown ») qui sont assez proches de celles proposées par Th. Gallèpe pour cet aspect. On serait toutefois, dans ce cas, devant une certaine forme d’abus de cet attribut, qui sert dans la TEI à indiquer le degré de certitude de l’annotateur quant à l’analyse proposée via l’élément auquel cert se rattache. Ceci est d’autant plus gênant que l’annotation des didascalies internes peut mener à des situations où l’annotateur n’est effectivement pas certain de la pertinence de l’observable qu’il crée, et peut sentir le besoin de l’indiquer au moyen de ce mécanisme. Moins que d’une recommandation, il s’agit donc ici d’indiquer simplement une possibilité.
- next/ prev : dans certains cas, les didascalies internes s’étendent sur deux vers, ou posent d’autres problèmes potentiels de conflit de hiérarchies XML. Afin de contourner ce problème, tout en préservant l’intégrité du segment porteur de sens, on peut utiliser ce mécanisme de liaison prévu par la TEI, et utilisé dans de nombreux autres cas similaires. Il paraît recommandable, dans ce cas, d’utiliser uniquement « xml :id » et « prev » sur le second segment de la didascalie (sans reprendre ana, type, etc.), afin de ne pas alourdir inutilement l’exercice.
Une dernière proposition est d’annoter comme didascalie séparée chaque syntagme verbal avec ses compléments, au lieu d’annoter au niveau de la phrase, comme on le fait sur la base de l’homothétie avec l’imprimé. Cette pratique a le désavantage de multiplier le nombre de didascalies, et donc d’attributs à utiliser, mais permet de réduire les caractérisations multiples (concaténation de valeurs d’ana), ainsi que les doutes au sujet de la valeur à attribuer.
Cette liste assez longue d’attributs devrait assurer une grande expressivité à l’annotation des didascalies. En revanche, elle présente l’inconvénient d’une certaine lourdeur de mise en œuvre. En fonction des objectifs de chaque projet, on peut toutefois concevoir l’allègement d’une partie de l’appareil – en laissant de côté, par exemple, outre le degré de certitude dont on a signalé plus haut les difficultés, l’annotation des correspondances, et peut-être même celle de la synchronicité ou de la direction de la parole/des gestes.
L’annotation des didascalies internes, jamais pratiquée à ma connaissance, risque à son tour de donner lieu à de multiples hésitations. Comme dans les interactions verbales courantes, toutes les actions ou organisations du monde « programmées » par les didascalies internes ne se réalisent pas – que l’on prenne comme mesure de cette réalisation les actions que l’on peut inférer à partir du texte, ou que l’on se réfère à des spectacles réalisés à partir du texte. En effet, le dramaturge lui-même peut indiquer, par un autre système (textuel ou para-textuel), que certains scenarios imaginés par les personnages ne se réalisent pas – sans mentionner la réinterprétation susceptible d’être réalisée par les metteurs en scène au sujet du jeu souhaitable, de l’organisation du plateau, de l’aspect, de la mimique, des costumes des personnages, etc. Un des objectifs d’une telle annotation serait d’ailleurs de disposer d’un ensemble d’éléments textuels que l’on pourra aligner et confronter avec des choix de mise en scène, afin d’observer quels actes, gestes, décors, mouvements décrits par le texte restent en place, et ce qui change au fil du temps et/ ou selon les partis-pris esthétiques. Mais faut-il retenir, pour cette confrontation, uniquement les éléments « confirmés » par un autre aspect du texte, ou bien faut-il ratisser large ? Un exemple extrait d’Arlequin poli par l’amour permettra de mieux saisir la difficulté. À la scène 17, la Fée en colère contre Silvia appelle ses aides, afin de punir la bergère qui a su plaire à son amant : « Paraissez, esprits infernaux ; enchaînez-la, et n’oubliez rien pour la tourmenter. » Le premier verbe, à l’impératif, suggère une entrée ; « esprits infernaux » indique quels sont les personnages attendus et dirige la parole ; les deux autres verbes, enfin, programment une suite de mouvements et de gestes. Cependant, rien de tout ceci n’aura réellement lieu, puisque Silvia, intimidée, accepte le marché que lui propose sa puissante rivale ; on peut même supposer que la Fée n’avait aucune intention de supplicier véritablement la bergère, et qu’en tout cas de telles actions n’avaient pas vocation à être montrées sur la scène, du moins à l’époque de Marivaux. À s’en tenir à une approche restrictive, qui laisserait de côté ces suggestions non effectives, on risque toutefois d’appauvrir le texte, et peut-être de passer à côté d’éléments fructueux dans la perspective d’un alignement avec les pratiques des artistes.
Comme il a déjà été mentionné plus haut, si elles posent les bases d’une pratique, les propositions faites plus haut ne prétendent pas régler tous les aspects qu’un guide d’annotation d’un corpus précis doit aborder. Jusqu’où faut-il aller dans l’annotation des didascalies internes reste, par exemple, une question à régler à l’intérieur de chaque projet. Dans certains, on s’en tiendra strictement à ce que (Krazem 2009) appelle « des commentaires d’événement ». Dans d’autres, on leur ajoutera les onomatopées, qui suggèrent des réactions physiologiques (rire, pleurs) ou des réalisations vocales (chant, modulation), et peut-être même des éléments prosodiques que l’on peut inférer à partir de la ponctuation15. Sur ces points, moins que le cadre théorique et les possibilités pratiques des outils digitaux, ce sont les objectifs scientifiques des investigateurs et leurs ressources matérielles qui conditionnent les décisions.
Enfin, notons que le schéma proposé soulève la question des interactions, ou des conflits et redondances possibles, avec d’autres schémas susceptibles d’être appliqués au texte de théâtre. L’identification des tours de parole et de la direction des propos risque ainsi de se superposer, dans une certaine mesure, avec l’identification des entités nommées, ou des chaînes de co-référence, susceptible d’être pratiquées sur un texte de théâtre. De même, aspect et attitude peuvent s’intégrer dans un relevé des éléments de caractérisation des personnages, posant dès lors la question de la double caractérisation des segments qui les portent (à la fois en tant que didascalies, et en tant qu’éléments de caractérisation). Sans allonger la liste, observons de nouveau qu’une perspective globale sur l’annotation du texte dramatique, qui prenne en compte l’ensemble des approches possibles et des besoins informationnels dont elles ont besoin, reste à construire, l’annotation des didascalies ici proposée n’ayant eu pour but, comme indiqué dans l’introduction, que de poser un premier jalon en direction d’une annotation sémantique qui ne parte plus exclusivement de la matérialité du texte et des systèmes typographiques de manifestation d’informations.
Conclusions
À l’heure de la multiplication des projets numériques, le schéma d’annotation ici proposé se veut une contribution qui ramène la discussion sur le travail digital dans la communauté des études sur le spectacle, où elle a finalement trop peu lieu. Conçue principalement pour répondre à des problèmes identifiés lors de l’annotation du théâtre européen de la période moderne, la liste alternative de valeurs proposées pour classifier les didascalies n’a pas de prétention d’exhaustivité, ni d’universalité. La création d’une liste propre à un projet, adaptée à des auteurs ou des textes spécifiques reste toujours possible, voire recommandée. Cependant, en plein développement des « distant readings », qui brassent de grands volumes de texte et visent à comparer des pratiques de pays, d’époques et de genres différents, la convergence vers un vocabulaire commun est nécessaire, et la liste proposée se veut une contribution en ce sens.
Quel est l’impact de l’abandon de l’annotation « traditionnelle », c’est-à-dire se limitant aux didascalies explicites et ayant recours au jeu de valeurs suggéré par la TEI ? S’il est trop tôt pour répondre de façon définitive à cette question, on peut noter déjà – à partir de mes propres projets d’annotation du théâtre de Louis de Boissy et de Marivaux - une augmentation significative du nombre d’ « events » dans l’échantillon travaillé, là où ce sont plutôt les « deliveries » qui enregistraient les plus grand scores avec le schéma traditionnel. Or, ce phénomène peut être interprété comme une preuve de la pertinence du schéma proposé : plutôt que dialogue dont le déroulement serait géré par des didascalies, le théâtre n’est-il pas « drama », action, une action imaginaire que l’auteur convie le spectateur à mettre en œuvre, ou action que metteur en scène et comédiens retravaillent à leur façon ? Le déplacement des accents peut contribuer à une perception autre du théâtre, et de ce fait améliorer, peut-être, les lectures que l’on est susceptible d’en faire.
Il ne reste pas moins vrai que l’annotation des didascalies internes repose sur une grande part de subjectivité. Classer une didascalie parmi les « event » ou les « proxemy », décider s’il s’agit d’une « attitude » ou d’une « voice » n’a rien qui va de soi, et quelques exemples donnés plus haut ont montré à quel point la décision est parfois délicate. Mais il n’y a là, après tout, rien qui sorte véritablement du cadre du travail en sciences humaines. Les éditeurs scientifiques ne sont-ils pas habitués, depuis des décennies, à engager leur responsabilité lorsqu’ils publient une version d’une œuvre ? L’éditeur numérique sera, de même, jugé sur la pertinence de son identification des didascalies internes et de son classement de l’ensemble des « stage directions » . Et, tout comme la philologie a su créer, dans le temps, ses traditions de travail et de présentation qui permettent d’apprécier la qualité de cet engagement, il revient aux études théâtrales et littéraires en régime numérique de mettre au point leurs propres pratiques et leurs cadres critiques permettant de tirer parti des possibilités de la dématérialisation pour une présentation plus riche des œuvres, proposant plus de nouvelles lectures et susceptible d’en stimuler d’autres.
Bibliographie
Bernanoce, Marie. 2007. « Pour une typologie de la "voix didascalique" : redonner figure à l’auteur de théâtre contemporain ». In La Didascalie dans le théâtre du XXe siècle. Regarder l’impossible, 47‑60. Dijon: Éditions universitaires de Dijon.
Calas, Frédéric, Romdane Elouri, Saïd Hamzaoui, et Tijani Sallaoui. 2007. Le Texte didascalique à l’épreuve de la lecture et de la représentation. Tunis, Bordeaux: Sud Éditions et PU Bordeaux.
Clement, Tanya. 2011. « Knowledge Representation and Digital Scholarly Editions in Theory and Practice ». Journal of the Text Encoding Initiative, nᵒ 1 (juin). https://doi.org/10.4000/jtei.203.
Corvin, Michel. 2008. Dictionnaire encyclopédique du théâtre à travers le monde. Paris: Bordas.
Dompeyre, Simone. 1992. « Étude des fonctions et du fonctionnement des didascalies ». Pratiques 74 (1):77‑104. https://doi.org/10.3406/prati.1992.1665.
Gallèpe, Thierry. 1997. Didascalies. Les mots de la mise en scène. Paris: L’Harmattan.
Gallèpe, Thierry. 2007. « Le statut des didascalies ». In Le Texte didascalique à l’épreuve de la lecture et de la représentation, 22‑38. Tunis, Bordeaux: Sud Éditions, PU Bordeaux.
Gallèpe, Thierry. 2009. « Didascalies et énonciation : "je" interdits ? » In La Lettre et la scène : linguistique du texte de théâtre, 43‑57. Dijon: Éditions universitaires de Dijon.
Gerbe, Marie-Rose. 2007. « L’appareil formel des didascalies et ses effets prototypants ». In Le Texte didascalique à l’épreuve de la lecture et de la représentation, 465‑78. Tunis, Bordeaux: Sud Éditions, PU Bordeaux.
Golopentia, Sanda, et Monique Martinez-Thomas. 1994. Voir les didascalies. Paris, Toulouse: CRIC et OPHRYS.
Krazem, Mustapha. 2009. « Les marques linguistiques du commentaire didascalique ». In La Lettre et la scène : linguistique du texte de théâtre, 123‑34. Dijon: Éditions universitaires de Dijon.
Martinez-Thomas, Monique. 2007. « Typologie fonctionnelle du didascale ». In La Didascalie dans le théâtre du XXe siècle. Regarder l’impossible, 35‑46. Dijon: Éditions universitaires de Dijon.
Moretti, Franco. 2014. « “Operationalizing”: or, the Function of Measurement in Modern Literary Theory ». The Journal of English Language and Literature 60 (mars):3‑19. https://doi.org/10.15794/jell.2014.60.1.001.
Pavis, Patrice. 2002. Dictionnaire du théâtre. Paris: Armand Colin.
Sort, Aurélia. 2009. « L’énonciation lyrique dans la tragédie du premier XVIIe siècle ». In La Lettre et la scène : linguistique du texte de théâtre, 137‑48. Dijon: Éditions universitaires de Dijon.
Tadier, Elsa. 2009. « Les "didascalies implicites" : l’exemple de Molière ». Coulisses, nᵒ 39 (décembre):43‑54. https://doi.org/10.4000/coulisses.966.
Tudoire-Surlapierre, Frédérique, et Florence Fix. 2007. La Didascalie dans le théâtre du XXe siècle. Regarder l’impossible. Dijon: Éditions universitaires de Dijon.
Viglianti, Raffaele. 2016. « Why TEI Stand-off Markup Authoring Needs Simplification ». Journal of the Text Encoding Initiative, nᵒ Issue 10 (décembre). https://doi.org/10.4000/jtei.1838.
Vodoz, Isabelle. 1986. « Le texte de théâtre : inachèvement et didascalies ». DRLAV. Documentation et Recherche en Linguistique Allemande Vincennes 34 (1):95‑109. https://doi.org/10.3406/drlav.1986.1038.
Wolowski, Witold. 2007. « Sur quelques formes de l’écriture didascalique ». In La didascalie dans le théâtre du XXe siècle. Regarder l’impossible, 21‑33. Dijon: Éditions universitaires de Dijon.
Wolowski, Witold. 2009. « La facette de la paradidascalie : Sur la « didascalie » intégrée au dialogue ». Coulisses, nᵒ 39 (décembre):131‑44. https://doi.org/10.4000/coulisses.1467.
Voir en ce sens le site Théâtre classique, ou la « Bibliothèque dramatique » de l’OBVIL, consultée le 31 mars 2020.↩
La dernière version de ces recommandations figure sur Text Encoding Initiative, consultée le 31 mars 2020.↩
Comme celle de T. Clément, publiée significativement dans le premier numéro de JTEI (Clement 2011), ou, plus récemment, les considérations préliminaires de R. Viglianti (Viglianti 2016) dans son article sur le stand-off encoding.↩
Statut textuel complexe, voire inconfortable, comme le remarquent Thierry Gallèpe (Gallèpe 2007) et Marie Bernanoce (Bernanoce 2007), ce qui explique peut-être les difficultés de leur traitement en XML/TEI.↩
Voir la définition d’A. Ubersfeld : « On peut appeler didascalies tout ce qui dans le texte de théâtre n’est pas dialogue, c’est-à-dire tout ce qui est du fait du scripteur, directement. » (Corvin 2008, 434). P. Pavis préfère parler d’indications scéniques, mais les définit également comme « texte […] non prononcé par les acteurs et destiné à éclairer pour le lecteur la compréhension ou le mode de présentation de la pièce » (Pavis 2002, 172).↩
Voir la page Projects using the TEI, consulté le 31 mars 2020.↩
Voir Catalogue OAI du consortium CAHIER, consulté le 31 mars 2020 ; se référer également à la page des projets membres du consortium.↩
Voir sur le site Henrik Ibsens Skrifter, consulté le 5 avril 2020.↩
Voir sur le site Folger Shakespeare Library, consulté le 31 mars 2020.↩
Voir cette entrée publiée sur le site Projets EMAN, consulté le 5 avril 2020.↩
Voir cette entrée publiée sur le site LiCoRN, consulté le 31 mars 2020.↩
Il est vrai que l’attribut toWhom est récent dans la TEI, résultat de discussions ayant eu lieu entre 2017 et 2018, et d’une implémentation intervenue en juillet 2018, à en croire la discussion sur GitHub qui peut être consultée ici, consultation le 5 avril 2020. Réalisée en 2003, l’édition Folger du théâtre de Shakespeare n’a pas pu disposer de cet attribut.↩
Un autre exemple de difficulté similaire est celui de la description des didascalies selon le « regard » qu’elles supposent (extra-scénique/ intra-scénique/ mélange des deux), que propose (Martinez-Thomas 2007).↩
Les « didascalies de la source locutoire » ne sont pas annotées en tant que
‹stage›
dans la TEI, mais en tant que‹speaker›
à l’intérieur d’un tour de parole (« speech », annoté‹sp›
). Pour obtenir la liste de l’ensemble des didascalies, il faudra donc lancer une requête qui regroupe‹speaker›
et‹stage›
. Avec l’introduction de‹seg›
, on aurait une requête qui devrait demander à la fois tous les‹sp›
, tous les‹speaker›
et tous les‹seg›
. Si rien de ceci n’est infaisable, c’est bien évidemment plus lourd. L’annotation avec le même élément a, en outre, l’avantage de manifester clairement leur proximité, voire similitude, sur un plan conceptuel.↩Des signes d’exclamation ou d’interrogation peuvent, en effet, être vus comme des moyens traditionnels, et fort économiques, d’annoter le dit précisément dans le sens d’une « programmation » de sa réalisation effective. Tout comme dans le cas des didascalies internes, certaines de ces informations apportées à travers la ponctuation sont explicitées par des didascalies « externes » : dans la pièce mentionnée plus haut, un complément circonstanciel de manière (« en colère ») complète et explicite ce que nous suggère le signe d’exclamation dans « Vous osez me résister ! ».↩