À chacun son dialogue national. Analyse multimodale du vidéoblogue « 03 minutes du peuple »

Mohamadou Ousmanou

 

Introduction

Les plateformes internet offrent un nombre de possibilités d’interactions technodiscursives aux internautes qui semblent difficilement réalisables dans la vie réelle. La « vie numérique », substitut de la « vie réelle », est dans ce cas de figure un monde fait de potentialités quasi illimitées. On voit très bien que la connaissance et le contrôle des plateformes jouent un rôle central pour un pays qui souhaite émerger. Au-delà des enjeux géostratégiques, il faut aussi y voir les possibilités offertes pour la création, l’éducation, l’économie, bref le développement humain.

L’étude a pour corpus le programme Trois minutes du peuple (3MP), vidéoblogue[1] conçu et présenté par Steve Fah. Le numéro retenu ici est consacré au grand dialogue national (GDN), organisé du 30 septembre au 4 octobre 2019 au Cameroun pour trouver des solutions à la crise dans les régions du Nord-Ouest et du Sud-Ouest. Ce programme, qui connaît une popularité importante au Cameroun[2], constitue un exemple de construction technodiscursive s’inscrivant dans la mouvance de nouvelles plateformes médiatiques qui s’emparent des questions d’actualité. Son principal ressort est la satire, mais une satire qui mêle d’autres genres discursifs.

L’approche adoptée se veut multimodale. Elle s’intéresse autant aux éléments discursifs, gestuels que technographiques[3]. La vidéo, d’une durée de 7 minutes et 21 secondes, a fait l’objet d’une transcription et d’une annotation au moyen du logiciel ELAN. Les acteurs retenus sont le présentateur-vlogueur (Steve Fah) et les personnages apparaissant dans les extraits de vidéo que nous nommons « invités ». Les annotations concernent les pistes suivantes :

(a) les propos (nommés respectivement Steve Discours et Invités-Discours) pour les deux protagonistes;

(b) la gestualité pour le présentateur (Steve_Posturo-mimo-gestuel);

(c) la cohérence technodiscursive du vlogue (Invités_Contexte).

Les pistes (b) et (c) sont dotées de vocabulaires contrôlés. Il s’agit des mouvements de la tête, du regard et la mine du visage pour (b); du contexte rapproché et du contexte décroché pour (c). Étant donné le caractère satirique du discours, nous avons souhaité mesurer, par le biais de ce dernier paramètre, la cohérence technodiscursive en rapport avec le contexte (sujet traité, propos tenus par les intervenant·e·s, situation d’énonciation). Ce qui permet d’envisager les éléments de décalage et de grossissement, caractéristiques de la satire.

Dans cette étude, nous proposons une description du vlogue en tant que nouvel artéfact qui, de plus en plus, s’est en quelque sorte imposé dans la vie des citoyen·ne·s. Préalablement, une réflexion épistémologique, à la fois sur les questions de justice cognitive et d’éthique, tente de frayer des chemins à la linguistique du développement afin qu’elle fasse sienne des questions liées au discours numérique.

Le discours numérique : quels enjeux pour la linguistique du développement?

3MP est un vlogue, genre de communication médiatisée par ordinateur (Combe, 2019). Selon la typologie de Paveau, il ressortit aux technogenres de discours prescrit, par opposition aux technogenres négociés. Dans le premier cas, il s’agit « des genres de discours proposés dans les systèmes d’écriture en ligne et fortement contraints par les dispositifs technologiques » (Paveau, 2017, p. 301). En effet, le média (vidéo) comporte des contraintes de format, notamment. Les numéros du programme durent entre 5 et 7 minutes, et les extraits de vidéos font moins d’une minute. Mais ces contraintes techniques sont comme compensées par les effets induits grâce aux possibilités offertes par le média en termes d’affordance, car le vlogue est un technodiscours multimodal : une pluralité de modes ou de ressources sémiotiques multiplie les possibilités dans la production et le façonnage du discours, exploitables par les vlogueurs et vlogueuses. En tant que technodiscours multimodal, 3MP exploite les ressources de l’oral et de l’écrit, le son, le texte, l’image, la conjonction lecture-écriture, les technographismes, etc. Il est relativement aisé d’identifier le registre classique et prénumérique dans lequel s’inscrit le programme : la satire sociale. Il en possède les principales caractéristiques : déroulement sous la forme narrative, description critique, visée moraliste, grossissement ou transformation des faits, humour et parodie, etc. On voit bien que les technodiscours ne se substituent pas aux discours prénumériques en les annulant, mais plutôt ils les transforment en recourant aux possibilités techniques nouvelles.

L’émergence des technodiscours dans les sociétés africaines semble imposer un saut à la fois quantitatif et qualitatif dans le macrocosme communicatif global. Entre impréparation et tentatives d’adaptation, les communautés sont ainsi forcées à l’appropriation de ces outils qui prennent de plus en plus une place importante dans leur vie au quotidien. Cette appropriation passe par la connaissance approfondie et le contrôle des mécanismes de fonctionnement à la fois des outils et des dispositifs. La linguistique du développement, qui s’appréhende comme « ce processus holistique qui apporte un mieux-être à l’humain sur les plans prioritaires de la santé, de la sécurité alimentation, de l’éducation, etc., et qui permet une évolution globale de la société » (Métangmo-Tatou, 2019, p. 7), fournit les outils conceptuels et pratiques aptes à répondre aux défis que soulèvent les technodiscours.

Une linguistique préoccupée par l’amélioration des conditions de vie des populations doit pouvoir poser les questions suivantes : quels sont outils de communication disponibles et accessibles pour les populations? Quelles connaissances ont-elles de ces outils? Quelle est la nature des rapports que ces outils entretiennent avec les cultures, croyances et traditions locales? Quel est le coût à la fois technologique, financier et humain de l’adoption de ces outils?

De l’appropriation à la visibilisation numérique

À l’observation, la contribution du web à la démocratisation du monde, dans divers domaines, est importante : plateforme d’échanges, liberté d’expression, accès libre à des savoirs, etc. Cependant, cette avancée s’accompagne d’un revers que l’on ne saurait nier. En effet, le web est aussi le lieu d’observation par excellence d’une forme de domination sociétale et culturelle indéniable. Plus récemment encore, on a pu observer dans différents pays, le rôle central joué par les réseaux sociaux dans la construction des mouvements populistes. Ils ont largement contribué à amplifier des campagnes de discrédit des instructions politiques, et même scientifiques[4].

Parmi les effets potentiellement dévastateurs de la mondialisation, l’unification linguistique – sans parler de l’anglicisation – des sociétés et des cultures a souvent été considérée comme le plus dangereux [sic]. Si dangereux, en fait, que des sommets internationaux sur la diversité culturelle et linguistique ont été organisés et que des efforts considérables ont été faits pour mettre un frein à l’homogénéisation culturelle (Osborn, 2011, p. XI).

En effet, il est aisé de constater que les contenus web proposés sont diffusés largement dans une langue dominante, l’anglais. L’on sait aujourd’hui que ces choix relèvent de la volonté politique, s’appuyant, entre autres, sur l’argument selon lequel telle langue donne une meilleure visibilité, ou encore le désir d’exercer de l’attrait à l’international. De nombreuses voix qui réclament, de nos jours, le respect de la diversité linguistique et culturelle ont montré que l’unification culturelle et le monolithisme linguistique mènent à l’invisibilisation des communautés. Et c’est là, une grande injustice cognitive.

Il revient alors à la linguistique du développement de veiller à ce que les langues et les cultures, dans leur diversité, soient représentées dans les espaces discursifs, notamment les discours numériques. Il est du ressort du linguiste d’interroger et d’interpeller les citoyen·ne·s, ainsi que les responsables, sur les questions de protection, de promotion des langues et des cultures. De nombreuses initiatives ont été lancées dans ce sens ces dernières années. On peut citer « Idemi[5] : ma langue compte! », l’Initiative d’Helsinki sur le multilinguisme dans la communication savante[6], le Manifeste pour la reconnaissance du principe de diversité linguistique et culturelle dans les recherches concernant les langues[7]. Par ailleurs, dans le cas spécifique du discours natif en ligne, il y a effectivement une dimension anthropologique du langage qui n’est pas négligeable. On sait, à partir des travaux de Bornand et Leguy (2013) par exemple, que l’étude des pratiques langagières fournit un accès à des renseignements non négligeables sur les communautés; une approche anthropologique des pratiques technolangagières est donc utile[8]. Ainsi, les éléments de ritualisation des vlogues ne sont-ils pas pertinents de ce point de vue?

Mais au-delà de ces aspects liés aux pratiques et aux activités des internautes, ce sont les interactions qui se nouent entre les nouveaux artéfacts et les traditions qui nous semblent soulever des préoccupations importantes. Les individus, tout comme les communautés, s’identifient généralement à travers un système de valeurs et de croyances. Dans le cas des sociétés africaines, la question semble encore plus sensible dans la mesure où les pratiques culturelles paraissent visiblement être en déphasage avec l’univers numérique et certaines innovations technodiscursives. Il est sans doute utile de se demander quels changements ces outils introduisent dans la vie des citoyens et citoyennes. Comment ceux-ci et celles-ci s’y adaptent? Au prix de quels sacrifices?

La question éthique comme pan de la justice cognitive

Une éthique technodiscursive doit pouvoir s’intéresser aux rapports entre les discours et les valeurs sociétales. Elle renvoie à « l’ensemble des critères d’acceptabilité des discours produits sur internet par rapport aux valeurs reconnues par les usagers dans un espace et dans un temps donnés » (Paveau, 2016, p. 178). La problématique de l’éthique du discours numérique couvre un ensemble assez large de préoccupations : le rapport à la vie privée des usager·e·s, le rapport à la notion de vérité, le respect des droits d’auteur et d’autrice, les formes de cyberviolence. Nous considérons alors que les réflexions sur l’éthique discursive font partie intégrante de la problématique de la justice cognitive[9] dans la mesure où elles confrontent les innovations scientifiques et technologiques avec les valeurs sociales attachées aux populations locales. Il faut inverser la conception selon laquelle les connaissances issues de ces communautés soient « considérées comme de l’ethno-science, de la superstition ou plus brutalement, du non-savoir. “Pré-scientifique” est un mot qui est souvent utilisé en parallèle avec « sauvage » ou « primitif » (Shiv Visvanathan, 2016, paragr. 13).

Dans la même perspective, Paveau (2016) parle d’une « décence technodiscursive » qui permettra, par le biais d’ajustement collectif des usager·e·s, d’éviter que des personnes soient l’objet d’humiliation, par exemple. En ce qui concerne 3MP, on peut bien remarquer des cas pouvant être assimilés à une humiliation des personnalités publiques : ministres, Président de la République entre autres.

En outre, les discours numériques en ligne bousculent également certaines conventions conversationnelles, notamment celles qui concernent la théorie de la politesse. L’usage du tutoiement, dans 3MP, illustre bien une forme de transgression rendue possible grâce au dispositif de vlogue. On aurait pu dire qu’il en est ainsi des autres formes de satire sociale, mais on sait aussi que certains éléments comme l’anonymat, le pseudonymat, l’hétéronymat[10] et le caractère virtuel, c’est-à-dire la non-présence physique, sont des facteurs susceptibles de modifier significativement les rapports entre individus au cours des échanges (Paveau, 2016).

Une production technodiscursive comme 3MP pose des problèmes quant à son statut juridique. Doit-on la considérer comme une œuvre artistique? Les extraits de vidéo pris çà et là deviennent-ils la propriété du vlogueur? Les propos tenus par les intervenant·e·s, qu’ils soient fidèles ou transformés, appartiennent-ils au vlogueur? Les informations diffusées sur les personnes sont-elles conformes à la réalité? Consentent-elles à cette diffusion? Les opinions politiques exprimées sont-elles assumées, et par qui? Quelle répartition aux contenus des vidéos vis-à-vis de la distinction privé/public? Quelle place faut-il réserver à l’extimité[11]? C’est-à-dire cette pratique qui « consiste sur internet, et tout particulièrement sur les réseaux sociaux numériques du web participatif, en l’extériorisation de l’intimité des internautes à des fins de validation de l’image de soi » (Paveau, 2017, p. 185). Dans le cas de la vidéo que nous analysons, le montage de plusieurs séquences issues de différences sources tend à brouiller les frontières entre l’intime et le public. Ainsi, la scène de l’inondation (00 : 19)[12], celle de la vedette de la musique qui se plaint du froid (00 : 25) ont quelque chose qui relève de l’extimité. Elles présentent la particularité d’exposer des aspects de la vie personnelle des protagonistes, en s’écartant ainsi du sujet principal de la vidéo qui est le grand dialogue national.

Le grand dialogue national vu par 3MP

Depuis le mois d’octobre 2016, les régions du Nord-Ouest et du Sud-Ouest connaissent une crise qui a engendré de sérieux problèmes de sécurité. Ce qui commença par des manifestations d’avocat·e·s et d’enseignant·e·s s’est transformé, au fil du temps, en bataille tragique entre les forces de sécurité et les séparatistes[13]. Dans un discours diffusé le 10 septembre 2019, le Président de la République convoque un grand dialogue national afin de trouver des réponses à cette crise. Le numéro des 3MP[14] sur lequel porte la présente étude s’inspire alors de ce contexte du GDN tant réclamé, et tant attendu. Il s’agit d’une construction, ou alors d’une mise en scène fictive de ce GDN, qui s’est tenu du 30 septembre au 4 octobre 2019 au palais des congrès de Yaoundé[15].

Une composition proleptique du GDN : participants et rôles sociaux

Les artéfacts numériques ont la particularité de renforcer l’affordance en augmentant les activités et les capacités cognitives. En tant que dispositif multimodal, le vidéoblogue permet au produsager[16] de réaliser une foultitude d’actions : son, texte, image immobile et/ou fixe, montage, etc. Il est un outil au service de l’inventivité humaine. Dans le cas de 3MP, on voit bien que des extraits de vidéo pris çà et là sur les réseaux sociaux constituent le matériau sur lequel se bâtit le récit. Bien évidemment, ce matériau lui-même est déjà un contenant qui renferme des personnages, des lieux, un décor, une ambiance. Tous ces éléments technodiscursifs mis ensemble selon une chronologie narrative n’obéissent pas forcément à la cohérence de la situation d’énonciation de production d’origine puisqu’ils ont été déplacés de ce contexte et entrent dans une composition toute différente. Autant ces objets produisent du sens dans leur contexte de départ, autant on leur ajoute de nouvelles significations dans de nouveaux contextes. Dans la conception des 3MP, on repère les opérations technodiscursives suivantes :

(1) élaboration d’un script vidéo;

(2) sélection des extraits de vidéos;

(3) montage de l’ensemble.

L’opération (1) est une activité préproduction qui permet non seulement de donner corps à l’histoire, mais prévoir tous les plans et les effets souhaités par le vlogueur. L’opération (2) elle-même est une opération complexe : elle nécessite le visionnage d’un ensemble de vidéos, le choix des extraits à exploiter et l’arrangement. En (3), il n’y a pas la seule opération d’assemblage, c’est-à-dire une conjonction entre « du langagier et du technique » (Paveau, 2017, p. 65), mais également un travail sur la cohérence multimodale à travers les différents processus (la composition, le dialogue, les liens d’information, le rythme) (Leeuwen, 2004) ou alors dans une relation de type motivation (Adami, 2009).

Le caractère composite des vidéos de 3MP fait qu’il n’est pas aisé de hiérarchiser ces opérations technodiscursives. Si on part du principe que chaque scénario de 3MP s’inspire des faits issus de l’actualité politique au Cameroun, on peut considérer que la construction du scénario précède la sélection des extraits de vidéo. Cependant, il n’est pas du tout exclu que la récurrence d’une série de vidéos portant sur un sujet donné et postées sur les plateformes numériques conduise le vlogueur à consacrer un numéro sur le thème. C’est notamment le cas des toutes premières diffusions des 3MP.

Le GDN mis en scène dans les 3MP se veut une image vraisemblable de la situation sociopolitique camerounaise. L’un des aspects de cette scénarisation du dialogue est la volonté de respecter une certaine représentativité des différentes catégories socioprofessionnelles parmi les protagonistes.

Tableau 1. Les participants au dialogue par catégories

Annotation Occurrences Fréquence
Anonyme 14 0.0317
Artiste 7 0.0158
Commerçant·e 2 0.00453
Journaliste 3 0.00679
Politique 60 0.1359

La part du discursif dans la satire multimodale : ritualisation, mémoire technodiscursive et impertinence

L’un des points forts de la critique des 3MP est le problème de la représentativité du GDN. En effet, la mise en place de personnages issus de divers domaines et catégories sociales dans le vlogue contraste avec l’approche sélective du GDN où sont intervenues quelques personnalités choisies par les organisateurs et organisatrices. Cette restriction s’observe également au niveau du thème des échanges : la crise dans les régions du Nord-Ouest et du Sud-Ouest. On entend d’ailleurs l’un des intervenants affirmer que la crise ne se limite pas à ces deux régions. La satire est le lieu où cohabitent les contradictions : négation et affirmation de l’existence d’une crise, interdiction des débats médiatiques sur la question et désir d’organiser un dialogue, promesses politiques non tenues, entre autres.

La scénarisation dans 3MP tient sa force dans sa capacité à reproduire une scène énonciative ayant les caractéristiques d’un échange réel. Les éléments de la composition du dialogue national incluent les rituels et les routines des conversations naturelles. La fonction jouée par les rituels conversationnels[17] est d’assurer « aux partenaires de la conversation le maintien de l’ordre social et leur reconnaissance mutuelle en tant que membres respectables de la société » (Heinz-Helmut, 1993, p. 16). Parmi ces éléments de ritualisation, les énoncés d’ouverture et de clôture figurent en bonne place. 3MP s’ouvre presque toujours par « salut c’est Steve Fah » et se referment par « épicétou[18] ». Les routines technodiscursives mises en place par le vlogueur servent aussi à instaurer une forme de connivence avec le téléspectateur ou la spectatrice. D’ailleurs, elles assument, comme le souligne Traverso, une fonction intégrative dans la mesure où « elles permettent de s’intégrer dans le groupe social et d’en renforcer les valeurs » (2007, p. 54). Ainsi, la relation qui se noue entre le présentateur-vlogueur et les téléspectateurs et téléspectatrices s’apparente à une forme de régulation coénonciative par laquelle le premier anticipe et ajuste ses comportements langagiers vis-à-vis d’un public dont il connaît les préférences, les réactions et les valeurs; en tant que membre de la communauté numérique, il en connaît les principes et le fonctionnement.

On est donc dans une opération d’ajustement coénonciatif à deux niveaux. Le premier concerne l’interaction vlogueur-personnages; cette connexion est purement et simplement fictive d’autant plus qu’il s’agit d’une construction virtuelle. Mais cette virtualité est d’une forme complexe, ne se ramenant pas strictement à l’opposition vrai/faux. En effet, les personnages apparaissant dans les extraits de vidéo existent réellement et certains sont même des personnalités publiques; pareillement, les propos tenus sont les leurs. Toutefois, ceux-ci ont subi une transformation, plus exactement une décontextualisation, puis une recontextualisation. Donc, l’enjeu, relativement à la véracité des énoncés proférés, porte beaucoup plus sur la conformité plausible avec les circonstances dans lesquelles sont produits les énoncés que l’identité même de leurs énonciateurs ou énonciatrices. Ici, s’observe la force affordancielle de l’outil technologique qu’est le vlogue, dans la capacité qu’elle confère au vlogueur de détourner un discours pour lui faire signifier différemment.

Pour ce qui est de la seconde relation, elle se rapporte à l’interaction vlogueur-téléspectateur/téléspectatrice. Cette interrelation obéit également à un jeu d’ajustement qui possède une dimension discursive, notamment à travers les commentaires des internautes en réaction à la vidéo, et une dimension prédiscursive, de par la mobilisation « des cadres de savoir, de croyance et de pratique qui ne sont pas seulement disponibles dans l’esprit des individus et dans la culture des groupes […] mais sont distribués, au sens cognitif de ce terme, dans les environnements matériels de la production discursive » (Paveau, 2011, p. 4).

Sur le plan du discours, la répétition constitue une ressource de la déformabilité[19] discursive. C’est l’un des principaux ressorts de l’humour utilisé dans 3MP, pour ses effets amplificateurs. Aussi le vlogueur recourt-il à cet outil pour se moquer, ridiculiser ou tourner en dérision un personnage.

Exemple 1. Steve vs BAS[20] : de l’attaque à la resignification

 

Cette séquence montre que le vlogueur est bien suivi par les internautes. Il fait ici l’objet d’une attaque de la part d’un groupe d’opposant·e·s au régime en place. La reprise, dans son propre vlogue, d’une séquence vidéo où il est mis en cause permet au vlogeur d’en retourner le contenu discursif en sa faveur. La répétition technodiscursive sert donc à une resignification de l’acte de dénigrement, « c’est-à-dire d’inversion ou de renégociation sémantique et axiologique par recontextualisation d’énoncés insultants (verbaux, ou iconiques, ou composites […] avec un effet réparateur) » (Paveau, 2019, p. 111-112). En plus de l’intégration de cette image à son discours, le vlogueur en profite pour discréditer, à son tour, ses agresseurs et agresseuses. Pour ce faire, il reprend les incorrections grammaticales dans leur discours qu’il grossit grâce à la répétition de la séquence.

Exemple 2. Dévoilement des contradictions ou dénigrement?

La séquence ci-dessus cherche plutôt à confronter deux discours dont les énonciateurs sont liés politiquement. Si c’est le choix de mot (crise ou question) qui semble être le point de désaccord ciblé par le vlogueur, on ne saurait ignorer les aspects disqualifiant l’un des protagonistes. En effet, le personnage est connu des téléspectateurs et téléspectatrices des 3MP dans la mesure où il y avait fait des apparitions auparavant. Il se trouve alors que dans ces apparitions, il n’est pas toujours présenté sous une image valorisante.

La part du visuel dans la satire multimodale : gestes amples et position de la caméra

La dimension visuelle est fondamentale dans un vlogue. Les effets d’amplification sont avant tout visuels. Nous nous limiterons ici à la gestualité du vlogueur et aux mouvements face à la caméra. Précisons que 3MP est conçu comme une narration composite, avec des passages de commentaires du narrateur-vlogueur, des passages de dialogue entre ce dernier et « ses invités », c’est-à-dire les personnages apparaissant dans les extraits de vidéo. Les mouvements corporels, combinés aux positions face à la caméra sont mis à profit par le vlogueur comme ressort de la régulation coénonciative; la proximité participant d’un effet visuel amplifié. La mise en scène du dialogue épouse, naturellement, la structure technodiscursive se rapportant au genre, en ce sens qu’elle représente un échange de paroles, avec respect des tours de parole alternés. Ce principe d’alternance est ici facilité par le recours à la technologie. Dans les deux séries d’images suivantes, on peut observer comment fonctionne le dispositif technodialogal.

3MP, Steve FAh

L’extrait (a) est tiré de l’adresse du Président qui précise le cadre thématique du GDN qu’il vient d’annoncer. La réplique (b) qui est produite en réaction à cet extrait est une intervention différée dans la mesure il n’y a pas eu d’interaction directe entre les deux protagonistes. C’est donc par le biais des ressources technologiques (le montage) que le dialogue s’obtient. Si, dans ce cas précis, l’échange prend l’allure d’un dilogue fictif (interaction entre deux protagonistes), il reste qu’il n’en est véritablement pas un. En fait, on a seulement affaire à une confrontation de points de vue, sans possibilité de réplique effective. C’est donc une construction due à l’auteur du vlogue.

3MP, Steve Fah

La séquence met en scène deux hommes politiques appartenant au même parti. Le premier (c1) réfute la dénomination de crise à la situation sociopolitique dans deux régions camerounaises. Il est question pour celui-ci de ne pas donner l’impression d’une situation grave; ce qui impliquerait une certaine responsabilité de ceux et celles qui gouvernent dans cette gravité. Le choix du terme « question » relève alors d’une tendance euphémique. Toutefois, l’énoncé (e), proféré par son supérieur hiérarchique, contredit sa démarche. Le vlogueur en profite pour mettre en lumière cette contradiction en confrontant les deux propos et leurs énonciateurs. Sa réaction empreinte d’étonnement est produite en (d2).

Comme c’est le cas en communication multimodale, le cadrage constitue une ressource de construction de sens importante. Dans le cas des 3MP, le vlogueur apparaît à l’écran en plan rapproché poitrine, alternant avec le gros plan. La variation des plans renforce également les mimiques qui accompagnent le discours du vlogueur.

3MP, Steve Fah

De la cohérence à la connivence technodiscursive

Les notions de cohésion et cohérence discursives permettent de rendre compte de l’organisation et de la structuration textuelle (Détrie et al., 2017). De la même manière que « n’importe quel assemblage de mots ne produit pas une phrase » (Charolles, 1978, p. 7), n’importe quel montage vidéo ne donne pas naissance à un vlogue. Au-delà de la cohérence linguistique traditionnelle, il faut y voir également les éléments qui ne relèvent pas du linguistique, au sens strict, mais qui font des vlogues des productions composites, dont la compréhension tient davantage à une cohérence de type technodiscursif. Dans une telle conception, le concept s’appréhende autrement que par le bout du seul discursif. Si l’on prend l’aspect thématique par exemple, on est amené à constater que les séquences vidéo des 3MP ne présentent pas d’unité thématique : elles sont délinéarisées de par l’enchaînement de séquences qui basculent à la fois les téléspectateurs et les téléspectatrices dans des cadres spatiotemporels, des décors, des sujets aussi différents les uns des autres. La délinéarisation constitue un trait spécifique du discours numérique natif (Paveau, 2017, p. 117).

Pour décrire ce phénomène, nous utilisons la théorie du repérage de Culioli (1990) que nous avons réaménagée quelque peu. Nous nous intéressons spécifiquement au fonctionnement du domaine notionnel qui, organisé autour d’une occurrence de référence, se répartit en trois zones : l’intérieur, l’extérieur et la frontière. La définition de ces zones correspond respectivement aux opérations énonciatives d’identification, de décrochage et de différenciation[21]. Ainsi, les paramètres de la situation énonciative (sujet, espace, temps) peuvent être soit en adéquation avec le thème du vlogue (contexte identifié), soit en rupture avec celui-ci (contexte décroché), soit, enfin, proche mais différent (contexte différencié). Le tableau qui suit présente les statistiques des annotations du repérage contextuel.

Tableau 3. Les paramètres du contexte d’énonciation

Annotation Occurrences Fréquence
Différencié 17 0.038
Décroché 21 0.047
Identifié 45

0.101

On peut le voir, les contextes identifiés sont les plus nombreux, avec 45 occurrences. Mais la présence des séquences à contextes différenciés et décrochés n’empêche pas la compréhension de la production dans son ensemble. Les contraintes linguistiques sont comme détournées par les moyens technologiques. La cohérence délinéaire est une autre forme d’organisation composite qui répond à une cohérence discursive autre. Les extraits de vidéo pris séparément appartiennent à des contextes d’énonciation particuliers, donc relevant chacun d’une cohérence discursive différente. Pris dans une composition, ils forment un ensemble discursif construit sur une nouvelle cohérence complexe. Cette cohérence repose aussi sur l’appareillage technologique. Par exemple, les interactions entre le présentateur-vlogueur et les personnages apparaissant dans les séquences vidéo ne tiennent qu’à une technique : le montage vidéo.

Par ailleurs, le discours du vlogueur tend toujours à agir sur le public de par l’anticipation des représentations coénonciatives, d’une part, et l’exploitation de la mémoire discursive en ligne, d’autre part. Les séquences vidéo utilisées notamment circulent beaucoup au sein de la communauté des internautes et à travers les réseaux sociaux. On peut y voir ici une reconfiguration des lieux communs. L’énonciataire-téléspectateur participe alors à la construction du sens. Il ou elle peut reconnaître les scènes, les décors, les personnages et leurs paroles pourtant proférées dans un autre contexte. C’est d’ailleurs cette circularité qui facilite l’instauration d’une connivence vlogueur-public. Rabatel parle d’une connivence-complicité, par opposition à la connivence-collusion-transgression.

Cette forme de connivence renvoie à une sorte de compréhension à mi-mots entre deux individus qui partagent les mêmes valeurs (esthétiques, idéologiques, morales, politiques, etc.), les mêmes expériences jugées fondatrices de leurs identités personnelles et collectives (Rabatel, 2015, p. 195).

Les mouvements corporels du vlogueur nous renseignent sur la place des ressources posturo-mimo-gestuelles dans la communication médiée par ordinateur. Ils jouent un rôle crucial dans la communication du vlogueur qui, de ce point de vue, est très expressif; cela est significatif d’une construction multimodale du discours. Le tableau 4 donne des indications chiffrées sur les paramètres posturo-mimo-gestuels annotés.

Tableau 4. Les paramètres posturo-mimo-gestuels

Annotations Occurrences Fréquence Durée Moyenne Proportion de temps Latence
Mains 30 0.068 2.156 0.147 0.222
Mimique 20 0.045 1.326 0.060 0.0
Mimique mains 25 0.056 1.748 0.099 52.82
Posture mimique 2 0.004 1.945 0.008 415.406
Regard 1 0.002 1.05 0.002 1.259
Regard mains 4 0.009 1.7995 0.016 46.996
Tête 1 0.002 0.656 0.001 23.348
Tête Regard Mains 5 0.011 3.718 0.042 114.495

Le vlogueur recourt abondamment aux gestes manuels : des mouvements verticaux et horizontaux, en direction de l’écran, orientés vers les angles gauche et droit de l’écran. Les mouvements de la main s’accompagnent régulièrement des mimiques assez expressives, allant de la surprise à l’horreur.

Conclusion

L’exploration des discours numériques natifs (productions verbales élaborées en ligne) tels que le vlogue apporte une double exigence : une exigence théorique dans l’aménagement conceptuel en cours d’élaboration[22]; et une exigence empirique de par la qualité propre du matériau due à son hybridité (technologique et langagière). L’analyse de 3MP que nous avons esquissée ici donne un aperçu du travail et du regard du linguiste sur la question. La représentation prospective du GDN qui en ressort prend la forme d’une satire sociale qui non seulement amuse, mais aussi interpelle. Le discours satirique se trouve ici amplifié grâce aux ressources multimodales et aux potentialités du vlogue. La vidéo de 3MP étudiée se veut une sorte de reconstruction – effet fictionnel – d’une scène énonciative produisant l’illusion du réel. De par le recours aux rituels et aux routines des conversations naturelles, le vlogeur réussit à donner vie à des personnages et à faire confronter des points de vue. Les discours issus du vlogue se singularisent alors par leur caractère composite et une forme de cohérence qui transcende la linéarité du discours ordinaire. Le rôle de la linguistique du développement dans l’analyse d’un tel dispositif médiatique est central : elle doit pouvoir éduquer au numérique, concevoir et expérimenter des outils qui répondent aux nouveaux besoins des communautés locales, car si le vlogue constitue un objet de la modernité, il n’en demeure pas moins qu’il peut constituer une véritable entrave aux valeurs humaines.

Références

Adami, Elisabeth. 2010. “We/YouTube” : exploring sign-making in video-interaction. Visual Communication 8 (4), 379-399.

Benson, Phil. 2017. The Discourse of YouTube : Multimodal Text in a Global Context. New York-London : Routledge.

Bornand, Sandra et Leguy, Cécile. 2013. Anthropologie des pratiques langagières. Paris : Armand Colin.

Charolles, Michel. 1978. Introduction aux problèmes de la cohérence des textes. Langue française, 38, 7-41.

Combe Celik, Christelle. 2014. Vlogues sur YouTube : un nouveau genre d’interactions multimodales. Conférences Interactions multimodales par écran – IMPEC, université Lyon 2, 265-280. ffhal-01507711f

Combe Celik, Christelle. 2019. Quand le technogenre de discours « vlogue » éduque à la politique : le cas français d’« Osons causer ». Communication au colloque Numérisation généralisée de la société et enjeux sociopolitiques de la culture et de la communication, ISTE, Université du Québec à Montréal, 2, 3 et 4 mai 2018.
https://hal.archives-ouvertes.fr/hal-02194777

Culioli, Antoine. 1990. Pour une linguistique de l’énonciation. Opérations et représentations (tome 1). Paris : Ophrys.

Détrie, Catherine, Siblot, Paul, Verine, Bertrand et Angès Steuckkardt. 2017. Termes et concepts pour l’analyse du discours. Une approche praxématique. Paris : Honoré Champion.

Emerit, Laetitia. 2014. Vers une typologie des pseudonymes sur Facebook. Actes de la conférence Interactions multimodales par écran – IMPEC, université Lyon 2, 93-103.

Heinz-Helmut, Lüger. 1993. Routine conversationnelle et comportement langagier. Langage et société, 63, 5-38.

Lacan, Jacques. 1986. Séminaire 7. L’éthique de la psychanalyse. Paris : Seuil.

Leeuwen, Theo van. 2004. Introducing Social Semiotics. An introductory Textbook. London : Routledge.

Métangmo-Tatou, Léonie. 2019. Pour une linguistique du développement. Essai d’épistémologie sur l’émergence d’un nouveau paradigme en sciences du langage. Québec : Éditions science et bien commun.

Osborn, Don. 2011. Les langues africaines à l’ère du numérique : défis et opportunités. Québec : Presses de l’université de Laval.

Paveau, Marie-Anne. 2011. Quelles données entre l’esprit et le discours? Du préconstruit au prédiscours. Dans Ammar Azouzi (éd.), L’analyse du discours. Notions et problèmes (p. 19-37). Tunis : Les éditions Sahar. ffhal-00596737f

Paveau, Marie-Anne. 2013. Langage et morale. Une éthique des vertus discursives. Limoges : Lambert-Lucas.

Paveau, Marie-Anne. 2016. L’éthique du discours numérique. Linguas e Instrumentoos Linguítiscos, 37, 177-210.

Paveau, Marie-Anne. 2017. L’Analyse du discours numérique. Dictionnaire des formes et des pratiques. Paris : Hermann.

Paveau, Marie-Anne. 2019. Technographismes en ligne. Énonciation matérielle visuelle et iconisation du texte. Corela 28. Url : http://journals.openedition.org/corela/9185

Plantard, Pascal. 2014. Anthropologie des usages du numérique. Habilitation à diriger les recherches, Université de Nantes.

Rabatel, Alain, 2014. Le jeu fictionnel de l’intériorité et de l’extériorité autour des images et photographies dans Les Années. La Licorne. En ligne : https://licorne.edel.univ-poitiers.fr:443/licorne/index.php?id=6187.

Rabatel, Alain. 2015. Analyse pragma-énonciative de la connivence représentée dans les récits. Cahiers du GADGES, 13, 189-229.

Salmon, Christian. 2020. La tyrannie des bouffons. Sur le pouvoir grotesque. Paris : Les liens qui libèrent.

Tisseron, Serge, 2011. Intimité et extimité. Communications, 1(1), 83-91. Url : https://doi.org/10.3917/commu.088.0083

Traverso, Véronique. 2007. L’Analyse conversationnelle. Paris : Armand Colin.

Leeuwen, Theo van. 2004. Introducing Social Semiotics. An Introductory Textbook. London : Routledge.

Visvanathan, Shiv. 2016. La quête de justice cognitive [Traduction de The Search for Cognitive Justice, 2009]. Dans Piron, Regulus et Dibounje Madiba (dir.), Justice cognitive, libre accès et savoirs locaux. Pour une science ouverte juste, au service du développement local durable. Québec : Editions science et bien commun. Url : https://scienceetbiencommun.pressbooks.pub/justicecognitive1

Wildfeuer, Janina, Adami, Elisabetta, Boeriis, Morten, Ravelli, Louise Jane et Francisco Osvanilson Dourado Veloso. 2018. Analysing digitized visual culture. Visual Communication, 17(3), 271–275.



  1. Pour une description détaillée de ces concepts, on peut consulter le glossaire de la théorie de Culioli en ligne : https://feglossary.sil.org/sites/feglossary/files/toeen.pdf.
  2. C’est notamment le travail abattu par Paveau sur la plateforme https://penseedudiscours.hypotheses.org/ouvrages/technologies-discursives
  3. Toutefois, nous ne prenons pas en compte les séquences de publicité, ainsi que les commentaires des internautes en réaction à la vidéo. Ces éléments seront envisagés dans des études ultérieures.
  4. Sur cette question, on peut consulter Salmon (2020).
  5. Campagne lancée par l’association Idemi Africa, en collaboration avec le laboratoire Langage, langues et cultures d’Afrique noire (LLACAN) dans le but de rendre plus visibles les langues africaines sur internet, en promouvant les sites multilangues et en produisant des données sur les cinquante langues africaines les plus répandues. Les missions et les actions de l’association sont disponibles sur https://idemi.africa/.
  6. Cette initiative est due à un ensemble d’acteurs regroupés entre autres autour de la Fédération des sociétés savantes finlandaises (TSV), le Comité de l’information publique (TJNK), l’Association finlandaise pour l’édition savante, Universities Norway (UHR) et l’action COST "European Network for Research Evaluation in the Social Sciences and the Humanities" (ENRESSH). Pour les détails, voir https://www.helsinki-initiative.org/fr/read.
  7. Parmi les signataires de ce manifeste, on a des chercheurs et chercheuses dans le domaine de la didactique des langues et de la communication tels que Didier de Robillard, Marc Arabyan, Véronique Castellotti Patrick Charaudeau, Sylvie Wharton. On peut consulter le manifeste sur www.observatoireplurilinguisme.eu/les-fondamentaux/langues-et-sciences/12937-manifeste-pour-la-reconnaissance-du-principe-de-diversité-linguistique-et-culturelle-dans-les-recherches-concernant-les-langues
  8. On suivrait dans ce sens les travaux de Plantard (2014) dans ce qu’il nomme anthropologie des usages du numérique.
  9. La notion de « justice cognitive » est empruntée au savant indien Shiv Visvanathan (2016) qui l’a inventé pour décrire une conception et des pratiques hégémoniques, dans le domaine scientifique, des pays développés sur les savoirs provenant d’autres pays, moins connus sur le plan scientifique. Il promeut une visibilité juste pour tous les savoirs.
  10. On sait que l’usage des pseudonymes, ainsi que les hétéronymes (noms pouvant être prononcés différemment et ayant des sens différents) fait partie de la culture de la communication digitale. Leur usage pose des problèmes d’ordre éthique, se mêlant à des enjeux relatifs à la cyberviolence. On trouve une explication détaillée de ces phénomènes énonciatifs dans les technodiscours chez Paveau (2017). De même, une typologie des pseudonymes utilisés dans les réseaux sociaux est proposée par Emerit (2014).
  11. Ce terme a été proposé par Lacan (1986), puis repris par Tisseron (2011). Il est exploité par de nombreux auteurs et autrices. On trouve notamment une analyse du jeu fictionnel par Rabatel (2014) appliqué au roman d’Annie Ernaux, Les Années.
  12. Pour faciliter le repérage d’une scène de la vidéo, nous indiquerons le temps (code temporel) correspondant entre parenthèses.
  13. On parle de milliers de morts et encore plus de déplacé·e·s. Sur l’historique du conflit, on peut rapporter à https://www.france24.com/fr/20170518-cameroun-region-anglophone-paul-biya-manifestations-origine-crise.
  14. Le vlogue a été posté le 15 septembre 2019. Il est accessible à partir de https://www.youtube.com/watch?v=jdZ5NVJ0qOE
  15. Sur le déroulement de cette rencontre, ainsi que les résolutions qui ont été prises, on peut consulter le compte rendu du rapporteur général du GDN à partir de https://nationaldialogue.cm/fr/category/ressources/documents/.
  16. Ce mot-valise (combinaison de production et d’usage) est un néologisme pour décrire les situations de communication numérique de type collaboratif dans lesquelles la frontière entre producteur et usager s’efface (cf. Paveau, 2017).
  17. Nous différencions, suivant la distinction proposée par Traverso (2007), rituel et routine. Le premier a une portée symbolique, tandis la seconde est surtout caractérisée par sa récurrence et son aspect stéréotypé.
  18. Déformation de « et puis c’est tout ».
  19. Terme emprunté à Culioli (1990) pour caractériser la propriété malléable et déformable des formes linguistiques. Même s’il est vrai qu’une telle conception trouve son origine dans l’analyse des situations de communication réelles, les discours numériques sont également soumis à la plasticité linguistique; le fait même que le vlogueur puisse réorienter, à l’aide d’outils technodiscursifs, l’interprétation des énoncés témoigne de la labilité des langues naturelles.
  20. Brigade antisardinard, groupe d’opposant·e·s au régime installé majoritairement en Europe.
  21. Pour une description détaillée de ces concepts, on peut consulter le glossaire de la théorie de Culioli en ligne : https://feglossary.sil.org/sites/feglossary/files/toeen.pdf.
  22. C’est notamment le travail abattu par Paveau sur la plateformehttps://penseedudiscours.hypotheses.org/ouvrages/technologies-discursives

Pour citer cet article

Mohamadou, Ousmanou. 2021. À chacun son dialogue national. Analyse multimodale du vidéoblogue « 03 minutes du peuple ». JEYNITAARE. Revue panafricaine de linguistique pour le développement, 1(1), en ligne. DOI : 10.46711/jeynitaare.2021.1.1.5

Licence


JEYNITAARE – Revue panafricaine de linguistique pour le développement est sous une license Creative Commons Attribution – Partage dans les mêmes conditions 4.0 International, sauf indication contraire.

Digital Object Identifier (DOI)

https://dx.doi.org/10.46711/jeynitaare.2021.1.1.5

Télécharger le PDF de l’article

Partagez cet article


ISSN : Version imprimée

2756-7222

ISSN : Version en ligne

2756-7222