2024, l’année du tour de chauffe
Cette année, je me rendais à San Francisco au nom de Antler Interactive où je suis employé en tant que Narrative Designer maison, accompagné de mon patron Lenny, et d’Oliwer, Directeur Créatif, pour y présenter Cloudborn, notre titre récemment annoncé.
Il y a quelques semaines auparavant, nous n’avions pas prévu de sauter dans des avions pour passer une semaine entière dans un hall d’exposition à l’autre bout du monde mais voilà, il se trouve que tout a changé. Oui, tout a été redéfini, et ce n’est pas trop exagéré que de dire cela, grâce ou à cause de deux lettres que l’on lit désormais partout: IA.
Un peu de contexte s’impose. Notre venue à la GDC a notamment été accélérée par le partenariat qui lie le développement de Cloudborn et Inworld AI. Un partenariat que nous avons initié tôt, alors qu’Inworld s’annonçait à peine sur la scène des outils IA appliqués au développement de jeu vidéo.
C’était une vraie chance, pour ne pas dire une opportunité, que nous avons eue de pouvoir montrer notre jeu sur le salon, un jeu pensé pour le web3, mais qui se marie parfaitement avec les nouvelles fonctionnalités proposées par Inworld AI. Aussi, nous avons rapidement réalisé notre chance d’avoir été choisis par eux pour figurer sur leur stand, ainsi que celui de la Blockchain Games Alliance.
Même à la GDC, l’IA de Inworld provoque le “wow”.
Alors en chemin pour la GDC, j’étais sûr de la démo que nous allions montrer sur le stand de Inworld. Oui, le flow de cette démo était bon, l’équipe avait travaillé d’arrache-pied, les graphismes étaient magnifiques, l’UI aux petits oignons, mais voilà, je me disais que la botte secrète narrative, qui se trouvaient être les personnages NPC en IA, n’allaient pas impressionner grand monde. Heureusement, je me suis largement trompé.
J’avais effectivement préjugé que le public de la GDC, déjà tout à fait renseigné sur ces technologies émergentes, et j’imaginais chacun ayant déjà vu et revu des démos de personnages interagissant à l’aide d’un LLM. J’avais visualisé des haussements d’épaules de la part de cette foule pour qui ChatGPT était déjà de l’histoire ancienne et qui était venue rechercher le frisson de l’étape suivante. Au lieu de cela, je peux affirmer que quasiment la totalité des testeurs ont lâché une interjection de surprise alors qu’ils venaient de débloquer un passage vers une grotte, bloquée par une épée géante, après avoir négocié avec notre personnage téméraire, Vendahlor. Un personnage unique, dont les dialogues, immédiatement générés à partir de l’entrée texte envoyée par les joueurs, étaient 100% générés par intelligence artificielle.
Pourtant notre parterre de testeurs était des plus divers. Nous avons eu une pléthore de visiteurs allant d’aspirants développeurs de jeux, ou même des étudiants, à des chercheurs en IA de chez NetEase, Bandai Namco ou même Square Enix. D’autres grands studios étaient représentés, tels que Sony, Tencent, 2K Games, et j’aime à dire que chacun a été enthousiaste, j’en veux pour preuve les nombreuses questions qui nous ont été posées.
Et pour une raison qui m’échappe, je me rappelle particulièrement d’un testeur qui est venu vers moi avec une idée de personnage qu’il m’a immédiatement décrite, une fois la démo terminée. Il me brossa le portrait d’un ancien soldat qui a vu beaucoup de choses, qui sait beaucoup de choses, mais qui parle tout le temps en état d’ébriété, et qui donc, ironiquement, est incapable de partager clairement ses souvenirs. Il me dit que ce serait génial de pouvoir parler à un tel personnage dans un jeu, mais qu’avec les outils d’aujourd’hui, ce ne serait pas vraiment possible. À cette remarque, je lui
répondis tout à trac qu’il suffirait qu’il écrive son personnage exactement comme il venait de l’énoncer. Rien de plus. Ajouter quelques détails certes, aideraient toujours à rendre l’expression du personnage, sa diction, plus florissante. Mais ce visiteur avait compris immédiatement où je voulais en venir, qu’il n’y avait plus qu’à exécuter son idée globale. Le reste, ce sel qui fait qu’un personnage qui parle par IA est meilleur qu’un autre, viendrait avec de l’étude et de la pratique.
AI, AI, AI.
Oui, le mot était sur toutes les lèvres, avec tous mes interlocuteurs sur le salon. Mais il n’était pas franchement encore partout. Les startups proposant des outils pour assister les développeurs avec des outils en IA n’étaient pas forcément très visibles, et n’avaient pas encore l’emplacement et l’écrin d’un Inworld.
Il fallait chercher pour trouver Meshy, une IA capable de générer des assets en 3D à partir d’un simple prompt, et susceptible d’intégrer un pipeline de production. Il fallait se rendre dans l’annuaire pour rencontrer les gens derrière XandImmersion, une IA capable d’assister un raconteur d’histoires dans la conduite de son univers et ainsi générer des contenus à l’envi.
Il y avait également une retenue à avoir, j’imagine, car cette année comme rarement auparavant, la GDC s’ouvrait en plein contexte désastreux d’une industrie largement qualifiée comme malade, en proie à des licenciements massifs et brutaux. Avec, et chacun l’avait à l’esprit, l’essor de l’IA générative en embuscade, largement perçue comme susceptible de remplacer des pans entiers de métiers du développement de jeu vidéo, avec cette crainte que des travailleurs ne soient, in fine, jamais repris sur le marché du travail.
Dans ce contexte éminemment particulier, quelques mois après que ChatGPT ait été décrit, même par mes collègues comme « L’outil qui remplace le scénariste », étant présent à la GDC avec un titre proposant une expérience en IA à la pointe, étant encore aujourd’hui en collaboration proche avec Inworld AI pour développer des choses folles dans Cloudborn, il est temps pour moi de faire le point.
Écrire, tout le monde peut le faire.
Je commencerai par cette assertion : écrire, tout le monde peut le faire. Je commence par là, car depuis que Midjourney fait partie de nos vies, il nous a été donné cette impression vertigineuse que ça y est, chacun, sans formation, sans étude, est capable de générer un travail visuel pouvant rivaliser avec des artistes ayant des années d’entraînement et d’expérience professionnelle. L’injustice, était ce premier sentiment largement partagé sur les réseaux. Cette dépossession d’un savoir durement acquis était insupportable, et je le conçois. Et la question reste en suspens : à qui le tour ? Les acteurs de doublage sont largement remplaçables par Eleven Labs à l’heure où j’écris ces lignes. Et en ce qui concerne notre industrie, la messe sera donnée quand tout un chacun pourra “prompter” directement dans Unreal ou Unity pour ne pas avoir à coder.
Sauf que cette dépossession, nous, Narrative Designers, avons toujours, toujours, vécu avec. Car oui, un Narrative Designer vit en permanence avec cette idée assez partagée qu’écrire et à fortiori raconter une histoire, est à la portée de n’importe qui.
C’est quelque chose qui reste en nous, avec lequel on vit, on travaille, on apprend. J’en veux pour preuve que le syndrome de l’imposteur est très présent chez les Narrative Designers. Si vous n’en êtes pas convaincus, interrogez simplement mes consoeurs et confrères, ou promenez-vous sur LinkedIn à la recherche de posts émis par des Narrative Designers, je vous garantis qu’il ne vous faudra pas longtemps avant que le sujet ne soit abordé.
Ce sentiment est d’autant plus amplifié qu’il faut souvent composer au sein d’un studio de jeu vidéo avec d’autres développeurs dotés d’un savoir-faire complexe, minutieux et qui, selon la légende, requiert de base une formation du cerveau et un agencement de pensée spécifique à l’exercice de certains métiers. Viennent s’ajouter à cela des années d’études, de pratique et de formation. Fatalement, notre talent de Narrative Designer, même doué d’une formation respectable, sera immédiatement perçu comme une coquetterie, l’expression futile d’un esprit papillonnant, et terriblement difficile à juger sur pièce. Oui, même les artistes ne souffrent pas de cet écueil. Bien que très durement mis en concurrence, leur travail est facile à juger, et un talent émergera facilement du reste sur un simple coup d’œil. Ce qui encore une fois, est bien moins évident pour un Narrative Designer.
Pourquoi alors cette idée persiste ? Peut-être parce qu’elle est probablement, aussi une vérité. Et je l’affirmerai moi-même. Oui, écrire de la fiction, si tant est qu’on maîtrise un minimum sa langue, avec un minimum de style et une syntaxe correcte, est possible. J’irais même jusqu’à affirmer que quiconque travaillant dans un studio de jeu vidéo possède, a priori, des capacités rédactionnelles largement suffisantes pour produire une histoire compréhensible. Les studios de jeux vidéos sont en effet peuplés de gens diplômés, qui sont très probablement là par vocation, et sont donc portés par un minimum de curiosité pour la fiction et les récits, de manière globale. Ce qui en fait à mon sens un pré-requis bien plus que suffisant pour s’essayer à la construction d’histoires. C’est énoncer des évidences que de dire cela, aussi je n’ai jamais tenu à mystifier mon métier inutilement, et j’invite tout Narrative Designer à ne pas enrober son savoir-faire par des concepts complexes dans le seul but d’asseoir malencontreusement une quelconque autorité au sein d’un studio.
Même si je le concède, ce sentiment d’insécurité nous amène parfois à manquer d’humilité et de sagesse. Et je pardonnerai doublement, sachant que parfois, et pour ne pas dire souvent, une équipe attend du Narrative Designer cette part de mysticisme, voire de bizarrerie. De là au numéro de clown ou à la séance psy, il n’y a malheureusement qu’un pas, qu’il faut éviter de franchir.
L’IA, tout le monde peut le faire.
La raison pour laquelle j’évoque cet état de fait est que désormais, oui, il appartient à absolument n’importe qui de produire une image par le moyen d’un simple prompt dans Midjourney ou ChatGPT, gratuitement ou presque, en quelques secondes. Oui, il m’est possible, à moi, de produire des images à la composition certes simple, mais dont le rendu est largement suffisant pour exprimer une intention, une sensation, et de pouvoir le mettre dans un document de travail, à destination de n’importe qui.
Je peux désormais faire du concept art. Je n’y peux rien, mais c’est comme ça. Et du concept art, pour illustrer mes récits, mes pitches, j’en ai fait. J’en ai fait beaucoup, sous Dall-E 3, qui est plus que suffisant pour l’usage que j’en fais. J’en ai fait pour Cloudborn, et pour d’autres projets. Je me rappelle alors ce qu’impliquait de demander des concept arts pour des projets personnels à des amis artistes il y a encore quelques années. C’est tout simplement incomparable.
Quels métiers pourrai-je exercer demain ? Animateur 2D ? Modeleur 3D ? Animateur 3D ? Programmeur Unity ? Rien ne m’interdit de rêver. J’ai vu tourner à la GDC des modèles d’IA, comme Meshy, capables de produire des assets 3D générés à partir de simples prompts que je pourrais envoyer aujourd’hui dans un pipeline de production 3D. Et ce n’est qu’un tour de chauffe. Les promesses tenues par d’autres startups ont été nombreuses, folles, et en même temps, au vu des progrès déjà acquis, je ne vois pas comment la machine pourrait s’arrêter en si bon chemin. Je veux donc croire que ces promesses seront tenues.
Alors ça y est, nous y sommes. Chacun peut aussi bien faire des concepts, faire du doublage dans n’importe quelle langue, et sous peu produire des assets 3D, aussi bien que chacun peut écrire un texte. Nous y voilà. Ce que nous raconteurs d’histoires avons ressenti depuis le début, vous le ressentez. Ce dans quoi nous avons appris et évolué, ce dans quoi nous avons tanné notre cuir, vous y êtes. Et la question demeure la même. Vous savez écrire un e-mail donc vous pouvez tout à fait écrire une fiction. C’est tout à fait vrai. Mais désormais, qu’allez-vous écrire ?
Pour quels changements ?
Avant de conclure sur la question préalablement posée, je tiens à préciser qu’il m’est tout à fait aisé de m’exprimer ainsi parce que je jouis d’un privilège inouï d’évoluer au sein d’un studio, Antler Interactive, qui me laisse explorer de tels outils et qui les a embrassés dans sa production. Au-delà même de ça, je peux aujourd’hui me reposer sur un enthousiasme partagé, au sein du studio, vis-à-vis de ces technologies. Je comprends tout à fait qu’un ami Narrative Designer, qui ne puisse pas bénéficier d’un tel soutien, ait des réticences à embrasser ces nouveaux outils. Toutefois, j’ose espérer que ces prochains paragraphes pourront lui faire changer d’avis.
Des personnages vivants
On pourrait croire à me lire que rien n’a changé ou presque dans mon métier, et ce serait évidemment se tromper. Souvent la question m’a été posée du changement, en bien ou en mal, survenu dans le flot de mes journées de travail. Et même avec un réel effort de recul, j’aurais encore du mal à cacher mon enthousiasme. Oui, l’IA est un changement de paradigme. Elle ne remplace pas ma production d’idées, mais fait tomber les barrières entre l’idée et son exécution. Plus que ça, elle est cette impulsion électrique, magnétique, qui met en mouvement une vision, lui donne vie, lui donne corps, et exprime directement mon intention au joueur.
Tout comme Rob Vel qui donna vie à Spirou dans ces deux cases mythiques où il se met en scène aspergeant son dessin d’une “eau de vie” pour que le personnage s’anime, sorte de son cadre et se mette “au service” du lecteur, je peux désormais, notamment grâce aux outils et à la technologie de Inworld, donner vie à des personnages. Ces personnages suivront avant tout mon intention, tout comme une note d’intention écrite pour un film ou un jeu, saurait donner corps à tout ce qui s’en suit: un scénario, un séquencier…
Cette image de Spirou qui prend vie est particulièrement parlante pour illustrer le cas de notre démo à la GDC, où j’avais l’impression à un certain moment donné que nos deux personnages étaient des acteurs qui jouaient sur scène, toujours campés dans leur rôle. Une fois la conférence terminée, j’étais content d’eux comme j’aurais pu être content de deux comédiens que j’aurais fait exercer des semaines durant en amont de leur représentation en public. Et force est de réaliser que désormais, mon travail se situe ici. Je suis devenu à la fois un rôliste, mais également un concepteur de conversations, un dramaturge et un fabricant de personnages. Des personnages que je n’écris pas d’un seul jet, mais que je façonne autour des conversations que j’ai avec eux, pour ensuite les polir à partir de ce que d’autres personnes m’en disent. Tout ceci est tout à fait nouveau.
Des mondes vivants
Un personnage ne va pas sans son univers. Même un personnage qu’on voudrait faire partie de notre monde et de notre époque aurait besoin de repères et de contexte, en plus de ce sur quoi le LLM est capable d’extrapoler. C’est ainsi que tout un chacun qui voudrait faire parler des personnages en s’aidant de l’intelligence artificielle devrait immanquablement créer l’univers dans lequel le faire évoluer. Non, il ne suffira jamais d’écrire un simple personnage en quelques lignes et d’appuyer sur un bouton magique pour que l’IA fasse tout le reste. Vous devrez l’armer d’une bonne base de données de connaissances et de logique, le tout avec le plus de cohérence possible. Une chose que j’ai apprise avec les personnages travaillant sous Inworld est qu’ils feront remonter très rapidement toute incohérence du monde dans lequel ils vivent, et ce très rapidement. Donc oui, il faudra prévoir les angles morts, anticiper, et préparer des couches successives de faits et règles pour que votre personnage puisse se reposer dessus avec le plus de confort possible. Ensuite seulement, une fois cette besogne faite, vous pourrez espérer pouvoir lui faire cracher du feu. Pas avant.
A ce propos, je me suis rendu compte peu à peu, alors que je travaillais mon worldbuilding, que toutes ces règles que j’écrivais, alors que je remplissais mes tableaux Excel, que tout ce contenu allait être d’une importance capitale. Car avec l’IA, tout compte. Même la plus petite règle d’univers la plus obscure, la plus saugrenue, peut à tout moment être appelée par le modèle pour être retranscrit par un personnage. Désormais, votre iceberg est totalement émergé. Tout doit faire sens, car vous n’aurez plus de cache misère. Réjouissez-vous chers consoeurs et confrères, votre bible de worldbuilding ne sera plus ce document qui traîne au fond d’un Google Drive et que personne ne lira jamais.
C’est en réalisant cela que je me suis senti comme les D’Ni, ces créateurs de mondes dans la saga de jeux vidéo Myst, que j’adore. Ces faiseurs de monde sont les maîtres de l’Écriture, et s’adonnent à la fabrication de mondes qu’ils décrivent avec des mots, dans des livres magiques. Des livres sur lesquels il suffit ensuite de poser la paume pour pouvoir s’y téléporter afin de les visiter. Et avec l’IA comme dans Myst, il faudra équilibrer le monde, penser aux moindres règles qui définissent l’espace, le temps, la physique, les enjeux sociétaux… parce que votre personnage ne répondra jamais indéfiniment “je ne sais pas” à votre joueur. Et vous ne voudrez pas qu’il soit trop créatif et fabrique des faits que vous n’avez pas voulu.
Oui, c’est un travail massif et jamais terminé. Si vous pensiez que l’IA allait nous enlever du travail de narration, alors il est probablement temps de revoir votre jugement.