Comment créer automatiquement des ressources VO temporaires à l'aide de WAAPI et TTS

Outils et conseils pour Wwise

Introduction

L'automatisation est une approche couramment utilisée sur de grands projets.

Dans une équipe composée de centaines de personnes, les communications récurrentes et les allers-retours entre participants peuvent facilement compliquer les choses. Avec un flux de travail automatisé, nous pouvons minimiser le taux d'erreurs et maximiser notre efficacité de production.

En production industrielle, l'équipe de projet a tendance à implémenter des outils comme des build machines ou des packagers pour automatiser certaines opérations, ceux-ci combinés à un système de notification pour afficher les résultats sur une page spécifique et avertir le personnel concerné. Cela rend le contrôle de la qualité et l'ensemble du flux de travail plus efficaces.

En production audio, nous pouvons également automatiser certaines opérations manuelles, en réduisant l'intervention humaine et la communication. Par exemple, en automatisant la génération de packages de SoundBanks à l'aide de build machines. De cette façon, vous pouvez éviter les conflits tout en ayant plusieurs personnes générant des SoundBanks localement, minimisant ainsi les problèmes de téléchargement.

En ce qui concerne l'automatisation du moteur Wwise, grâce aux fonctions WAAPI fournies par Audiokinetic (comme il y a beaucoup d'articles sur WAAPI, je n'entrerai pas ici dans les détails), il devient plus facile pour les développeurs d'automatiser les opérations internes de Wwise. De plus, vous pouvez combiner WAAPI avec d'autres outils pour construire une chaîne d'automatisation, et la déployer sur le packager, ce qui rend l'ensemble du flux de travail plus homogène et efficace.

Ici, je vais décrire comment créer automatiquement des assets de VO (Voice-Over) temporaires avec WAAPI et TTS (text-to-speech).

Problèmes de création de VO et idées d'optimisation

Lors de la création de VO, vous pouvez vous retrouver avec un processus de configuration long et fastidieux, et un grand nombre d'itérations nécessaires, en particulier lorsqu'il y a une forte demande d'assets de VO. Sans l’aide d’outils additionnels, concepteur-ice de jeu et concepteur-ice sonore devront communiquer, opérer et télécharger leurs fichiers encore et encore. L'ensemble du processus est répétitif, monotone, sujet aux erreurs, et prend beaucoup de temps.

1. Le-la concepteur-ice du jeu télécharge la feuille de route de VO et informe le-la concepteur-ice sonore ;

2. Le-la concepteur-ice sonore ajoute les assets dans Wwise en les configurant, en les important et en les synchronisant dans le moteur de jeu ;

3. L'équipe de projet effectue la réception et les tests du projet.

Copy of Img001 - FR

Résoudre les problèmes de configuration

En production industrielle, la modularisation est une approche courante qui peut minimiser le travail en double, réduire les coûts de debug et faciliter la coordination et une vérification rapide. Cela permet à chaque membre de l'équipe de se concentrer sur son propre travail, augmentant ainsi l'efficacité du développement. L'idée générale est d'intégrer le texte, l'audio, l'art et d'autres éléments dans un seul module pour une configuration unifiée. Lorsque le-la concepteur-ice de jeu a terminé son travail pour les textes, il-elle l'a également fait pour les VO. Il n'est pas nécessaire de configurer les VO séparément. Les Events peuvent être nommés selon des règles spécifiques, convenues à l'avance avec le-la concepteur-ice du jeu.

Résoudre les problèmes de communication, de fonctionnement de Wwise, et de téléchargement

Lorsqu'il s'agit « d'éviter les communications répétées », la solution la plus évidente est de laisser la machine gérer autant de coordination humaine que possible. Puisque la collaboration en production de VO se trouve être très répétitive, elle peut être remplacé par un processus d’automatisation dans la plupart des cas.

Voici ma méthode pour créer automatiquement des assets de VO : d'abord, trouver les opérations manuelles répétitives, puis établir un processus d'automatisation ; ensuite, encapsuler les processus d'exécution dans des lignes de commande, ce qui implique WAAPI, Microsoft TTS et d'autres APIs connexes, via des outils de téléchargement et de déploiement comme Perforce et Jenkins.

Déploiement du processus d'automatisation

Définition des règles

1. Spécifier la convention de nomenclature des Events ;

2. Confirmer que l'en-tête de la feuille de route de VO comprend des informations comme le nom de la VO, la langue, le timbre, la tonalité et le contenu ;

3. Créer des Work Units séparément dans l'onglet Audio et dans l'onglet Events, et créer un dossier pour les fichiers wav générés par IA dans le répertoire Originals ;

4. Écouter et sélectionner des tonalités fournies par TTS, ou élaborer votre propre modèle de tonalité.

Outils nécessaires

1. Outil pour convertir la feuille de route de VO au format SSML (Speech Synthesis Markup Language) (reconnaissable par Microsoft TTS) ;

image002Exemple de cible de sortie

2. Outil TTS (text-to-speech) ;

image003(Vous devez vous enregistrer et demander une clé de licence sur le site officiel)
Ligne 12 : Réglage de la clé de licence et de la région.
Ligne 13 : Réglage du format du fichier wav généré
Ligne 16 : Remplissage des noms de fichiers SSML
Ligne 25 : Exécution de la conversion TTS
Ligne 28 : Écriture des fichiers

3. Outil WAAPI pour importer automatiquement des assets, créer des fichiers Sound Voices et des Events ;

4. Contenu pertinent, mécanisme de notification et déploiement du processus des outils de contrôle de version comme Git, P4, etc. ;

5. Logique de lecture frontend.

Déploiement de la build machine

Pour utiliser la build machine, vous devez installer l'environnement Wwise et effectuer les processus suivants sur la machine :

1. Comparer et répertorier les ajouts, les suppressions et les modifications apportées à la feuille de route de VO ;

2. Convertir la partie modifiée en SSML ;

3. Effectuer la conversion TTS ;

4. Utiliser WAAPI pour créer et mettre à jour des Voice SFXs au sein des Work Units spécifiées dans Wwise, générer les Events associés et les télécharger sur le serveur ;

5. Générer les SoundBanks et les autres assets utilisés par le moteur de jeu dans certains répertoires et les télécharger sur le serveur.

Copy of Img002 - FR

Lorsque le serveur détecte que la feuille de route de VO a été téléchargée par le-la concepteur-ice du jeu, il exécute automatiquement les processus ci-dessus.

Flux de travail optimisé

1. Dans la production quotidienne, après la création et le téléchargement de la feuille de route de VO par le-la concepteur-ice de jeu, la build machine exécutera le processus automatisé, ce qui vous permettra d’écouter ces assets de VO temporaires ;

2. Il est possible de tester et debugger les VOs simultanément avec l'envoi du package.

Copy of Img003 - FR-V2

Problèmes potentiels

Le processus d'automatisation peut prendre du temps et peut monopoliser les ressources allouées au build si le nombre de VOs est élevé. Vous pourriez vouloir effectuer cette opération à un moment opportun (par exemple, la nuit). Cependant, si vous disposez de ressources build suffisantes, il est possible de le faire en même temps que le téléchargement de la feuille de route de VO.

Huang Chao

Conceptrice Sonore Technique

X.D. Network

Huang Chao

Conceptrice Sonore Technique

X.D. Network

Huang Chao est passionnée de bonne gastronomie. Elle aime explorer de nouveaux domaines et travailler avec ses coéquipiers.

Commentaires

Laisser une réponse

Votre adresse électronique ne sera pas publiée.

Plus d'articles

Aide-mémoire pour Wwise et Unity

Parlons un peu de l'intégration de Wwise dans Unity. Il existe un certain nombre de ressources...

5.5.2022 - Par Mads Maretty Sønderup

Hitman 2 : Améliorer la réverbération sur les processeurs modernes

La popularisation des processeurs à six et huit cœurs signifie qu'une puissance de traitement...

19.5.2022 - Par Stepan Boev

Réintroduction de Wwise Audio Lab (WAL)

Wwise Audio Lab (WAL) est un environnement 3D open-source semblable à un jeu vidéo, développé avec...

15.7.2022 - Par Damian Kastbauer

Visualiser les variations issues de la synthèse croisée d'Impacter

Bienvenue à nouveau dans notre série d'articles sur le plugiciel Impacter. Dans les deux articles...

24.11.2022 - Par Ryan Done

Nouveauté de Wwise Spatial Audio 2023.1 | Révision du modèle d'envois auxiliaires

Si vous avez parcouru la liste des nouvelles fonctionnalités de Wwise 2023.1, et en effet, il y en a...

15.12.2023 - Par Nathan Harris

Nouveauté de Wwise Spatial Audio 2023.1 | Réduction de l'effet de phasing

Dans l'article d'aujourd'hui, nous allons plonger en profondeur dans un phénomène acoustique...

25.1.2024 - Par Allen Lee

Plus d'articles

Aide-mémoire pour Wwise et Unity

Parlons un peu de l'intégration de Wwise dans Unity. Il existe un certain nombre de ressources...

Hitman 2 : Améliorer la réverbération sur les processeurs modernes

La popularisation des processeurs à six et huit cœurs signifie qu'une puissance de traitement...

Réintroduction de Wwise Audio Lab (WAL)

Wwise Audio Lab (WAL) est un environnement 3D open-source semblable à un jeu vidéo, développé avec...