-->

01 mai 2007

VoiceXML 2.1 dans l'état Proposed Recommendations

Le groupe Voice du W3C vient d'annoncer le passage dans l'état Proposed Recommendation de la version 2.1 du langage VoiceXML. Cette étape est la dernière avant le passage à l'état Recommendation qui devrait intervenir avant la fin de l'année 2007.

Cette version corrige les quelques insuffisances de la version 2.0 (consultation transfer, recording utterances) et va devenir rapidement le langage de référence dans les domaine des services vocaux.

Les principaux éditeurs de Voice Browser ont d'ailleurs déjà intégré cette version du langage dans leurs offres (Genesys, Voxpilot, ...).Publier

Voici le lien vers cette version du langage ainsi qu'un résumé des principaux apports de VoiceXML 2.1 :

- Le "consultation transfer" : Les fonctions de Mise en relation de VoiceXML 2.0 sont enrichies par l?ajout d?un nouveau mode de transfert d?appel : le « Consultation Transfer ». Ce nouveau mode s'ajoute aux deux modes déjà existants dans le langage VoiceXML 2.0 : le mode Bridge et le mode Blind.
Les caractéristiques de ce nouveau mode de transfert sont les suivantes :
  • L?appel est contrôlé par le Voice Browser tant que le destinataire n?a pas décroché, permettant la gestion des erreurs de type Non réponse, Occupation, Durée maximum d?attente atteinte pendant la phase d?Alerte.
  • L?appel est « relâché » par le Voice Browser à l?interface usager-réseau dès que le destinataire du transfert a répondu. Les ressources télécom nécessaires pour traiter l?appel suite au transfert sont donc minimisées.
Cette fonction de mise en relation est essentielle pour des services vocaux interactifs d?accueil dans des applications de type Centre d?appels. Elle résorbe les inconvénients des modes de transfert Bridge et Blind proposés par la version 2.0 du langage VoiceXML.

- Enregistrement des phases de dialogue en reconnaissance vocale :Lors des interactions en reconnaissance vocale, le langage VoiceXML 2.0 permet de collecter les informations suivantes :
  • le « niveau de confiance » (valeur entre 0 et 1) remontée par le moteur de reconnaissance vocale
  • l?expression de la grammaire reconnue par le moteur de reconnaissance vocale
  • l?interprétation sémantique associée à l?expression si celle-ci est qualifiée au sein de la grammaire par l?utilisation de la balise SRGS tag

VoiceXML 2.1 permet en complément d'enregistrer la phase de dialogue pendant laquelle la reconnaissance vocale est activée.

Ces données audio sont mémorisées par le Voice Browser dans une variable et peuvent être remontées sur le serveur d?application via une requête HTTP (balise submit). Ces données collectées sur le serveur d'application peuvent ensuite être archivées pour étude pendant la phase de « tuning » de l?application de reconnaissance vocale.

Cette capacité du langage va permettre aux développeurs de s'affranchir des contraintes liées au moteur de reconnaissance vocale et va faciliter le développement des applications en reconnaisssance vocale.


- Statistiques sur l'utilisation du "barge-in" : L'ajout d'une balise mark va permettre de collecter des informations statistiques sur l'utilisation du Barge-in au sein des applications vocales.

Cette balise étend les capacités de la balise mark déjà définies dans le langage SSML. Suite au barge-in, l'interpréteur VoiceXML mémorisera la durée écoulée en milli-secondes entre l'interprétation de la dernière balise mark et l'action de l'utilisateur.

Cette fonction va permettre de collecter des informations plus précises sur le comportement des utilisateurs d'application vocales.

- Améliorations du langage : Deux améliorations proposées par la version 2.1 du langage VocieXML vont faciliter le développement d?applications vocales :
  • L'ajout d?une balise foreach va permettre de diffuser des listes de fichiers audio stockés dans des tableaux EcmaScript. Cette évolution offre une plus grande souplesse aux développeurs d?applications vocales.
  • La balise data permet d?initialiser en arrière plan des tableaux avec des données XML collectées via des requêtes http.

Les capacités offertes par cette balise data sont similaires aux capacités offertes par la fonction Javascript XML_HTTP_REQUEST que l'on trouve sur les navigateurs Web. Cette fonction (utilisée par Google Maps, Google GMail entre autres) est à la base d'une nouvelle génération d'applications Web.

La balise data offre des perspectives différentes dans la conception des applications vocales.

Libellés :