-->

06 décembre 2009

3 décembre 2009 : Le W3C diffuse une nouvelle version de VoiceXML 3.0

Le 3 décembre, le groupe Voice du W3C a diffusé une nouvelle version du draft VoiceXML 3.0.

Les évolutions par rapport à la version précédente concernent essentiellement les fonctions suivantes :
  • Speaker Identification
  • Speaker Verification
  • Speaker Enrollment

31 août 2009

Nouveau Draft VoiceXML 3.0

Une nouvelle version draft du document VoiceXML 3.0 a été publiée par le groupe Voice du W3C le samedi 29 août. Une version avec identification des modifications est également disponible.

24 décembre 2008

Publication du premier draft VoiceXML 3.0

Le W3C vient de publier le premier draft de la version 3.0 du langage VoiceXML 3.0.

Vous trouverez cette première version du document ici.

17 janvier 2008

Les portails développeurs VoiceXML

Depuis le lancement de TellMe en 2001, les portails dédiés aux développeurs VoiceXML se sont développés.
Ces portails proposent généralement des ressources (code source, tutorial, white papers), un accès aux Voice Browser (via un téléphone classique ou un softphone SIP) pour tester les applications VoiceXML. Les Voice Browser associés à ces portails intègrent des moteurs de synthèse et de reconnaissance vocale, des fonctions de trace logicielle. Certains de ces portails (TellMe, Voxeo) sont également accessibles depuis Skype.
Voici la liste des principaux portails développeurs VoiceXML :

01 mai 2007

VoiceXML 2.1 dans l'état Proposed Recommendations

Le groupe Voice du W3C vient d'annoncer le passage dans l'état Proposed Recommendation de la version 2.1 du langage VoiceXML. Cette étape est la dernière avant le passage à l'état Recommendation qui devrait intervenir avant la fin de l'année 2007.

Cette version corrige les quelques insuffisances de la version 2.0 (consultation transfer, recording utterances) et va devenir rapidement le langage de référence dans les domaine des services vocaux.

Les principaux éditeurs de Voice Browser ont d'ailleurs déjà intégré cette version du langage dans leurs offres (Genesys, Voxpilot, ...).Publier

Voici le lien vers cette version du langage ainsi qu'un résumé des principaux apports de VoiceXML 2.1 :

- Le "consultation transfer" : Les fonctions de Mise en relation de VoiceXML 2.0 sont enrichies par l?ajout d?un nouveau mode de transfert d?appel : le « Consultation Transfer ». Ce nouveau mode s'ajoute aux deux modes déjà existants dans le langage VoiceXML 2.0 : le mode Bridge et le mode Blind.
Les caractéristiques de ce nouveau mode de transfert sont les suivantes :
  • L?appel est contrôlé par le Voice Browser tant que le destinataire n?a pas décroché, permettant la gestion des erreurs de type Non réponse, Occupation, Durée maximum d?attente atteinte pendant la phase d?Alerte.
  • L?appel est « relâché » par le Voice Browser à l?interface usager-réseau dès que le destinataire du transfert a répondu. Les ressources télécom nécessaires pour traiter l?appel suite au transfert sont donc minimisées.
Cette fonction de mise en relation est essentielle pour des services vocaux interactifs d?accueil dans des applications de type Centre d?appels. Elle résorbe les inconvénients des modes de transfert Bridge et Blind proposés par la version 2.0 du langage VoiceXML.

- Enregistrement des phases de dialogue en reconnaissance vocale :Lors des interactions en reconnaissance vocale, le langage VoiceXML 2.0 permet de collecter les informations suivantes :
  • le « niveau de confiance » (valeur entre 0 et 1) remontée par le moteur de reconnaissance vocale
  • l?expression de la grammaire reconnue par le moteur de reconnaissance vocale
  • l?interprétation sémantique associée à l?expression si celle-ci est qualifiée au sein de la grammaire par l?utilisation de la balise SRGS tag

VoiceXML 2.1 permet en complément d'enregistrer la phase de dialogue pendant laquelle la reconnaissance vocale est activée.

Ces données audio sont mémorisées par le Voice Browser dans une variable et peuvent être remontées sur le serveur d?application via une requête HTTP (balise submit). Ces données collectées sur le serveur d'application peuvent ensuite être archivées pour étude pendant la phase de « tuning » de l?application de reconnaissance vocale.

Cette capacité du langage va permettre aux développeurs de s'affranchir des contraintes liées au moteur de reconnaissance vocale et va faciliter le développement des applications en reconnaisssance vocale.


- Statistiques sur l'utilisation du "barge-in" : L'ajout d'une balise mark va permettre de collecter des informations statistiques sur l'utilisation du Barge-in au sein des applications vocales.

Cette balise étend les capacités de la balise mark déjà définies dans le langage SSML. Suite au barge-in, l'interpréteur VoiceXML mémorisera la durée écoulée en milli-secondes entre l'interprétation de la dernière balise mark et l'action de l'utilisateur.

Cette fonction va permettre de collecter des informations plus précises sur le comportement des utilisateurs d'application vocales.

- Améliorations du langage : Deux améliorations proposées par la version 2.1 du langage VocieXML vont faciliter le développement d?applications vocales :
  • L'ajout d?une balise foreach va permettre de diffuser des listes de fichiers audio stockés dans des tableaux EcmaScript. Cette évolution offre une plus grande souplesse aux développeurs d?applications vocales.
  • La balise data permet d?initialiser en arrière plan des tableaux avec des données XML collectées via des requêtes http.

Les capacités offertes par cette balise data sont similaires aux capacités offertes par la fonction Javascript XML_HTTP_REQUEST que l'on trouve sur les navigateurs Web. Cette fonction (utilisée par Google Maps, Google GMail entre autres) est à la base d'une nouvelle génération d'applications Web.

La balise data offre des perspectives différentes dans la conception des applications vocales.

Libellés :

26 octobre 2006

Voice XML au W3C

Voici l'état des travaux en cours du groupe Voice du W3C :
  • Voice XML 2.1 : Une version Last Call Working Draft a été diffusée le 15 septembre 2006. Le passage en version Candidate Recommendation est prévu pour le mois de novembre 2006. Cette version intègre des améliorations à la version 2.0 et quelques fonctionnalités majeures : le "consultation transfer", l'enregistrement des phases de dialogue en reconnaissance vocale, des capacités de capture de statistiques sur les phases de dialogue.
  • VoiceXML 3.0 : la première version Working Draft de VoiceXML 3.0 est planifiée pour la fin 2007
  • SSML (Speech Synthesis Markup Language) 1.1 : Les travaux vont débuter fin 2006 pour une diffusion du Working Draft en janvier 2007. SSML 1.1 apportera quelques améliorations au langage SSML 1.0 (internationalisation du langage).
  • SISR 1.0 (Semantic Interpretation for Speech recognition) : L'évolution Candidate Recommendation est prévue début 2007.
  • State Chart XML (SCML) : Working Draft en novembre 2006. Ce langage sera intégré à VoiceXML 3.0, CCXML et les langages multimodaux pour traiter la gestion d'évènements.

31 août 2006

Label VoiceXML 2.0 pour les Voice Browsers Aspect Software et Vail Systems

Deux nouvelles plateformes ont obtenues le label VoiceXML 2.0 du VoiceXML Forum : Aspect Software et Vail Systems. Cela porte à 18 le nombre de plateformes certifiées 2.0 par le VoiceXML Forum.