Facilité d'utilisation: la reconnaissance vocale par rapport à clavier

https://stackoverflow.com/questions/898402

23-08-2019
|

Question

Nous voyons de plus en plus la reconnaissance vocale mis en œuvre et demande de bibliothèques qui fait une bonne reconnaissance de la parole. Quelle est la raison d'être (en terme de facilité d'utilisation) derrière par rapport à un clavier ou d'un clavier? Quelles raisons vous devez investir dans ce développement?

Par exemple, nous allons prendre les centres d'appels. Il y a quelques années, presque tous les centres d'appel a utilisé un IVR qui a poussé une clé pour les menus. Maintenant, nous voyons de plus en plus menus avec invite pour un mot clé parlé et / ou un clavier pressé: « S'il vous plaît dites facture ou appuyez sur 1 pour voir votre facture ». Ou nous voyons la même chose dans le répertoire téléphonique des entreprises: « S'il vous plaît dites le nom de la personne que vous essayez d'atteindre » ... « Franck Loyd » ... « Vous avez dit Jack Freud S'il vous plaît dire oui si vous voulez pour atteindre cette personne ou dire non à essayer à nouveau ».

Je suppose que c'est un plus quand vous êtes dans votre voiture sans tenir votre téléphone, mais il vaut la peine le temps d'attente supplémentaire? interaction plus pour tous les choix, le temps plus rapidement tout en essayant d'analyser si quelque chose a été dit et ainsi de suite? En outre, la fiabilité est meilleure qu'elle ne l'était, sans aucun doute, mais parfois il se sent plus comme un jouet que quelqu'un a décidé de branché sur le système afin qu'il puisse se sentir futuriste.

Toute expérience dans la conception IVR ou un logiciel utilisé (ou choisi de ne pas) la reconnaissance vocale?

Merci!

La solution

Quelle est la raison d'être (en terme de facilité d'utilisation) derrière elle par rapport à un clavier ou le clavier?

La convivialité est un terme très large. Si je devais tenter d'entrer mon adresse avec un pavé tactile, il ne serait pas considéré comme très utile. Certains font valoir que l'aide d'un moteur de reconnaissance vocale avec un taux de réussite global de 70-80% n'est pas très utile non plus. Comme indiqué dans d'autres postes, entrée mains libres peut être beaucoup plus facile pour ceux qui ont un téléphone mobile. Cependant, en utilisant des mots par rapport à l'entrée numérique peut effectivement être moins intuitif qu'un téléphone à clavier si le sujet est un peu étrangère à l'appelant. Un appelant entendre les termes et expressions qui ne sont pas très familiers ne peut pas les retenir dans les 10-30 secondes de l'invite, mais ils peuvent planer sur le meilleur choix de sondage avec leur doigt ou de se rappeler l'ordre des choix.

Quelles raisons vous avez d'investir dans ce développement?

Ceci est une question bizarre. Habituellement, la décision d'utiliser ou non la parole dans un environnement SVI n'est pas entraîné de la vue du développement du monde. Sauf si vous avez une exigence spécifique qui nécessite vraiment la parole, vous réduisez presque toujours le taux global de réussite. La parole est généralement un facteur d'image de l'entreprise ... ou d'avoir le dernier jouet technologique.

Je suppose que c'est un plus quand vous êtes dans votre voiture sans tenir votre téléphone mais il vaut la peine le temps d'attente supplémentaire?

latences de reconnaissance vocale ne sont pas très élevés ces jours-ci lors de l'utilisation ASRs modernes. Dans la plupart des cas, l'entrée est traité en parallèle avec la parole et le temps entre la fin de la reconnaissance vocale est 0,5 à 1 s. Soyez conscient que beaucoup de SVI doivent alors effectuer look-ups de données après quelques entrées et cela peut apparaître comme un système plus lent. entrées normales poussant au-delà de 1s est généralement le signe d'un déploiement alimenté sous.

Il peut ne pas avoir été sous-alimenté lorsque mis en œuvre d'origine, mais grâce à des efforts de réglage, vous faites beaucoup de performance par rapport à des décisions de précision. Pour obtenir ce prochain 0,1%, les ressources peuvent être poussés au-delà de ce qu'ils devraient être au sommet.

En outre, la fiabilité est meilleure qu'elle ne l'était, sans aucun doute, mais parfois il se sent plus comme un jouet que quelqu'un a décidé à brancher dans le système afin qu'il puisse se sentir futuriste.

En général, oui. Sur la note de fiabilité, vous devez vraiment regarder les chiffres globaux pour avoir une idée du système. Il est une bataille de statistiques, lorsque l'individu est pas très important (à moins qu'ils détiennent le titre de vice-président ou au-dessus). Grâce à l'optimisation de l'entrée (décalage invite), l'utilisation des ressources et d'autres paramètres de réglage de reco vocale vous essayez de maximiser la précision. Pour les réponses en langage naturel de base, vous pouvez obtenir dans les années 90 supérieures. Cependant, votre taux de réussite global est beaucoup plus faible. 5 Imaginez invite tous à 98% (en réalité, vous avez tendance à avoir un groupe de 99, puis quelques milieu des années 90 ou légèrement au-dessous): 0,98 * 0,98 * 0,98 * 0,98 * 0,98 = 90%. Cela signifie que 1 sur 10 à défaut. C'est avant confusion de l'appelant et les règles commerciales. entrée DTMF est généralement très proche de 100%, même après plusieurs entrées.

Toute expérience dans la conception IVR ou logiciel utilisé (ou choisi de ne pas) la reconnaissance de la parole? Oui. Mais, je pense que est vraiment pas la question que vous voulez. Comme quelqu'un du côté de la technologie, ce qui est généralement pas votre décision et que vous avez une influence limitée sur elle. Si vous cherchez vraiment les avantages / inconvénients de la parole:

Avantages:

Froid / hanche (note, la parole seule ne suffit pas. Vous avez besoin d'un grand talent VUI et voix)
Bon pour une foule très mobile qui évite les pièces d'oreille. L'avenir est censé être la parole mélange avec entrée tactile. Peut être. Il ne viendra probablement pas du côté IVR du marché.
Bon pour des tâches qui ne peuvent être faites avec DTMF. Notez, bon nombre de ces problèmes ont tendance à avoir un faible succès rAtes dans la parole aussi bien. Le coût (par rapport à l'homme) est généralement le facteur de conduite non de la facilité d'utilisation. La suppression d'un appel dans une boîte vocale pour des choses comme le changement d'adresse peut être très rentable.

Inconvénients:

Cher au développement, déployer et maintenir. L'ajout de nouveaux choix peut avoir un impact significatif sur les taux de réussite si vous ne faites pas attention. Surveillez toujours l'impact du changement.
est souvent déployée de façon inappropriée. Par exemple, disons que votre choix de menu numérique. Ceci est presque souvent un cas de fraîcheur, nous voulons de la parole, mais ne peut pas se permettre ce qu'il faut vraiment réaliser la fraîcheur de la parole.
Les taux de réussite seront plus faibles et donc appeler les coûts du centre seront plus élevés.
Les échecs ont tendance à se concentrer sur les invites spécifiques et les appels individuels. Un appelant qui connaît régulièrement des problèmes avec votre système sera très malheureux avec vous.
Les appelants se mettent en colère quand ils ne sont pas compris. Votre but est d'identifier un sous-ensemble de votre base de clients et de vraiment les mettre en colère?

Autres conseils

Je pense que la parole de reconnaissance comme une méthode d'entrée a il est

pro et con.

Pro de

Pas de courbe d'apprentissage, nous avons parlé depuis un très jeune âge.
Très-utilisateur intuitive.
Sur le téléphone, pas besoin de se déplacer en permanence le casque de votre oreille.

Con

plus long temps d'attente
Si la mauvaise qualité sonore, prend de multiples tentatives pour obtenir le droit de sélection.

Dans certains cas, une entreprise est nécessaire pour gérer les téléphones rotatifs. Il peut être trouvé comme plus affectif des coûts pour simplement configurer le système de reconnaissance au lieu des deux.

La reconnaissance vocale a beaucoup plus de frais généraux que les tons tactiles. Si vous voulez les meilleurs résultats, vous devez modifier en permanence l'application et de former le système sur la prononciation de mots non reconnus. Vous devez également être très particulier sur la façon dont vous invite l'utilisateur avec la reconnaissance vocale ou vous pouvez obtenir des réponses inattendues.

tonalité d'ensemble est beaucoup plus facile car il n'y a qu'un nombre limité d'options possibles à tout moment.

Si votre application est simple suffit que vous exprimez beaucoup rec que compliquer. Appuyez sur 2 pour une autre langue ..

La reconnaissance vocale est definetly la vague de l'avenir lorsqu'il est combiné avec la technologie de l'écran tactile. A titre d'exemple, j'utilise la reconnaissance vocale tazti. Il est disponible dans la version XP et Vista. Depuis la plate-forme tactile « Surface » de Microsoft fonctionne sur Vista, je suis sûr que tazti travaillera avec la technologie de l'écran tactile. Quand j'ai essayé la reconnaissance vocale tazti intégré dans les commandes fonctionnait très bien. En outre, il me laisse créer mes propres commandes vocales et ceux qui travaillent aussi grande. Voix de recherche Google et Yahoo, Wikipedia Youtube et bien d'autres moteurs de recherche fonctionne très bien. A de nombreuses autres fonctionnalités aussi bien. Mais il n'a pas dictée. Je trouve que j'élimine 70% ou plus de mon Internet ont généré des clics .... peut-être plus. NOTE:. Tazti est un téléchargement gratuit de leur site web

Licencié sous: CC-BY-SA avec attribution

Non affilié à StackOverflow