La mise à jour de Gboard offre une reconnaissance vocale ultra-rapide sur l'appareil

La conversion de la parole en texte est une fonction incroyablement astucieuse lorsque vous conduisez ou lorsque vos mains ne sont pas disponibles pour taper. L’utilité d’une telle fonction dépend en grande partie du logiciel qui traite votre voix et de la vitesse à laquelle elle est traitée, car dans certains cas, cela peut prendre trop de temps au point où vous pourriez être plus rapide simplement en la tapant.

Alternativement, il peut aussi être très imprécis, ce qui fait que vous passez plus de temps à l’éditer. Pour les utilisateurs de Gboard qui pensent que la fonctionnalité de reconnaissance vocale de l’application pourrait être améliorée, vous avez de la chance car Google a annoncé qu’il a commencé à déployer la reconnaissance vocale « de bout en bout, entièrement neurologique, sur l’appareil » pour cette application.

« Aujourd’hui, nous sommes heureux d’annoncer le déploiement d’un dispositif de reconnaissance de la parole de bout en bout, entièrement neuronal, pour alimenter l’entrée vocale dans Gboard. Dans notre récent article,’Streaming End-to-End Speech Recognition for Mobile Devices’, nous présentons un modèle formé en utilisant la technologie de transducteur RNN (RNN-T) qui est suffisamment compact pour résider sur un téléphone. Cela signifie qu’il n’y a plus de latence du réseau ou de spottiness – le nouveau recognizer est toujours disponible, même lorsque vous êtes hors ligne. »

Généralement, lorsque la reconnaissance vocale est utilisée, l’information est envoyée à des serveurs distants qui se chargeront de tout le traitement pour comprendre ce que vous essayez de dire. Comme nous l’avons dit, cela peut prendre un certain temps en fonction du trafic du serveur et de la vitesse de votre connexion, mais la dernière mise à jour de Gboard prendra tout ce processus hors ligne et le mettra dans votre téléphone.

Lire également : Samsung espère capitaliser sur les malheurs de Huawei

En fin de compte, cela devrait réduire le temps passé à traiter les données, et à son tour permettra également une sortie en temps réel, caractère par caractère, ce qui, selon Google, donnera l’impression que quelqu’un tapait ce que vous dites comme vous le dites.

Cela dit, la mauvaise nouvelle est que la fonctionnalité ne sera disponible que sur les appareils Google Pixel pour le moment, mais nous espérons qu’elle finira par trouver son chemin vers d’autres appareils dans un avenir proche.

Source : Google

Related Posts

Digitalisation des services : les solutions pour transformer son idée en produit rapidement

Comment activer la 4K sur une TV ?

Comment désactiver Play Protect ?