La actualización de Google Docs podría hacer realmente útil la escritura por voz

Google Docs está recibiendo una gran actualización que pronto podría hacer que su función de escritura por voz sea mucho más útil y popular para transcribir reuniones.

El procesador de textos en la nube lleva varios años ofreciendo la posibilidad de «escribir» a manos libres con la voz (basta con ir a Herramientas > Escritura por voz, con el micrófono activado). Pero una actualización que llegará a principios de febrero verá algunas mejoras en la función, además de la opción de usarlo en los navegadores web más allá de Chrome.

Google afirma que la actualización «ayudará a reducir los errores de transcripción y a minimizar la pérdida de audio durante la transcripción». Las limitaciones de la encarnación actual le han hecho perder terreno frente a las mejores aplicaciones de voz a texto, como Otter.ai, ampliamente utilizada por el equipo de TechRadar. Las herramientas de reconocimiento de voz y accesibilidad de Microsoft también han dado grandes saltos recientemente en aplicaciones como Word.

Pero si el equivalente integrado de Google Docs puede igualar la precisión de sus cada vez más impresionantes rivales, podría convertirse en una herramienta mucho más utilizada. Sobre todo porque también funcionará en Google Slides para mostrar las palabras de un orador en tiempo real.

La función también debería seguir mejorando gracias a otra actualización: la ampliación de la compatibilidad a «la mayoría de los principales navegadores». Google aún no ha dicho qué navegadores, pero es seguro decir que Safari, Firefox y Microsoft Edge podrían estar incluidos.

Probablemente lo sabremos cuando la actualización comience a desplegarse a lo largo del próximo mes. Los usuarios de Google Workspace que estén suscritos a las actualizaciones de Lanzamiento Rápido empezarán a verla llegar a partir de hoy, pero la mayoría de nosotros veremos un despliegue gradual a lo largo de dos semanas a partir del 6 de febrero.


Análisis: La IA aprende a ser útil

Google no ha sido explícito sobre qué tecnología está impulsando su actualización de escritura por voz en Google Docs, pero es probable que sea similar a la interfaz basada en IA que ofrece a las empresas para mejorar servicios como las interacciones con los clientes.

La tecnología de IA ha ido mejorando rápidamente en el espacio visual con productos como Dall-E y Midjourney, junto con chatbots como ChatGPT. El reconocimiento de la escritura también ha recibido un gran impulso. Pero el habla es sin duda una de las áreas más útiles para el desarrollo de la IA, tanto para la usabilidad como para la accesibilidad. Y un software de voz a texto fiable es sólo el principio.

Microsoft acaba de presentar una nueva tecnología de IA escalofriante, pero potencialmente útil, llamada Vall-E, que puede imitar voces humanas (se abre en una nueva pestaña) basándose solo en una muestra de tres segundos. En una línea similar, Apple acaba de lanzar su primera gama de audiolibros con narradores dotados de inteligencia artificial (arriba).

Estos avances plantean enormes cuestiones éticas en torno a la posibilidad de suplantación de identidad, razón por la cual la tecnología que los sustenta está actualmente bloqueada y no está disponible para los consumidores. Pero la caja de Pandora de la tecnología basada en la voz se ha abierto de par en par.

Por ahora, las rápidas mejoras en la tecnología de voz a texto que encontramos en Google Docs (y, de hecho, en el mejor software de texto a voz) son los frutos más útiles de estos nuevos algoritmos de IA. Mientras ese software toma las notas de nuestras reuniones, nosotros prepararemos las palomitas para los inevitables debates éticos sobre los imitadores de voz de nueva generación.