Whisper, la herramienta de inteligencia artificial de OpenAI para convertir archivos de audio a texto

Los creadores de ChatGPT y DALL-E 2 también tienen una herramienta que simplificará tu vida cuando necesites convertir grabaciones de audio a texto.

learn more about Eduardo Scheffler Zawadzki

PorEduardo Scheffler Zawadzki

whisper.ai

Quienes trabajamos en el mundo editorial sabemos lo engorroso que puede resultar transcribir una entrevista. A veces, la parte fácil del proceso es realizar la entrevista en sí misma; lo complicado es transcribirla en un intento por recuperar las palabras y el tono exacto en que el entrevistado habló.

Aunque a lo largo de los años han aparecido diversas aplicaciones para convertir archivos de audio de voz en texto, solían presentar algunas fallas (sobre todo con la puntuación) y se trataba de aplicaciones de paga en las que, además, había que subir los archivos a su plataforma. El proceso seguía teniendo un su grado de complejidad y tedio.

Ahora ha aparecido en el mercado una nueva herramienta impulsada por lainteligencia artificialcapaz de comprender y transcribir a la perfección voces hasta en 90 idiomas. Su nombre esWhisper(susurro en español) y es una creación deOpenAI, la organización que ha tomado por asalto este 2023 y que ya está transformando el modo en el que trabajamos con el modelo de lenguaje autorregresivo,GPT-3, yDALL-E 2, esa herramienta capaz de generar increíbles imágenes y diseño a partir de una entrada de texto.

¿Qué es Whisper?

Según se explica en lapágina oficial del proyecto, Whisper "esun sistema de reconocimiento automático de voz (ASR)entrenado con más de 680,000 horas de datos supervisados multilingües y multitarea recopilados de la web".

El programa no solo es capaz de convertir a texto lo que escucha, sino que también de traducirlo al inglés en tiempo (por ahora) con resultados sorprendentes. La herramienta es muy precisa, reconoce la puntuación y es capaz de entender hasta las voces veloces y complejas. He aquí un ejemplo:

¿Cómo usar Whisper?

El problema con Whisper es que (todavía) no es fácil de utilizar. Como un gran número de aplicaciones de inteligencia artificial, es necesario utilizar un programa comoGoogle Colabque permite a los usuarios "escribir y ejecutar código abierto de Python en el navegador". Aunque este proceso no es tan complejo como suena (y existen cantidad de tutoriales en YouTube que te ayudarían a hacerlo), sigue siendo engorroso sobre todo para quienes no somos desarrolladores.

Pero gracias a que Whisper esun desarrollo de código abierto, varios programadores han comenzado a crear aplicaciones más amigables impulsadas por Whisper que, una vez instaladas, te permiten probar las mieles de latranscripción de texto asistida por la inteligencia artificial.

Si te interesa saber más al respecto y quieres probar instalara en tu computadora te recomendamos ver este tutorial en el queDot CSVte explica cómo hacerlo:

Eduardo Scheffler Zawadzki

Entrepreneur Staff

Experto en creación de contenidos

Temas relacionados

Noticias

La canción de Drake y The Weeknd creada por la inteligencia artificial que se hizo viral

Plataformas como Spotify y YouTube tuvieron que eliminar la canción, debido a una solicitud de Universal Music.

Emprendedores

6 maneras en que los propietarios de pequeñas empresas pueden utilizar ChatGPT para eliminar horas de trabajo

La tecnología que permitirá a las pequeñas empresas y emprendedores competir con las grandes corporaciones ya está disponible y es gratis. Pero está en su infancia y no hay un manual de usuario. Estoy aquí para ayudar.

Tecnología

丫esta aqui Auto-GPT拉inteligencia人工que trabaja (casi) sola

El modelo es capaz de auto gestionarse para seguir trabajando, buscando cumplir un objetivo.

Estilo de vida

10 maneras efectivas en que las personas inteligentes tratan a las personas groseras

Tal vez no sea realmente una persona grosera, tal vez sea una persona estresada que está siendo grosera.