La nueva actualización de Gemini 1.5 Pro agrega la capacidad de escuchar archivos de audio y luego procesar y extraer información de texto de esos clips de audio. Gemini es capaz de procesar diferentes tipos de audio en texto, en muchos idiomas diferentes para ayudar a los usuarios a obtener fácilmente el contenido que necesitan. Aquí hay una guía para convertir audio a texto en Gemini 1.5 Pro.
Cómo convertir audio a texto en Gemini 1.5 Pro
Paso 1:
Primero debes acceder al sitio web de procesamiento de audio de Gemini en el siguiente enlace.
A continuación, mire la sección Modelo a la derecha y seleccione Gemini 1.5 Pro para usar.

Paso 2:
A continuación, el usuario hace clic en la pestaña Audio de arriba para descargar el archivo de audio que desea convertir a texto.

El usuario ahora verá opciones para cargar audio a Gemini 1.5 Pro para su uso. Selecciona Drive para descargar audio desde Google Drive.

En este punto, el usuario debe aceptar que Google AI Studio acceda a su cuenta de Google.

Paso 3:
Los usuarios cargan el archivo de audio que se procesará en Gemini 1.5 Pro, ingresan la solicitud que desean realizar y luego presionan el ícono circular azul de envío . Tenga en cuenta que cada cuenta tendrá su propia cantidad de tokens y cada vez que cargue un archivo de audio, se necesitará una cantidad diferente de tokens para procesar el archivo cargado.

Paso 4:
Inmediatamente después verás el contenido transferido desde el audio a Gemini 1.5 Pro como se muestra a continuación. El contenido está escrito de forma clara y específica por hora para que los usuarios puedan seguirlo fácilmente.

Esta nueva función de Gemini 1.5 Pro se aplica a todas las cuentas de Google sin necesidad de registrar nada más.