Este bloque trata sobre cómo transformar información escrita en audio en español.
- Caso de Uso 5: Transcripción y Narración de Audio en Español
- Se puede generar un audio en NotebookLM (aunque por defecto puede estar en otro idioma como inglés). Se descarga el audio.
- Se va a la plataforma Google AI Studio. En la sección de chat, se selecciona Gemini 2.5 Flash.
- Se carga el audio descargado.
- Se le pide a Gemini que transcriba la información en español y que lo haga como si fuese una persona narrando, sin añadir tiempos y solo como texto.
- Gemini 2.5 Flash, siendo un modelo de razonamiento, puede mostrar su proceso de pensamiento.
- Es capaz de hacer la transcripción a gran velocidad, incluso de audios largos (ejemplo con 20 minutos).
- El resultado es el texto narrativo recreado en español y la transcripción completa del audio.
- Caso de Uso 6: Recreación de Podcast con Múltiples Voces
- Se utiliza la plataforma ElevenLabs.
- Se carga el archivo de audio (por ejemplo, un podcast) a ElevenLabs.
- ElevenLabs realiza la transcripción del audio.
- La herramienta puede diferenciar a las personas que hablan (identificando “Speaker 0”, “Speaker 1”, etc.).
- Se exporta el texto transcrito. Opcionalmente, se puede exportar sin las líneas de tiempo para un texto más limpio.
- El texto se traduce al español (usando una herramienta como Google Translate o pidiéndoselo a una IA como ChatGPT).
- Se copia el texto traducido y se pega en el apartado “studio” de ElevenLabs.
- Esta interfaz permite que cada frase sea dicha por una persona distinta. Se pueden seleccionar diferentes voces predefinidas para asignar a cada parte del diálogo.
- La plataforma permite clonar voces para usar una voz propia o de otra persona.
- Al reproducir, se escucha el podcast con las voces seleccionadas en español, personalizando completamente lo que dicen. Esto permite “no perder ese podcast que esté en nuestro idioma”.
- Caso de Uso 7: Creación de Canciones sobre Temas Específicos
- Se vuelve al documento resumen de NotebookLM.
- Se copia la información.
- Se inicia un nuevo chat de Gemini.
- Se le pide a Gemini que cree una canción educativa infantil en español que enseñe la información copiada de forma sencilla.
- Gemini redacta la letra de la canción.
- Se copia la letra generada.
- Se salta a la plataforma Refusion (descrita como similar a Suno, pero gratuita y limitada).
- En Refusion, se pega la letra en el apartado “lyrics”. Se especifica el estilo de sonido (ej. “canción infantil”).
- Se genera la canción. Refusion procesa y genera el audio de la canción.
- Esto muestra lo fácil que es ahora aprender incluso para los más pequeños.