logo

Este bloque trata sobre cómo transformar información escrita en audio en español.

  • Caso de Uso 5: Transcripción y Narración de Audio en Español
    • Se puede generar un audio en NotebookLM (aunque por defecto puede estar en otro idioma como inglés). Se descarga el audio.
    • Se va a la plataforma Google AI Studio. En la sección de chat, se selecciona Gemini 2.5 Flash.
    • Se carga el audio descargado.
    • Se le pide a Gemini que transcriba la información en español y que lo haga como si fuese una persona narrando, sin añadir tiempos y solo como texto.
    • Gemini 2.5 Flash, siendo un modelo de razonamiento, puede mostrar su proceso de pensamiento.
    • Es capaz de hacer la transcripción a gran velocidad, incluso de audios largos (ejemplo con 20 minutos).
    • El resultado es el texto narrativo recreado en español y la transcripción completa del audio.
  • Caso de Uso 6: Recreación de Podcast con Múltiples Voces
    • Se utiliza la plataforma ElevenLabs.
    • Se carga el archivo de audio (por ejemplo, un podcast) a ElevenLabs.
    • ElevenLabs realiza la transcripción del audio.
    • La herramienta puede diferenciar a las personas que hablan (identificando “Speaker 0”, “Speaker 1”, etc.).
    • Se exporta el texto transcrito. Opcionalmente, se puede exportar sin las líneas de tiempo para un texto más limpio.
    • El texto se traduce al español (usando una herramienta como Google Translate o pidiéndoselo a una IA como ChatGPT).
    • Se copia el texto traducido y se pega en el apartado “studio” de ElevenLabs.
    • Esta interfaz permite que cada frase sea dicha por una persona distinta. Se pueden seleccionar diferentes voces predefinidas para asignar a cada parte del diálogo.
    • La plataforma permite clonar voces para usar una voz propia o de otra persona.
    • Al reproducir, se escucha el podcast con las voces seleccionadas en español, personalizando completamente lo que dicen. Esto permite “no perder ese podcast que esté en nuestro idioma”.
  • Caso de Uso 7: Creación de Canciones sobre Temas Específicos
    • Se vuelve al documento resumen de NotebookLM.
    • Se copia la información.
    • Se inicia un nuevo chat de Gemini.
    • Se le pide a Gemini que cree una canción educativa infantil en español que enseñe la información copiada de forma sencilla.
    • Gemini redacta la letra de la canción.
    • Se copia la letra generada.
    • Se salta a la plataforma Refusion (descrita como similar a Suno, pero gratuita y limitada).
    • En Refusion, se pega la letra en el apartado “lyrics”. Se especifica el estilo de sonido (ej. “canción infantil”).
    • Se genera la canción. Refusion procesa y genera el audio de la canción.
    • Esto muestra lo fácil que es ahora aprender incluso para los más pequeños.