logo

Capítulo 1: Asistencia con Documentos

  • Esta primera parte del video muestra cómo utilizar Google AI Studio con la función de “stream” (transmisión) para tener una conversación en tiempo real con el modelo Gemini mientras este ve tu pantalla.
  • La prueba inicial se realiza con un documento de Google Docs titulado “Software IA”.
  • El usuario simula tener un tutor de IA que ve su documento y le pregunta cómo realizar tareas comunes.
  • Se hacen preguntas específicas como:
    • ¿Cómo añadir paginación (números de página) al documento? La IA responde indicando ir a “Insertar” y luego seleccionar “Números de página” y elegir el estilo.
    • ¿Cómo añadir comentarios para colaboradores? La IA explica seleccionar el texto o sección, hacer clic derecho y elegir “Comentar”.
    • ¿Cómo exportar el documento como PDF? La IA guía al usuario a través de “Archivo”, luego “Descargar”, y finalmente “Documento PDF”.
  • Este capítulo demuestra la facilidad con la que se pueden obtener respuestas concretas y pasos a seguir para dudas que se tengan sobre un documento específico que la IA está visualizando.

Capítulo 2: Asistencia con Software de Escritorio Especializado

  • La segunda parte busca probar si la IA puede guiar al usuario a través de un editor de video instalado en su computadora.
  • Se utiliza Google AI Studio, pero esta vez se inicia una nueva conversación para no tener en cuenta el historial previo.
  • Se introducen dos funciones importantes de Google AI Studio: aumentar la ventana de contexto (para que recuerde más la conversación) y añadir una instrucción personalizada.
  • En este caso, se le da la instrucción a la IA: “Actúa como un experto editor de video de CapCut” (el programa que se usará).
  • El usuario comparte la ventana específica de CapCut.
  • Se plantean desafíos más complejos relacionados con la edición de video:
    • ¿Cómo añadir subtítulos automatizados? La IA proporciona una secuencia de pasos dentro de CapCut: seleccionar el clip, ir a “Texto”, elegir “Subtítulos automáticos”.
    • ¿Cómo cambiar el color de los subtítulos generados? La IA indica seleccionar el texto y usar las opciones de formato en el panel derecho, en la sección “Texto”.
    • ¿Cómo añadir un borde a los subtítulos para que contrasten mejor? La IA señala que la opción de borde está en la sección “Carácter”, justo debajo de la opción de color.
    • ¿Cómo añadir una transición entre dos clips de video? La IA describe el proceso: seleccionar el punto de corte, ir a la pestaña “Transiciones”, y arrastrar y soltar la transición deseada.
  • Este capítulo muestra cómo la IA puede ofrecer asistencia detallada para programas específicos, mejorando su utilidad con instrucciones personalizadas y un contexto de conversación más amplio.

Capítulo 3: Configuración de Sistemas Complejos con Búsqueda en Internet

  • Este capítulo eleva la dificultad probando la capacidad de la IA para ayudar a configurar un agente de inteligencia artificial en una herramienta de automatización compleja como N8N.
  • Se mantiene el uso de Google AI Studio, pero se desactiva la instrucción personalizada previa.
  • La función clave habilitada en esta parte es “Grounding with Google Search”. Esto permite que la IA busque información en internet en tiempo real para guiar al usuario.
  • El usuario comparte la pantalla de N8N y pide ayuda para crear un chatbot de atención al cliente.
  • La IA, utilizando potencialmente su capacidad de búsqueda, guía al usuario a través de los pasos en N8N:
    • Define el disparador (“trigger”), que sería un mensaje nuevo en el chat.
    • Explica cómo agregar el siguiente paso clicando en el “+”.
    • Sugiere añadir un nodo de “Advanced AI” para integrar un agente de inteligencia artificial.
    • Guía sobre cómo conectar un modelo de lenguaje clicando debajo de “chat model”.
    • Ante la pregunta de qué modelo de OpenAI es barato y funciona bien, sugiere GPT 3.5 Turbo.
    • Indica cómo añadir memoria para que el agente recuerde conversaciones previas, recomendando “Simple Memory”.
    • Finalmente, explica cómo probar si el flujo funciona usando “Execute previous Notes” y “Open chat”.
  • Este capítulo demuestra que la IA puede ayudar en tareas de configuración técnica avanzada y que la función de búsqueda en internet (“Grounding with Google Search”) es fundamental para obtener guías actualizadas o información necesaria para completar la tarea.

Capítulo 4: Asistencia con Aplicaciones Móviles y Búsqueda en la App Store

  • La prueba final lleva la funcionalidad a los dispositivos móviles, mostrando que estas capacidades de asistencia con visualización de pantalla no se limitan al escritorio.
  • Se menciona que herramientas como ChatGPT (para usuarios Plus), Gemini (en Android), Perplexity (en Android) y Copilot (próximamente) también están incorporando estas funciones. El video se enfoca en la demostración con ChatGPT en un iPhone.
  • Se comparte la pantalla del teléfono móvil.
  • Primer caso de uso móvil: Asistencia con una aplicación conocida como Gmail.
    • El usuario pregunta cómo programar el envío de un correo electrónico.
    • La IA (ChatGPT en este caso) le indica los pasos en Gmail: hacer clic en la flecha junto al botón “Enviar” y seleccionar “Programar envío”.
  • Segundo caso de uso móvil: Buscar una aplicación en la App Store con criterios específicos (gratuita para dormir mejor).
    • El usuario pide a ChatGPT que busque en internet (o actúe como si lo hiciera, basándose en su entrenamiento o capacidades) una aplicación para iPhone.
    • La IA sugiere inicialmente “Autosleep”.
    • El usuario la busca en la App Store y se da cuenta de que es de pago.
    • El usuario pide una alternativa gratuita.
    • La IA sugiere “Sleep Cycle” y confirma que es esa la que se ve en la pantalla del usuario en la App Store.
  • Este capítulo concluye mostrando la versatilidad de la asistencia de IA con visualización de pantalla, extendiéndola al uso de aplicaciones móviles y la capacidad de buscar y recomendar herramientas basadas en criterios específicos del usuario, funcionando como un asistente útil tanto en el ordenador como en el teléfono.