M
Lección 05 — Guía Completa

Gemini
El multimedia y el ecosistema Google

Gems personalizados, análisis de videos y audios, Google Workspace con IA integrada, generación de imágenes y Google AI Studio

🔗 gemini.google.com ↗ Google Acceso gratuito disponible
Gemini Advanced Gems YouTube Audio Workspace Imágenes AI Studio
2hAudio/video
GemsAsistentes propios
NativoGoogle Workspace
GratisPlan base
En esta lección: ¿Qué hace diferente a Gemini? Videos y YouTube Audio y podcasts Gems personalizados Google Workspace Generación de imágenes AI Studio Casos reales
Introducción
¿Qué hace diferente a Gemini?

Gemini es la IA de Google — y eso lo cambia todo. Tiene acceso nativo a todo el ecosistema Google: Drive, Docs, Sheets, Slides, Gmail, YouTube, Maps y Search. Ninguna otra IA tiene esa integración profunda.

Su superpoder real es el multimedia: puede ver videos completos de YouTube, transcribir y analizar audios de hasta 2 horas, generar imágenes de alta calidad y entender el contexto visual de fotografías. Para autores que investigan con videos y para empresas que manejan reuniones grabadas, Gemini es insustituible.

🎬
Videos y YouTube nativos
Analiza videos de YouTube completos y archivos de video propios. Extrae puntos clave, citas, resúmenes y responde preguntas sobre el contenido sin que lo veas.
Exclusivo
🎙️
Audio hasta 2 horas
Sube grabaciones de reuniones, entrevistas o podcasts. Gemini transcribe, resume, identifica speakers y extrae los puntos de acción automáticamente.
Potente
💎
Gems: asistentes propios
Crea asistentes especializados con personalidad, instrucciones y acceso a tus archivos de Drive. Similares a los GPTs de ChatGPT pero integrados con Google.
Gratis
📊
Google Workspace con IA
Docs, Sheets, Slides y Gmail tienen Gemini integrado nativamente. Redacta, resume, analiza y genera contenido directamente en tus documentos de trabajo.
Workspace
💡
Gemini Free vs Advanced: El plan gratuito da acceso a Gemini 1.5 Flash con funciones básicas. Gemini Advanced (~$20 USD/mes) incluye Gemini 2.0 Ultra, análisis de audio/video largo, más capacidad de contexto y acceso prioritario a nuevas funciones. Para usuarios de Google Workspace, Gemini viene incluido en planes Business y Enterprise.
🚀
Visión XAI: La ventana de contexto de 1 millón de tokens de Gemini no es solo "espacio". Es la capacidad de mantener la coherencia entre el Capítulo 1 y el Capítulo 30 de tu libro simultáneamente.
🎬
Multimedia
Analizar videos de YouTube y archivos de video

Esta es la función más poderosa de Gemini frente a sus competidores. Claude y ChatGPT no pueden ver videos — solo leen transcripciones. Gemini ve el video real: imágenes, gráficas, presentaciones, demostraciones en pantalla y todo el contenido visual.

Para autores que investigan con conferencias, TED Talks o documentales. Para empresas que graban reuniones, demos de ventas o capacitaciones. Para cualquiera que quiera convertir horas de video en minutos de insights.

📋 Lo que Gemini "ve" en tus videos:
  • Texto en diapositivas o pizarras (OCR).
  • Objetos, colores y cambios de escena.
  • Lenguaje corporal y expresiones faciales.
  • Demostraciones de software paso a paso.
📺
Ejemplo real — Análisis de video de YouTube
youtube.com/watch?v=dQw4w9WgXcQ · Conferencia: "Consciencia y Realidad" · 1h 23min
"Analiza esta conferencia completa. Dame los 5 argumentos filosóficos principales, las referencias bibliográficas que menciona el ponente, los momentos donde hay mayor audiencia y una cita textual memorable para cada argumento."
Argumento 1 (min 8:24): La consciencia como campo no-local — referencia a Penrose y Hameroff, teoría Orch-OR
Argumento 2 (min 22:10): La paradoja del observador en mecánica cuántica aplicada a experiencia subjetiva
Argumento 3 (min 41:35): Noesis como acceso directo al conocimiento — conexión con fenomenología de Husserl
Cita memorable (min 55:18): "La consciencia no emerge del cerebro — el cerebro emerge de la consciencia"
Bibliografía detectada: 12 referencias citadas — generando lista completa...
Prompt para investigación con YouTube
Analiza este video de YouTube: [URL]. Extrae: 1) Los 5 argumentos o puntos principales con el minuto exacto donde aparecen, 2) Todas las referencias bibliográficas o autores citados, 3) Las 3 citas textuales más relevantes para mi investigación sobre [tema], 4) Preguntas que quedaron sin responder y que podría explorar en mis escritos.
Prompt para análisis de grabación de reunión empresarial
Analiza esta grabación de reunión adjunta. Identifica: 1) Los puntos de acción acordados con el responsable de cada uno, 2) Las decisiones tomadas y las que quedaron pendientes, 3) Los desacuerdos o tensiones que surgieron, 4) El tiempo aproximado de participación de cada persona. Formato de salida: acta ejecutiva lista para distribuir.
🎯
Para autores de ficción filosófica: Sube a Gemini conferencias de filósofos, documentales sobre consciencia o entrevistas con pensadores. Pídele que extraiga los argumentos que conectan con los temas de tu novela. Gemini ve las diapositivas, las fórmulas en la pizarra y los gráficos — no solo escucha el audio.
🎙️
Multimedia
Análisis de audio: reuniones, podcasts y entrevistas

Gemini procesa archivos de audio de hasta 2 horas. No solo transcribe — identifica hablantes, detecta el tono emocional, extrae puntos de acción y genera el resumen ejecutivo. Es el fin de las actas de reunión manuales.

🎤
Entrevistas para investigación literaria
Autores
Grabaste 3 horas de entrevistas con expertos en filosofía de la consciencia para documentar Noesis. Sube los audios a Gemini y pídele que extraiga los testimonios más relevantes por tema, las citas que puedes usar con atribución, las historias personales de cada entrevistado y las contradicciones entre sus puntos de vista.
Analiza estas entrevistas de audio adjuntas. Identifica y organiza por tema: citas directas sobre [tema central], momentos de mayor claridad conceptual, anécdotas personales que ilustren los conceptos y puntos donde los entrevistados contradicen o complementan la perspectiva del otro. Incluye el nombre del hablante y el minuto aproximado de cada cita.
💼
Actas automáticas de reunión
Empresas
Graba tu reunión con cualquier app de grabación (Meet, Teams, Zoom o incluso el teléfono). Sube el audio a Gemini. En 2 minutos tienes el acta completa: asistentes identificados por voz, puntos discutidos, decisiones tomadas, tareas asignadas con responsable y próxima fecha de seguimiento.
Transcribe y analiza esta grabación de reunión. Genera un acta ejecutiva con: participantes identificados, agenda cubierta, decisiones tomadas (con quién las propuso), tareas asignadas (responsable + fecha comprometida), temas que quedaron pendientes y fecha de próxima reunión si se acordó.
🎧
Análisis competitivo de podcasts
Creadores
Descarga los episodios de los podcasts más exitosos de tu nicho y súbelos a Gemini. Analiza su estructura, los temas que generan más engagement, el ritmo de la conversación y los ganchos que usan al inicio. Usa esos insights para diseñar tu propio podcast literario.
Analiza estos 3 episodios de podcast de mi nicho. Identifica: estructura del episodio (tiempo por sección), técnicas de gancho en los primeros 3 minutos, momentos de mayor energía o ritmo, temas que generan discusión y cómo presentan a los invitados. Dame un framework replicable para mis propios episodios.
💎
Asistentes personalizados
Gems: crea tu asistente especializado

Un Gem es un asistente de Gemini con personalidad, instrucciones y acceso a tus archivos de Google Drive. Lo creas una vez y está disponible en cualquier conversación de Gemini. Piensa en ello como tener un experto especializado siempre listo.

Gem Manager — Mis Gems
Gemini Advanced
Nombre del Gem
Editor φ — Corrector filosófico de Noesis
Instrucciones del sistema
"Eres un editor literario especializado en filosofía fenomenológica. Corriges textos manteniendo el tono lírico y filosófico del autor. Señalas inconsistencias con el sistema conceptual de la cuatrilogía φ (noesis, noema, metanoia, anamnesis). Nunca cambias la voz del autor — solo señalas problemas y propones alternativas..."
Archivos conectados de Drive
📄 Glosario_filosofico_phi.docx · 📄 Guia_estilo_Yoniliman.pdf · 📄 Personajes_cuatrilogia.pdf
φ
Editor φ
Listo para revisar tu manuscrito. Envíame el fragmento que quieres editar y te daré retroalimentación filosófica y estilística alineada con la cuatrilogía.
1
Accede a Gem Manager
Ve a gemini.google.com → clic en tu foto de perfil → "Gem Manager" → "Nuevo Gem". O busca el ícono de Gems en el panel lateral izquierdo de Gemini.
💡 Gems disponibles en el plan gratuito con limitaciones — Advanced desbloquea el máximo potencial
2
Define el nombre y las instrucciones
El campo de instrucciones es el más importante. Define: el rol específico del Gem, el tono de sus respuestas, qué puede y no puede hacer, y cómo debe formatear sus respuestas. Cuanto más específico, mejor el resultado.
💡 Usa el botón "Probar Gem" para verificar cómo responde antes de guardarlo
3
Conecta archivos de Google Drive
A diferencia de ChatGPT GPTs, los Gems pueden conectarse directamente a archivos de tu Google Drive y mantenerlos actualizados en tiempo real. Si actualizas el documento en Drive, el Gem lo refleja automáticamente.
💡 Esta conexión en tiempo real con Drive es la ventaja clave de Gems sobre GPTs
4
Usa el Gem en cualquier conversación
Desde el panel lateral de Gemini selecciona tu Gem antes de iniciar la conversación. El Gem recuerda sus instrucciones pero NO recuerda conversaciones anteriores — cada sesión empieza fresca con el contexto base del Gem.
💡 Para proyectos largos combina Gems (instrucciones) + archivos adjuntos (contexto de la sesión)
🔥
5 Gems que todo autor y profesional debería crear: 1) "Editor de estilo" — revisa coherencia con tu voz narrativa, 2) "Generador de sinopsis" — convierte capítulos en resúmenes de marketing, 3) "Analista de reuniones" — procesa grabaciones y genera actas, 4) "Redactor de propuestas" — adapta tu pitch a cada cliente, 5) "Tutor del equipo" — responde preguntas sobre tus manuales y políticas internas.
📊
Ecosistema Google
Gemini en Google Docs, Sheets, Slides y Gmail

Si ya usas Google Workspace (y la mayoría de colombianos lo usa), Gemini ya está ahí esperándote. No tienes que cambiar de herramienta ni copiar y pegar — la IA vive dentro de tus documentos de trabajo.

✍️
Redactar desde cero
Clic derecho → "Ayúdame a escribir". Describe lo que necesitas y Gemini genera el texto directamente en tu documento. Para capítulos, reportes, propuestas o cualquier contenido largo.
🔄
Reformular y mejorar
Selecciona cualquier párrafo → "Reformular". Gemini ofrece versiones alternativas: más formal, más concisa, más persuasiva o en otro tono. Tú eliges la que mejor funciona.
📋
Resumir documentos largos
Abre el panel de Gemini (ícono de estrella) → "Resume este documento". Genera un resumen ejecutivo del documento completo en segundos, sin importar cuántas páginas tenga.
Hacer preguntas sobre el documento
"¿Cuáles son las obligaciones del contratista en este contrato?" o "¿Qué secciones no tienen conclusión?" — Gemini responde basándose en el contenido del documento abierto.
🧮
Fórmulas en lenguaje natural
"Ayúdame a escribir" en cualquier celda → describe lo que necesitas calcular. Gemini genera la fórmula correcta — sin memorizar VLOOKUP, SUMIFS o funciones complejas.
📊
Generar tablas y análisis
"Crea una tabla comparativa de estos datos con las columnas X, Y, Z" — Gemini genera la estructura de la tabla y los datos organizados directamente en el Sheet.
🔍
Analizar y encontrar patrones
Selecciona el rango de datos → pregunta en el panel de Gemini: "¿Qué meses tienen las ventas más bajas y hay algún patrón?" Gemini analiza los datos y responde en lenguaje natural.
🧹
Limpiar datos automáticamente
"Detecta y corrige inconsistencias en esta columna de fechas" — Gemini identifica el problema y genera las fórmulas o las correcciones directas en el Sheet.
🎨
Crear presentación desde cero
En Slides nuevo → "Crear con Gemini". Describe el tema y el número de diapositivas. Gemini genera la estructura, el contenido y el diseño básico de toda la presentación.
🖼️
Generar imágenes para cada slide
En cualquier diapositiva → "Insertar imagen → Crear imagen con IA". Describe la imagen que necesitas y Gemini la genera directamente en el slide. Sin salir de Slides.
📝
Notas del presentador automáticas
"Genera las notas del presentador para esta diapositiva" — Gemini crea un guion de apoyo completo con los puntos clave a mencionar, las transiciones y el tiempo sugerido.
🔄
Convertir documentos en presentaciones
Describe el documento de Drive que quieres convertir. Gemini lee el Doc y genera automáticamente una presentación de Slides con la estructura y el contenido del documento original.
✉️
Redactar correos completos
Clic en "Ayúdame a escribir" en el compositor de Gmail. Describe el propósito y el tono del correo. Gemini redacta el email completo listo para revisar y enviar.
📋
Resumir hilos largos
En cualquier conversación de Gmail → "Resumir este correo". Gemini condensa el hilo completo en 3-5 puntos clave. Ideal para volver a hilos de hace semanas sin leer todo.
🎯
Responder en el tono correcto
"Responde a este correo siendo firme pero cordial, rechazando la propuesta sin cerrar la relación comercial." Gemini redacta la respuesta alineada con las instrucciones de tono.
🔍
Buscar en toda la bandeja
"¿Cuándo fue la última vez que alguien del equipo de ventas me escribió sobre el cliente X?" — Gemini busca en toda tu bandeja y encuentra el hilo relevante con contexto.
🖼️
Generación visual
Crear imágenes para tus libros y presentaciones

Gemini genera imágenes de alta calidad directamente en el chat. Para autores: portadas, ilustraciones de personajes, mapas de mundos narrativos, material de marketing. Para empresas: infografías, banners, presentaciones visuales y material de marca.

🔮
Portada filosófica
🌌
Universo narrativo
🔥
Símbolo en llamas
🌿
Personaje en contexto
Material de marketing
🗺️
Mapa del mundo
Prompt para portada de libro filosófico
Genera una imagen para la portada de un libro de filosofía y consciencia llamado "[título]". Estética: oscura y mística. Elementos: dodecaedro geométrico dorado flotando en un espacio infinito negro, con el símbolo Phi (φ) brillando en su interior, partículas de luz dorada dispersas alrededor. Estilo: realismo fotográfico con elementos de geometría sagrada. Formato vertical, alta resolución.
Prompt para material de marketing editorial
Crea una imagen para redes sociales promocionando el lanzamiento de mi libro. Incluye: fondo oscuro elegante, título del libro "[título]" en tipografía serif dorada grande, frase de gancho "[frase]" más pequeña debajo, y el nombre del autor en la parte inferior. Debe verse como material editorial profesional tipo New York Times Book Review. Formato cuadrado 1:1.
⚠️
Sobre derechos de autor: Las imágenes generadas por Gemini son tuyas para uso comercial. Sin embargo, Gemini tiene restricciones para generar imágenes de personas reales, personajes con copyright o marcas registradas. Para imágenes con personas específicas o estilos artísticos protegidos, usa Adobe Firefly o Midjourney que tienen políticas más claras de uso comercial.
🔬
Para usuarios avanzados
Google AI Studio: el laboratorio de Gemini

Google AI Studio (aistudio.google.com) es la interfaz avanzada de Gemini — gratuita y sin necesidad de cuenta de pago. Aquí tienes acceso a los modelos más potentes, ventanas de contexto enormes y la capacidad de crear prompts del sistema para tus aplicaciones.

📂
Contexto de 1 millón de tokens
Sube libros completos, datasets enormes o repositorios de código. AI Studio procesa contextos que ninguna interfaz normal admite.
Gratis
⚙️
System Prompts configurables
Define instrucciones del sistema completas para crear experiencias de IA personalizadas. Ideal para prototipar aplicaciones sin programar.
Avanzado
🔑
API Key gratuita
Genera tu clave de API para integrar Gemini en tus propias aplicaciones, sitio web o automatizaciones. Plan gratuito generoso para empezar.
Gratis
💡
Caso de uso para yoniliman.com: Usa la API gratuita de Google AI Studio para crear el asistente de lectura de la cuatrilogía φ en tu sitio web. Conectas el asistente a los documentos de tus libros y tus lectores pueden hacer preguntas directamente desde yoniliman.com — sin costo hasta los límites del plan gratuito.
🎯
Aplicación práctica
Gemini en tu sector
✍️
Autor — Investigación multimedia para Noesis
Autores
Sube a Gemini las conferencias de Husserl, Merleau-Ponty y Penrose en YouTube. Pídele que extraiga los argumentos sobre consciencia que conectan con la filosofía de tu cuatrilogía. Luego usa el Gem "Editor φ" para revisar que los fragmentos que incorpores en el manuscrito sean filosóficamente coherentes con tu sistema conceptual.
Analiza estos 5 videos de YouTube sobre fenomenología de la consciencia [URLs]. Identifica los argumentos que más conectan con los conceptos de noesis (conocimiento puro) y noema (objeto del pensamiento). Para cada argumento: autor, cita textual, minuto del video y cómo podría enriquecer una novela filosófica ambientada en el presente.
🎓
Educación — Clases invertidas con video
Docentes
Selecciona los mejores videos de YouTube sobre cada tema de tu programa. Súbelos a Gemini y genera automáticamente: guía de pre-lectura, preguntas de reflexión, actividades de clase basadas en el contenido y evaluación alineada con los objetivos de aprendizaje. Todo en una sola sesión de trabajo.
Analiza este video de YouTube [URL] sobre [tema]. Genera material completo para clase invertida: 1) Guía de pre-visualización con 5 preguntas orientadoras, 2) Resumen de los conceptos clave en lenguaje estudiante, 3) 3 actividades prácticas para discutir en clase, 4) Evaluación de 10 preguntas alineada con los objetivos del video.
📣
Marketing — Análisis de competencia en video
Empresas
Sube los videos de lanzamiento de productos de tus competidores. Gemini analiza el mensaje, el tono, los argumentos de venta, las objeciones que responden y los elementos visuales de cada video. Con ese análisis diseñas tu estrategia de diferenciación con datos reales, no intuición.
Analiza estos videos de lanzamiento de productos de mis competidores [URLs]. Para cada uno extrae: propuesta de valor central, argumentos de venta usados, objeciones que responden, tono y audiencia objetivo, elementos visuales más prominentes. Al final identifica el gap que ninguno cubre y que yo podría ocupar con mi producto.
φ

Metodología validada por Yoniliman Galvis

Como experto en Ciencia de Datos, utilizo Gemini para la orquestación de flujos de trabajo multimodales. Esta lección garantiza que aproveches la infraestructura de Google para reducir la fricción técnica en tu proceso creativo.