Artificialmente Newsletter
Posts
El futuro de la IA: DeepMind, agentes y Runway

El futuro de la IA: DeepMind, agentes y Runway

Artificialmente, el boletín donde compartimos historias, tendencias, estrategias e ideas para ayudarte a mantenerte relevante en la era de la Inteligencia Artificial

Ivan Acuña
2 de diciembre de 2024

Las 3 noticias más relevantes de esta semana:

1. DeepMind lleva la IA a otra dimensión

Google DeepMind CAT4D

Google DeepMind ha presentado CAT4D, un modelo de IA que transforma la forma en que interactuamos con el contenido de video al agregar una cuarta dimensión: el control del tiempo.

Múltiples perspectivas: Genera videos desde diferentes ángulos usando un solo video como base, ideal para reconstruir escenas en 3D.
Control independiente: Ajusta el movimiento de la cámara y el tiempo por separado, dándote más control creativo.
Escenas en 3D: Reconstruye escenas en tres dimensiones para entender mejor los espacios y sus relaciones.

Reflexión: Mientras que Sora de OpenAI captó la atención de todos con la generación de videos (sí, todavía estamos esperando el lanzamiento oficial), el CAT4D de DeepMind representa algo mucho más ambicioso. La capacidad de no solo generar videos, sino de comprender y manipular la esencia misma de las escenas en el espacio y el tiempo me fascina.

Iván A.

2. Nuevo sistema operativo para agentes de IA

Ex ejecutivos de Google y Stripe han recaudado 56 millones de dólares para construir un sistema operativo para agentes de IA, con su empresa /dev/agents.

Respaldo sólido: Index Ventures y CapitalG de Alphabet lideraron la ronda inicial, valorando la empresa en 500 millones de dólares, con el apoyo de figuras clave como Andrej Karpathy de OpenAI.
Equipo experimentado: Fundadores con amplia trayectoria en sistemas operativos como Android, Chrome OS y plataformas AR/VR de Meta.
Visión innovadora: Planean desarrollar un sistema operativo en la nube con soporte para múltiples dispositivos e interacciones naturales con agentes.

Reflexión: Así como Android proporcionó la base para millones de aplicaciones móviles, podemos mirar hacia este momento como el inicio del ecosistema para los agentes de IA.

Iván A.

3. La revolución realista de Runway

Runway Frames

Runway ha presentado Frames, su nuevo modelo de generación de imágenes enfocado en un control y consistencia estilística sin precedentes.

Control estético: El modelo domina la consistencia de estilos mientras permite explorar nuevas ideas creativas.
Variedad visual: Incluye 10 mundos únicos, desde maquillaje ochentero de efectos especiales hasta estéticas japonesas y collages de revistas.
Lanzamiento gradual: Disponible en Gen-3 Alpha, con medidas integradas de seguridad y moderación de contenido.

Reflexión: Lo que me fascina de Frames es cómo está cambiando la narrativa de “puede la IA generar buenas imágenes?” a “puede la IA mantener una misma visión artística?”. La capacidad de establecer y mantener un mismo estilo a través de múltiples imagenes es crucial para los artistas/creativos que necesitan consistencia en su trabajo.

Iván A.

Idea que aprendí:

ElevenLabs te permite convertir texto en un podcast personalizado.

Esta semana, ElevenLabs lanzó la capacidad de crear podcasts personalizados a partir de PDFs, artículos, eBooks, enlaces o texto en 32 idiomas dentro de ElevenReader, su app para iOS.

NotebookLM de Google se lanzó hace solo dos meses con una propuesta similar de hacer que los documentos estáticos cobren vida a través de un podcast narrado por dos personas.

Mientras que NotebookLM ofrece dos narradores estándar, lo que me gusta de ElevenLabs es su variedad de voces, idiomas y la forma en que empaquetan el resultado final.

Para ayudarte a empezar, he creado un breve video tutorial que te explica lo básico. Asegúrate de verlo antes de comenzar.

Para empezar:

Descarga ElevenReader en iOS —> Link
Sube tu material de lectura
Selecciona tu idioma de entre 32 opciones

Para los usuarios de Android, no te preocupes, el soporte llegará en las próximas semanas.

Esto parece un paso real hacia adelante en cómo consumimos contenido escrito, especialmente para aquellos que prefieren aprender escuchando o quieren aprovechar mejor su tiempo durante el traslado.

Déjame saber cómo te va.

¿Tienes una pregunta sobre IA?

Responde a este correo y elegiré una para responder la próxima semana 👍

Un saludo,

Ivan A.

Reply

or to participate.