En Resumen

  • Google lanzó Veo 2, Whisk e Imagen 3, expandiendo sus capacidades gratuitas de generación de video, imágenes y texto en Gemini.
  • xAI democratizó Grok-2 y Aurora, ofreciendo herramientas avanzadas de IA e integración con la plataforma X de Elon Musk sin costo.
  • La competencia entre gigantes de IA impulsa accesibilidad, mientras el software de código abierto sigue como alternativa gratuita y personalizable.

Amantes de la tecnología gratuita, ¡están de suerte! Google y xAI han revelado actualizaciones bastante interesantes en sus ofertas de IA de forma gratuita, igualando y expandiendo los recientes esfuerzos de democratización de OpenAI.

La semana pasada, OpenAI lanzó la última salva en la guerra por los corazones—y, en última instancia, las billeteras de los usuarios—con su ambiciosa campaña "12 Días de OpenAI", lanzando al público una serie de potentes herramientas. Los aspectos destacados de la campaña incluyen Sora, el generador de texto a video de última generación de la firma, el modelo de razonamiento avanzado "OpenAI o1" y SearchGPT, una sofisticada integración de búsqueda web.

De estos, tanto el motor de búsqueda como el modelo de razonamiento están disponibles para usuarios gratuitos. Mientras que Sora requiere una suscripción a ChatGPT Plus.

Google respondió con una amplia serie de anuncios para mostrar que todavía tiene mucho que ofrecer. Compitiendo directamente contra Sora, anunció Veo 2—el último modelo de generación de video de la compañía—y las inscripciones ya están abiertas para que los usuarios prueben el modelo a través del AI Test Kitchen de Google.

AD

"Veo crea videos con movimiento realista y salida de alta calidad, hasta 4K. Explora diferentes estilos y encuentra el tuyo con extensos controles de cámara", dice la compañía. Los clips pueden extenderse varios minutos, superando a la mayoría de los mejores generadores de video que funcionan en resolución 1080p con tiempos de ejecución más cortos.

El 16 de diciembre, Google también presentó Whisk—una herramienta experimental de creación de imágenes que se centra en el rediseño y el uso de entradas visuales y pictográficas para producir salidas visuales, a través de la plataforma experimental Labs. A diferencia de los modelos tradicionales de texto a imagen, Whisk introduce un novedoso enfoque de "remix" donde los usuarios pueden crear nuevas imágenes principalmente a través de referencias visuales de sus galerías de fotos existentes, minimizando la necesidad de indicaciones de texto detalladas.

Las capacidades de imagen de la compañía se han mejorado aún más con el lanzamiento de Imagen 3—que ya está disponible gratuitamente en la aplicación del chatbot Google Gemini. Este nuevo modelo trae mejoras en el renderizado de detalles, diversidad de estilos y reducción de alucinaciones. También tiene capacidades de generación de texto, que los modelos anteriores de Google carecían.

AD

También está disponible gratuitamente Gemini 2.0 Flash, un modelo actualizado que está disponible tanto en la consola de desarrollador de Google como en la plataforma Gemini más pulida y fácil de usar. Google también lanzó una función avanzada de asistente de investigación y dio a sus modelos la capacidad de procesar hasta 1 millón de tokens de forma gratuita en la consola del desarrollador.

Y algunos usuarios han informado que una versión experimental de Gemini 2.0 Advanced también está disponible para ser probada. "Advanced" es el modelo más potente de la familia Gemini, siendo "Flash" un modelo pequeño orientado a la eficiencia, y "Pro" un modelo de tamaño medio.

Grok-2 para las masas

Sin quedarse atrás, xAI de Elon Musk ha entrado en la batalla de los gigantes tecnológicos, haciendo sus propios esfuerzos para democratizar el acceso a capacidades avanzadas de IA a través de la plataforma X (anteriormente conocida como Twitter).

La compañía ha lanzado una versión mejorada de su modelo Grok-2, que presume de mejoras sustanciales en velocidad y capacidad. La nueva iteración funciona tres veces más rápido que su predecesora mientras ofrece mayor precisión, seguimiento de instrucciones y capacidades multilingües.

Además, la semana pasada, xAI comenzó a implementar Grok para todos los usuarios de la plataforma X de forma gratuita. La integración se extiende más allá de las capacidades básicas de chat, introduciendo características como la búsqueda web con citas, permitiendo a los usuarios verificar información y explorar fuentes directamente a través de la plataforma.

"Hoy nos complace anunciar que estamos comenzando a implementar esta nueva versión de Grok-2 para todos los usuarios en X de forma gratuita. Como siempre, los usuarios Premium y Premium+ obtienen límites de uso más altos y serán los primeros en acceder a cualquier nueva capacidad en el futuro", señaló xAI en una publicación de blog.

La compañía también ha lanzado Aurora, su propio modelo de generación de imágenes, que se ha integrado en las capacidades de Grok. El modelo ofrece una calidad de imagen menor que la integración anterior de Grok con Flux, pero es lo suficientemente bueno para proporcionar imágenes fotorrealistas con menos adherencia a las indicaciones, pero también menos censura.

AD

Para apoyar aún más a desarrolladores y empresas, xAI ha anunciado reducciones significativas de precios para su acceso API, bajando las tarifas a $2 por millón de tokens de entrada y $10 por millón de tokens de salida.

La competencia ha provocado una rápida evolución en las capacidades de IA, con cada compañía empujando los límites de lo posible mientras simultáneamente hace estas herramientas más accesibles. Esta democratización podría llevar a una nueva era de creatividad y productividad impulsada por IA, ya que los usuarios obtienen acceso a herramientas que anteriormente estaban disponibles solo para desarrolladores seleccionados o clientes de pago.

Sin embargo, también hay una gran opción que algunos usuarios pueden no estar considerando: la IA de código abierto. Hay modelos lo suficientemente buenos para competir contra estos gigantes, y están disponibles gratuitamente, son completamente personalizables y dramáticamente más transparentes.

Genmo Mochi 1, Flux, Stable Diffusion y Llama-3 son excelentes opciones que podrían satisfacer tus necesidades—y probablemente incluso superar tus expectativas si les das una oportunidad. Y también son gratuitos.

Editado por Andrew Hayward

Stay on top of crypto news, get daily updates in your inbox.