El gigante de la tecnología introdujo recientemente su modelo intermedio y multimodal, Gemini 1.5, proyectado para escalar eficazmente en el universo IA. Gemini debutó a mediados del mes anterior y su disponibilidad se limitaba inicialmente a un círculo exclusivo de desarrolladores y clientes mediante una lista de espera específica.
Diseñado para ser un reemplazo directo de Gemini 1.0 Pro, presentó una ventana de contexto capaz de recordar y considerar un millón de tókenes, "más larga que cualquier modelo de base a gran escala".
Gemini 1.5 is now generally available in Google AI Studio. It’s the one with the crazy 1M token context window - and it can really really use all those tokens without forgetting or getting confused. Great for looking for detailed information from a huge text (like a book etc.) or… pic.twitter.com/H8dAphR9FF
— Khalifa Manaa (@khalifahmanaa) March 21, 2024
En su estado de prueba, este modelo, concebido para reemplazar al Gemini 1.0 Pro, se nota por su robustez en el manejo de información. Se caracteriza por una avanzada ventana de contexto, es decir, la magnitud de datos que el modelo puede utilizar para generar respuestas, con la habilidad de manejar hasta un millón de tokens.
Google menciona que esta ventana de contexto, todavía bajo prueba, supera en longitud a cualquier otro modelo de IA y que, hasta la fecha de lanzamiento de Gemini, la ventana de contexto más amplia en un modelo de lenguaje contaba con 200.000 tokens. Este avance le permite al modelo procesar aproximadamente 700.000 palabras o 30.000 líneas de código de una vez. Además, al ser multimodal, tiene la capacidad de procesar hasta 11 horas de audio o una hora de video en múltiples idiomas.
Publicidad
Sin embargo, a pesar de sus innovaciones, Gemini ha atraído la atención no solo por sus capacidades. En febrero, generó controversia cuando su función de generación de imágenes de personas ya que produjo representaciones que fueron criticadas por su inexactitud histórica y diversidad racial, lo que provocó acusaciones de racismo por parte de algunos usuarios. Este incidente llevó a Google a suspender temporalmente la tecnología.
Por otra parte, el uso de estas herramientas colaborativas puede representar un ahorro significativo de tiempo y recursos para las empresas, ya que pueden ahorrar hasta 171 horas de trabajo por usuario al año.
Publicidad
La inteligencia artificial generativa de Google, conocida como Gemini, además, integra características de Google Duet AI y Bard, asegurando la seguridad de la información al asociarse con una cuenta de Google. Esto garantiza que la información confidencial se maneje de manera segura y no se exponga a una red abierta.