Ciencias

El nuevo ChatGPT todavía tiene problemas para ver e interpretar imágenes

Se suponía que el nuevo ChatGPT analizaría imágenes, y en realidad no lo imaginamos. Todavía en pruebas, el MiniGPT-4 revela las hazañas esperadas de esta función. Y eso aún no es todo…

El 14 de marzo de 2023, algunos suscriptores de ChatGPT recibieron un correo electrónico invitándolos a seguir el anuncio de la nueva fórmula, basada en el modelo GPT-4. Greg Brockman, uno de los fundadores de OpenAI, luego presentó en detalle las ventajas de esta nueva versión.

Una de las funciones presentadas fue la siguiente: gracias a GPT-4, la nueva fórmula de ChatGPT será “multimodal”. Claramente, ya no aceptará solo texto como entrada, sino también imágenes. Y por poner un ejemplo contundente: a ChatGPT se le muestra una imagen de una nevera abierta y puede sugerir una receta de cocina en base a lo que ha analizado.

Una versión paga de ChatGPT

Para acceder a las funcionalidades de este nuevo ChatGPT era imprescindible contar con una suscripción de pago -la fórmula ChatGPT Plus- y en todo el mundo muchos fans de esta herramienta se han embarcado en esta aventura. Sin embargo, cuando intentamos analizar las imágenes, nos fuimos con las manos vacías: apareció un mensaje que decía que GPT-4 aún no era capaz de hacer esto.

GPT-4 promete en el análisis de imágenes

Y así, OpenAI finalmente ha presentado una demostración de esta tan esperada función de análisis de imágenes. Es accesible en esta dirección: https://minigpt-4.github.io/

La herramienta a la que tenemos acceso se llama MiniGPT-4. En el video de presentación, OpenAI destaca muchas características:

  • analiza una fotografía de una hoja y luego explica cómo cuidarla;
  • podría describir una fotografía con un cactus en un lago helado;
  • ofrece consignas relacionadas con una foto de tazas;
  • Se le muestra una imagen de langostas a la parrilla y se le da la receta correspondiente, etc.
READ  Estudiantes de medicina de San Pablo-T se incorporan al sistema de salud para combatir el coronavirus

Una demo ultralenta e imperfecta

Queríamos probar esta herramienta y advertirte lo más posible: se necesita mucha paciencia. Como muchos usuarios están probando esta herramienta, cada solicitud se coloca en una cola. Cuente varios minutos para subir una fotografía, cinco buenos minutos para que cada solicitud sea respondida. Y tanto que decir, esta función de análisis de imágenes sigue siendo muy perfectible y está lejos de lograr la hazaña que elogia OpenAI. El caso es que si no tienes mucha prisa, puedes enviar imágenes a esta herramienta y hacer preguntas sobre ellas. Esto nos da una idea de lo que debería ofrecer ChatGPT una vez que se haya desarrollado esta nueva fórmula.

Prudencia Febo

"Explorador. Entusiasta de la cerveza. Geek del alcohol. Gurú de Internet sutilmente encantador. Erudito de la web en general".

Publicaciones relacionadas

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Botón volver arriba