Warning: Undefined array key "HTTP_ACCEPT_LANGUAGE" in /srv/vhost/diaridigital.net/home/html/intelligence/includes/config.php on line 61

Deprecated: substr(): Passing null to parameter #1 ($string) of type string is deprecated in /srv/vhost/diaridigital.net/home/html/intelligence/includes/config.php on line 61
Asistente GPT-4o
Intelligence

Asistente GPT-4o


Tiempo de lectura: 3 minutos


Con GPT-4o (omni) se da un salto tecnológico en la interface de la IA



GPT-4o

OpenAi anunció el nuevo modelo GPT-4o. La presentación fue liderada por Mira Murati, directora técnica de OpenAI. Murati comenzó el evento anunciando el nuevo modelo multimodal GPT-4o.

GPT-4o, es un salto evolutivo que destaca por ser multimodal de forma nativa, todo ello con poca latencia e interacciones en tiempo real. En resumen, esto hace que se mejoren las capacidades de texto, audio y visión de GPT.

Lo mejor es la nueva interface de voz natural, con tonalidad i emociones, que le otorga un aspecto de IA de película de ciencia-ficción y de gran credibilidad.

Features

Qué puede hacer esta IA:

Mientras que GPT-4 tardaba una media de unos 5 segundos en responder, la media de GPT-4o es de 320 milisegundos. Con esta velocidad media de respuesta, cuando tarda dos o tres segundos parece que se lo esté realmente pensando.

Procesamiento multimodal. Esto quiere decir que entiende tanto lo que le escribas por texto como lo que le envíes por imágenes, audio y vídeo. Así puedes combinar entradas para conversar, esto es impresionante.

A la hora de responder con voz muestra emociones, lo que le acercará más la sensación de estar hablando con una persona real.

Interpretar tu expresión facial, y saber describir si estás triste o feliz, adaptando las respuestas a este contexto.

Algo que lo hace real es que puede ser interrumpido y responder inmediatamente sin tardar segundos. Este detalle es clave para que parezca un humano conversando y entendiendo.

Puede hacer interpretación y traducción simultánea de idiomas de viva voz, respondiendo en el mismo tono en que se le habla.

Es capaz de leer una gráfica de datos y analizarla, dando conclusiones relacionadas con lo que figura en la imagen.

Conversación

Estas capacidades de la IA hacen que, tras una hora de conversación con ella, la persona llegue a la conclusión que se trata de una persona real. Esa es la gran capacidad de GPT-4o como asistente. Todos los que lo han probado enseguida han recordado la película Her, en la que un hombre establece una relación con un sofisticado asistente de inteligencia artificial.

Es cierto que todavía hay momentos de la conversación en los que se aprecia que es una IA, pero recordemos que acaba de ser presentado y, poco a poco, irá mejorando en los aspectos de interface para ofrecer una cara más humana.

En cualquier caso, no deja de ser un programa informático basado en unas ecuaciones matemáticas regidas por algoritmos y entrenada con miles de horas de vídeo, pero es la respuesta que ofrece la que nos convence de ser una entidad inteligente.

Sam Altman

Después del evento, el director ejecutivo de OpenAI, Sam Altman, publicó crípticamente solo una palabra en X: "Her". También ha expresado que Her es su película favorita.

“El nuevo modo de voz y video es la mejor interfaz de ordenador que he usado. Parece la IA de las películas; y todavía me sorprende un poco que sea real”, dijo Altman en una publicación de blog justo después de la transmisión en vivo. "Llegar a tiempos de respuesta y expresividad a nivel humano resulta ser un gran cambio".

Referencias

Comentarios sobre 'Asistente GPT-4o'

Carregant comentaris...
Más artículos




Xavier es un desarrollador senior full stack y opera desde la ciudad mediterránea de Barcelona. Le encantan las tecnologías de software y está convencido que el desarrollo de software es un proceso colaborativo y abierto.
Y es un apasionado de la astronomía y de la fotografía. Lo puedes encontrar en:
Comparte este post