Ciencia

Exclusivo: Honor debuta un nuevo agente de IA que puede leer y comprender su pantalla

Eligió un restaurante, pero luego no pudo completar el proceso, ya que el lugar que eligió requirió una tarjeta de crédito para confirmar una reserva, momento en el que el usuario tuvo que hacerse cargo. Puede ser flexible en su consulta, en otro ejemplo, pedirle que reserve un restaurante "altamente calificado" significaba que analizaría las revisiones con puntajes altos, aunque el agente no investiga más que eso. No es una referencia cruzada de revisiones de OpenTable con datos de otras partes de la web, especialmente porque todos estos datos se procesan en el dispositivo y no se envían a la nube.

Este tipo de inteligencia artificial agente es la palabra de moda actual en la esfera tecnológica. Mi colega Will Knight probó recientemente un asistente de IA que podría navegar por la web y realizar tareas en línea. Google a fines del año pasado presentó su modelo Gemini 2 AI entrenado para tomar medidas en su nombre. También renueva la idea de una interfaz de usuario generativa para teléfonos inteligentes: en MWC 2024, vimos a algunas compañías trabajando en formas de interactuar con aplicaciones sin usar aplicaciones, en lugar de apoyarnos en los asistentes de IA para generar una interfaz de usuario mientras emitió un comando.

El enfoque de Honor se siente como lo que Rabbit, del infame Rabbit R1, está haciendo con el modo de enseñanza, donde entrenas a su asistente manualmente para completar una tarea. No es necesario acceder a la interfaz de programación de aplicaciones (API) de una aplicación, que es la forma tradicional de que las aplicaciones o servicios se comunican entre sí. El agente memoriza el proceso, lo que le permite emitir el comando y hacer que ejecute la tarea.

Pero Honor dice que su modelo de ejecución de IA autosuficiente no está entrenado para seguir pasos estrictos, es capaz de reconocimiento de contexto de pantalla multimodal para realizar tareas de forma autónoma. En lugar de tener que entrenar al asistente para que aprenda cada parte de la aplicación OpenTable, es capaz de comprender los elementos semánticos de la interfaz de usuario y seguirá a través de un proceso de varios pasos para ejecutar su solicitud. Honor destacó que este proceso fue más rentable: "A diferencia de los competidores como Apple, Samsung y Google, que dependen de API externos, que resulta en costos operativos más altos, el agente de IA de Honor administra independientemente una amplia gama de tareas".

Fotografía: Julian Chokkattu

Related Articles

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Back to top button