Home Negocio Operai presenta su nuevo modelo de lenguaje grande GPT-4.5

Operai presenta su nuevo modelo de lenguaje grande GPT-4.5

8
0

Openai lanzó un nuevo modelo base el jueves llamado GPT-4.5, que la compañía dijo que es su mejor y más inteligente modelo para chat hasta ahora. No es un modelo de razonamiento como los modelos O1 y O3 de Openai, pero se puede usar para entrenar a otros modelos para que sean modelos de razonamiento. En particular, GPT-4.5 fue entrenado utilizando 10 veces la potencia informática (puntajes de GPU en centros de datos) que su predecesor, GPT-4O.

El resultado es un modelo cuyas salidas se sienten más naturales y humanas, dijo Openai en su comunicado de prensa y demuestra una mejor comprensión general del mundo. Sus habilidades de escritura y programación son mejores, y alucina menos. También muestra un mayor nivel de inteligencia emocional sobre el usuario y lo que está tratando de hacer. Por ejemplo, cuando se le solicita "Estoy pasando por un momento difícil después de fallar una prueba", respondió el modelo:

“Aw, lamento mucho escuchar eso. Fallar una prueba puede sentirse bastante duro y desalentador, pero recuerde, es solo un momento, no un reflejo de quién es usted o sus capacidades ".

El cofundador de OpenAi y ex investigador Andrej Karpathy, quien obtuvo acceso temprano al modelo, publicó en X que las mejoras son sutiles pero significativas. "Todo es un poco mejor y es increíble, pero tampoco exactamente de manera trivial para señalar", continuó Karpathy; Además, el modelo parece haber mejorado en un 20% en todo lo que hace en lugar de mejorar varias veces en ciertos dominios o habilidades.

Operai dijo que el rendimiento de GPT-4.5 demuestra que el supervaloramiento de modelos, datos de entrenamiento y potencia informática aún puede producir ganancias de rendimiento significativas. Sin embargo, un debate ha estado en su afirmación en X.

Karpathy vio evidencia de esto en sus pruebas: "(i) t es increíblemente interesante y emocionante como otra medición cualitativa de una cierta pendiente de capacidad que viene 'gratis' de simplemente previendo un modelo más grande". Por supuesto, "gratis" lo está estirando: los costos de capacitación para un modelo tan grande como GPT-4.5 podrían acercarse a $ 1 mil millones.

Operai está lanzando GPT-4.5 como una vista previa de investigación para los usuarios de ChatGPT Pro y a los desarrolladores que pagan para acceder a los modelos Operai a través de una API. Estará disponible para ChatGPT Plus y los usuarios del equipo la próxima semana, dice la compañía.


LEAVE A REPLY

Please enter your comment!
Please enter your name here