Noticias

miércoles 26 de junio de 2024

Claude 3.5 Sonnet de Anthropic se eleva a la cima de los rankings de IA

TECNOLOGIA

...

Foto: itmastersmag.com

El modelo de inteligencia artificial Claude 3.5 Sonnet de Anthropic ha alcanzado rápidamente la cima de los rankings en el LMSYS Chatbot Arena


El modelo de inteligencia artificial Claude 3.5 Sonnet de Anthropic ha alcanzado rápidamente la cima de los rankings en el LMSYS Chatbot Arena, destacándose en categorías clave como la codificación y los desafíos difíciles, solo cinco días después de su lanzamiento. Aunque GPT-4o de OpenAI sigue siendo el líder general, Claude 3.5 Sonnet ha demostrado ser un competidor formidable y económico. Daniela Amodei, cofundadora de Anthropic, afirmó que este modelo es el más capaz, inteligente y barato en el mercado actualmente.

El LMSYS Chatbot Arena utiliza un enfoque único de evaluación basado en comparaciones directas por usuarios humanos, proporcionando una evaluación más realista de las capacidades de la IA. Claude 3.5 Sonnet se ha destacado en la categoría de "Hard Prompts", diseñada para tareas complejas y específicas.

A pesar de estos logros, la comunidad de IA subraya la necesidad de métodos de evaluación estandarizados y cautela al interpretar los resultados. Las evaluaciones internas de Anthropic muestran mejoras significativas en varios dominios, incluyendo el razonamiento y la codificación.

El ascenso de Claude 3.5 Sonnet podría redefinir los puntos de referencia para el rendimiento y la rentabilidad en los modelos de lenguaje grandes, con la comunidad de IA observando con interés los próximos movimientos de Anthropic.



Fuente: Ximena Rodríguez


¿Quieres escuchar nuestras emisoras?

Radio