lobehub/locales/es-ES/models.json
2025-12-05 01:35:20 +08:00

3632 lines
353 KiB
JSON
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

{
"01-ai/yi-1.5-34b-chat": {
"description": "Cero Uno, el último modelo de ajuste fino de código abierto, cuenta con 34 mil millones de parámetros, con ajuste fino que admite múltiples escenarios de conversación y datos de entrenamiento de alta calidad, alineados con las preferencias humanas."
},
"01-ai/yi-1.5-9b-chat": {
"description": "Cero Uno, el último modelo de ajuste fino de código abierto, cuenta con 9 mil millones de parámetros, con ajuste fino que admite múltiples escenarios de conversación y datos de entrenamiento de alta calidad, alineados con las preferencias humanas."
},
"360/deepseek-r1": {
"description": "【Versión desplegada de 360】DeepSeek-R1 utiliza técnicas de aprendizaje por refuerzo a gran escala en la fase de post-entrenamiento, mejorando enormemente la capacidad de inferencia del modelo con muy pocos datos etiquetados. En tareas de matemáticas, código y razonamiento en lenguaje natural, su rendimiento es comparable al de la versión oficial de OpenAI o1."
},
"360gpt-pro": {
"description": "360GPT Pro, como un miembro importante de la serie de modelos de IA de 360, satisface diversas aplicaciones de procesamiento de lenguaje natural con su eficiente capacidad de manejo de textos, soportando la comprensión de textos largos y funciones de diálogo en múltiples turnos."
},
"360gpt-pro-trans": {
"description": "Modelo especializado en traducción, optimizado con un ajuste fino profundo, con resultados de traducción líderes."
},
"360gpt-turbo": {
"description": "360GPT Turbo ofrece potentes capacidades de cálculo y diálogo, con una excelente comprensión semántica y eficiencia de generación, siendo la solución ideal para empresas y desarrolladores como asistente inteligente."
},
"360gpt-turbo-responsibility-8k": {
"description": "360GPT Turbo Responsibility 8K enfatiza la seguridad semántica y la responsabilidad, diseñado específicamente para aplicaciones que requieren altos estándares de seguridad de contenido, asegurando la precisión y robustez de la experiencia del usuario."
},
"360gpt2-o1": {
"description": "360gpt2-o1 utiliza la búsqueda en árbol para construir cadenas de pensamiento e introduce un mecanismo de reflexión, entrenado mediante aprendizaje por refuerzo, lo que le permite tener la capacidad de auto-reflexión y corrección de errores."
},
"360gpt2-pro": {
"description": "360GPT2 Pro es un modelo avanzado de procesamiento de lenguaje natural lanzado por la empresa 360, con una excelente capacidad de generación y comprensión de textos, destacándose especialmente en la generación y creación de contenido, capaz de manejar tareas complejas de conversión de lenguaje y representación de roles."
},
"360zhinao2-o1": {
"description": "360zhinao2-o1 utiliza búsqueda en árbol para construir cadenas de pensamiento e introduce un mecanismo de reflexión, entrenando el modelo con aprendizaje por refuerzo, lo que le confiere la capacidad de auto-reflexión y corrección de errores."
},
"4.0Ultra": {
"description": "Spark4.0 Ultra es la versión más poderosa de la serie de modelos grandes de Xinghuo, mejorando la comprensión y capacidad de resumen de contenido textual al actualizar la conexión de búsqueda en línea. Es una solución integral para mejorar la productividad en la oficina y responder con precisión a las necesidades, siendo un producto inteligente líder en la industria."
},
"AnimeSharp": {
"description": "AnimeSharp (también conocido como “4xAnimeSharp”) es un modelo de superresolución de código abierto desarrollado por Kim2091 basado en la arquitectura ESRGAN, enfocado en la ampliación y el afilado de imágenes con estilo anime. Fue renombrado en febrero de 2022 desde “4x-TextSharpV1”, originalmente también aplicable a imágenes de texto, pero con un rendimiento significativamente optimizado para contenido anime."
},
"Baichuan2-Turbo": {
"description": "Utiliza tecnología de búsqueda mejorada para lograr un enlace completo entre el gran modelo y el conocimiento del dominio, así como el conocimiento de toda la red. Soporta la carga de documentos en PDF, Word y otros formatos, así como la entrada de URL, proporcionando información oportuna y completa, con resultados precisos y profesionales."
},
"Baichuan3-Turbo": {
"description": "Optimizado para escenarios de alta frecuencia empresarial, con mejoras significativas en el rendimiento y una excelente relación calidad-precio. En comparación con el modelo Baichuan2, la creación de contenido mejora un 20%, las preguntas y respuestas de conocimiento un 17%, y la capacidad de interpretación de roles un 40%. En general, su rendimiento es superior al de GPT-3.5."
},
"Baichuan3-Turbo-128k": {
"description": "Con una ventana de contexto ultra larga de 128K, optimizado para escenarios de alta frecuencia empresarial, con mejoras significativas en el rendimiento y una excelente relación calidad-precio. En comparación con el modelo Baichuan2, la creación de contenido mejora un 20%, las preguntas y respuestas de conocimiento un 17%, y la capacidad de interpretación de roles un 40%. En general, su rendimiento es superior al de GPT-3.5."
},
"Baichuan4": {
"description": "El modelo tiene la mejor capacidad en el país, superando a los modelos principales extranjeros en tareas en chino como enciclopedias, textos largos y creación generativa. También cuenta con capacidades multimodales líderes en la industria, destacándose en múltiples evaluaciones de referencia autorizadas."
},
"Baichuan4-Air": {
"description": "El modelo más potente del país, superando a los modelos principales extranjeros en tareas en chino como enciclopedias, textos largos y creación generativa. También cuenta con capacidades multimodales líderes en la industria, destacándose en múltiples evaluaciones de referencia."
},
"Baichuan4-Turbo": {
"description": "El modelo más potente del país, superando a los modelos principales extranjeros en tareas en chino como enciclopedias, textos largos y creación generativa. También cuenta con capacidades multimodales líderes en la industria, destacándose en múltiples evaluaciones de referencia."
},
"ByteDance-Seed/Seed-OSS-36B-Instruct": {
"description": "Seed-OSS es una serie de modelos de lenguaje grandes de código abierto desarrollados por el equipo Seed de ByteDance, diseñados específicamente para un potente manejo de contextos largos, razonamiento, agentes inteligentes y capacidades generales. Dentro de esta serie, Seed-OSS-36B-Instruct es un modelo afinado por instrucciones con 36 mil millones de parámetros, que soporta de forma nativa contextos ultra largos, permitiendo procesar grandes volúmenes de documentos o complejas bases de código de una sola vez. Este modelo está especialmente optimizado para tareas de razonamiento, generación de código y agentes (como el uso de herramientas), manteniendo un equilibrio y una capacidad general sobresaliente. Una característica destacada de este modelo es la función \"Presupuesto de Pensamiento\" (Thinking Budget), que permite a los usuarios ajustar de manera flexible la longitud del razonamiento según sus necesidades, mejorando así la eficiencia en aplicaciones prácticas."
},
"DeepSeek-R1": {
"description": "LLM eficiente de última generación, experto en razonamiento, matemáticas y programación."
},
"DeepSeek-R1-Distill-Llama-70B": {
"description": "DeepSeek R1, el modelo más grande e inteligente del conjunto DeepSeek, ha sido destilado en la arquitectura Llama 70B. Basado en pruebas de referencia y evaluaciones humanas, este modelo es más inteligente que el Llama 70B original, destacándose especialmente en tareas que requieren precisión matemática y factual."
},
"DeepSeek-R1-Distill-Qwen-1.5B": {
"description": "El modelo de destilación DeepSeek-R1 basado en Qwen2.5-Math-1.5B optimiza el rendimiento de inferencia mediante aprendizaje por refuerzo y datos de arranque en frío, actualizando el estándar de múltiples tareas en modelos de código abierto."
},
"DeepSeek-R1-Distill-Qwen-14B": {
"description": "El modelo de destilación DeepSeek-R1 basado en Qwen2.5-14B optimiza el rendimiento de inferencia mediante aprendizaje por refuerzo y datos de arranque en frío, actualizando el estándar de múltiples tareas en modelos de código abierto."
},
"DeepSeek-R1-Distill-Qwen-32B": {
"description": "La serie DeepSeek-R1 optimiza el rendimiento de inferencia mediante aprendizaje por refuerzo y datos de arranque en frío, actualizando el estándar de múltiples tareas en modelos de código abierto, superando el nivel de OpenAI-o1-mini."
},
"DeepSeek-R1-Distill-Qwen-7B": {
"description": "El modelo de destilación DeepSeek-R1 basado en Qwen2.5-Math-7B optimiza el rendimiento de inferencia mediante aprendizaje por refuerzo y datos de arranque en frío, actualizando el estándar de múltiples tareas en modelos de código abierto."
},
"DeepSeek-V3": {
"description": "DeepSeek-V3 es un modelo MoE desarrollado internamente por la empresa DeepSeek. Los resultados de DeepSeek-V3 en múltiples evaluaciones superan a otros modelos de código abierto como Qwen2.5-72B y Llama-3.1-405B, y su rendimiento es comparable al de los modelos cerrados de primer nivel mundial como GPT-4o y Claude-3.5-Sonnet."
},
"DeepSeek-V3-1": {
"description": "DeepSeek V3.1: modelo de inferencia de próxima generación, mejora la capacidad de razonamiento complejo y pensamiento en cadena, adecuado para tareas que requieren análisis profundo."
},
"DeepSeek-V3-Fast": {
"description": "Proveedor del modelo: plataforma sophnet. DeepSeek V3 Fast es la versión de alta velocidad y alto TPS de DeepSeek V3 0324, completamente sin cuantificación, con mayor capacidad en código y matemáticas, ¡y respuesta más rápida!"
},
"DeepSeek-V3.1-Fast": {
"description": "DeepSeek V3.1 Fast es la versión de alta TPS y alta velocidad del DeepSeek V3.1. Modo híbrido de pensamiento: mediante la modificación de la plantilla de chat, un solo modelo puede soportar simultáneamente modos reflexivo y no reflexivo. Llamadas a herramientas más inteligentes: gracias a la optimización post-entrenamiento, el modelo mejora notablemente su desempeño en el uso de herramientas y tareas de agentes."
},
"DeepSeek-V3.1-Think": {
"description": "DeepSeek-V3.1 en modo reflexivo; DeepSeek-V3.1 es un nuevo modelo híbrido de razonamiento lanzado por DeepSeek, que soporta dos modos de razonamiento: reflexivo y no reflexivo, con una eficiencia de pensamiento superior a DeepSeek-R1-0528. Tras una optimización post-entrenamiento, el uso de herramientas por agentes y el desempeño en tareas de agentes inteligentes han mejorado significativamente."
},
"Doubao-lite-128k": {
"description": "Doubao-lite ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 128k."
},
"Doubao-lite-32k": {
"description": "Doubao-lite ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 32k."
},
"Doubao-lite-4k": {
"description": "Doubao-lite ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 4k."
},
"Doubao-pro-128k": {
"description": "El modelo principal con mejor rendimiento, adecuado para tareas complejas, con excelentes resultados en preguntas de referencia, resúmenes, creación, clasificación de texto, juegos de rol y otros escenarios. Soporta inferencia y ajuste fino con una ventana de contexto de 128k."
},
"Doubao-pro-32k": {
"description": "El modelo principal con mejor rendimiento, adecuado para tareas complejas, con excelentes resultados en preguntas de referencia, resúmenes, creación, clasificación de texto, juegos de rol y otros escenarios. Soporta inferencia y ajuste fino con una ventana de contexto de 32k."
},
"Doubao-pro-4k": {
"description": "El modelo principal con mejor rendimiento, adecuado para tareas complejas, con excelentes resultados en preguntas de referencia, resúmenes, creación, clasificación de texto, juegos de rol y otros escenarios. Soporta inferencia y ajuste fino con una ventana de contexto de 4k."
},
"DreamO": {
"description": "DreamO es un modelo de generación de imágenes personalizado de código abierto desarrollado conjuntamente por ByteDance y la Universidad de Pekín, diseñado para soportar generación de imágenes multitarea mediante una arquitectura unificada. Utiliza un método eficiente de modelado combinado para generar imágenes altamente coherentes y personalizadas según múltiples condiciones especificadas por el usuario, como identidad, sujeto, estilo y fondo."
},
"ERNIE-3.5-128K": {
"description": "Modelo de lenguaje a gran escala de primera línea desarrollado por Baidu, que abarca una vasta cantidad de corpus en chino y en inglés, con potentes capacidades generales que pueden satisfacer la mayoría de los requisitos de preguntas y respuestas en diálogos, generación de contenido y aplicaciones de plugins; soporta la integración automática con el plugin de búsqueda de Baidu, garantizando la actualidad de la información en las respuestas."
},
"ERNIE-3.5-8K": {
"description": "Modelo de lenguaje a gran escala de primera línea desarrollado por Baidu, que abarca una vasta cantidad de corpus en chino y en inglés, con potentes capacidades generales que pueden satisfacer la mayoría de los requisitos de preguntas y respuestas en diálogos, generación de contenido y aplicaciones de plugins; soporta la integración automática con el plugin de búsqueda de Baidu, garantizando la actualidad de la información en las respuestas."
},
"ERNIE-3.5-8K-Preview": {
"description": "Modelo de lenguaje a gran escala de primera línea desarrollado por Baidu, que abarca una vasta cantidad de corpus en chino y en inglés, con potentes capacidades generales que pueden satisfacer la mayoría de los requisitos de preguntas y respuestas en diálogos, generación de contenido y aplicaciones de plugins; soporta la integración automática con el plugin de búsqueda de Baidu, garantizando la actualidad de la información en las respuestas."
},
"ERNIE-4.0-8K-Latest": {
"description": "Modelo de lenguaje a gran escala ultra avanzado desarrollado por Baidu, que ha logrado una actualización completa de las capacidades del modelo en comparación con ERNIE 3.5, siendo ampliamente aplicable a escenarios de tareas complejas en diversos campos; soporta la integración automática con el plugin de búsqueda de Baidu, garantizando la actualidad de la información en las respuestas."
},
"ERNIE-4.0-8K-Preview": {
"description": "Modelo de lenguaje a gran escala ultra avanzado desarrollado por Baidu, que ha logrado una actualización completa de las capacidades del modelo en comparación con ERNIE 3.5, siendo ampliamente aplicable a escenarios de tareas complejas en diversos campos; soporta la integración automática con el plugin de búsqueda de Baidu, garantizando la actualidad de la información en las respuestas."
},
"ERNIE-4.0-Turbo-8K-Latest": {
"description": "Modelo de lenguaje a gran escala desarrollado por Baidu, con un rendimiento general excepcional, ampliamente aplicable a escenas complejas en diversos campos; soporta la conexión automática al complemento de búsqueda de Baidu, garantizando la actualidad de la información de las preguntas y respuestas. En comparación con ERNIE 4.0, tiene un rendimiento superior."
},
"ERNIE-4.0-Turbo-8K-Preview": {
"description": "Modelo de lenguaje a gran escala ultra avanzado desarrollado por Baidu, con un rendimiento excepcional en efectos generales, siendo ampliamente aplicable a escenarios de tareas complejas en diversos campos; soporta la integración automática con el plugin de búsqueda de Baidu, garantizando la actualidad de la información en las respuestas. En comparación con ERNIE 4.0, ofrece un rendimiento superior."
},
"ERNIE-Character-8K": {
"description": "Modelo de lenguaje vertical desarrollado por Baidu, adecuado para aplicaciones como NPC en juegos, diálogos de servicio al cliente, y juegos de rol conversacionales, con un estilo de personaje más distintivo y coherente, y una mayor capacidad de seguir instrucciones, además de un rendimiento de inferencia superior."
},
"ERNIE-Lite-Pro-128K": {
"description": "Modelo de lenguaje ligero desarrollado por Baidu, que combina un excelente rendimiento del modelo con una alta eficiencia de inferencia, superando a ERNIE Lite, adecuado para su uso en tarjetas de aceleración de IA de bajo consumo."
},
"ERNIE-Speed-128K": {
"description": "Modelo de lenguaje de alto rendimiento desarrollado por Baidu, lanzado en 2024, con capacidades generales excepcionales, adecuado como modelo base para ajustes finos, manejando mejor problemas en escenarios específicos, y con un rendimiento de inferencia excelente."
},
"ERNIE-Speed-Pro-128K": {
"description": "Modelo de lenguaje de alto rendimiento desarrollado por Baidu, lanzado en 2024, con capacidades generales excepcionales, superando a ERNIE Speed, adecuado como modelo base para ajustes finos, manejando mejor problemas en escenarios específicos, y con un rendimiento de inferencia excelente."
},
"FLUX-1.1-pro": {
"description": "FLUX.1.1 Pro"
},
"FLUX.1-Kontext-dev": {
"description": "FLUX.1-Kontext-dev es un modelo multimodal de generación y edición de imágenes desarrollado por Black Forest Labs, basado en la arquitectura Rectified Flow Transformer, con una escala de 12 mil millones de parámetros. Se especializa en generar, reconstruir, mejorar o editar imágenes bajo condiciones contextuales dadas. Combina las ventajas de generación controlada de modelos de difusión con la capacidad de modelado contextual de Transformers, soportando salidas de alta calidad y aplicándose ampliamente en tareas como restauración de imágenes, completado y reconstrucción de escenas visuales."
},
"FLUX.1-Kontext-pro": {
"description": "FLUX.1 Kontext [pro]"
},
"FLUX.1-dev": {
"description": "FLUX.1-dev es un modelo multimodal de lenguaje (MLLM) de código abierto desarrollado por Black Forest Labs, optimizado para tareas de texto e imagen, integrando capacidades de comprensión y generación tanto visual como textual. Está basado en avanzados modelos de lenguaje grande (como Mistral-7B) y mediante un codificador visual cuidadosamente diseñado y un ajuste fino por etapas con instrucciones, logra procesamiento colaborativo de texto e imagen y razonamiento para tareas complejas."
},
"Gryphe/MythoMax-L2-13b": {
"description": "MythoMax-L2 (13B) es un modelo innovador, adecuado para aplicaciones en múltiples campos y tareas complejas."
},
"HelloMeme": {
"description": "HelloMeme es una herramienta de IA que puede generar automáticamente memes, GIFs o videos cortos basados en las imágenes o acciones que proporciones. No requiere conocimientos de dibujo o programación; solo necesitas preparar una imagen de referencia y la herramienta te ayudará a crear contenido atractivo, divertido y con estilo coherente."
},
"HiDream-I1-Full": {
"description": "HiDream-E1-Full es un modelo de edición de imágenes multimodal de código abierto lanzado por HiDream.ai, basado en la avanzada arquitectura Diffusion Transformer y potenciado con una fuerte capacidad de comprensión del lenguaje (incorporando LLaMA 3.1-8B-Instruct). Soporta generación de imágenes, transferencia de estilo, edición local y redibujo de contenido mediante instrucciones en lenguaje natural, con excelentes habilidades de comprensión y ejecución texto-imagen."
},
"HunyuanDiT-v1.2-Diffusers-Distilled": {
"description": "hunyuandit-v1.2-distilled es un modelo ligero de generación de imágenes a partir de texto, optimizado mediante destilación para generar imágenes de alta calidad rápidamente, especialmente adecuado para entornos con recursos limitados y tareas de generación en tiempo real."
},
"InstantCharacter": {
"description": "InstantCharacter es un modelo de generación de personajes personalizados sin necesidad de ajuste fino, lanzado por el equipo de IA de Tencent en 2025, diseñado para lograr generación consistente y de alta fidelidad en múltiples escenarios. El modelo permite modelar un personaje basándose únicamente en una imagen de referencia y transferirlo de forma flexible a diversos estilos, acciones y fondos."
},
"InternVL2-8B": {
"description": "InternVL2-8B es un potente modelo de lenguaje visual, que admite el procesamiento multimodal de imágenes y texto, capaz de identificar con precisión el contenido de las imágenes y generar descripciones o respuestas relacionadas."
},
"InternVL2.5-26B": {
"description": "InternVL2.5-26B es un potente modelo de lenguaje visual, que admite el procesamiento multimodal de imágenes y texto, capaz de identificar con precisión el contenido de las imágenes y generar descripciones o respuestas relacionadas."
},
"Kolors": {
"description": "Kolors es un modelo de generación de imágenes a partir de texto desarrollado por el equipo Kolors de Kuaishou. Entrenado con miles de millones de parámetros, destaca en calidad visual, comprensión semántica del chino y renderizado de texto."
},
"Kwai-Kolors/Kolors": {
"description": "Kolors es un modelo de generación de imágenes a partir de texto a gran escala basado en difusión latente, desarrollado por el equipo Kolors de Kuaishou. Entrenado con miles de millones de pares texto-imagen, muestra ventajas significativas en calidad visual, precisión semántica compleja y renderizado de caracteres en chino e inglés. Soporta entradas en ambos idiomas y sobresale en la comprensión y generación de contenido específico en chino."
},
"Kwaipilot/KAT-Dev": {
"description": "KAT-Dev (32B) es un modelo de código abierto con 32 mil millones de parámetros, diseñado específicamente para tareas de ingeniería de software. En la prueba de referencia SWE-Bench Verified, alcanzó una tasa de resolución del 62,4 %, situándose en el quinto lugar entre todos los modelos de código abierto de diferentes tamaños. El modelo ha sido optimizado a través de múltiples etapas, incluyendo entrenamiento intermedio, ajuste fino supervisado (SFT) y aprendizaje por refuerzo (RL), con el objetivo de ofrecer un sólido soporte para tareas complejas de programación como autocompletado de código, corrección de errores y revisión de código."
},
"Llama-3.2-11B-Vision-Instruct": {
"description": "Capacidad de razonamiento de imágenes excepcional en imágenes de alta resolución, adecuada para aplicaciones de comprensión visual."
},
"Llama-3.2-90B-Vision-Instruct\t": {
"description": "Capacidad avanzada de razonamiento de imágenes para aplicaciones de agentes de comprensión visual."
},
"Meta-Llama-3-3-70B-Instruct": {
"description": "Llama 3.3 70B: modelo Transformer de gran versatilidad, adecuado para tareas de diálogo y generación."
},
"Meta-Llama-3.1-405B-Instruct": {
"description": "Modelo de texto ajustado por instrucciones de Llama 3.1, optimizado para casos de uso de diálogos multilingües, que se destaca en muchos modelos de chat de código abierto y cerrados en benchmarks de la industria comunes."
},
"Meta-Llama-3.1-70B-Instruct": {
"description": "Modelo de texto ajustado por instrucciones de Llama 3.1, optimizado para casos de uso de diálogos multilingües, que se destaca en muchos modelos de chat de código abierto y cerrados en benchmarks de la industria comunes."
},
"Meta-Llama-3.1-8B-Instruct": {
"description": "Modelo de texto ajustado por instrucciones de Llama 3.1, optimizado para casos de uso de diálogos multilingües, que se destaca en muchos modelos de chat de código abierto y cerrados en benchmarks de la industria comunes."
},
"Meta-Llama-3.2-1B-Instruct": {
"description": "Modelo de lenguaje pequeño de última generación, con comprensión del lenguaje, excelente capacidad de razonamiento y generación de texto."
},
"Meta-Llama-3.2-3B-Instruct": {
"description": "Modelo de lenguaje pequeño de última generación, con comprensión del lenguaje, excelente capacidad de razonamiento y generación de texto."
},
"Meta-Llama-3.3-70B-Instruct": {
"description": "Llama 3.3 es el modelo de lenguaje de código abierto multilingüe más avanzado de la serie Llama, que ofrece un rendimiento comparable al modelo de 405B a un costo extremadamente bajo. Basado en la estructura Transformer, y mejorado en utilidad y seguridad a través de ajuste fino supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF). Su versión ajustada por instrucciones está optimizada para diálogos multilingües, superando a muchos modelos de chat de código abierto y cerrados en múltiples benchmarks de la industria. La fecha límite de conocimiento es diciembre de 2023."
},
"Meta-Llama-4-Maverick-17B-128E-Instruct-FP8": {
"description": "Llama 4 Maverick: modelo a gran escala basado en Mixture-of-Experts, que ofrece una estrategia eficiente de activación de expertos para un rendimiento sobresaliente en inferencia."
},
"MiniMax-M1": {
"description": "Modelo de inferencia de desarrollo propio completamente nuevo. Líder mundial: 80K cadenas de pensamiento x 1M de entradas, con un rendimiento comparable a los modelos más avanzados del extranjero."
},
"MiniMax-M2": {
"description": "Diseñado específicamente para una codificación eficiente y flujos de trabajo con agentes."
},
"MiniMax-M2-Stable": {
"description": "Diseñado para una codificación eficiente y flujos de trabajo de agentes, con mayor concurrencia y uso comercial."
},
"MiniMax-Text-01": {
"description": "En la serie de modelos MiniMax-01, hemos realizado una innovación audaz: la implementación a gran escala del mecanismo de atención lineal, donde la arquitectura Transformer tradicional ya no es la única opción. Este modelo tiene una cantidad de parámetros de hasta 456 mil millones, con 45.9 mil millones por activación. El rendimiento general del modelo es comparable a los mejores modelos internacionales, y puede manejar de manera eficiente contextos de hasta 4 millones de tokens, que es 32 veces más que GPT-4o y 20 veces más que Claude-3.5-Sonnet."
},
"MiniMaxAI/MiniMax-M1-80k": {
"description": "MiniMax-M1 es un modelo de inferencia de atención mixta a gran escala con pesos de código abierto, que cuenta con 456 mil millones de parámetros, activando aproximadamente 45.9 mil millones de parámetros por token. El modelo soporta de forma nativa contextos ultra largos de hasta 1 millón de tokens y, gracias a su mecanismo de atención relámpago, reduce en un 75 % las operaciones de punto flotante en tareas de generación de 100 mil tokens en comparación con DeepSeek R1. Además, MiniMax-M1 utiliza una arquitectura MoE (Mezcla de Expertos), combinando el algoritmo CISPO y un diseño de atención mixta para un entrenamiento eficiente mediante aprendizaje reforzado, logrando un rendimiento líder en la industria en inferencia con entradas largas y escenarios reales de ingeniería de software."
},
"MiniMaxAI/MiniMax-M2": {
"description": "MiniMax-M2 redefine la eficiencia para los agentes inteligentes. Es un modelo MoE compacto, rápido y rentable, con un total de 230 mil millones de parámetros y 10 mil millones de parámetros activos. Está diseñado para ofrecer un rendimiento de primer nivel en tareas de codificación y agentes, manteniendo al mismo tiempo una inteligencia general sólida. Con solo 10 mil millones de parámetros activos, MiniMax-M2 ofrece un rendimiento comparable al de modelos a gran escala, lo que lo convierte en una opción ideal para aplicaciones de alta eficiencia."
},
"Moonshot-Kimi-K2-Instruct": {
"description": "Con un total de 1 billón de parámetros y 32 mil millones de parámetros activados, este modelo no reflexivo alcanza niveles de vanguardia en conocimiento avanzado, matemáticas y codificación, destacando en tareas generales de agentes. Optimizado para tareas de agentes, no solo responde preguntas sino que también puede actuar. Ideal para conversaciones improvisadas, chat general y experiencias de agentes, es un modelo de nivel reflexivo que no requiere largos tiempos de pensamiento."
},
"NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO": {
"description": "Nous Hermes 2 - Mixtral 8x7B-DPO (46.7B) es un modelo de instrucciones de alta precisión, adecuado para cálculos complejos."
},
"OmniConsistency": {
"description": "OmniConsistency mejora la consistencia de estilo y la capacidad de generalización en tareas de imagen a imagen mediante la introducción de grandes Diffusion Transformers (DiTs) y datos estilizados emparejados, evitando la degradación del estilo."
},
"Phi-3-medium-128k-instruct": {
"description": "El mismo modelo Phi-3-medium, pero con un tamaño de contexto más grande para RAG o indicaciones de pocos disparos."
},
"Phi-3-medium-4k-instruct": {
"description": "Un modelo de 14B parámetros, que demuestra mejor calidad que Phi-3-mini, con un enfoque en datos densos de razonamiento de alta calidad."
},
"Phi-3-mini-128k-instruct": {
"description": "El mismo modelo Phi-3-mini, pero con un tamaño de contexto más grande para RAG o indicaciones de pocos disparos."
},
"Phi-3-mini-4k-instruct": {
"description": "El miembro más pequeño de la familia Phi-3. Optimizado tanto para calidad como para baja latencia."
},
"Phi-3-small-128k-instruct": {
"description": "El mismo modelo Phi-3-small, pero con un tamaño de contexto más grande para RAG o indicaciones de pocos disparos."
},
"Phi-3-small-8k-instruct": {
"description": "Un modelo de 7B parámetros, que demuestra mejor calidad que Phi-3-mini, con un enfoque en datos densos de razonamiento de alta calidad."
},
"Phi-3.5-mini-instruct": {
"description": "Versión actualizada del modelo Phi-3-mini."
},
"Phi-3.5-vision-instrust": {
"description": "Versión actualizada del modelo Phi-3-vision."
},
"Pro/Qwen/Qwen2-7B-Instruct": {
"description": "Qwen2-7B-Instruct es un modelo de lenguaje a gran escala de ajuste fino por instrucciones dentro de la serie Qwen2, con un tamaño de parámetros de 7B. Este modelo se basa en la arquitectura Transformer, utilizando funciones de activación SwiGLU, sesgos de atención QKV y atención de consulta agrupada, entre otras técnicas. Es capaz de manejar entradas a gran escala. Este modelo ha destacado en múltiples pruebas de referencia en comprensión del lenguaje, generación, capacidad multilingüe, codificación, matemáticas y razonamiento, superando a la mayoría de los modelos de código abierto y mostrando competitividad comparable a modelos propietarios en ciertas tareas. Qwen2-7B-Instruct ha mostrado mejoras significativas en múltiples evaluaciones en comparación con Qwen1.5-7B-Chat."
},
"Pro/Qwen/Qwen2.5-7B-Instruct": {
"description": "Qwen2.5-7B-Instruct es uno de los últimos modelos de lenguaje a gran escala lanzados por Alibaba Cloud. Este modelo de 7B ha mejorado significativamente en áreas como codificación y matemáticas. También ofrece soporte multilingüe, abarcando más de 29 idiomas, incluidos chino e inglés. El modelo ha mostrado mejoras significativas en el seguimiento de instrucciones, comprensión de datos estructurados y generación de salidas estructuradas (especialmente JSON)."
},
"Pro/Qwen/Qwen2.5-Coder-7B-Instruct": {
"description": "Qwen2.5-Coder-7B-Instruct es la última versión de la serie de modelos de lenguaje a gran escala específicos para código lanzada por Alibaba Cloud. Este modelo, basado en Qwen2.5, ha mejorado significativamente la generación, razonamiento y reparación de código a través de un entrenamiento con 55 billones de tokens. No solo ha mejorado la capacidad de codificación, sino que también ha mantenido ventajas en habilidades matemáticas y generales. El modelo proporciona una base más completa para aplicaciones prácticas como agentes de código."
},
"Pro/Qwen/Qwen2.5-VL-7B-Instruct": {
"description": "Qwen2.5-VL es el nuevo miembro de la serie Qwen, con potentes capacidades de comprensión visual. Puede analizar texto, gráficos y diseños en imágenes, comprender videos largos y capturar eventos. Es capaz de razonar, manipular herramientas, admitir el posicionamiento de objetos en múltiples formatos y generar salidas estructuradas. Optimiza la resolución dinámica y la tasa de cuadros para la comprensión de videos, además de mejorar la eficiencia del codificador visual."
},
"Pro/THUDM/GLM-4.1V-9B-Thinking": {
"description": "GLM-4.1V-9B-Thinking es un modelo de lenguaje visual (VLM) de código abierto lanzado conjuntamente por Zhipu AI y el laboratorio KEG de la Universidad de Tsinghua, diseñado específicamente para manejar tareas cognitivas multimodales complejas. Este modelo se basa en el modelo base GLM-4-9B-0414 y mejora significativamente su capacidad y estabilidad de razonamiento multimodal mediante la introducción del mecanismo de razonamiento \"Cadena de Pensamiento\" (Chain-of-Thought) y la adopción de estrategias de aprendizaje reforzado."
},
"Pro/THUDM/glm-4-9b-chat": {
"description": "GLM-4-9B-Chat es la versión de código abierto de la serie de modelos preentrenados GLM-4 lanzada por Zhipu AI. Este modelo destaca en semántica, matemáticas, razonamiento, código y conocimiento. Además de soportar diálogos de múltiples turnos, GLM-4-9B-Chat también cuenta con funciones avanzadas como navegación web, ejecución de código, llamadas a herramientas personalizadas (Function Call) y razonamiento de textos largos. El modelo admite 26 idiomas, incluidos chino, inglés, japonés, coreano y alemán. En múltiples pruebas de referencia, GLM-4-9B-Chat ha demostrado un rendimiento excepcional, como AlignBench-v2, MT-Bench, MMLU y C-Eval. Este modelo admite una longitud de contexto máxima de 128K, adecuado para investigación académica y aplicaciones comerciales."
},
"Pro/deepseek-ai/DeepSeek-R1": {
"description": "DeepSeek-R1 es un modelo de inferencia impulsado por aprendizaje por refuerzo (RL) que aborda problemas de repetitividad y legibilidad en el modelo. Antes del RL, DeepSeek-R1 introdujo datos de arranque en frío, optimizando aún más el rendimiento de inferencia. Se desempeña de manera comparable a OpenAI-o1 en tareas matemáticas, de código e inferencia, y mejora el rendimiento general a través de métodos de entrenamiento cuidadosamente diseñados."
},
"Pro/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
"description": "DeepSeek-R1-Distill-Qwen-7B es un modelo obtenido mediante destilación de conocimiento basado en Qwen2.5-Math-7B. Este modelo se ha ajustado utilizando 800.000 muestras seleccionadas generadas por DeepSeek-R1, demostrando una excelente capacidad de razonamiento. Ha mostrado un rendimiento sobresaliente en múltiples pruebas de referencia, alcanzando un 92,8% de precisión en MATH-500, un 55,5% de tasa de aprobación en AIME 2024 y una puntuación de 1189 en CodeForces, lo que demuestra una fuerte capacidad matemática y de programación para un modelo de escala 7B."
},
"Pro/deepseek-ai/DeepSeek-V3": {
"description": "DeepSeek-V3 es un modelo de lenguaje de expertos mixtos (MoE) con 671 mil millones de parámetros, que utiliza atención potencial de múltiples cabezas (MLA) y la arquitectura DeepSeekMoE, combinando estrategias de balanceo de carga sin pérdidas auxiliares para optimizar la eficiencia de inferencia y entrenamiento. Preentrenado en 14.8 billones de tokens de alta calidad, y ajustado mediante supervisión y aprendizaje por refuerzo, DeepSeek-V3 supera a otros modelos de código abierto y se acerca a los modelos cerrados líderes."
},
"Pro/deepseek-ai/DeepSeek-V3.1-Terminus": {
"description": "DeepSeek-V3.1-Terminus es una versión actualizada del modelo V3.1 lanzado por DeepSeek, posicionada como un modelo de lenguaje grande con agentes híbridos. Esta actualización mantiene las capacidades originales del modelo, enfocándose en corregir problemas reportados por los usuarios y mejorar la estabilidad. Mejora significativamente la coherencia del lenguaje, reduciendo la mezcla de chino e inglés y la aparición de caracteres anómalos. El modelo integra el “Modo de pensamiento” y el “Modo sin pensamiento”, permitiendo a los usuarios cambiar flexiblemente mediante plantillas de chat para adaptarse a diferentes tareas. Como optimización importante, V3.1-Terminus mejora el rendimiento del agente de código y del agente de búsqueda, haciéndolos más confiables en la invocación de herramientas y en la ejecución de tareas complejas de múltiples pasos."
},
"Pro/deepseek-ai/DeepSeek-V3.2-Exp": {
"description": "DeepSeek-V3.2-Exp es una versión experimental lanzada por DeepSeek como un paso intermedio hacia una arquitectura de próxima generación. Basado en V3.1-Terminus, introduce el mecanismo de Atención Dispersa de DeepSeek (DeepSeek Sparse Attention, DSA) para mejorar la eficiencia en el entrenamiento e inferencia con contextos largos. Ha sido especialmente optimizado para la invocación de herramientas, la comprensión de documentos extensos y el razonamiento en múltiples pasos. V3.2-Exp actúa como un puente entre la investigación y la producción, ideal para usuarios que buscan explorar una mayor eficiencia de razonamiento en escenarios con presupuestos de contexto elevados."
},
"Pro/moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 es la versión más reciente y potente de Kimi K2. Es un modelo de lenguaje de expertos mixtos (MoE) de primer nivel, con un total de un billón de parámetros y 32 mil millones de parámetros activados. Las principales características de este modelo incluyen: inteligencia mejorada para agentes de codificación, mostrando un rendimiento notable en pruebas de referencia públicas y en tareas reales de agentes de codificación; y una experiencia mejorada en la codificación frontend, con avances tanto en la estética como en la funcionalidad de la programación frontend."
},
"Pro/moonshotai/Kimi-K2-Thinking": {
"description": "Kimi K2 Thinking Turbo es la versión Turbo de la serie Kimi K2, optimizada para la velocidad de inferencia y el rendimiento, manteniendo la capacidad de razonamiento multietapa y uso de herramientas de K2 Thinking. Este modelo se basa en una arquitectura de expertos mixtos (MoE), con aproximadamente 1 billón de parámetros, soporte nativo para contextos de hasta 256K y ejecución estable de llamadas a herramientas a gran escala. Ideal para entornos de producción con altas exigencias de latencia y concurrencia."
},
"QwQ-32B-Preview": {
"description": "QwQ-32B-Preview es un modelo de procesamiento de lenguaje natural innovador, capaz de manejar de manera eficiente tareas complejas de generación de diálogos y comprensión del contexto."
},
"Qwen/QVQ-72B-Preview": {
"description": "QVQ-72B-Preview es un modelo de investigación desarrollado por el equipo de Qwen, enfocado en la capacidad de razonamiento visual, que tiene ventajas únicas en la comprensión de escenas complejas y en la resolución de problemas matemáticos relacionados con la visión."
},
"Qwen/QwQ-32B": {
"description": "QwQ es el modelo de inferencia de la serie Qwen. A diferencia de los modelos tradicionales de ajuste por instrucciones, QwQ posee habilidades de pensamiento e inferencia, lo que le permite lograr un rendimiento significativamente mejorado en tareas posteriores, especialmente en la resolución de problemas difíciles. QwQ-32B es un modelo de inferencia de tamaño mediano que puede competir en rendimiento con los modelos de inferencia más avanzados (como DeepSeek-R1, o1-mini). Este modelo utiliza tecnologías como RoPE, SwiGLU, RMSNorm y sesgo de atención QKV, y cuenta con una estructura de red de 64 capas y 40 cabezas de atención Q (en la arquitectura GQA, KV es de 8)."
},
"Qwen/QwQ-32B-Preview": {
"description": "QwQ-32B-Preview es el último modelo de investigación experimental de Qwen, enfocado en mejorar la capacidad de razonamiento de la IA. A través de la exploración de mecanismos complejos como la mezcla de lenguajes y el razonamiento recursivo, sus principales ventajas incluyen una poderosa capacidad de análisis de razonamiento, así como habilidades matemáticas y de programación. Sin embargo, también presenta problemas de cambio de idioma, ciclos de razonamiento, consideraciones de seguridad y diferencias en otras capacidades."
},
"Qwen/Qwen-Image": {
"description": "Qwen-Image es un modelo base de generación de imágenes desarrollado por el equipo Tongyi Qianwen de Alibaba, con 20 mil millones de parámetros. Este modelo ha logrado avances significativos en la representación compleja de texto y la edición precisa de imágenes, destacándose especialmente en la generación de imágenes con texto en chino e inglés de alta fidelidad. Qwen-Image no solo puede manejar diseños de múltiples líneas y textos a nivel de párrafo, sino que también mantiene la coherencia tipográfica y la armonía contextual al generar imágenes. Además de su sobresaliente capacidad de renderizado de texto, el modelo admite una amplia gama de estilos artísticos, desde fotografía realista hasta estética de anime, adaptándose con flexibilidad a diversas necesidades creativas. También posee potentes capacidades de edición y comprensión de imágenes, incluyendo transferencia de estilo, adición y eliminación de objetos, mejora de detalles, edición de texto e incluso manipulación de posturas humanas. Su objetivo es convertirse en un modelo base integral para la creación y procesamiento visual inteligente que integre lenguaje, diseño y contenido visual."
},
"Qwen/Qwen-Image-Edit-2509": {
"description": "Qwen-Image-Edit-2509 es la versión más reciente de edición de imágenes del modelo Qwen-Image, lanzado por el equipo Tongyi Qianwen de Alibaba. Este modelo ha sido entrenado en profundidad sobre la base del modelo Qwen-Image de 20 mil millones de parámetros, extendiendo con éxito su capacidad única de renderizado de texto al ámbito de la edición de imágenes, logrando una edición precisa del texto dentro de las imágenes. Qwen-Image-Edit adopta una arquitectura innovadora que envía la imagen de entrada simultáneamente a Qwen2.5-VL (para el control semántico visual) y al codificador VAE (para el control de la apariencia visual), lo que le otorga una capacidad de edición dual tanto semántica como visual. Esto significa que no solo permite ediciones locales de apariencia como agregar, eliminar o modificar elementos, sino también ediciones semánticas visuales avanzadas que requieren coherencia semántica, como la creación de propiedad intelectual (IP) o la transferencia de estilo. El modelo ha demostrado un rendimiento de vanguardia (SOTA) en múltiples pruebas de referencia públicas, consolidándose como un potente modelo base para la edición de imágenes."
},
"Qwen/Qwen2-72B-Instruct": {
"description": "Qwen2 es un modelo de lenguaje general avanzado, que soporta múltiples tipos de instrucciones."
},
"Qwen/Qwen2-7B-Instruct": {
"description": "Qwen2-72B-Instruct es un modelo de lenguaje a gran escala de ajuste fino por instrucciones dentro de la serie Qwen2, con un tamaño de parámetros de 72B. Este modelo se basa en la arquitectura Transformer, utilizando funciones de activación SwiGLU, sesgos de atención QKV y atención de consulta agrupada, entre otras técnicas. Es capaz de manejar entradas a gran escala. Este modelo ha destacado en múltiples pruebas de referencia en comprensión del lenguaje, generación, capacidad multilingüe, codificación, matemáticas y razonamiento, superando a la mayoría de los modelos de código abierto y mostrando competitividad comparable a modelos propietarios en ciertas tareas."
},
"Qwen/Qwen2-VL-72B-Instruct": {
"description": "Qwen2-VL es la última iteración del modelo Qwen-VL, alcanzando un rendimiento de vanguardia en pruebas de comprensión visual."
},
"Qwen/Qwen2.5-14B-Instruct": {
"description": "Qwen2.5 es una nueva serie de modelos de lenguaje a gran escala, diseñada para optimizar el procesamiento de tareas de instrucción."
},
"Qwen/Qwen2.5-32B-Instruct": {
"description": "Qwen2.5 es una nueva serie de modelos de lenguaje a gran escala, diseñada para optimizar el procesamiento de tareas de instrucción."
},
"Qwen/Qwen2.5-72B-Instruct": {
"description": "Modelo de lenguaje de gran escala desarrollado por el equipo de Tongyi Qianwen de Alibaba Cloud"
},
"Qwen/Qwen2.5-72B-Instruct-128K": {
"description": "Qwen2.5 es una nueva serie de grandes modelos de lenguaje, con capacidades de comprensión y generación más fuertes."
},
"Qwen/Qwen2.5-72B-Instruct-Turbo": {
"description": "Qwen2.5 es una nueva serie de grandes modelos de lenguaje, diseñada para optimizar el manejo de tareas instructivas."
},
"Qwen/Qwen2.5-7B-Instruct": {
"description": "Qwen2.5 es una nueva serie de modelos de lenguaje a gran escala, diseñada para optimizar el procesamiento de tareas de instrucción."
},
"Qwen/Qwen2.5-7B-Instruct-Turbo": {
"description": "Qwen2.5 es una nueva serie de grandes modelos de lenguaje, diseñada para optimizar el manejo de tareas instructivas."
},
"Qwen/Qwen2.5-Coder-32B-Instruct": {
"description": "Qwen2.5-Coder se centra en la escritura de código."
},
"Qwen/Qwen2.5-Coder-7B-Instruct": {
"description": "Qwen2.5-Coder-7B-Instruct es la última versión de la serie de modelos de lenguaje a gran escala específicos para código lanzada por Alibaba Cloud. Este modelo, basado en Qwen2.5, ha mejorado significativamente la generación, razonamiento y reparación de código a través de un entrenamiento con 55 billones de tokens. No solo ha mejorado la capacidad de codificación, sino que también ha mantenido ventajas en habilidades matemáticas y generales. El modelo proporciona una base más completa para aplicaciones prácticas como agentes de código."
},
"Qwen/Qwen2.5-VL-32B-Instruct": {
"description": "Qwen2.5-VL-32B-Instruct es un modelo multimodal avanzado desarrollado por el equipo Tongyi Qianwen, que forma parte de la serie Qwen2.5-VL. Este modelo no solo domina el reconocimiento de objetos comunes, sino que también puede analizar texto, gráficos, iconos, diagramas y diseños en imágenes. Funciona como un agente visual inteligente capaz de razonar y manipular herramientas dinámicamente, con habilidades para operar computadoras y dispositivos móviles. Además, el modelo puede localizar con precisión objetos en imágenes y generar salidas estructuradas para documentos como facturas y tablas. En comparación con su predecesor Qwen2-VL, esta versión ha mejorado significativamente sus capacidades matemáticas y de resolución de problemas mediante aprendizaje por refuerzo, y su estilo de respuesta se ha optimizado para adaptarse mejor a las preferencias humanas."
},
"Qwen/Qwen2.5-VL-72B-Instruct": {
"description": "Qwen2.5-VL es el modelo de lenguaje visual de la serie Qwen2.5. Este modelo presenta mejoras significativas en múltiples aspectos: posee una mayor capacidad de comprensión visual, pudiendo reconocer objetos comunes, analizar texto, gráficos y diseños; como agente visual puede razonar y guiar dinámicamente el uso de herramientas; soporta la comprensión de videos largos de más de 1 hora capturando eventos clave; es capaz de localizar objetos en imágenes con precisión generando cuadros delimitadores o puntos; y admite la generación de salidas estructuradas, especialmente útil para datos escaneados como facturas o tablas."
},
"Qwen/Qwen3-14B": {
"description": "Qwen3 es un nuevo modelo de Tongyi Qianwen de próxima generación con capacidades significativamente mejoradas, alcanzando niveles líderes en la industria en razonamiento, general, agente y múltiples idiomas, y admite el cambio de modo de pensamiento."
},
"Qwen/Qwen3-235B-A22B": {
"description": "Qwen3 es un nuevo modelo de Tongyi Qianwen de próxima generación con capacidades significativamente mejoradas, alcanzando niveles líderes en la industria en razonamiento, general, agente y múltiples idiomas, y admite el cambio de modo de pensamiento."
},
"Qwen/Qwen3-235B-A22B-Instruct-2507": {
"description": "Qwen3-235B-A22B-Instruct-2507 es un modelo de lenguaje grande híbrido experto (MoE) de nivel insignia desarrollado por el equipo Tongyi Qianwen de Alibaba Cloud. Cuenta con 235 mil millones de parámetros totales y activa 22 mil millones por inferencia. Es una versión actualizada del modo no reflexivo Qwen3-235B-A22B, enfocada en mejorar significativamente el cumplimiento de instrucciones, razonamiento lógico, comprensión textual, matemáticas, ciencias, programación y uso de herramientas. Además, amplía la cobertura de conocimientos multilingües y mejora la alineación con las preferencias del usuario en tareas subjetivas y abiertas para generar textos más útiles y de alta calidad."
},
"Qwen/Qwen3-235B-A22B-Thinking-2507": {
"description": "Qwen3-235B-A22B-Thinking-2507 es un modelo de lenguaje grande de la serie Qwen3 desarrollado por el equipo Tongyi Qianwen de Alibaba, especializado en tareas complejas de razonamiento avanzado. Basado en arquitectura MoE, cuenta con 235 mil millones de parámetros totales y activa aproximadamente 22 mil millones por token, mejorando la eficiencia computacional sin sacrificar rendimiento. Como modelo dedicado al “pensamiento”, destaca en razonamiento lógico, matemáticas, ciencias, programación y pruebas académicas que requieren conocimiento experto, alcanzando niveles líderes en modelos reflexivos de código abierto. También mejora capacidades generales como cumplimiento de instrucciones, uso de herramientas y generación de texto, y soporta nativamente comprensión de contexto largo de hasta 256K tokens, ideal para escenarios que requieren razonamiento profundo y manejo de documentos extensos."
},
"Qwen/Qwen3-30B-A3B": {
"description": "Qwen3 es un nuevo modelo de Tongyi Qianwen de próxima generación con capacidades significativamente mejoradas, alcanzando niveles líderes en la industria en razonamiento, general, agente y múltiples idiomas, y admite el cambio de modo de pensamiento."
},
"Qwen/Qwen3-30B-A3B-Instruct-2507": {
"description": "Qwen3-30B-A3B-Instruct-2507 es una versión actualizada del modelo Qwen3-30B-A3B en modo no reflexivo. Es un modelo de expertos mixtos (MoE) con un total de 30.5 mil millones de parámetros y 3.3 mil millones de parámetros activados. El modelo ha mejorado significativamente en varios aspectos, incluyendo el seguimiento de instrucciones, razonamiento lógico, comprensión de texto, matemáticas, ciencias, codificación y uso de herramientas. Además, ha logrado avances sustanciales en la cobertura de conocimientos multilingües de cola larga y se alinea mejor con las preferencias del usuario en tareas subjetivas y abiertas, generando respuestas más útiles y textos de mayor calidad. También se ha mejorado la capacidad de comprensión de textos largos hasta 256K. Este modelo solo soporta el modo no reflexivo y no genera etiquetas `<think></think>` en su salida."
},
"Qwen/Qwen3-30B-A3B-Thinking-2507": {
"description": "Qwen3-30B-A3B-Thinking-2507 es el último modelo de pensamiento de la serie Qwen3, publicado por el equipo Tongyi Qianwen de Alibaba. Como un modelo Mixture of Experts (MoE) con 30.500 millones de parámetros en total y 3.300 millones de parámetros activados, está enfocado en mejorar la capacidad de abordar tareas complejas. Este modelo muestra mejoras significativas en razonamiento lógico, matemáticas, ciencias, programación y en evaluaciones académicas que requieren conocimientos humanos especializados. Al mismo tiempo, presenta avances notables en capacidades generales como el cumplimiento de instrucciones, el uso de herramientas, la generación de texto y la alineación con las preferencias humanas. El modelo soporta de forma nativa la comprensión de contextos largos de 256K tokens y puede ampliarse hasta 1 millón de tokens. Esta versión está diseñada específicamente para el “modo de pensamiento”, con el objetivo de resolver tareas altamente complejas mediante razonamientos detallados y paso a paso; asimismo, sus capacidades como agente (Agent) también resultan sobresalientes."
},
"Qwen/Qwen3-32B": {
"description": "Qwen3 es un nuevo modelo de Tongyi Qianwen de próxima generación con capacidades significativamente mejoradas, alcanzando niveles líderes en la industria en razonamiento, general, agente y múltiples idiomas, y admite el cambio de modo de pensamiento."
},
"Qwen/Qwen3-8B": {
"description": "Qwen3 es un nuevo modelo de Tongyi Qianwen de próxima generación con capacidades significativamente mejoradas, alcanzando niveles líderes en la industria en razonamiento, general, agente y múltiples idiomas, y admite el cambio de modo de pensamiento."
},
"Qwen/Qwen3-Coder-30B-A3B-Instruct": {
"description": "Qwen3-Coder-30B-A3B-Instruct es un modelo de código de la serie Qwen3 desarrollado por el equipo Tongyi Qianwen (通义千问) de Alibaba. Como un modelo depurado y optimizado, mantiene un alto rendimiento y eficiencia a la vez que se centra en mejorar la capacidad de procesamiento de código. Este modelo muestra una ventaja de rendimiento notable frente a otros modelos de código abierto en tareas complejas como la programación agente (Agentic Coding), la automatización de operaciones en navegadores y la invocación de herramientas. Soporta de forma nativa contextos largos de 256K tokens y puede ampliarse hasta 1M tokens, lo que le permite entender y gestionar mejor repositorios de código a escala. Además, proporciona un sólido soporte de codificación por agentes para plataformas como Qwen Code y CLINE, y está diseñado con un formato específico para llamadas a funciones."
},
"Qwen/Qwen3-Coder-480B-A35B-Instruct": {
"description": "Qwen3-Coder-480B-A35B-Instruct es un modelo de código publicado por Alibaba, hasta la fecha el más capaz en términos de agencia (agentic). Es un modelo de expertos mixtos (MoE) con 480 000 millones de parámetros en total y 35 000 millones de parámetros de activación, que logra un equilibrio entre eficiencia y rendimiento. El modelo admite de forma nativa una longitud de contexto de 256K (aprox. 260 000) tokens y puede ampliarse hasta 1 000 000 tokens mediante métodos de extrapolación como YaRN, lo que le permite manejar bases de código a gran escala y tareas de programación complejas. Qwen3-Coder está diseñado para flujos de trabajo de codificación orientados a agentes: no solo genera código, sino que puede interactuar de forma autónoma con herramientas y entornos de desarrollo para resolver problemas de programación complejos. En múltiples pruebas de referencia de tareas de codificación y de agente, este modelo ha alcanzado un nivel superior entre los modelos de código abierto, y su rendimiento puede compararse con el de modelos líderes como Claude Sonnet 4."
},
"Qwen/Qwen3-Next-80B-A3B-Instruct": {
"description": "Qwen3-Next-80B-A3B-Instruct es un modelo base de próxima generación lanzado por el equipo Tongyi Qianwen de Alibaba. Está basado en la nueva arquitectura Qwen3-Next, diseñada para lograr una eficiencia extrema en entrenamiento e inferencia. Este modelo utiliza un innovador mecanismo de atención híbrida (Gated DeltaNet y Gated Attention), una estructura de expertos mixtos altamente dispersos (MoE) y múltiples optimizaciones para la estabilidad del entrenamiento. Como un modelo disperso con un total de 80 mil millones de parámetros, solo activa alrededor de 3 mil millones durante la inferencia, reduciendo significativamente el costo computacional. En tareas de contexto largo que superan los 32K tokens, su rendimiento de inferencia es más de 10 veces superior al modelo Qwen3-32B. Esta versión está afinada para instrucciones, diseñada para tareas generales y no soporta el modo de cadena de pensamiento (Thinking). En cuanto a rendimiento, es comparable al modelo insignia Qwen3-235B en algunas pruebas de referencia, mostrando ventajas claras en tareas de contexto ultra largo."
},
"Qwen/Qwen3-Next-80B-A3B-Thinking": {
"description": "Qwen3-Next-80B-A3B-Thinking es un modelo base de próxima generación lanzado por el equipo Tongyi Qianwen de Alibaba, diseñado específicamente para tareas complejas de razonamiento. Basado en la innovadora arquitectura Qwen3-Next, que integra mecanismos de atención híbrida (Gated DeltaNet y Gated Attention) y una estructura de expertos mixtos altamente dispersos (MoE), busca alcanzar una eficiencia extrema en entrenamiento e inferencia. Como modelo disperso con 80 mil millones de parámetros totales, solo activa alrededor de 3 mil millones durante la inferencia, reduciendo considerablemente el costo computacional. En tareas de contexto largo que superan los 32K tokens, su rendimiento es más de 10 veces superior al modelo Qwen3-32B. Esta versión “Thinking” está optimizada para ejecutar tareas complejas de múltiples pasos como demostraciones matemáticas, síntesis de código, análisis lógico y planificación, y por defecto produce el proceso de razonamiento en forma estructurada de “cadena de pensamiento”. En rendimiento, supera no solo a modelos más costosos como Qwen3-32B-Thinking, sino también a Gemini-2.5-Flash-Thinking en múltiples benchmarks."
},
"Qwen/Qwen3-Omni-30B-A3B-Captioner": {
"description": "Qwen3-Omni-30B-A3B-Captioner es un modelo de lenguaje visual (VLM) de la serie Qwen3 del equipo Qwen de Alibaba. Está diseñado para generar descripciones de imágenes de alta calidad, detalladas y precisas. Basado en una arquitectura de expertos mixtos (MoE) con un total de 30 mil millones de parámetros, el modelo puede comprender profundamente el contenido visual y convertirlo en descripciones textuales naturales y fluidas. Destaca en la captura de detalles visuales, comprensión de escenas, reconocimiento de objetos y razonamiento relacional, siendo ideal para aplicaciones que requieren una comprensión precisa de imágenes y generación de descripciones."
},
"Qwen/Qwen3-Omni-30B-A3B-Instruct": {
"description": "Qwen3-Omni-30B-A3B-Instruct es parte de la última serie Qwen3 del equipo Qwen de Alibaba. Es un modelo de expertos mixtos (MoE) con 30 mil millones de parámetros totales y 3 mil millones de parámetros activos, que mantiene un alto rendimiento mientras reduce los costos de inferencia. Entrenado con datos de alta calidad, multifuente y multilingües, posee una gran capacidad general y admite entradas multimodales, incluyendo texto, imágenes, audio y video, permitiendo la comprensión y generación de contenido entre modalidades."
},
"Qwen/Qwen3-Omni-30B-A3B-Thinking": {
"description": "Qwen3-Omni-30B-A3B-Thinking es el componente central \"pensante\" (Thinker) del modelo multimodal Qwen3-Omni. Está diseñado para procesar entradas multimodales como texto, audio, imágenes y video, y realizar razonamientos complejos en cadena. Como el cerebro del sistema de inferencia, este modelo unifica todas las entradas en un espacio de representación común, logrando una comprensión profunda y razonamiento complejo entre modalidades. Basado en una arquitectura de expertos mixtos (MoE), cuenta con 30 mil millones de parámetros totales y 3 mil millones de parámetros activos, optimizando la eficiencia computacional sin sacrificar capacidad de razonamiento."
},
"Qwen/Qwen3-VL-235B-A22B-Instruct": {
"description": "Qwen3-VL-235B-A22B-Instruct es un modelo de ajuste fino basado en instrucciones de gran escala de la serie Qwen3-VL. Basado en una arquitectura de expertos mixtos (MoE), ofrece una capacidad sobresaliente de comprensión y generación multimodal, con soporte nativo para contextos de hasta 256K, ideal para servicios multimodales de nivel de producción con alta concurrencia."
},
"Qwen/Qwen3-VL-235B-A22B-Thinking": {
"description": "Qwen3-VL-235B-A22B-Thinking es la versión insignia de razonamiento de la serie Qwen3-VL, especialmente optimizada para el razonamiento multimodal complejo, el razonamiento con contextos largos y la interacción con agentes inteligentes. Es adecuada para escenarios empresariales que requieren razonamiento profundo y capacidades avanzadas de inferencia visual."
},
"Qwen/Qwen3-VL-30B-A3B-Instruct": {
"description": "Qwen3-VL-30B-A3B-Instruct es una versión de ajuste fino basada en instrucciones de la serie Qwen3-VL, con potentes capacidades de comprensión y generación visual-lingüística. Soporta de forma nativa contextos de hasta 256K, siendo ideal para diálogos multimodales y tareas de generación condicionada por imágenes."
},
"Qwen/Qwen3-VL-30B-A3B-Thinking": {
"description": "Qwen3-VL-30B-A3B-Thinking es la versión mejorada para razonamiento (Thinking) de Qwen3-VL, optimizada para tareas de razonamiento multimodal, conversión de imágenes a código y comprensión visual compleja. Soporta contextos de hasta 256K y posee una capacidad mejorada de razonamiento en cadena."
},
"Qwen/Qwen3-VL-32B-Instruct": {
"description": "Qwen3-VL-32B-Instruct es un modelo de lenguaje visual desarrollado por el equipo Qwen de Alibaba, que ha alcanzado un rendimiento SOTA líder en múltiples pruebas de referencia de lenguaje visual. Admite imágenes de alta resolución a nivel de megapíxeles y posee una potente capacidad de comprensión visual general, OCR multilingüe, localización visual de alta precisión y diálogo visual. Como parte de la serie Qwen3, este modelo puede manejar tareas multimodales complejas y admite funciones avanzadas como llamadas a herramientas y generación de texto con prefijos."
},
"Qwen/Qwen3-VL-32B-Thinking": {
"description": "Qwen3-VL-32B-Thinking es una versión optimizada del modelo de lenguaje visual de la serie Qwen3 del equipo Qwen de Alibaba, diseñada específicamente para tareas de razonamiento visual complejo. Incorpora un \"modo de pensamiento\" que le permite generar pasos intermedios detallados antes de responder, mejorando significativamente su rendimiento en tareas que requieren lógica multietapa, planificación y razonamiento complejo. Admite imágenes de alta resolución a nivel de megapíxeles, y cuenta con sólidas capacidades de comprensión visual general, OCR multilingüe, localización visual precisa y diálogo visual, además de funciones como llamadas a herramientas y generación con prefijos."
},
"Qwen/Qwen3-VL-8B-Instruct": {
"description": "Qwen3-VL-8B-Instruct es un modelo de lenguaje visual de la serie Qwen3, desarrollado a partir de Qwen3-8B-Instruct y entrenado con grandes volúmenes de datos de texto e imagen. Se especializa en comprensión visual general, diálogos centrados en lo visual y reconocimiento multilingüe de texto en imágenes. Es adecuado para tareas como preguntas y respuestas visuales, descripción de imágenes, seguimiento de instrucciones multimodales y activación de herramientas."
},
"Qwen/Qwen3-VL-8B-Thinking": {
"description": "Qwen3-VL-8B-Thinking es la versión de razonamiento visual de la serie Qwen3, optimizada para tareas complejas de razonamiento en múltiples pasos. Por defecto, genera una cadena de pensamiento antes de responder, con el fin de mejorar la precisión del razonamiento. Es ideal para escenarios que requieren razonamiento profundo, como preguntas y respuestas visuales complejas o análisis detallado del contenido de imágenes."
},
"Qwen2-72B-Instruct": {
"description": "Qwen2 es la última serie del modelo Qwen, que admite un contexto de 128k. En comparación con los modelos de código abierto más óptimos actuales, Qwen2-72B supera significativamente a los modelos líderes actuales en comprensión del lenguaje natural, conocimiento, código, matemáticas y capacidades multilingües."
},
"Qwen2-7B-Instruct": {
"description": "Qwen2 es la última serie del modelo Qwen, capaz de superar a los modelos de código abierto de tamaño equivalente e incluso a modelos de mayor tamaño. Qwen2 7B ha logrado ventajas significativas en múltiples evaluaciones, especialmente en comprensión de código y chino."
},
"Qwen2-VL-72B": {
"description": "Qwen2-VL-72B es un potente modelo de lenguaje visual que admite el procesamiento multimodal de imágenes y texto, capaz de identificar con precisión el contenido de las imágenes y generar descripciones o respuestas relacionadas."
},
"Qwen2.5-14B-Instruct": {
"description": "Qwen2.5-14B-Instruct es un modelo de lenguaje grande de 14 mil millones de parámetros, con un rendimiento excelente, optimizado para escenarios en chino y multilingües, que admite aplicaciones de preguntas y respuestas inteligentes, generación de contenido, entre otros."
},
"Qwen2.5-32B-Instruct": {
"description": "Qwen2.5-32B-Instruct es un modelo de lenguaje grande de 32 mil millones de parámetros, con un rendimiento equilibrado, optimizado para escenarios en chino y multilingües, que admite aplicaciones de preguntas y respuestas inteligentes, generación de contenido, entre otros."
},
"Qwen2.5-72B-Instruct": {
"description": "Qwen2.5-72B-Instruct admite un contexto de 16k, generando textos largos de más de 8K. Soporta llamadas a funciones e interacción sin problemas con sistemas externos, lo que mejora enormemente la flexibilidad y escalabilidad. El conocimiento del modelo ha aumentado significativamente, y se ha mejorado considerablemente la capacidad de codificación y matemáticas, con soporte para más de 29 idiomas."
},
"Qwen2.5-7B-Instruct": {
"description": "Qwen2.5-7B-Instruct es un modelo de lenguaje grande de 7 mil millones de parámetros, que admite llamadas a funciones e interacción sin problemas con sistemas externos, mejorando enormemente la flexibilidad y escalabilidad. Optimizado para escenarios en chino y multilingües, admite aplicaciones de preguntas y respuestas inteligentes, generación de contenido, entre otros."
},
"Qwen2.5-Coder-14B-Instruct": {
"description": "Qwen2.5-Coder-14B-Instruct es un modelo de instrucciones de programación basado en un preentrenamiento a gran escala, con una potente capacidad de comprensión y generación de código, capaz de manejar eficientemente diversas tareas de programación, especialmente adecuado para la escritura inteligente de código, generación de scripts automatizados y resolución de problemas de programación."
},
"Qwen2.5-Coder-32B-Instruct": {
"description": "Qwen2.5-Coder-32B-Instruct es un modelo de lenguaje grande diseñado específicamente para la generación de código, comprensión de código y escenarios de desarrollo eficiente, con una escala de 32B parámetros, líder en la industria, capaz de satisfacer diversas necesidades de programación."
},
"Qwen3-235B": {
"description": "Qwen3-235B-A22B es un modelo MoE (modelo de expertos mixtos) que introduce el “modo de razonamiento mixto”, permitiendo a los usuarios cambiar sin problemas entre el “modo reflexivo” y el “modo no reflexivo”. Soporta la comprensión y el razonamiento en 119 idiomas y dialectos, y cuenta con una potente capacidad de invocación de herramientas. En pruebas de referencia que evalúan capacidades generales, código y matemáticas, multilingüismo, conocimiento y razonamiento, compite con los principales modelos del mercado como DeepSeek R1, OpenAI o1, o3-mini, Grok 3 y Google Gemini 2.5 Pro."
},
"Qwen3-235B-A22B-Instruct-2507-FP8": {
"description": "Qwen3 235B A22B Instruct 2507: modelo optimizado para razonamiento avanzado e instrucciones de diálogo, con arquitectura de expertos mixtos para mantener la eficiencia en inferencia con gran cantidad de parámetros."
},
"Qwen3-32B": {
"description": "Qwen3-32B es un modelo denso (Dense Model) que introduce el “modo de razonamiento mixto”, permitiendo a los usuarios cambiar sin problemas entre el “modo reflexivo” y el “modo no reflexivo”. Gracias a mejoras en la arquitectura del modelo, aumento de datos de entrenamiento y métodos de entrenamiento más eficientes, su rendimiento general es comparable al de Qwen2.5-72B."
},
"SenseChat": {
"description": "Modelo de versión básica (V4), longitud de contexto de 4K, con potentes capacidades generales."
},
"SenseChat-128K": {
"description": "Modelo de versión básica (V4), longitud de contexto de 128K, se destaca en tareas de comprensión y generación de textos largos."
},
"SenseChat-32K": {
"description": "Modelo de versión básica (V4), longitud de contexto de 32K, aplicable de manera flexible en diversos escenarios."
},
"SenseChat-5": {
"description": "Modelo de última versión (V5.5), longitud de contexto de 128K, con capacidades significativamente mejoradas en razonamiento matemático, diálogos en inglés, seguimiento de instrucciones y comprensión de textos largos, comparable a GPT-4o."
},
"SenseChat-5-1202": {
"description": "Basado en la versión más reciente V5.5, con mejoras significativas en capacidades básicas en chino e inglés, chat, conocimientos científicos y humanísticos, redacción, lógica matemática y control de longitud de texto."
},
"SenseChat-5-Cantonese": {
"description": "Longitud de contexto de 32K, supera a GPT-4 en la comprensión de diálogos en cantonés, siendo comparable a GPT-4 Turbo en múltiples áreas como conocimiento, razonamiento, matemáticas y programación."
},
"SenseChat-5-beta": {
"description": "Rendimiento superior en algunos aspectos en comparación con SenseCat-5-1202"
},
"SenseChat-Character": {
"description": "Modelo estándar, longitud de contexto de 8K, alta velocidad de respuesta."
},
"SenseChat-Character-Pro": {
"description": "Modelo de versión avanzada, longitud de contexto de 32K, con capacidades completamente mejoradas, admite diálogos en chino/inglés."
},
"SenseChat-Turbo": {
"description": "Adecuado para preguntas rápidas y escenarios de ajuste fino del modelo."
},
"SenseChat-Turbo-1202": {
"description": "Es la última versión ligera del modelo, alcanzando más del 90% de la capacidad del modelo completo, reduciendo significativamente el costo de inferencia."
},
"SenseChat-Vision": {
"description": "La última versión del modelo (V5.5) admite la entrada de múltiples imágenes, logrando una optimización completa de las capacidades básicas del modelo, con mejoras significativas en el reconocimiento de atributos de objetos, relaciones espaciales, reconocimiento de eventos de acción, comprensión de escenas, reconocimiento de emociones, razonamiento lógico y comprensión y generación de texto."
},
"SenseNova-V6-5-Pro": {
"description": "Mediante una actualización integral de datos multimodales, lingüísticos y de razonamiento, junto con la optimización de estrategias de entrenamiento, el nuevo modelo ha logrado mejoras significativas en el razonamiento multimodal y la capacidad de seguimiento de instrucciones generalizadas. Soporta una ventana de contexto de hasta 128k y destaca en tareas especializadas como OCR y reconocimiento de IP en turismo y cultura."
},
"SenseNova-V6-5-Turbo": {
"description": "Mediante una actualización integral de datos multimodales, lingüísticos y de razonamiento, junto con la optimización de estrategias de entrenamiento, el nuevo modelo ha logrado mejoras significativas en el razonamiento multimodal y la capacidad de seguimiento de instrucciones generalizadas. Soporta una ventana de contexto de hasta 128k y destaca en tareas especializadas como OCR y reconocimiento de IP en turismo y cultura."
},
"SenseNova-V6-Pro": {
"description": "Logra una unificación nativa de capacidades de imagen, texto y video, superando las limitaciones tradicionales de la multimodalidad discreta, y ha ganado el doble campeonato en las evaluaciones de OpenCompass y SuperCLUE."
},
"SenseNova-V6-Reasoner": {
"description": "Equilibra el razonamiento profundo visual y lingüístico, logrando un pensamiento lento y un razonamiento profundo, presentando un proceso completo de cadena de pensamiento."
},
"SenseNova-V6-Turbo": {
"description": "Logra una unificación nativa de capacidades de imagen, texto y video, superando las limitaciones tradicionales de la multimodalidad discreta, liderando en dimensiones clave como capacidades multimodales y lingüísticas, combinando literatura y ciencia, y ocupando repetidamente el nivel de la primera división en múltiples evaluaciones tanto nacionales como internacionales."
},
"Skylark2-lite-8k": {
"description": "El modelo de segunda generación Skaylark (Skylark), el modelo Skylark2-lite, tiene una alta velocidad de respuesta, adecuado para escenarios donde se requiere alta inmediatez, sensibilidad de costos y baja necesidad de precisión del modelo, con una longitud de ventana de contexto de 8k."
},
"Skylark2-pro-32k": {
"description": "El modelo de segunda generación Skaylark (Skylark), la versión Skylark2-pro, cuenta con una alta precisión, adecuada para escenarios de generación de texto más complejos, como redacción de copy en campos especializados, creación de novelas y traducciones de alta calidad, con una longitud de ventana de contexto de 32k."
},
"Skylark2-pro-4k": {
"description": "El modelo de segunda generación Skaylark (Skylark), el modelo Skylark2-pro, tiene una alta precisión, adecuado para escenarios de generación de texto más complejos, como redacción de copy en campos especializados, creación de novelas y traducciones de alta calidad, con una longitud de ventana de contexto de 4k."
},
"Skylark2-pro-character-4k": {
"description": "El modelo de segunda generación Skaylark (Skylark), el modelo Skylark2-pro-character, presenta habilidades excepcionales para el juego de roles y la conversación, destacándose en interpretar diversos roles según las solicitudes del usuario, con un contenido conversacional natural y fluido, ideal para la construcción de chatbots, asistentes virtuales y servicios al cliente en línea, con una alta velocidad de respuesta."
},
"Skylark2-pro-turbo-8k": {
"description": "El modelo de segunda generación Skaylark (Skylark), Skylark2-pro-turbo-8k, ofrece una inferencia más rápida y costos más bajos, con una longitud de ventana de contexto de 8k."
},
"THUDM/GLM-4-32B-0414": {
"description": "GLM-4-32B-0414 es el nuevo modelo de código abierto de la serie GLM, con 32 mil millones de parámetros. Su rendimiento es comparable a las series GPT de OpenAI y V3/R1 de DeepSeek."
},
"THUDM/GLM-4-9B-0414": {
"description": "GLM-4-9B-0414 es un modelo pequeño de la serie GLM, con 9 mil millones de parámetros. Este modelo hereda las características técnicas de la serie GLM-4-32B, pero ofrece opciones de implementación más ligeras. A pesar de su menor tamaño, GLM-4-9B-0414 sigue mostrando habilidades sobresalientes en tareas de generación de código, diseño web, generación de gráficos SVG y redacción basada en búsqueda."
},
"THUDM/GLM-4.1V-9B-Thinking": {
"description": "GLM-4.1V-9B-Thinking es un modelo de lenguaje visual (VLM) de código abierto lanzado conjuntamente por Zhipu AI y el laboratorio KEG de la Universidad de Tsinghua, diseñado específicamente para manejar tareas cognitivas multimodales complejas. Este modelo se basa en el modelo base GLM-4-9B-0414 y mejora significativamente su capacidad y estabilidad de razonamiento multimodal mediante la introducción del mecanismo de razonamiento \"Cadena de Pensamiento\" (Chain-of-Thought) y la adopción de estrategias de aprendizaje reforzado."
},
"THUDM/GLM-Z1-32B-0414": {
"description": "GLM-Z1-32B-0414 es un modelo de inferencia con capacidad de pensamiento profundo. Este modelo se desarrolló a partir de GLM-4-32B-0414 mediante un arranque en frío y aprendizaje por refuerzo ampliado, y se entrenó adicionalmente en tareas de matemáticas, código y lógica. En comparación con el modelo base, GLM-Z1-32B-0414 mejora significativamente la capacidad matemática y la habilidad para resolver tareas complejas."
},
"THUDM/GLM-Z1-9B-0414": {
"description": "GLM-Z1-9B-0414 es un modelo pequeño de la serie GLM, con solo 9 mil millones de parámetros, pero que muestra una capacidad sorprendente manteniendo la tradición de código abierto. A pesar de su menor tamaño, este modelo sigue destacando en razonamiento matemático y tareas generales, con un rendimiento general que se encuentra entre los mejores en modelos de código abierto de tamaño similar."
},
"THUDM/GLM-Z1-Rumination-32B-0414": {
"description": "GLM-Z1-Rumination-32B-0414 es un modelo de inferencia profunda con capacidad de reflexión (en comparación con la investigación profunda de OpenAI). A diferencia de los modelos típicos de pensamiento profundo, el modelo de reflexión utiliza un tiempo de reflexión más prolongado para resolver problemas más abiertos y complejos."
},
"THUDM/glm-4-9b-chat": {
"description": "GLM-4 9B es una versión de código abierto, que proporciona una experiencia de conversación optimizada para aplicaciones de diálogo."
},
"Tongyi-Zhiwen/QwenLong-L1-32B": {
"description": "QwenLong-L1-32B es el primer modelo de razonamiento a gran escala con contexto largo entrenado mediante aprendizaje reforzado (LRM), optimizado para tareas de razonamiento con textos extensos. Utiliza un marco de aprendizaje reforzado con expansión progresiva de contexto, logrando una transición estable de contexto corto a largo. En siete pruebas de referencia de preguntas y respuestas con documentos de contexto largo, QwenLong-L1-32B supera a modelos insignia como OpenAI-o3-mini y Qwen3-235B-A22B, con un rendimiento comparable a Claude-3.7-Sonnet-Thinking. Destaca en razonamiento matemático, lógico y de múltiples saltos."
},
"Yi-34B-Chat": {
"description": "Yi-1.5-34B, manteniendo la excelente capacidad de lenguaje general de la serie original, ha mejorado significativamente la lógica matemática y la capacidad de codificación mediante un entrenamiento incremental de 500 mil millones de tokens de alta calidad."
},
"abab5.5-chat": {
"description": "Orientado a escenarios de productividad, admite el procesamiento de tareas complejas y la generación eficiente de texto, adecuado para aplicaciones en campos profesionales."
},
"abab5.5s-chat": {
"description": "Diseñado para escenarios de diálogo de personajes en chino, ofrece capacidades de generación de diálogos de alta calidad en chino, adecuado para diversas aplicaciones."
},
"abab6.5g-chat": {
"description": "Diseñado para diálogos de personajes multilingües, admite generación de diálogos de alta calidad en inglés y otros idiomas."
},
"abab6.5s-chat": {
"description": "Adecuado para una amplia gama de tareas de procesamiento de lenguaje natural, incluyendo generación de texto, sistemas de diálogo, etc."
},
"abab6.5t-chat": {
"description": "Optimizado para escenarios de diálogo de personajes en chino, ofrece capacidades de generación de diálogos fluidos y acordes con las expresiones chinas."
},
"accounts/fireworks/models/deepseek-r1": {
"description": "DeepSeek-R1 es un modelo de lenguaje grande de última generación, optimizado mediante aprendizaje por refuerzo y datos de arranque en frío, con un rendimiento excepcional en razonamiento, matemáticas y programación."
},
"accounts/fireworks/models/deepseek-v3": {
"description": "Modelo de lenguaje potente de Deepseek, basado en Mixture-of-Experts (MoE), con un total de 671B de parámetros, activando 37B de parámetros por cada token."
},
"accounts/fireworks/models/llama-v3-70b-instruct": {
"description": "El modelo de instrucciones Llama 3 70B está optimizado para diálogos multilingües y comprensión del lenguaje natural, superando el rendimiento de la mayoría de los modelos competidores."
},
"accounts/fireworks/models/llama-v3-8b-instruct": {
"description": "El modelo de instrucciones Llama 3 8B está optimizado para diálogos y tareas multilingües, ofreciendo un rendimiento excepcional y eficiente."
},
"accounts/fireworks/models/llama-v3-8b-instruct-hf": {
"description": "El modelo de instrucciones Llama 3 8B (versión HF) es consistente con los resultados de la implementación oficial, ofreciendo alta consistencia y compatibilidad multiplataforma."
},
"accounts/fireworks/models/llama-v3p1-405b-instruct": {
"description": "El modelo de instrucciones Llama 3.1 405B, con parámetros de gran escala, es adecuado para tareas complejas y seguimiento de instrucciones en escenarios de alta carga."
},
"accounts/fireworks/models/llama-v3p1-70b-instruct": {
"description": "El modelo de instrucciones Llama 3.1 70B ofrece una capacidad excepcional de comprensión y generación de lenguaje, siendo la elección ideal para tareas de diálogo y análisis."
},
"accounts/fireworks/models/llama-v3p1-8b-instruct": {
"description": "El modelo de instrucciones Llama 3.1 8B está optimizado para diálogos multilingües, capaz de superar la mayoría de los modelos de código abierto y cerrado en estándares de la industria."
},
"accounts/fireworks/models/llama-v3p2-11b-vision-instruct": {
"description": "Modelo de razonamiento de imágenes de 11B parámetros ajustado por Meta. Este modelo está optimizado para el reconocimiento visual, razonamiento de imágenes, descripción de imágenes y respuestas a preguntas generales sobre imágenes. Puede entender datos visuales, como gráficos y diagramas, y cerrar la brecha entre la visión y el lenguaje generando descripciones textuales de los detalles de las imágenes."
},
"accounts/fireworks/models/llama-v3p2-3b-instruct": {
"description": "El modelo de instrucciones Llama 3.2 3B es un modelo multilingüe ligero lanzado por Meta. Está diseñado para mejorar la eficiencia, ofreciendo mejoras significativas en latencia y costos en comparación con modelos más grandes. Ejemplos de uso de este modelo incluyen consultas, reescritura de indicaciones y asistencia en la escritura."
},
"accounts/fireworks/models/llama-v3p2-90b-vision-instruct": {
"description": "Modelo de razonamiento de imágenes de 90B parámetros ajustado por Meta. Este modelo está optimizado para el reconocimiento visual, razonamiento de imágenes, descripción de imágenes y respuestas a preguntas generales sobre imágenes. Puede entender datos visuales, como gráficos y diagramas, y cerrar la brecha entre la visión y el lenguaje generando descripciones textuales de los detalles de las imágenes."
},
"accounts/fireworks/models/llama-v3p3-70b-instruct": {
"description": "Llama 3.3 70B Instruct es la versión actualizada de diciembre de Llama 3.1 70B. Este modelo ha sido mejorado sobre la base de Llama 3.1 70B (lanzado en julio de 2024), mejorando la invocación de herramientas, el soporte de texto multilingüe, así como las capacidades matemáticas y de programación. El modelo alcanza niveles de liderazgo en la industria en razonamiento, matemáticas y cumplimiento de instrucciones, y puede ofrecer un rendimiento similar al de 3.1 405B, al tiempo que presenta ventajas significativas en velocidad y costo."
},
"accounts/fireworks/models/mistral-small-24b-instruct-2501": {
"description": "Modelo de 24B parámetros, con capacidades de vanguardia comparables a modelos más grandes."
},
"accounts/fireworks/models/mixtral-8x22b-instruct": {
"description": "El modelo de instrucciones Mixtral MoE 8x22B, con parámetros a gran escala y arquitectura de múltiples expertos, soporta de manera integral el procesamiento eficiente de tareas complejas."
},
"accounts/fireworks/models/mixtral-8x7b-instruct": {
"description": "El modelo de instrucciones Mixtral MoE 8x7B, con una arquitectura de múltiples expertos, ofrece un seguimiento y ejecución de instrucciones eficientes."
},
"accounts/fireworks/models/mythomax-l2-13b": {
"description": "El modelo MythoMax L2 13B combina técnicas de fusión innovadoras, destacándose en narración y juegos de rol."
},
"accounts/fireworks/models/phi-3-vision-128k-instruct": {
"description": "El modelo de instrucciones Phi 3 Vision es un modelo multimodal ligero, capaz de manejar información visual y textual compleja, con una fuerte capacidad de razonamiento."
},
"accounts/fireworks/models/qwen-qwq-32b-preview": {
"description": "El modelo QwQ es un modelo de investigación experimental desarrollado por el equipo de Qwen, enfocado en mejorar la capacidad de razonamiento de la IA."
},
"accounts/fireworks/models/qwen2-vl-72b-instruct": {
"description": "La versión de 72B del modelo Qwen-VL es el resultado de la última iteración de Alibaba, representando casi un año de innovación."
},
"accounts/fireworks/models/qwen2p5-72b-instruct": {
"description": "Qwen2.5 es una serie de modelos de lenguaje solo decodificadores desarrollados por el equipo Qwen de Alibaba Cloud. Estos modelos ofrecen diferentes tamaños, incluidos 0.5B, 1.5B, 3B, 7B, 14B, 32B y 72B, y tienen variantes base y de instrucciones."
},
"accounts/fireworks/models/qwen2p5-coder-32b-instruct": {
"description": "Qwen2.5 Coder 32B Instruct es la última versión de la serie de modelos de lenguaje a gran escala específicos para código lanzada por Alibaba Cloud. Este modelo, basado en Qwen2.5, ha mejorado significativamente la generación, razonamiento y reparación de código a través de un entrenamiento con 55 billones de tokens. No solo ha mejorado la capacidad de codificación, sino que también ha mantenido ventajas en habilidades matemáticas y generales. El modelo proporciona una base más completa para aplicaciones prácticas como agentes de código."
},
"accounts/yi-01-ai/models/yi-large": {
"description": "El modelo Yi-Large ofrece una capacidad de procesamiento multilingüe excepcional, adecuado para diversas tareas de generación y comprensión de lenguaje."
},
"ai21-jamba-1.5-large": {
"description": "Un modelo multilingüe de 398B parámetros (94B activos), que ofrece una ventana de contexto larga de 256K, llamada a funciones, salida estructurada y generación fundamentada."
},
"ai21-jamba-1.5-mini": {
"description": "Un modelo multilingüe de 52B parámetros (12B activos), que ofrece una ventana de contexto larga de 256K, llamada a funciones, salida estructurada y generación fundamentada."
},
"ai21-labs/AI21-Jamba-1.5-Large": {
"description": "Un modelo multilingüe de 398 mil millones de parámetros (94 mil millones activos), que ofrece una ventana de contexto larga de 256K, llamadas a funciones, salida estructurada y generación basada en hechos."
},
"ai21-labs/AI21-Jamba-1.5-Mini": {
"description": "Un modelo multilingüe de 52 mil millones de parámetros (12 mil millones activos), que ofrece una ventana de contexto larga de 256K, llamadas a funciones, salida estructurada y generación basada en hechos."
},
"alibaba/qwen-3-14b": {
"description": "Qwen3 es la última generación de modelos de lenguaje a gran escala de la serie Qwen, que ofrece un conjunto completo de modelos densos y de expertos mixtos (MoE). Basado en un entrenamiento extenso, Qwen3 proporciona avances revolucionarios en razonamiento, cumplimiento de instrucciones, capacidades de agente y soporte multilingüe."
},
"alibaba/qwen-3-235b": {
"description": "Qwen3 es la última generación de modelos de lenguaje a gran escala de la serie Qwen, que ofrece un conjunto completo de modelos densos y de expertos mixtos (MoE). Basado en un entrenamiento extenso, Qwen3 proporciona avances revolucionarios en razonamiento, cumplimiento de instrucciones, capacidades de agente y soporte multilingüe."
},
"alibaba/qwen-3-30b": {
"description": "Qwen3 es la última generación de modelos de lenguaje a gran escala de la serie Qwen, que ofrece un conjunto completo de modelos densos y de expertos mixtos (MoE). Basado en un entrenamiento extenso, Qwen3 proporciona avances revolucionarios en razonamiento, cumplimiento de instrucciones, capacidades de agente y soporte multilingüe."
},
"alibaba/qwen-3-32b": {
"description": "Qwen3 es la última generación de modelos de lenguaje a gran escala de la serie Qwen, que ofrece un conjunto completo de modelos densos y de expertos mixtos (MoE). Basado en un entrenamiento extenso, Qwen3 proporciona avances revolucionarios en razonamiento, cumplimiento de instrucciones, capacidades de agente y soporte multilingüe."
},
"alibaba/qwen3-coder": {
"description": "Qwen3-Coder-480B-A35B-Instruct es el modelo de código más orientado a agentes de Qwen, con un rendimiento destacado en codificación de agentes, uso de navegadores de agentes y otras tareas básicas de codificación, alcanzando resultados comparables a Claude Sonnet."
},
"amazon/nova-lite": {
"description": "Un modelo multimodal de muy bajo costo que procesa entradas de imágenes, videos y texto a una velocidad extremadamente rápida."
},
"amazon/nova-micro": {
"description": "Un modelo solo de texto que ofrece respuestas con la latencia más baja a un costo muy reducido."
},
"amazon/nova-pro": {
"description": "Un modelo multimodal altamente competente que ofrece la mejor combinación de precisión, velocidad y costo, adecuado para una amplia gama de tareas."
},
"amazon/titan-embed-text-v2": {
"description": "Amazon Titan Text Embeddings V2 es un modelo de incrustaciones multilingüe ligero y eficiente, compatible con dimensiones de 1024, 512 y 256."
},
"anthropic.claude-3-5-sonnet-20240620-v1:0": {
"description": "Claude 3.5 Sonnet eleva el estándar de la industria, superando a modelos competidores y a Claude 3 Opus, destacándose en evaluaciones amplias, mientras mantiene la velocidad y costo de nuestros modelos de nivel medio."
},
"anthropic.claude-3-5-sonnet-20241022-v2:0": {
"description": "Claude 3.5 Sonnet ha elevado los estándares de la industria, superando el rendimiento de modelos competidores y de Claude 3 Opus, destacándose en evaluaciones amplias, mientras mantiene la velocidad y el costo de nuestros modelos de nivel medio."
},
"anthropic.claude-3-haiku-20240307-v1:0": {
"description": "Claude 3 Haiku es el modelo más rápido y compacto de Anthropic, ofreciendo una velocidad de respuesta casi instantánea. Puede responder rápidamente a consultas y solicitudes simples. Los clientes podrán construir experiencias de IA sin costuras que imiten la interacción humana. Claude 3 Haiku puede manejar imágenes y devolver salidas de texto, con una ventana de contexto de 200K."
},
"anthropic.claude-3-opus-20240229-v1:0": {
"description": "Claude 3 Opus es el modelo de IA más potente de Anthropic, con un rendimiento de vanguardia en tareas altamente complejas. Puede manejar indicaciones abiertas y escenarios no vistos, con una fluidez y comprensión humana excepcionales. Claude 3 Opus muestra la vanguardia de las posibilidades de la IA generativa. Claude 3 Opus puede manejar imágenes y devolver salidas de texto, con una ventana de contexto de 200K."
},
"anthropic.claude-3-sonnet-20240229-v1:0": {
"description": "Claude 3 Sonnet de Anthropic logra un equilibrio ideal entre inteligencia y velocidad, especialmente adecuado para cargas de trabajo empresariales. Ofrece la máxima utilidad a un costo inferior al de los competidores, diseñado para ser un modelo confiable y duradero, apto para implementaciones de IA a gran escala. Claude 3 Sonnet puede manejar imágenes y devolver salidas de texto, con una ventana de contexto de 200K."
},
"anthropic.claude-instant-v1": {
"description": "Un modelo rápido, económico y aún muy capaz, que puede manejar una variedad de tareas, incluyendo conversaciones cotidianas, análisis de texto, resúmenes y preguntas y respuestas de documentos."
},
"anthropic.claude-v2": {
"description": "Anthropic muestra un modelo con alta capacidad en una amplia gama de tareas, desde diálogos complejos y generación de contenido creativo hasta el seguimiento detallado de instrucciones."
},
"anthropic.claude-v2:1": {
"description": "La versión actualizada de Claude 2, con el doble de ventana de contexto, así como mejoras en la fiabilidad, tasa de alucinaciones y precisión basada en evidencia en contextos de documentos largos y RAG."
},
"anthropic/claude-3-haiku": {
"description": "Claude 3 Haiku es el modelo más rápido de Anthropic hasta la fecha, diseñado para cargas de trabajo empresariales que suelen involucrar indicaciones largas. Haiku puede analizar rápidamente grandes volúmenes de documentos, como informes trimestrales, contratos o casos legales, a la mitad del costo de otros modelos de su clase."
},
"anthropic/claude-3-opus": {
"description": "Claude 3 Opus es el modelo más inteligente de Anthropic, con un rendimiento líder en el mercado en tareas altamente complejas. Navega indicaciones abiertas y escenarios inéditos con fluidez excepcional y comprensión humana."
},
"anthropic/claude-3.5-haiku": {
"description": "Claude 3.5 Haiku ofrece capacidades mejoradas en velocidad, precisión de codificación y uso de herramientas. Ideal para escenarios con altas exigencias de velocidad e interacción con herramientas."
},
"anthropic/claude-3.5-sonnet": {
"description": "Claude 3.5 Sonnet es un modelo rápido y eficiente de la familia Sonnet, con mejor rendimiento en codificación y razonamiento. Algunas versiones serán reemplazadas gradualmente por Sonnet 3.7 y otros."
},
"anthropic/claude-3.7-sonnet": {
"description": "Claude 3.7 Sonnet es una versión mejorada de la serie Sonnet, con capacidades superiores de razonamiento y codificación, ideal para tareas empresariales complejas."
},
"anthropic/claude-haiku-4.5": {
"description": "Claude Haiku 4.5 es un modelo rápido y de alto rendimiento de Anthropic, que mantiene una alta precisión con una latencia extremadamente baja."
},
"anthropic/claude-opus-4": {
"description": "Opus 4 es el modelo insignia de Anthropic, diseñado para tareas complejas y aplicaciones empresariales."
},
"anthropic/claude-opus-4.1": {
"description": "Opus 4.1 es un modelo avanzado de Anthropic, optimizado para programación, razonamiento complejo y tareas continuas."
},
"anthropic/claude-opus-4.5": {
"description": "Claude Opus 4.5 es el modelo insignia de Anthropic, que combina una inteligencia excepcional con un rendimiento escalable, ideal para tareas complejas que requieren respuestas de la más alta calidad y una gran capacidad de razonamiento."
},
"anthropic/claude-sonnet-4": {
"description": "Claude Sonnet 4 es una versión de razonamiento híbrido de Anthropic, que combina capacidades de pensamiento y no pensamiento."
},
"anthropic/claude-sonnet-4.5": {
"description": "Claude Sonnet 4.5 es el último modelo de razonamiento híbrido de Anthropic, optimizado para razonamiento complejo y codificación."
},
"ascend-tribe/pangu-pro-moe": {
"description": "Pangu-Pro-MoE 72B-A16B es un modelo de lenguaje grande disperso con 72 mil millones de parámetros y 16 mil millones de parámetros activados. Está basado en la arquitectura de expertos mixtos agrupados (MoGE), que agrupa expertos durante la selección y restringe la activación de un número igual de expertos por grupo para cada token, logrando un balance de carga entre expertos y mejorando significativamente la eficiencia de despliegue en la plataforma Ascend."
},
"aya": {
"description": "Aya 23 es un modelo multilingüe lanzado por Cohere, que admite 23 idiomas, facilitando aplicaciones de lenguaje diversas."
},
"aya:35b": {
"description": "Aya 23 es un modelo multilingüe lanzado por Cohere, que admite 23 idiomas, facilitando aplicaciones de lenguaje diversas."
},
"azure-DeepSeek-R1-0528": {
"description": "Desplegado y proporcionado por Microsoft; el modelo DeepSeek R1 ha recibido una actualización menor, la versión actual es DeepSeek-R1-0528. En la última actualización, DeepSeek R1 ha mejorado significativamente la profundidad de inferencia y la capacidad de deducción mediante el aumento de recursos computacionales y la introducción de mecanismos de optimización algorítmica en la fase posterior al entrenamiento. Este modelo destaca en múltiples pruebas de referencia en matemáticas, programación y lógica general, y su rendimiento general se acerca a modelos líderes como O3 y Gemini 2.5 Pro."
},
"baichuan-m2-32b": {
"description": "Baichuan M2 32B es un modelo de expertos mixto desarrollado por Baichuan Intelligence, con potentes capacidades de razonamiento."
},
"baichuan/baichuan2-13b-chat": {
"description": "Baichuan-13B es un modelo de lenguaje de gran escala de código abierto y comercializable desarrollado por Baichuan Intelligence, que cuenta con 13 mil millones de parámetros y ha logrado los mejores resultados en benchmarks autorizados en chino e inglés."
},
"baidu/ERNIE-4.5-300B-A47B": {
"description": "ERNIE-4.5-300B-A47B es un modelo de lenguaje grande desarrollado por Baidu basado en la arquitectura de expertos mixtos (MoE). Cuenta con un total de 300 mil millones de parámetros, pero durante la inferencia solo activa 47 mil millones por token, equilibrando un rendimiento potente con eficiencia computacional. Como uno de los modelos centrales de la serie ERNIE 4.5, destaca en tareas de comprensión, generación, razonamiento y programación de texto. Emplea un innovador método de preentrenamiento multimodal heterogéneo MoE, que combina entrenamiento conjunto de texto y visión, mejorando la capacidad integral del modelo, especialmente en el seguimiento de instrucciones y la memoria de conocimientos del mundo."
},
"baidu/ernie-5.0-thinking-preview": {
"description": "ERNIE 5.0 Thinking Preview es el nuevo modelo multimodal nativo de Baidu, especializado en comprensión multimodal, seguimiento de instrucciones, creación, preguntas y respuestas basadas en hechos y uso de herramientas."
},
"c4ai-aya-expanse-32b": {
"description": "Aya Expanse es un modelo multilingüe de alto rendimiento de 32B, diseñado para desafiar el rendimiento de los modelos monolingües a través de innovaciones en ajuste por instrucciones, arbitraje de datos, entrenamiento de preferencias y fusión de modelos. Soporta 23 idiomas."
},
"c4ai-aya-expanse-8b": {
"description": "Aya Expanse es un modelo multilingüe de alto rendimiento de 8B, diseñado para desafiar el rendimiento de los modelos monolingües a través de innovaciones en ajuste por instrucciones, arbitraje de datos, entrenamiento de preferencias y fusión de modelos. Soporta 23 idiomas."
},
"c4ai-aya-vision-32b": {
"description": "Aya Vision es un modelo multimodal de última generación, que destaca en múltiples benchmarks clave de capacidades lingüísticas, textuales y visuales. Soporta 23 idiomas. Esta versión de 32B se centra en el rendimiento multilingüe de vanguardia."
},
"c4ai-aya-vision-8b": {
"description": "Aya Vision es un modelo multimodal de última generación, que destaca en múltiples benchmarks clave de capacidades lingüísticas, textuales y visuales. Esta versión de 8B se centra en baja latencia y rendimiento óptimo."
},
"charglm-3": {
"description": "CharGLM-3 está diseñado para juegos de rol y acompañamiento emocional, soportando memoria de múltiples rondas y diálogos personalizados, con aplicaciones amplias."
},
"charglm-4": {
"description": "CharGLM-4 está diseñado para el juego de roles y la compañía emocional, soportando memoria de múltiples turnos de larga duración y diálogos personalizados, con aplicaciones amplias."
},
"chatgpt-4o-latest": {
"description": "ChatGPT-4o es un modelo dinámico que se actualiza en tiempo real para mantener la versión más actual. Combina una poderosa comprensión y generación de lenguaje, adecuado para aplicaciones a gran escala, incluyendo servicio al cliente, educación y soporte técnico."
},
"claude-2.0": {
"description": "Claude 2 ofrece avances en capacidades clave para empresas, incluyendo un contexto líder en la industria de 200K tokens, una reducción significativa en la tasa de alucinaciones del modelo, indicaciones del sistema y una nueva función de prueba: llamadas a herramientas."
},
"claude-2.1": {
"description": "Claude 2 ofrece avances en capacidades clave para empresas, incluyendo un contexto líder en la industria de 200K tokens, una reducción significativa en la tasa de alucinaciones del modelo, indicaciones del sistema y una nueva función de prueba: llamadas a herramientas."
},
"claude-3-5-haiku-20241022": {
"description": "Claude 3.5 Haiku es el modelo de próxima generación más rápido de Anthropic. En comparación con Claude 3 Haiku, Claude 3.5 Haiku ha mejorado en todas las habilidades y ha superado al modelo más grande de la generación anterior, Claude 3 Opus, en muchas pruebas de referencia de inteligencia."
},
"claude-3-5-haiku-latest": {
"description": "Claude 3.5 Haiku ofrece respuestas rápidas, ideal para tareas ligeras."
},
"claude-3-7-sonnet-20250219": {
"description": "Claude 3.7 Sonnet es el modelo de IA más potente de Anthropic, con un rendimiento de vanguardia en tareas altamente complejas. Puede manejar indicaciones abiertas y escenarios no vistos, con una fluidez y comprensión humana excepcionales. Claude 3.7 Sonnet muestra la vanguardia de las posibilidades de la IA generativa."
},
"claude-3-7-sonnet-latest": {
"description": "Claude 3.7 Sonnet es el modelo más potente y reciente de Anthropic para manejar tareas altamente complejas. Destaca en rendimiento, inteligencia, fluidez y comprensión."
},
"claude-3-haiku-20240307": {
"description": "Claude 3 Haiku es el modelo más rápido y compacto de Anthropic, diseñado para lograr respuestas casi instantáneas. Tiene un rendimiento de orientación rápido y preciso."
},
"claude-3-opus-20240229": {
"description": "Claude 3 Opus es el modelo más potente de Anthropic para manejar tareas altamente complejas. Destaca en rendimiento, inteligencia, fluidez y comprensión."
},
"claude-3-sonnet-20240229": {
"description": "Claude 3 Sonnet proporciona un equilibrio ideal entre inteligencia y velocidad para cargas de trabajo empresariales. Ofrece la máxima utilidad a un costo más bajo, siendo fiable y adecuado para implementaciones a gran escala."
},
"claude-haiku-4-5-20251001": {
"description": "Claude Haiku 4.5 es el modelo Haiku más rápido e inteligente de Anthropic, con una velocidad relámpago y una capacidad de razonamiento ampliada."
},
"claude-opus-4-1-20250805": {
"description": "Claude Opus 4.1 es el modelo más potente y reciente de Anthropic para manejar tareas altamente complejas. Sobresale en rendimiento, inteligencia, fluidez y comprensión."
},
"claude-opus-4-1-20250805-thinking": {
"description": "Modelo de pensamiento Claude Opus 4.1, una versión avanzada que puede mostrar su proceso de razonamiento."
},
"claude-opus-4-20250514": {
"description": "Claude Opus 4 es el modelo más potente de Anthropic para manejar tareas altamente complejas. Se destaca en rendimiento, inteligencia, fluidez y comprensión."
},
"claude-opus-4-5-20251101": {
"description": "Claude Opus 4.5 es el modelo insignia de Anthropic, que combina una inteligencia excepcional con un rendimiento escalable, ideal para tareas complejas que requieren respuestas de la más alta calidad y una gran capacidad de razonamiento."
},
"claude-sonnet-4-20250514": {
"description": "Claude Sonnet 4 puede generar respuestas casi instantáneas o un pensamiento prolongado paso a paso, permitiendo a los usuarios ver claramente estos procesos."
},
"claude-sonnet-4-20250514-thinking": {
"description": "Modelo de pensamiento Claude Sonnet 4 que puede generar respuestas casi instantáneas o un pensamiento prolongado paso a paso, permitiendo a los usuarios ver claramente estos procesos."
},
"claude-sonnet-4-5-20250929": {
"description": "Claude Sonnet 4.5 es el modelo más inteligente de Anthropic hasta la fecha."
},
"codegeex-4": {
"description": "CodeGeeX-4 es un potente asistente de programación AI, que admite preguntas y respuestas inteligentes y autocompletado de código en varios lenguajes de programación, mejorando la eficiencia del desarrollo."
},
"codegeex4-all-9b": {
"description": "CodeGeeX4-ALL-9B es un modelo de generación de código multilingüe, que admite funciones completas, incluyendo autocompletado y generación de código, intérprete de código, búsqueda en la web, llamadas a funciones y preguntas y respuestas de código a nivel de repositorio, cubriendo diversos escenarios de desarrollo de software. Es un modelo de generación de código de primer nivel con menos de 10B de parámetros."
},
"codegemma": {
"description": "CodeGemma es un modelo de lenguaje ligero especializado en diversas tareas de programación, que admite iteraciones rápidas e integración."
},
"codegemma:2b": {
"description": "CodeGemma es un modelo de lenguaje ligero especializado en diversas tareas de programación, que admite iteraciones rápidas e integración."
},
"codellama": {
"description": "Code Llama es un LLM enfocado en la generación y discusión de código, combinando un amplio soporte para lenguajes de programación, adecuado para entornos de desarrolladores."
},
"codellama/CodeLlama-34b-Instruct-hf": {
"description": "Code Llama es un LLM enfocado en la generación y discusión de código, que combina un amplio soporte para lenguajes de programación, adecuado para entornos de desarrolladores."
},
"codellama:13b": {
"description": "Code Llama es un LLM enfocado en la generación y discusión de código, combinando un amplio soporte para lenguajes de programación, adecuado para entornos de desarrolladores."
},
"codellama:34b": {
"description": "Code Llama es un LLM enfocado en la generación y discusión de código, combinando un amplio soporte para lenguajes de programación, adecuado para entornos de desarrolladores."
},
"codellama:70b": {
"description": "Code Llama es un LLM enfocado en la generación y discusión de código, combinando un amplio soporte para lenguajes de programación, adecuado para entornos de desarrolladores."
},
"codeqwen": {
"description": "CodeQwen1.5 es un modelo de lenguaje a gran escala entrenado con una gran cantidad de datos de código, diseñado para resolver tareas de programación complejas."
},
"codestral": {
"description": "Codestral es el primer modelo de código de Mistral AI, que proporciona un excelente soporte para tareas de generación de código."
},
"codestral-latest": {
"description": "Codestral es un modelo generativo de vanguardia enfocado en la generación de código, optimizado para tareas de completado de código y relleno intermedio."
},
"codex-mini-latest": {
"description": "codex-mini-latest es una versión ajustada de o4-mini, diseñada específicamente para Codex CLI. Para uso directo a través de la API, recomendamos comenzar con gpt-4.1."
},
"cogito-2.1:671b": {
"description": "Cogito v2.1 671B es un modelo de lenguaje grande de código abierto estadounidense con licencia comercial gratuita. Ofrece un rendimiento comparable a los mejores modelos, mayor eficiencia de inferencia por token, contexto largo de 128k y potentes capacidades generales."
},
"cogview-4": {
"description": "CogView-4 es el primer modelo de generación de imágenes a partir de texto de código abierto de Zhipu que admite la generación de caracteres chinos. Ofrece mejoras integrales en la comprensión semántica, la calidad de generación de imágenes y la capacidad de generar texto en chino e inglés. Soporta entradas bilingües en chino e inglés de cualquier longitud y puede generar imágenes en cualquier resolución dentro del rango especificado."
},
"cohere-command-r": {
"description": "Command R es un modelo generativo escalable dirigido a RAG y uso de herramientas para habilitar IA a escala de producción para empresas."
},
"cohere-command-r-plus": {
"description": "Command R+ es un modelo optimizado para RAG de última generación diseñado para abordar cargas de trabajo de nivel empresarial."
},
"cohere/Cohere-command-r": {
"description": "Command R es un modelo generativo escalable diseñado para su uso con RAG y herramientas, que permite a las empresas implementar IA de nivel productivo."
},
"cohere/Cohere-command-r-plus": {
"description": "Command R+ es un modelo optimizado de última generación para RAG, diseñado para manejar cargas de trabajo empresariales."
},
"cohere/command-a": {
"description": "Command A es el modelo más potente de Cohere hasta la fecha, sobresaliendo en uso de herramientas, agentes, generación mejorada por recuperación (RAG) y casos multilingües. Con una longitud de contexto de 256K, funciona con solo dos GPU y ofrece un rendimiento 150% superior en comparación con Command R+ 08-2024."
},
"cohere/command-r": {
"description": "Command R es un modelo de lenguaje grande optimizado para interacciones conversacionales y tareas de contexto largo. Se posiciona en la categoría \"escalable\", equilibrando alto rendimiento y precisión para permitir que las empresas avancen más allá de la prueba de concepto hacia la producción."
},
"cohere/command-r-plus": {
"description": "Command R+ es el modelo de lenguaje grande más reciente de Cohere, optimizado para interacciones conversacionales y tareas de contexto largo. Su objetivo es ofrecer un rendimiento excepcional para que las empresas puedan superar la prueba de concepto y pasar a producción."
},
"cohere/embed-v4.0": {
"description": "Un modelo que permite clasificar texto, imágenes o contenido mixto o convertirlos en incrustaciones."
},
"comfyui/flux-dev": {
"description": "FLUX.1 Dev - Modelo de generación de imágenes a partir de texto de alta calidad, genera en 10-50 pasos, ideal para creaciones artísticas y obras de alta calidad"
},
"comfyui/flux-kontext-dev": {
"description": "FLUX.1 Kontext-dev - Modelo de edición de imágenes, permite modificar imágenes existentes mediante instrucciones de texto, compatible con ediciones parciales y transferencia de estilo"
},
"comfyui/flux-krea-dev": {
"description": "FLUX.1 Krea-dev - Modelo de generación de imágenes con seguridad mejorada, desarrollado en colaboración con Krea, incluye filtros de seguridad integrados"
},
"comfyui/flux-schnell": {
"description": "FLUX.1 Schnell - Modelo ultrarrápido de generación de imágenes a partir de texto, genera imágenes de alta calidad en solo 1-4 pasos, ideal para aplicaciones en tiempo real y creación rápida de prototipos"
},
"comfyui/stable-diffusion-15": {
"description": "Modelo Stable Diffusion 1.5 de generación de imágenes a partir de texto, clásico con resolución de 512x512, ideal para prototipos rápidos y experimentación creativa"
},
"comfyui/stable-diffusion-35": {
"description": "Modelo de nueva generación Stable Diffusion 3.5 para generación de imágenes a partir de texto, disponible en versiones Large y Medium, requiere archivo externo del codificador CLIP, ofrece excelente calidad de imagen y precisión en la interpretación de los prompts"
},
"comfyui/stable-diffusion-35-inclclip": {
"description": "Versión de Stable Diffusion 3.5 con codificadores CLIP/T5 integrados, no requiere archivos externos, compatible con modelos como sd3.5_medium_incl_clips, con menor consumo de recursos"
},
"comfyui/stable-diffusion-custom": {
"description": "Modelo personalizado de generación de imágenes SD, el archivo del modelo debe llamarse custom_sd_lobe.safetensors; si se utiliza VAE, debe llamarse custom_sd_vae_lobe.safetensors. Los archivos del modelo deben colocarse en la carpeta correspondiente según los requisitos de Comfy"
},
"comfyui/stable-diffusion-custom-refiner": {
"description": "Modelo personalizado SDXL de conversión de imagen a imagen, el archivo del modelo debe llamarse custom_sd_lobe.safetensors; si se utiliza VAE, debe llamarse custom_sd_vae_lobe.safetensors. Los archivos del modelo deben colocarse en la carpeta correspondiente según los requisitos de Comfy"
},
"comfyui/stable-diffusion-refiner": {
"description": "Modelo SDXL de conversión de imagen a imagen, transforma imágenes de entrada en imágenes de alta calidad, compatible con transferencia de estilo, restauración de imágenes y transformaciones creativas"
},
"comfyui/stable-diffusion-xl": {
"description": "Modelo SDXL de generación de imágenes a partir de texto, compatible con generación de imágenes en alta resolución 1024x1024, ofrece mejor calidad de imagen y mayor nivel de detalle"
},
"command": {
"description": "Un modelo de conversación que sigue instrucciones, ofreciendo alta calidad y fiabilidad en tareas lingüísticas, además de tener una longitud de contexto más larga que nuestros modelos de generación básicos."
},
"command-a-03-2025": {
"description": "Command A es nuestro modelo más potente hasta la fecha, destacando en el uso de herramientas, agentes, generación aumentada por recuperación (RAG) y aplicaciones multilingües. Command A tiene una longitud de contexto de 256K, puede ejecutarse con solo dos GPU y ha mejorado su rendimiento en un 150% en comparación con Command R+ 08-2024."
},
"command-light": {
"description": "Una versión más pequeña y rápida de Command, casi igual de potente, pero más rápida."
},
"command-light-nightly": {
"description": "Para acortar el intervalo entre lanzamientos de versiones principales, hemos lanzado versiones nocturnas del modelo Command. Para la serie command-light, esta versión se llama command-light-nightly. Tenga en cuenta que command-light-nightly es la versión más reciente, experimental y (posiblemente) inestable. Las versiones nocturnas se actualizan regularmente sin previo aviso, por lo que no se recomienda su uso en entornos de producción."
},
"command-nightly": {
"description": "Para acortar el intervalo entre lanzamientos de versiones principales, hemos lanzado versiones nocturnas del modelo Command. Para la serie Command, esta versión se llama command-cightly. Tenga en cuenta que command-nightly es la versión más reciente, experimental y (posiblemente) inestable. Las versiones nocturnas se actualizan regularmente sin previo aviso, por lo que no se recomienda su uso en entornos de producción."
},
"command-r": {
"description": "Command R es un LLM optimizado para tareas de diálogo y contexto largo, especialmente adecuado para interacciones dinámicas y gestión del conocimiento."
},
"command-r-03-2024": {
"description": "Command R es un modelo de conversación que sigue instrucciones, ofreciendo una mayor calidad y fiabilidad en tareas lingüísticas, además de tener una longitud de contexto más larga que los modelos anteriores. Se puede utilizar en flujos de trabajo complejos, como generación de código, generación aumentada por recuperación (RAG), uso de herramientas y agentes."
},
"command-r-08-2024": {
"description": "command-r-08-2024 es una versión actualizada del modelo Command R, lanzada en agosto de 2024."
},
"command-r-plus": {
"description": "Command R+ es un modelo de lenguaje de gran tamaño de alto rendimiento, diseñado para escenarios empresariales reales y aplicaciones complejas."
},
"command-r-plus-04-2024": {
"description": "Command R+ es un modelo de conversación que sigue instrucciones, ofreciendo una mayor calidad y fiabilidad en tareas lingüísticas, además de tener una longitud de contexto más larga que los modelos anteriores. Es ideal para flujos de trabajo complejos de RAG y uso de herramientas en múltiples pasos."
},
"command-r-plus-08-2024": {
"description": "Command R+ es un modelo de conversación que sigue instrucciones, mostrando una mayor calidad y fiabilidad en tareas lingüísticas, con una longitud de contexto más larga en comparación con modelos anteriores. Es más adecuado para flujos de trabajo RAG complejos y el uso de herramientas en múltiples pasos."
},
"command-r7b-12-2024": {
"description": "command-r7b-12-2024 es una versión pequeña y eficiente, lanzada en diciembre de 2024. Destaca en tareas que requieren razonamiento complejo y procesamiento en múltiples pasos, como RAG, uso de herramientas y agentes."
},
"computer-use-preview": {
"description": "El modelo computer-use-preview está diseñado exclusivamente para \"herramientas de uso informático\", entrenado para comprender y ejecutar tareas relacionadas con computadoras."
},
"dall-e-2": {
"description": "El segundo modelo DALL·E, que admite generación de imágenes más realistas y precisas, con una resolución cuatro veces mayor que la de la primera generación."
},
"dall-e-3": {
"description": "El modelo DALL·E más reciente, lanzado en noviembre de 2023. Admite generación de imágenes más realistas y precisas, con una mayor capacidad de detalle."
},
"databricks/dbrx-instruct": {
"description": "DBRX Instruct ofrece capacidades de procesamiento de instrucciones de alta fiabilidad, soportando aplicaciones en múltiples industrias."
},
"deepseek-ai/DeepSeek-OCR": {
"description": "DeepSeek-OCR es un modelo de lenguaje visual desarrollado por DeepSeek AI, enfocado en el reconocimiento óptico de caracteres (OCR) y la \"compresión óptica contextual\". Este modelo explora los límites de la compresión de información contextual a partir de imágenes, permitiendo procesar documentos de manera eficiente y convertirlos en formatos de texto estructurado como Markdown. Es capaz de reconocer con precisión el contenido textual en imágenes, siendo especialmente útil para digitalización de documentos, extracción de texto y procesamiento estructurado."
},
"deepseek-ai/DeepSeek-R1": {
"description": "DeepSeek-R1 es un modelo de inferencia impulsado por aprendizaje reforzado (RL) que aborda los problemas de repetitividad y legibilidad en el modelo. Antes de RL, DeepSeek-R1 introdujo datos de arranque en frío, optimizando aún más el rendimiento de la inferencia. Su desempeño en tareas matemáticas, de código e inferencia es comparable al de OpenAI-o1, y ha mejorado su efectividad general a través de métodos de entrenamiento cuidadosamente diseñados."
},
"deepseek-ai/DeepSeek-R1-0528": {
"description": "DeepSeek R1 mejora significativamente la profundidad de razonamiento e inferencia mediante el uso de recursos computacionales aumentados y la introducción de mecanismos de optimización algorítmica en el postentrenamiento. Este modelo destaca en diversas evaluaciones de referencia, incluyendo matemáticas, programación y lógica general. Su rendimiento global se acerca a modelos líderes como O3 y Gemini 2.5 Pro."
},
"deepseek-ai/DeepSeek-R1-0528-Qwen3-8B": {
"description": "DeepSeek-R1-0528-Qwen3-8B es un modelo obtenido mediante destilación de cadenas de pensamiento del modelo DeepSeek-R1-0528 al Qwen3 8B Base. Este modelo alcanza el estado del arte (SOTA) entre modelos de código abierto, superando a Qwen3 8B en un 10% en la prueba AIME 2024 y alcanzando el nivel de rendimiento de Qwen3-235B-thinking. Sobresale en razonamiento matemático, programación y lógica general, compartiendo arquitectura con Qwen3-8B pero utilizando la configuración de tokenizador de DeepSeek-R1-0528."
},
"deepseek-ai/DeepSeek-R1-Distill-Llama-70B": {
"description": "El modelo de destilación DeepSeek-R1 optimiza el rendimiento de inferencia mediante aprendizaje por refuerzo y datos de arranque en frío, actualizando el estándar de múltiples tareas en modelos de código abierto."
},
"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B": {
"description": "El modelo de destilación DeepSeek-R1 optimiza el rendimiento de inferencia mediante aprendizaje por refuerzo y datos de arranque en frío, actualizando el estándar de múltiples tareas en modelos de código abierto."
},
"deepseek-ai/DeepSeek-R1-Distill-Qwen-14B": {
"description": "El modelo de destilación DeepSeek-R1 optimiza el rendimiento de inferencia mediante aprendizaje por refuerzo y datos de arranque en frío, actualizando el estándar de múltiples tareas en modelos de código abierto."
},
"deepseek-ai/DeepSeek-R1-Distill-Qwen-32B": {
"description": "DeepSeek-R1-Distill-Qwen-32B es un modelo obtenido mediante destilación de conocimiento basado en Qwen2.5-32B. Este modelo se ajustó utilizando 800,000 muestras seleccionadas generadas por DeepSeek-R1, mostrando un rendimiento excepcional en múltiples campos como matemáticas, programación e inferencia. Ha obtenido excelentes resultados en varias pruebas de referencia, alcanzando una precisión del 94.3% en MATH-500, demostrando una fuerte capacidad de razonamiento matemático."
},
"deepseek-ai/DeepSeek-R1-Distill-Qwen-7B": {
"description": "DeepSeek-R1-Distill-Qwen-7B es un modelo obtenido mediante destilación de conocimiento basado en Qwen2.5-Math-7B. Este modelo se ajustó utilizando 800,000 muestras seleccionadas generadas por DeepSeek-R1, mostrando un rendimiento excepcional en múltiples campos como matemáticas, programación e inferencia. Ha obtenido excelentes resultados en varias pruebas de referencia, alcanzando una precisión del 92.8% en MATH-500, una tasa de aprobación del 55.5% en AIME 2024, y una puntuación de 1189 en CodeForces, demostrando una fuerte capacidad matemática y de programación como modelo de 7B."
},
"deepseek-ai/DeepSeek-V2.5": {
"description": "DeepSeek V2.5 combina las excelentes características de versiones anteriores, mejorando la capacidad general y de codificación."
},
"deepseek-ai/DeepSeek-V3": {
"description": "DeepSeek-V3 es un modelo de lenguaje de expertos mixtos (MoE) con 6710 millones de parámetros, que utiliza atención latente de múltiples cabezas (MLA) y la arquitectura DeepSeekMoE, combinando una estrategia de balanceo de carga sin pérdidas auxiliares para optimizar la eficiencia de inferencia y entrenamiento. Al ser preentrenado en 14.8 billones de tokens de alta calidad y realizar ajustes supervisados y aprendizaje reforzado, DeepSeek-V3 supera en rendimiento a otros modelos de código abierto, acercándose a los modelos cerrados líderes."
},
"deepseek-ai/DeepSeek-V3.1": {
"description": "El modelo DeepSeek V3.1 adopta una arquitectura de inferencia híbrida, compatible tanto con el modo de razonamiento como con el modo no razonante."
},
"deepseek-ai/DeepSeek-V3.1-Terminus": {
"description": "DeepSeek-V3.1-Terminus es una versión actualizada del modelo V3.1 lanzado por DeepSeek, posicionada como un modelo de lenguaje grande con agentes híbridos. Esta actualización mantiene las capacidades originales del modelo, enfocándose en corregir problemas reportados por los usuarios y mejorar la estabilidad. Mejora significativamente la coherencia del lenguaje, reduciendo la mezcla de chino e inglés y la aparición de caracteres anómalos. El modelo integra el “Modo de pensamiento” y el “Modo sin pensamiento”, permitiendo a los usuarios cambiar flexiblemente mediante plantillas de chat para adaptarse a diferentes tareas. Como optimización importante, V3.1-Terminus mejora el rendimiento del agente de código y del agente de búsqueda, haciéndolos más confiables en la invocación de herramientas y en la ejecución de tareas complejas de múltiples pasos."
},
"deepseek-ai/DeepSeek-V3.2-Exp": {
"description": "DeepSeek-V3.2-Exp es una versión experimental lanzada por DeepSeek como un paso intermedio hacia una arquitectura de próxima generación. Basado en V3.1-Terminus, introduce el mecanismo de Atención Dispersa de DeepSeek (DeepSeek Sparse Attention, DSA) para mejorar la eficiencia en el entrenamiento e inferencia con contextos largos. Ha sido especialmente optimizado para la invocación de herramientas, la comprensión de documentos extensos y el razonamiento en múltiples pasos. V3.2-Exp actúa como un puente entre la investigación y la producción, ideal para usuarios que buscan explorar una mayor eficiencia de razonamiento en escenarios con presupuestos de contexto elevados."
},
"deepseek-ai/deepseek-llm-67b-chat": {
"description": "DeepSeek 67B es un modelo avanzado entrenado para diálogos de alta complejidad."
},
"deepseek-ai/deepseek-r1": {
"description": "LLM eficiente de última generación, experto en razonamiento, matemáticas y programación."
},
"deepseek-ai/deepseek-v3.1": {
"description": "DeepSeek V3.1: modelo de inferencia de próxima generación que mejora las capacidades de razonamiento complejo y pensamiento en cadena, ideal para tareas que requieren análisis profundo."
},
"deepseek-ai/deepseek-v3.1-terminus": {
"description": "DeepSeek V3.1: un modelo de inferencia de nueva generación que mejora la capacidad de razonamiento complejo y pensamiento en cadena, ideal para tareas que requieren un análisis profundo."
},
"deepseek-ai/deepseek-vl2": {
"description": "DeepSeek-VL2 es un modelo de lenguaje visual de expertos mixtos (MoE) desarrollado sobre DeepSeekMoE-27B, que utiliza una arquitectura MoE de activación dispersa, logrando un rendimiento excepcional al activar solo 4.5B de parámetros. Este modelo destaca en múltiples tareas como preguntas visuales, reconocimiento óptico de caracteres, comprensión de documentos/tablas/gráficos y localización visual."
},
"deepseek-chat": {
"description": "Un nuevo modelo de código abierto que fusiona capacidades generales y de codificación, que no solo conserva la capacidad de diálogo general del modelo Chat original y la potente capacidad de procesamiento de código del modelo Coder, sino que también se alinea mejor con las preferencias humanas. Además, DeepSeek-V2.5 ha logrado mejoras significativas en tareas de escritura, seguimiento de instrucciones y más."
},
"deepseek-coder-33B-instruct": {
"description": "DeepSeek Coder 33B es un modelo de lenguaje de código, entrenado con 20 billones de datos, de los cuales el 87% son código y el 13% son lenguajes en chino e inglés. El modelo introduce un tamaño de ventana de 16K y tareas de llenado de espacios, proporcionando funciones de autocompletado de código a nivel de proyecto y llenado de fragmentos."
},
"deepseek-coder-v2": {
"description": "DeepSeek Coder V2 es un modelo de código de expertos híbrido de código abierto, que destaca en tareas de codificación, comparable a GPT4-Turbo."
},
"deepseek-coder-v2:236b": {
"description": "DeepSeek Coder V2 es un modelo de código de expertos híbrido de código abierto, que destaca en tareas de codificación, comparable a GPT4-Turbo."
},
"deepseek-ocr": {
"description": "DeepSeek-OCR es un modelo de lenguaje visual desarrollado por DeepSeek AI, enfocado en el reconocimiento óptico de caracteres (OCR) y la 'compresión óptica contextual'. El modelo explora los límites de la compresión de información contextual a partir de imágenes, permitiendo procesar documentos de forma eficiente y convertirlos en formatos estructurados como Markdown. Es capaz de reconocer con precisión el contenido textual en imágenes, siendo especialmente útil para digitalización de documentos, extracción de texto y procesamiento estructurado."
},
"deepseek-r1": {
"description": "DeepSeek-R1 es un modelo de inferencia impulsado por aprendizaje reforzado (RL) que aborda los problemas de repetitividad y legibilidad en el modelo. Antes de RL, DeepSeek-R1 introdujo datos de arranque en frío, optimizando aún más el rendimiento de la inferencia. Su desempeño en tareas matemáticas, de código e inferencia es comparable al de OpenAI-o1, y ha mejorado su efectividad general a través de métodos de entrenamiento cuidadosamente diseñados."
},
"deepseek-r1-0528": {
"description": "Modelo completo de 685 mil millones de parámetros, lanzado el 28 de mayo de 2025. DeepSeek-R1 utiliza técnicas de aprendizaje reforzado a gran escala en la fase de postentrenamiento, mejorando significativamente la capacidad de razonamiento del modelo con muy pocos datos etiquetados. Presenta alto rendimiento y gran capacidad en tareas de matemáticas, código y razonamiento en lenguaje natural."
},
"deepseek-r1-250528": {
"description": "DeepSeek R1 250528, versión completa del modelo de inferencia DeepSeek-R1, ideal para tareas complejas de matemáticas y lógica."
},
"deepseek-r1-70b-fast-online": {
"description": "DeepSeek R1 70B versión rápida, que soporta búsqueda en línea en tiempo real, ofreciendo una velocidad de respuesta más rápida mientras mantiene el rendimiento del modelo."
},
"deepseek-r1-70b-online": {
"description": "DeepSeek R1 70B versión estándar, que soporta búsqueda en línea en tiempo real, adecuada para tareas de conversación y procesamiento de textos que requieren información actualizada."
},
"deepseek-r1-distill-llama": {
"description": "deepseek-r1-distill-llama es un modelo basado en Llama destilado a partir de DeepSeek-R1."
},
"deepseek-r1-distill-llama-70b": {
"description": "DeepSeek R1 Distill Llama 70B, modelo destilado que combina la capacidad de inferencia R1 con el ecosistema Llama."
},
"deepseek-r1-distill-llama-8b": {
"description": "DeepSeek-R1-Distill-Llama-8B es un modelo de lenguaje grande destilado basado en Llama-3.1-8B, utilizando las salidas de DeepSeek R1."
},
"deepseek-r1-distill-qianfan-70b": {
"description": "DeepSeek R1 Distill Qianfan 70B, modelo destilado R1 basado en Qianfan-70B, con excelente relación calidad-precio."
},
"deepseek-r1-distill-qianfan-8b": {
"description": "DeepSeek R1 Distill Qianfan 8B, modelo destilado R1 basado en Qianfan-8B, ideal para aplicaciones medianas y pequeñas."
},
"deepseek-r1-distill-qianfan-llama-70b": {
"description": "DeepSeek R1 Distill Qianfan Llama 70B, modelo destilado R1 basado en Llama-70B."
},
"deepseek-r1-distill-qwen": {
"description": "deepseek-r1-distill-qwen es un modelo basado en Qwen destilado a partir de DeepSeek-R1."
},
"deepseek-r1-distill-qwen-1.5b": {
"description": "DeepSeek R1 Distill Qwen 1.5B, modelo R1 ultraligero, adecuado para entornos con recursos extremadamente limitados."
},
"deepseek-r1-distill-qwen-14b": {
"description": "DeepSeek R1 Distill Qwen 14B, modelo R1 de tamaño medio, ideal para despliegue en múltiples escenarios."
},
"deepseek-r1-distill-qwen-32b": {
"description": "DeepSeek R1 Distill Qwen 32B, modelo destilado R1 basado en Qwen-32B, equilibrando rendimiento y coste."
},
"deepseek-r1-distill-qwen-7b": {
"description": "DeepSeek R1 Distill Qwen 7B, modelo R1 ligero, adecuado para entornos perimetrales y empresariales privados."
},
"deepseek-r1-fast-online": {
"description": "DeepSeek R1 versión rápida completa, que soporta búsqueda en línea en tiempo real, combinando la potente capacidad de 671B de parámetros con una velocidad de respuesta más rápida."
},
"deepseek-r1-online": {
"description": "DeepSeek R1 versión completa, con 671B de parámetros, que soporta búsqueda en línea en tiempo real, con una capacidad de comprensión y generación más potente."
},
"deepseek-reasoner": {
"description": "Modo de pensamiento de DeepSeek V3.2. Antes de proporcionar la respuesta final, el modelo genera una cadena de razonamiento para mejorar la precisión de la respuesta."
},
"deepseek-v2": {
"description": "DeepSeek V2 es un modelo de lenguaje Mixture-of-Experts eficiente, adecuado para necesidades de procesamiento económico."
},
"deepseek-v2:236b": {
"description": "DeepSeek V2 236B es el modelo de código de diseño de DeepSeek, que ofrece una potente capacidad de generación de código."
},
"deepseek-v3": {
"description": "DeepSeek-V3 es un modelo MoE desarrollado por Hangzhou DeepSeek Artificial Intelligence Technology Research Co., Ltd., que ha destacado en múltiples evaluaciones, ocupando el primer lugar en la lista de modelos de código abierto. En comparación con el modelo V2.5, la velocidad de generación se ha incrementado tres veces, brindando a los usuarios una experiencia de uso más rápida y fluida."
},
"deepseek-v3-0324": {
"description": "DeepSeek-V3-0324 es un modelo MoE de 671B parámetros, destacándose en habilidades de programación y técnicas, comprensión del contexto y procesamiento de textos largos."
},
"deepseek-v3.1": {
"description": "DeepSeek-V3.1 es un nuevo modelo híbrido de razonamiento lanzado por DeepSeek, que soporta dos modos de razonamiento: con pensamiento y sin pensamiento, con una eficiencia de pensamiento superior a DeepSeek-R1-0528. Tras una optimización post-entrenamiento, el uso de herramientas Agent y el rendimiento en tareas inteligentes han mejorado significativamente. Soporta una ventana de contexto de 128k y una longitud máxima de salida de 64k tokens."
},
"deepseek-v3.1-terminus": {
"description": "DeepSeek-V3.1-Terminus es una versión optimizada del modelo de lenguaje a gran escala lanzado por DeepSeek, especialmente diseñado para dispositivos terminales."
},
"deepseek-v3.1-think-250821": {
"description": "DeepSeek V3.1 Think 250821, modelo de pensamiento profundo correspondiente a la versión Terminus, ideal para escenarios de inferencia de alto rendimiento."
},
"deepseek-v3.1:671b": {
"description": "DeepSeek V3.1: modelo de inferencia de próxima generación que mejora las capacidades de razonamiento complejo y pensamiento en cadena, ideal para tareas que requieren análisis profundo."
},
"deepseek-v3.2-exp": {
"description": "deepseek-v3.2-exp introduce el mecanismo de atención dispersa, con el objetivo de mejorar la eficiencia en el entrenamiento y la inferencia al procesar textos largos, con un precio inferior al de deepseek-v3.1."
},
"deepseek-v3.2-think": {
"description": "DeepSeek V3.2 Think, versión completa del modelo de pensamiento profundo, con capacidades mejoradas de razonamiento de cadenas largas."
},
"deepseek-vl2": {
"description": "DeepSeek VL2, modelo multimodal que admite comprensión de imágenes y texto, así como preguntas visuales de alta precisión."
},
"deepseek-vl2-small": {
"description": "DeepSeek VL2 Small, versión multimodal ligera, adecuada para entornos con recursos limitados y escenarios de alta concurrencia."
},
"deepseek/deepseek-chat": {
"description": "DeepSeek-V3 es un modelo de razonamiento híbrido de alto rendimiento del equipo DeepSeek, adecuado para tareas complejas e integración con herramientas."
},
"deepseek/deepseek-chat-v3-0324": {
"description": "DeepSeek V3 es un modelo experto de mezcla de 685B parámetros, la última iteración de la serie de modelos de chat insignia del equipo de DeepSeek.\n\nHereda el modelo [DeepSeek V3](/deepseek/deepseek-chat-v3) y se desempeña excepcionalmente en diversas tareas."
},
"deepseek/deepseek-chat-v3-0324:free": {
"description": "DeepSeek V3 es un modelo experto de mezcla de 685B parámetros, la última iteración de la serie de modelos de chat insignia del equipo de DeepSeek.\n\nHereda el modelo [DeepSeek V3](/deepseek/deepseek-chat-v3) y se desempeña excepcionalmente en diversas tareas."
},
"deepseek/deepseek-chat-v3.1": {
"description": "DeepSeek-V3.1 es un modelo de razonamiento híbrido con contexto largo de DeepSeek, compatible con modos de pensamiento/no pensamiento e integración de herramientas."
},
"deepseek/deepseek-r1": {
"description": "El modelo DeepSeek R1 ha recibido una actualización menor, actualmente en la versión DeepSeek-R1-0528. En la última actualización, DeepSeek R1 mejora significativamente la profundidad y capacidad de razonamiento al aprovechar recursos computacionales aumentados y mecanismos de optimización algorítmica post-entrenamiento. El modelo destaca en evaluaciones de referencia en matemáticas, programación y lógica general, acercándose al rendimiento de modelos líderes como O3 y Gemini 2.5 Pro."
},
"deepseek/deepseek-r1-0528": {
"description": "DeepSeek R1 0528 es una variante actualizada de DeepSeek, centrada en la disponibilidad de código abierto y profundidad de razonamiento."
},
"deepseek/deepseek-r1-0528:free": {
"description": "DeepSeek-R1 mejora enormemente la capacidad de razonamiento del modelo con muy pocos datos etiquetados. Antes de generar la respuesta final, el modelo produce una cadena de pensamiento para aumentar la precisión de la respuesta."
},
"deepseek/deepseek-r1-distill-llama-70b": {
"description": "DeepSeek R1 Distill Llama 70B es un modelo de lenguaje de gran escala basado en Llama3.3 70B. Este modelo ha sido ajustado finamente utilizando las salidas de DeepSeek R1, logrando un rendimiento competitivo comparable al de los modelos más avanzados del mercado."
},
"deepseek/deepseek-r1-distill-llama-8b": {
"description": "DeepSeek R1 Distill Llama 8B es un modelo de lenguaje grande destilado basado en Llama-3.1-8B-Instruct, entrenado utilizando la salida de DeepSeek R1."
},
"deepseek/deepseek-r1-distill-qwen-14b": {
"description": "DeepSeek R1 Distill Qwen 14B es un modelo de lenguaje grande destilado basado en Qwen 2.5 14B, entrenado utilizando la salida de DeepSeek R1. Este modelo ha superado a o1-mini de OpenAI en múltiples pruebas de referencia, logrando resultados de vanguardia en modelos densos. A continuación se presentan algunos resultados de las pruebas de referencia:\nAIME 2024 pass@1: 69.7\nMATH-500 pass@1: 93.9\nCalificación de CodeForces: 1481\nEste modelo, ajustado a partir de la salida de DeepSeek R1, muestra un rendimiento competitivo comparable al de modelos de vanguardia de mayor escala."
},
"deepseek/deepseek-r1-distill-qwen-32b": {
"description": "DeepSeek R1 Distill Qwen 32B es un modelo de lenguaje grande destilado basado en Qwen 2.5 32B, entrenado utilizando la salida de DeepSeek R1. Este modelo ha superado a o1-mini de OpenAI en múltiples pruebas de referencia, logrando resultados de vanguardia en modelos densos. A continuación se presentan algunos resultados de las pruebas de referencia:\nAIME 2024 pass@1: 72.6\nMATH-500 pass@1: 94.3\nCalificación de CodeForces: 1691\nEste modelo, ajustado a partir de la salida de DeepSeek R1, muestra un rendimiento competitivo comparable al de modelos de vanguardia de mayor escala."
},
"deepseek/deepseek-r1/community": {
"description": "DeepSeek R1 es el último modelo de código abierto lanzado por el equipo de DeepSeek, que cuenta con un rendimiento de inferencia excepcional, especialmente en tareas de matemáticas, programación y razonamiento, alcanzando niveles comparables al modelo o1 de OpenAI."
},
"deepseek/deepseek-r1:free": {
"description": "DeepSeek-R1 mejora significativamente la capacidad de razonamiento del modelo con muy pocos datos etiquetados. Antes de proporcionar la respuesta final, el modelo genera una cadena de pensamiento para mejorar la precisión de la respuesta final."
},
"deepseek/deepseek-reasoner": {
"description": "DeepSeek-V3 Thinking (reasoner) es un modelo experimental de razonamiento de DeepSeek, diseñado para tareas de razonamiento de alta complejidad."
},
"deepseek/deepseek-v3": {
"description": "Modelo de lenguaje grande universal rápido con capacidades de razonamiento mejoradas."
},
"deepseek/deepseek-v3.1-base": {
"description": "DeepSeek V3.1 Base es una versión mejorada del modelo DeepSeek V3."
},
"deepseek/deepseek-v3/community": {
"description": "DeepSeek-V3 ha logrado un avance significativo en la velocidad de inferencia en comparación con modelos anteriores. Se clasifica como el número uno entre los modelos de código abierto y puede competir con los modelos cerrados más avanzados del mundo. DeepSeek-V3 utiliza la arquitectura de atención multi-cabeza (MLA) y DeepSeekMoE, que han sido completamente validadas en DeepSeek-V2. Además, DeepSeek-V3 ha introducido una estrategia auxiliar sin pérdidas para el balanceo de carga y ha establecido objetivos de entrenamiento de predicción de múltiples etiquetas para lograr un rendimiento más robusto."
},
"deepseek_r1": {
"description": "DeepSeek-R1 es un modelo de inferencia impulsado por aprendizaje por refuerzo (RL), que resuelve problemas de repetitividad y legibilidad en el modelo. Antes de RL, DeepSeek-R1 introdujo datos de arranque en frío, optimizando aún más el rendimiento de inferencia. Su rendimiento en tareas de matemáticas, código y razonamiento es comparable al de OpenAI-o1, y mediante un método de entrenamiento cuidadosamente diseñado, se ha mejorado el efecto general."
},
"deepseek_r1_distill_llama_70b": {
"description": "DeepSeek-R1-Distill-Llama-70B es un modelo obtenido a partir de Llama-3.3-70B-Instruct mediante entrenamiento de destilación. Este modelo es parte de la serie DeepSeek-R1, mostrando un rendimiento sobresaliente en matemáticas, programación y razonamiento mediante el ajuste con muestras generadas por DeepSeek-R1."
},
"deepseek_r1_distill_qwen_14b": {
"description": "DeepSeek-R1-Distill-Qwen-14B es un modelo obtenido a partir de Qwen2.5-14B mediante destilación de conocimiento. Este modelo se ajustó utilizando 800,000 muestras seleccionadas generadas por DeepSeek-R1, mostrando una excelente capacidad de inferencia."
},
"deepseek_r1_distill_qwen_32b": {
"description": "DeepSeek-R1-Distill-Qwen-32B es un modelo obtenido a partir de Qwen2.5-32B mediante destilación de conocimiento. Este modelo se ajustó utilizando 800,000 muestras seleccionadas generadas por DeepSeek-R1, mostrando un rendimiento excepcional en múltiples campos como matemáticas, programación y razonamiento."
},
"doubao-1.5-lite-32k": {
"description": "Doubao-1.5-lite es un modelo ligero de nueva generación, con una velocidad de respuesta extrema, alcanzando niveles de rendimiento y latencia de clase mundial."
},
"doubao-1.5-pro-256k": {
"description": "Doubao-1.5-pro-256k es una versión mejorada de Doubao-1.5-Pro, con un aumento del 10% en el rendimiento general. Soporta razonamiento con una ventana de contexto de 256k y una longitud de salida de hasta 12k tokens. Mayor rendimiento, ventana más grande y una excelente relación calidad-precio, adecuado para una amplia gama de escenarios de aplicación."
},
"doubao-1.5-pro-32k": {
"description": "Doubao-1.5-pro es un modelo de nueva generación, con un rendimiento completamente mejorado, destacando en conocimientos, código, razonamiento, entre otros."
},
"doubao-1.5-thinking-pro": {
"description": "El modelo de pensamiento profundo Doubao-1.5, completamente nuevo, destaca en campos especializados como matemáticas, programación y razonamiento científico, así como en tareas generales como la escritura creativa, alcanzando o acercándose al nivel de élite de la industria en múltiples estándares de referencia, como AIME 2024, Codeforces y GPQA. Soporta una ventana de contexto de 128k y una salida de 16k."
},
"doubao-1.5-thinking-pro-m": {
"description": "Doubao-1.5 es un nuevo modelo de pensamiento profundo (la versión m incluye capacidades nativas de inferencia multimodal profunda), que destaca en matemáticas, programación, razonamiento científico y tareas generales como escritura creativa. Alcanza o se acerca al nivel de élite en benchmarks reconocidos como AIME 2024, Codeforces y GPQA. Soporta ventana de contexto de 128k y salida de 16k."
},
"doubao-1.5-thinking-vision-pro": {
"description": "Nuevo modelo de pensamiento profundo visual con capacidades avanzadas de comprensión e inferencia multimodal general, logrando resultados SOTA en 37 de 59 benchmarks públicos."
},
"doubao-1.5-ui-tars": {
"description": "Doubao-1.5-UI-TARS es un modelo agente nativo orientado a la interacción con interfaces gráficas (GUI). Mediante capacidades humanas de percepción, razonamiento y acción, interactúa de forma fluida con la GUI."
},
"doubao-1.5-vision-lite": {
"description": "Doubao-1.5-vision-lite es un modelo multimodal de gran escala actualizado, que soporta el reconocimiento de imágenes de cualquier resolución y proporciones extremas, mejorando la capacidad de razonamiento visual, reconocimiento de documentos, comprensión de información detallada y seguimiento de instrucciones. Soporta una ventana de contexto de 128k, con una longitud de salida que admite hasta 16k tokens."
},
"doubao-1.5-vision-pro": {
"description": "Doubao-1.5-vision-pro es un modelo multimodal avanzado que soporta reconocimiento de imágenes con cualquier resolución y proporciones extremas, mejorando el razonamiento visual, reconocimiento de documentos, comprensión de detalles y seguimiento de instrucciones."
},
"doubao-1.5-vision-pro-32k": {
"description": "Doubao-1.5-vision-pro es un modelo multimodal avanzado que soporta reconocimiento de imágenes con cualquier resolución y proporciones extremas, mejorando el razonamiento visual, reconocimiento de documentos, comprensión de detalles y seguimiento de instrucciones."
},
"doubao-lite-128k": {
"description": "Ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 128k."
},
"doubao-lite-32k": {
"description": "Ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 32k."
},
"doubao-lite-4k": {
"description": "Ofrece una velocidad de respuesta excepcional y una mejor relación calidad-precio, proporcionando opciones más flexibles para diferentes escenarios de los clientes. Soporta inferencia y ajuste fino con una ventana de contexto de 4k."
},
"doubao-pro-256k": {
"description": "El modelo principal con mejor rendimiento, adecuado para tareas complejas, con excelentes resultados en preguntas de referencia, resúmenes, creación, clasificación de texto, juegos de rol y otros escenarios. Soporta inferencia y ajuste fino con una ventana de contexto de 256k."
},
"doubao-pro-32k": {
"description": "El modelo principal con mejor rendimiento, adecuado para tareas complejas, con excelentes resultados en preguntas de referencia, resúmenes, creación, clasificación de texto, juegos de rol y otros escenarios. Soporta inferencia y ajuste fino con una ventana de contexto de 32k."
},
"doubao-seed-1.6": {
"description": "Doubao-Seed-1.6 es un nuevo modelo multimodal de pensamiento profundo que soporta tres modos de pensamiento: automático, reflexivo y no reflexivo. En modo no reflexivo, el rendimiento del modelo mejora significativamente en comparación con Doubao-1.5-pro/250115. Soporta una ventana de contexto de 256k y una longitud máxima de salida de 16k tokens."
},
"doubao-seed-1.6-flash": {
"description": "Doubao-Seed-1.6-flash es un modelo multimodal de pensamiento profundo con velocidad de inferencia extrema, TPOT de solo 10 ms; soporta comprensión tanto textual como visual, con capacidad de comprensión textual superior a la generación lite anterior y comprensión visual comparable a los modelos pro de la competencia. Soporta una ventana de contexto de 256k y una longitud máxima de salida de 16k tokens."
},
"doubao-seed-1.6-lite": {
"description": "Doubao-Seed-1.6-lite es un nuevo modelo multimodal de pensamiento profundo que permite ajustar el nivel de razonamiento (reasoning effort) en cuatro modos: Mínimo, Bajo, Medio y Alto. Ofrece una excelente relación calidad-precio y es la mejor opción para tareas comunes, con una ventana de contexto de hasta 256k."
},
"doubao-seed-1.6-thinking": {
"description": "El modelo Doubao-Seed-1.6-thinking tiene una capacidad de pensamiento significativamente mejorada. En comparación con Doubao-1.5-thinking-pro, mejora aún más en habilidades básicas como programación, matemáticas y razonamiento lógico, y soporta comprensión visual. Soporta una ventana de contexto de 256k y una longitud máxima de salida de 16k tokens."
},
"doubao-seed-1.6-vision": {
"description": "Doubao-Seed-1.6-vision es un modelo de pensamiento profundo visual que demuestra una capacidad multimodal general más fuerte en escenarios como educación, revisión de imágenes, inspección y seguridad, y búsqueda y respuesta con IA. Soporta una ventana de contexto de 256k y una longitud máxima de salida de 64k tokens."
},
"doubao-seed-code": {
"description": "Doubao-Seed-Code está profundamente optimizado para tareas de programación agentic, con soporte multimodal (texto/imágenes/video) y contextos largos de hasta 256K. Compatible con la API de Anthropic, es ideal para programación, comprensión visual y escenarios con agentes."
},
"doubao-seededit-3-0-i2i-250628": {
"description": "El modelo de generación de imágenes Doubao fue desarrollado por el equipo Seed de ByteDance, soporta entrada de texto e imagen, ofreciendo una experiencia de generación de imágenes altamente controlable y de alta calidad. Permite editar imágenes mediante instrucciones de texto, generando imágenes con lados entre 512 y 1536 píxeles."
},
"doubao-seedream-3-0-t2i-250415": {
"description": "El modelo de generación de imágenes Seedream 3.0, desarrollado por el equipo Seed de ByteDance, soporta entrada de texto e imagen, ofreciendo una experiencia de generación de imágenes altamente controlable y de alta calidad. Genera imágenes basadas en indicaciones de texto."
},
"doubao-seedream-4-0-250828": {
"description": "El modelo de generación de imágenes Seedream 4.0, desarrollado por el equipo Seed de ByteDance, soporta entrada de texto e imagen, ofreciendo una experiencia de generación de imágenes altamente controlable y de alta calidad. Genera imágenes basadas en indicaciones de texto."
},
"doubao-vision-lite-32k": {
"description": "El modelo Doubao-vision es un modelo multimodal desarrollado por Doubao, con potentes capacidades de comprensión e inferencia de imágenes, así como una precisa comprensión de instrucciones. El modelo muestra un rendimiento destacado en extracción de información texto-imagen y tareas de inferencia basadas en imágenes, aplicable a tareas de preguntas visuales más complejas y amplias."
},
"doubao-vision-pro-32k": {
"description": "El modelo Doubao-vision es un modelo multimodal desarrollado por Doubao, con potentes capacidades de comprensión e inferencia de imágenes, así como una precisa comprensión de instrucciones. El modelo muestra un rendimiento destacado en extracción de información texto-imagen y tareas de inferencia basadas en imágenes, aplicable a tareas de preguntas visuales más complejas y amplias."
},
"emohaa": {
"description": "Emohaa es un modelo psicológico con capacidades de consulta profesional, ayudando a los usuarios a comprender problemas emocionales."
},
"ernie-4.5-0.3b": {
"description": "ERNIE 4.5 0.3B, modelo ligero de código abierto, ideal para despliegues locales y personalizados."
},
"ernie-4.5-21b-a3b": {
"description": "ERNIE 4.5 21B A3B, modelo de gran tamaño de código abierto, con mejor rendimiento en tareas de comprensión y generación."
},
"ernie-4.5-300b-a47b": {
"description": "ERNIE 4.5 300B A47B es un modelo de expertos mixto a gran escala desarrollado por Wenxin de Baidu, con capacidades de razonamiento excepcionales."
},
"ernie-4.5-8k-preview": {
"description": "ERNIE 4.5 8K Preview, modelo de vista previa con contexto de 8K, diseñado para probar y experimentar las capacidades de ERNIE 4.5."
},
"ernie-4.5-turbo-128k": {
"description": "ERNIE 4.5 Turbo 128K, modelo general de alto rendimiento, compatible con búsqueda mejorada y uso de herramientas, ideal para preguntas y respuestas, código, agentes inteligentes y más."
},
"ernie-4.5-turbo-128k-preview": {
"description": "ERNIE 4.5 Turbo 128K Preview, versión de vista previa con capacidades equivalentes a la versión oficial, ideal para pruebas y ajustes."
},
"ernie-4.5-turbo-32k": {
"description": "ERNIE 4.5 Turbo 32K, versión de contexto medio-largo, adecuada para preguntas y respuestas, recuperación de bases de conocimiento y diálogos multivuelta."
},
"ernie-4.5-turbo-latest": {
"description": "ERNIE 4.5 Turbo Última versión, optimizada en rendimiento general, ideal como modelo principal en entornos de producción."
},
"ernie-4.5-turbo-vl": {
"description": "ERNIE 4.5 Turbo VL, modelo multimodal maduro, ideal para tareas de comprensión e identificación de imágenes y texto en producción."
},
"ernie-4.5-turbo-vl-32k": {
"description": "ERNIE 4.5 Turbo VL 32K, versión multimodal de texto largo, adecuada para comprensión conjunta de documentos extensos e imágenes."
},
"ernie-4.5-turbo-vl-32k-preview": {
"description": "ERNIE 4.5 Turbo VL 32K Preview, versión de vista previa multimodal 32K, útil para evaluar capacidades visuales de contexto largo."
},
"ernie-4.5-turbo-vl-latest": {
"description": "ERNIE 4.5 Turbo VL Última versión, versión más reciente multimodal, con mejor rendimiento en comprensión e inferencia de imágenes y texto."
},
"ernie-4.5-turbo-vl-preview": {
"description": "ERNIE 4.5 Turbo VL Preview, modelo multimodal de vista previa, compatible con comprensión y generación de imágenes y texto, ideal para preguntas visuales y experiencias de comprensión de contenido."
},
"ernie-4.5-vl-28b-a3b": {
"description": "ERNIE 4.5 VL 28B A3B, modelo multimodal de código abierto, compatible con tareas de comprensión e inferencia de imágenes y texto."
},
"ernie-5.0-thinking-latest": {
"description": "Ernie 5.0 Thinking es un modelo insignia multimodal nativo que integra texto, imagen, audio y video en una única arquitectura. Con capacidades ampliamente mejoradas, es adecuado para preguntas complejas, creación de contenido y escenarios con agentes inteligentes."
},
"ernie-5.0-thinking-preview": {
"description": "ERNIE 5.0 Thinking Preview, modelo insignia nativo totalmente multimodal, compatible con modelado unificado de texto, imagen, audio y video, con capacidades integrales mejoradas, ideal para preguntas complejas, creación y agentes inteligentes."
},
"ernie-char-8k": {
"description": "ERNIE Character 8K, modelo de diálogo con personalidad, ideal para construcción de personajes IP y conversaciones de acompañamiento a largo plazo."
},
"ernie-char-fiction-8k": {
"description": "ERNIE Character Fiction 8K, modelo de personalidad orientado a la creación de novelas y tramas, ideal para generación de historias largas."
},
"ernie-char-fiction-8k-preview": {
"description": "ERNIE Character Fiction 8K Preview, versión de vista previa del modelo de creación de personajes y tramas, para pruebas y experiencia funcional."
},
"ernie-irag-edit": {
"description": "ERNIE iRAG Edit, modelo de edición de imágenes que admite borrado, repintado y generación de variantes."
},
"ernie-lite-8k": {
"description": "ERNIE Lite 8K, modelo general ligero, ideal para preguntas y respuestas diarias y generación de contenido con sensibilidad al coste."
},
"ernie-lite-pro-128k": {
"description": "ERNIE Lite Pro 128K, modelo ligero de alto rendimiento, ideal para escenarios sensibles a la latencia y al coste."
},
"ernie-novel-8k": {
"description": "ERNIE Novel 8K, modelo para creación de novelas largas y tramas IP, experto en narrativas multirrol y multilínea."
},
"ernie-speed-128k": {
"description": "ERNIE Speed 128K, modelo grande sin coste de entrada/salida, ideal para comprensión de textos largos y pruebas a gran escala."
},
"ernie-speed-8k": {
"description": "ERNIE Speed 8K, modelo gratuito y rápido, ideal para conversaciones diarias y tareas ligeras de texto."
},
"ernie-speed-pro-128k": {
"description": "ERNIE Speed Pro 128K, modelo de alta concurrencia y excelente relación calidad-precio, ideal para servicios en línea a gran escala y aplicaciones empresariales."
},
"ernie-tiny-8k": {
"description": "ERNIE Tiny 8K, modelo ultraligero, ideal para preguntas simples, clasificación y escenarios de inferencia de bajo coste."
},
"ernie-x1-turbo-32k": {
"description": "ERNIE X1 Turbo 32K, modelo de pensamiento rápido con contexto largo de 32K, ideal para razonamiento complejo y diálogos multivuelta."
},
"ernie-x1.1-preview": {
"description": "ERNIE X1.1 Preview, versión de vista previa del modelo de pensamiento ERNIE X1.1, ideal para validación y pruebas de capacidades."
},
"fal-ai/bytedance/seedream/v4": {
"description": "El modelo de generación de imágenes Seedream 4.0, desarrollado por el equipo Seed de ByteDance, soporta entrada de texto e imagen, ofreciendo una experiencia de generación de imágenes altamente controlable y de alta calidad. Genera imágenes basadas en indicaciones de texto."
},
"fal-ai/flux-kontext/dev": {
"description": "Modelo FLUX.1 enfocado en tareas de edición de imágenes, soporta entrada de texto e imagen."
},
"fal-ai/flux-pro/kontext": {
"description": "FLUX.1 Kontext [pro] puede procesar texto e imágenes de referencia como entrada, logrando ediciones locales dirigidas y transformaciones complejas de escenas completas sin interrupciones."
},
"fal-ai/flux/krea": {
"description": "Flux Krea [dev] es un modelo generador de imágenes con preferencia estética, orientado a crear imágenes más realistas y naturales."
},
"fal-ai/flux/schnell": {
"description": "FLUX.1 [schnell] es un modelo generador de imágenes con 12 mil millones de parámetros, enfocado en la generación rápida de imágenes de alta calidad."
},
"fal-ai/hunyuan-image/v3": {
"description": "Un potente modelo nativo de generación de imágenes multimodales"
},
"fal-ai/imagen4/preview": {
"description": "Modelo de generación de imágenes de alta calidad proporcionado por Google."
},
"fal-ai/nano-banana": {
"description": "Nano Banana es el modelo multimodal nativo más reciente, rápido y eficiente de Google, que permite generar y editar imágenes mediante conversación."
},
"fal-ai/qwen-image": {
"description": "Potente modelo de imágenes sin procesar del equipo Qwen, con impresionante capacidad para generar texto en chino y diversos estilos visuales de imágenes."
},
"fal-ai/qwen-image-edit": {
"description": "Modelo profesional de edición de imágenes lanzado por el equipo Qwen, que soporta edición semántica y de apariencia, capaz de editar texto en chino e inglés con precisión, realizar transformaciones de estilo, rotación de objetos y otras ediciones de alta calidad."
},
"flux-1-schnell": {
"description": "Modelo de generación de imágenes a partir de texto con 12 mil millones de parámetros desarrollado por Black Forest Labs, que utiliza tecnología de destilación de difusión adversarial latente, capaz de generar imágenes de alta calidad en 1 a 4 pasos. Su rendimiento es comparable a alternativas propietarias y se publica bajo licencia Apache-2.0, apto para uso personal, investigación y comercial."
},
"flux-dev": {
"description": "FLUX.1 [dev] es un modelo refinado y de pesos abiertos para aplicaciones no comerciales. Mantiene una calidad de imagen y capacidad de seguimiento de instrucciones similar a la versión profesional de FLUX, pero con mayor eficiencia operativa. En comparación con modelos estándar de tamaño similar, es más eficiente en el uso de recursos."
},
"flux-kontext-max": {
"description": "Generación y edición de imágenes contextuales de vanguardia — combinando texto e imágenes para obtener resultados precisos y coherentes."
},
"flux-kontext-pro": {
"description": "Generación y edición de imágenes contextuales de vanguardia: combina texto e imágenes para obtener resultados precisos y coherentes."
},
"flux-merged": {
"description": "El modelo FLUX.1-merged combina las características profundas exploradas durante la fase de desarrollo de “DEV” con las ventajas de ejecución rápida representadas por “Schnell”. Esta combinación no solo amplía los límites de rendimiento del modelo, sino que también amplía su rango de aplicaciones."
},
"flux-pro": {
"description": "Modelo comercial de generación de imágenes por IA de primer nivel — calidad de imagen incomparable y gran diversidad de resultados."
},
"flux-pro-1.1": {
"description": "Modelo profesional mejorado de generación de imágenes con IA — ofrece una calidad de imagen excepcional y una capacidad precisa para seguir las indicaciones."
},
"flux-pro-1.1-ultra": {
"description": "Generación de imágenes por IA de ultra alta resolución — compatible con salida de 4 megapíxeles; genera imágenes en alta definición en menos de 10 segundos."
},
"flux-schnell": {
"description": "FLUX.1 [schnell], como el modelo de pocos pasos más avanzado de código abierto actualmente, supera no solo a competidores similares sino también a potentes modelos no refinados como Midjourney v6.0 y DALL·E 3 (HD). Este modelo ha sido ajustado específicamente para conservar toda la diversidad de salida de la etapa de preentrenamiento. En comparación con los modelos más avanzados del mercado, FLUX.1 [schnell] mejora significativamente la calidad visual, el cumplimiento de instrucciones, la variación de tamaño/proporción, el manejo de fuentes y la diversidad de salida, ofreciendo a los usuarios una experiencia de generación de imágenes creativas más rica y variada."
},
"flux.1-schnell": {
"description": "FLUX.1-schnell, modelo de generación de imágenes de alto rendimiento, ideal para crear rápidamente imágenes de múltiples estilos."
},
"gemini-1.0-pro-001": {
"description": "Gemini 1.0 Pro 001 (Ajuste) ofrece un rendimiento estable y ajustable, siendo una opción ideal para soluciones de tareas complejas."
},
"gemini-1.0-pro-002": {
"description": "Gemini 1.0 Pro 002 (Ajuste) proporciona un excelente soporte multimodal, centrado en la resolución efectiva de tareas complejas."
},
"gemini-1.0-pro-latest": {
"description": "Gemini 1.0 Pro es el modelo de IA de alto rendimiento de Google, diseñado para la escalabilidad en una amplia gama de tareas."
},
"gemini-1.5-flash-001": {
"description": "Gemini 1.5 Flash 001 es un modelo multimodal eficiente, que admite la escalabilidad para aplicaciones amplias."
},
"gemini-1.5-flash-002": {
"description": "Gemini 1.5 Flash 002 es un modelo multimodal eficiente, que admite una amplia gama de aplicaciones."
},
"gemini-1.5-flash-8b": {
"description": "Gemini 1.5 Flash 8B es un modelo multimodal eficiente que admite una amplia gama de aplicaciones."
},
"gemini-1.5-flash-8b-exp-0924": {
"description": "Gemini 1.5 Flash 8B 0924 es el último modelo experimental, con mejoras significativas en el rendimiento tanto en casos de uso de texto como multimodal."
},
"gemini-1.5-flash-8b-latest": {
"description": "Gemini 1.5 Flash 8B es un modelo multimodal eficiente que admite una amplia gama de aplicaciones escalables."
},
"gemini-1.5-flash-exp-0827": {
"description": "Gemini 1.5 Flash 0827 ofrece capacidades de procesamiento multimodal optimizadas, adecuadas para diversas tareas complejas."
},
"gemini-1.5-flash-latest": {
"description": "Gemini 1.5 Flash es el último modelo de IA multimodal de Google, con capacidades de procesamiento rápido, que admite entradas de texto, imagen y video, adecuado para la escalabilidad eficiente en diversas tareas."
},
"gemini-1.5-pro-001": {
"description": "Gemini 1.5 Pro 001 es una solución de IA multimodal escalable, que admite una amplia gama de tareas complejas."
},
"gemini-1.5-pro-002": {
"description": "Gemini 1.5 Pro 002 es el último modelo listo para producción, que ofrece una calidad de salida superior, especialmente en tareas matemáticas, contextos largos y tareas visuales."
},
"gemini-1.5-pro-exp-0801": {
"description": "Gemini 1.5 Pro 0801 ofrece excelentes capacidades de procesamiento multimodal, brindando mayor flexibilidad para el desarrollo de aplicaciones."
},
"gemini-1.5-pro-exp-0827": {
"description": "Gemini 1.5 Pro 0827 combina las últimas tecnologías optimizadas para brindar capacidades de procesamiento de datos multimodales más eficientes."
},
"gemini-1.5-pro-latest": {
"description": "Gemini 1.5 Pro admite hasta 2 millones de tokens, siendo una opción ideal para modelos multimodales de tamaño medio, adecuados para un soporte multifacético en tareas complejas."
},
"gemini-2.0-flash": {
"description": "Gemini 2.0 Flash ofrece funciones y mejoras de próxima generación, incluyendo velocidad excepcional, uso de herramientas nativas, generación multimodal y una ventana de contexto de 1M tokens."
},
"gemini-2.0-flash-001": {
"description": "Gemini 2.0 Flash ofrece funciones y mejoras de próxima generación, incluyendo velocidad excepcional, uso de herramientas nativas, generación multimodal y una ventana de contexto de 1M tokens."
},
"gemini-2.0-flash-exp": {
"description": "Variante del modelo Gemini 2.0 Flash, optimizada para objetivos como la rentabilidad y la baja latencia."
},
"gemini-2.0-flash-exp-image-generation": {
"description": "Modelo experimental Gemini 2.0 Flash, que admite la generación de imágenes"
},
"gemini-2.0-flash-lite": {
"description": "Variante del modelo Gemini 2.0 Flash, optimizada para objetivos como la rentabilidad y la baja latencia."
},
"gemini-2.0-flash-lite-001": {
"description": "Variante del modelo Gemini 2.0 Flash, optimizada para objetivos como la rentabilidad y la baja latencia."
},
"gemini-2.5-flash": {
"description": "Gemini 2.5 Flash es el modelo de mejor relación calidad-precio de Google, que ofrece funcionalidades completas."
},
"gemini-2.5-flash-image": {
"description": "Nano Banana es el modelo multimodal nativo más reciente, rápido y eficiente de Google, que permite generar y editar imágenes mediante diálogo."
},
"gemini-2.5-flash-image-preview": {
"description": "Nano Banana es el modelo multimodal nativo más reciente, rápido y eficiente de Google, que permite generar y editar imágenes mediante diálogo."
},
"gemini-2.5-flash-image-preview:image": {
"description": "Nano Banana es el modelo multimodal nativo más reciente, rápido y eficiente de Google, que permite generar y editar imágenes mediante diálogo."
},
"gemini-2.5-flash-image:image": {
"description": "Nano Banana es el modelo multimodal nativo más reciente, rápido y eficiente de Google, que permite generar y editar imágenes mediante diálogo."
},
"gemini-2.5-flash-lite": {
"description": "Gemini 2.5 Flash-Lite es el modelo más pequeño y rentable de Google, diseñado para un uso a gran escala."
},
"gemini-2.5-flash-lite-preview-06-17": {
"description": "Gemini 2.5 Flash-Lite Preview es el modelo más pequeño y con mejor relación calidad-precio de Google, diseñado para un uso a gran escala."
},
"gemini-2.5-flash-lite-preview-09-2025": {
"description": "Versión preliminar (25 de septiembre de 2025) de Gemini 2.5 Flash-Lite"
},
"gemini-2.5-flash-preview-04-17": {
"description": "Gemini 2.5 Flash Preview es el modelo más rentable de Google, que ofrece una funcionalidad completa."
},
"gemini-2.5-flash-preview-09-2025": {
"description": "Versión preliminar (25 de septiembre de 2025) de Gemini 2.5 Flash"
},
"gemini-2.5-pro": {
"description": "Gemini 2.5 Pro es el modelo de pensamiento más avanzado de Google, capaz de razonar sobre problemas complejos en código, matemáticas y áreas STEM, así como de analizar grandes conjuntos de datos, bases de código y documentos utilizando contextos largos."
},
"gemini-2.5-pro-preview-03-25": {
"description": "Gemini 2.5 Pro Preview es el modelo de pensamiento más avanzado de Google, capaz de razonar sobre problemas complejos en código, matemáticas y campos STEM, así como de analizar grandes conjuntos de datos, bibliotecas de código y documentos utilizando un contexto largo."
},
"gemini-2.5-pro-preview-05-06": {
"description": "Gemini 2.5 Pro Preview es el modelo de pensamiento más avanzado de Google, capaz de razonar sobre problemas complejos en código, matemáticas y campos STEM, así como de analizar grandes conjuntos de datos, bibliotecas de código y documentos utilizando un análisis de contexto prolongado."
},
"gemini-2.5-pro-preview-06-05": {
"description": "Gemini 2.5 Pro Preview es el modelo de pensamiento más avanzado de Google, capaz de razonar sobre problemas complejos en código, matemáticas y áreas STEM, así como analizar grandes conjuntos de datos, bases de código y documentos utilizando contextos extensos."
},
"gemini-3-pro-image-preview": {
"description": "Gemini 3 Pro Image (Nano Banana Pro) es el modelo de generación de imágenes de Google, compatible con diálogos multimodales."
},
"gemini-3-pro-image-preview:image": {
"description": "Gemini 3 Pro Image (Nano Banana Pro) es el modelo de generación de imágenes de Google, compatible con diálogos multimodales."
},
"gemini-3-pro-preview": {
"description": "Gemini 3 Pro es el mejor modelo de comprensión multimodal del mundo, y el agente más potente de Google hasta la fecha. Ofrece efectos visuales más ricos e interacciones más profundas, todo basado en capacidades de razonamiento de vanguardia."
},
"gemini-flash-latest": {
"description": "Última versión de Gemini Flash"
},
"gemini-flash-lite-latest": {
"description": "Última versión de Gemini Flash-Lite"
},
"gemini-pro-latest": {
"description": "Última versión de Gemini Pro"
},
"gemma-7b-it": {
"description": "Gemma 7B es adecuado para el procesamiento de tareas de pequeña y mediana escala, combinando rentabilidad."
},
"gemma2": {
"description": "Gemma 2 es un modelo eficiente lanzado por Google, que abarca una variedad de escenarios de aplicación desde aplicaciones pequeñas hasta procesamiento de datos complejos."
},
"gemma2-9b-it": {
"description": "Gemma 2 9B es un modelo optimizado para la integración de tareas y herramientas específicas."
},
"gemma2:27b": {
"description": "Gemma 2 es un modelo eficiente lanzado por Google, que abarca una variedad de escenarios de aplicación desde aplicaciones pequeñas hasta procesamiento de datos complejos."
},
"gemma2:2b": {
"description": "Gemma 2 es un modelo eficiente lanzado por Google, que abarca una variedad de escenarios de aplicación desde aplicaciones pequeñas hasta procesamiento de datos complejos."
},
"generalv3": {
"description": "Spark Pro es un modelo de lenguaje grande de alto rendimiento optimizado para campos profesionales, enfocado en matemáticas, programación, medicina, educación y más, y soporta búsqueda en línea y plugins integrados como clima y fecha. Su modelo optimizado muestra un rendimiento excepcional y eficiente en preguntas y respuestas complejas, comprensión del lenguaje y creación de textos de alto nivel, siendo la opción ideal para escenarios de aplicación profesional."
},
"generalv3.5": {
"description": "Spark3.5 Max es la versión más completa, soportando búsqueda en línea y numerosos plugins integrados. Su capacidad central completamente optimizada, así como la configuración de roles del sistema y la función de llamada a funciones, hacen que su rendimiento en diversos escenarios de aplicación complejos sea excepcional y sobresaliente."
},
"glm-4": {
"description": "GLM-4 es la versión anterior lanzada en enero de 2024, actualmente ha sido reemplazada por el más potente GLM-4-0520."
},
"glm-4-0520": {
"description": "GLM-4-0520 es la última versión del modelo, diseñada para tareas altamente complejas y diversas, con un rendimiento excepcional."
},
"glm-4-32b-0414": {
"description": "GLM-4 32B 0414, versión del modelo general de la serie GLM, compatible con generación y comprensión de texto multitarea."
},
"glm-4-9b-chat": {
"description": "GLM-4-9B-Chat ofrece un alto rendimiento en semántica, matemáticas, razonamiento, programación y conocimiento. También admite navegación web, ejecución de código, uso de herramientas personalizadas e inferencia de textos largos. Compatible con 26 idiomas, incluidos japonés, coreano y alemán."
},
"glm-4-air": {
"description": "GLM-4-Air es una versión de alto costo-beneficio, con un rendimiento cercano al GLM-4, ofreciendo velocidad y precios asequibles."
},
"glm-4-air-250414": {
"description": "GLM-4-Air es una versión de buena relación calidad-precio, con un rendimiento cercano al de GLM-4, ofreciendo velocidad rápida y un precio asequible."
},
"glm-4-airx": {
"description": "GLM-4-AirX ofrece una versión eficiente de GLM-4-Air, con velocidades de inferencia de hasta 2.6 veces."
},
"glm-4-alltools": {
"description": "GLM-4-AllTools es un modelo de agente multifuncional, optimizado para soportar planificación de instrucciones complejas y llamadas a herramientas, como navegación web, interpretación de código y generación de texto, adecuado para la ejecución de múltiples tareas."
},
"glm-4-flash": {
"description": "GLM-4-Flash es la opción ideal para tareas simples, con la velocidad más rápida y el precio más bajo."
},
"glm-4-flash-250414": {
"description": "GLM-4-Flash es la opción ideal para tareas simples, siendo la más rápida y gratuita."
},
"glm-4-flashx": {
"description": "GLM-4-FlashX es una versión mejorada de Flash, con una velocidad de inferencia ultrarrápida."
},
"glm-4-long": {
"description": "GLM-4-Long admite entradas de texto extremadamente largas, adecuado para tareas de memoria y procesamiento de documentos a gran escala."
},
"glm-4-plus": {
"description": "GLM-4-Plus, como buque insignia de alta inteligencia, tiene una poderosa capacidad para manejar textos largos y tareas complejas, con un rendimiento mejorado en general."
},
"glm-4.1v-thinking-flash": {
"description": "La serie GLM-4.1V-Thinking es el modelo visual más potente conocido en la categoría de VLMs de 10 mil millones de parámetros, integrando tareas de lenguaje visual de última generación (SOTA) en su nivel, incluyendo comprensión de video, preguntas sobre imágenes, resolución de problemas académicos, reconocimiento OCR, interpretación de documentos y gráficos, agentes GUI, codificación web frontend, grounding, entre otros. En muchas tareas, supera incluso a modelos con 8 veces más parámetros como Qwen2.5-VL-72B. Gracias a técnicas avanzadas de aprendizaje reforzado, el modelo domina el razonamiento mediante cadenas de pensamiento para mejorar la precisión y riqueza de las respuestas, superando significativamente a los modelos tradicionales sin pensamiento en términos de resultados y explicabilidad."
},
"glm-4.1v-thinking-flashx": {
"description": "La serie GLM-4.1V-Thinking es el modelo visual más potente conocido en la categoría de VLMs de 10 mil millones de parámetros, integrando tareas de lenguaje visual de última generación (SOTA) en su nivel, incluyendo comprensión de video, preguntas sobre imágenes, resolución de problemas académicos, reconocimiento OCR, interpretación de documentos y gráficos, agentes GUI, codificación web frontend, grounding, entre otros. En muchas tareas, supera incluso a modelos con 8 veces más parámetros como Qwen2.5-VL-72B. Gracias a técnicas avanzadas de aprendizaje reforzado, el modelo domina el razonamiento mediante cadenas de pensamiento para mejorar la precisión y riqueza de las respuestas, superando significativamente a los modelos tradicionales sin pensamiento en términos de resultados y explicabilidad."
},
"glm-4.5": {
"description": "Modelo insignia de Zhipu, que soporta el cambio de modo de pensamiento, con una capacidad integral que alcanza el nivel SOTA de los modelos de código abierto, y una longitud de contexto de hasta 128K."
},
"glm-4.5-air": {
"description": "Versión ligera de GLM-4.5 que equilibra rendimiento y costo, con capacidad flexible para cambiar entre modelos de pensamiento híbrido."
},
"glm-4.5-airx": {
"description": "Versión ultra rápida de GLM-4.5-Air, con respuesta más rápida, diseñada para demandas de gran escala y alta velocidad."
},
"glm-4.5-flash": {
"description": "Versión gratuita de GLM-4.5, con un desempeño destacado en tareas de inferencia, codificación y agentes inteligentes."
},
"glm-4.5-x": {
"description": "Versión ultra rápida de GLM-4.5, que combina un rendimiento potente con una velocidad de generación de hasta 100 tokens por segundo."
},
"glm-4.5v": {
"description": "La nueva generación del modelo de razonamiento visual de Zhipu, basada en la arquitectura MOE, cuenta con 106B de parámetros totales y 12B de parámetros de activación; alcanza el estado del arte (SOTA) entre los modelos multimodales de código abierto de la misma categoría a nivel mundial en diversas pruebas de referencia, y cubre tareas comunes como comprensión de imágenes, vídeo, documentos y tareas de interfaz gráfica de usuario (GUI)."
},
"glm-4.6": {
"description": "El último modelo insignia de Zhipu, GLM-4.6 (355B), supera ampliamente a la generación anterior en codificación avanzada, procesamiento de textos largos, inferencia y capacidades de agentes inteligentes, especialmente en habilidades de programación alineadas con Claude Sonnet 4, convirtiéndose en el modelo de codificación líder en China."
},
"glm-4v": {
"description": "GLM-4V proporciona una poderosa capacidad de comprensión e inferencia de imágenes, soportando diversas tareas visuales."
},
"glm-4v-flash": {
"description": "GLM-4V-Flash se centra en la comprensión eficiente de una única imagen, adecuada para escenarios de análisis de imágenes rápidos, como análisis de imágenes en tiempo real o procesamiento por lotes de imágenes."
},
"glm-4v-plus": {
"description": "GLM-4V-Plus tiene la capacidad de entender contenido de video y múltiples imágenes, adecuado para tareas multimodales."
},
"glm-4v-plus-0111": {
"description": "GLM-4V-Plus tiene la capacidad de comprender contenido de video y múltiples imágenes, adecuado para tareas multimodales."
},
"glm-z1-air": {
"description": "Modelo de inferencia: posee una poderosa capacidad de inferencia, adecuado para tareas que requieren razonamiento profundo."
},
"glm-z1-airx": {
"description": "Inferencia ultrarrápida: con una velocidad de inferencia extremadamente rápida y un potente efecto de razonamiento."
},
"glm-z1-flash": {
"description": "La serie GLM-Z1 posee una fuerte capacidad de razonamiento complejo, destacando en lógica, matemáticas y programación."
},
"glm-z1-flashx": {
"description": "Alta velocidad y bajo costo: versión mejorada Flash, con velocidad de inferencia ultrarrápida y mejor garantía de concurrencia."
},
"glm-zero-preview": {
"description": "GLM-Zero-Preview posee una poderosa capacidad de razonamiento complejo, destacándose en áreas como razonamiento lógico, matemáticas y programación."
},
"global.anthropic.claude-opus-4-5-20251101-v1:0": {
"description": "Claude Opus 4.5 es el modelo insignia de Anthropic, que combina una inteligencia excepcional con un rendimiento escalable, ideal para tareas complejas que requieren respuestas de la más alta calidad y una gran capacidad de razonamiento."
},
"google/gemini-2.0-flash": {
"description": "Gemini 2.0 Flash es un modelo de razonamiento de alto rendimiento de Google, adecuado para tareas multimodales extendidas."
},
"google/gemini-2.0-flash-001": {
"description": "Gemini 2.0 Flash ofrece funciones y mejoras de próxima generación, incluyendo velocidad excepcional, uso de herramientas nativas, generación multimodal y una ventana de contexto de 1M tokens."
},
"google/gemini-2.0-flash-exp:free": {
"description": "Gemini 2.0 Flash Experimental es el último modelo de IA multimodal experimental de Google, con una mejora de calidad en comparación con versiones anteriores, especialmente en conocimiento del mundo, código y contexto largo."
},
"google/gemini-2.0-flash-lite": {
"description": "Gemini 2.0 Flash Lite ofrece funcionalidades de próxima generación y mejoras, incluyendo velocidad sobresaliente, uso integrado de herramientas, generación multimodal y una ventana de contexto de 1 millón de tokens."
},
"google/gemini-2.0-flash-lite-001": {
"description": "Gemini 2.0 Flash Lite es la versión ligera de la familia Gemini. Por defecto, el razonamiento está desactivado para mejorar la latencia y el coste, pero puede activarse mediante parámetros."
},
"google/gemini-2.5-flash": {
"description": "La serie Gemini 2.5 Flash (Lite/Pro/Flash) son modelos de razonamiento de Google que van desde baja latencia hasta alto rendimiento."
},
"google/gemini-2.5-flash-image": {
"description": "Gemini 2.5 Flash Image (Nano Banana) es el modelo de generación de imágenes de Google, compatible con diálogos multimodales."
},
"google/gemini-2.5-flash-image-free": {
"description": "Versión gratuita de Gemini 2.5 Flash Image, compatible con generación multimodal con cuota limitada."
},
"google/gemini-2.5-flash-image-preview": {
"description": "Modelo experimental Gemini 2.5 Flash, compatible con generación de imágenes."
},
"google/gemini-2.5-flash-lite": {
"description": "Gemini 2.5 Flash Lite es la versión ligera de Gemini 2.5, optimizada para latencia y coste, ideal para escenarios de alto rendimiento."
},
"google/gemini-2.5-flash-preview": {
"description": "Gemini 2.5 Flash es el modelo principal más avanzado de Google, diseñado para razonamiento avanzado, codificación, matemáticas y tareas científicas. Incluye la capacidad de 'pensar' incorporada, lo que le permite proporcionar respuestas con mayor precisión y un manejo más detallado del contexto.\n\nNota: Este modelo tiene dos variantes: con pensamiento y sin pensamiento. La fijación de precios de salida varía significativamente según si la capacidad de pensamiento está activada. Si elige la variante estándar (sin el sufijo ':thinking'), el modelo evitará explícitamente generar tokens de pensamiento.\n\nPara aprovechar la capacidad de pensamiento y recibir tokens de pensamiento, debe elegir la variante ':thinking', lo que resultará en un precio de salida de pensamiento más alto.\n\nAdemás, Gemini 2.5 Flash se puede configurar a través del parámetro 'número máximo de tokens de razonamiento', como se describe en la documentación (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
},
"google/gemini-2.5-flash-preview:thinking": {
"description": "Gemini 2.5 Flash es el modelo principal más avanzado de Google, diseñado para razonamiento avanzado, codificación, matemáticas y tareas científicas. Incluye la capacidad de 'pensar' incorporada, lo que le permite proporcionar respuestas con mayor precisión y un manejo más detallado del contexto.\n\nNota: Este modelo tiene dos variantes: con pensamiento y sin pensamiento. La fijación de precios de salida varía significativamente según si la capacidad de pensamiento está activada. Si elige la variante estándar (sin el sufijo ':thinking'), el modelo evitará explícitamente generar tokens de pensamiento.\n\nPara aprovechar la capacidad de pensamiento y recibir tokens de pensamiento, debe elegir la variante ':thinking', lo que resultará en un precio de salida de pensamiento más alto.\n\nAdemás, Gemini 2.5 Flash se puede configurar a través del parámetro 'número máximo de tokens de razonamiento', como se describe en la documentación (https://openrouter.ai/docs/use-cases/reasoning-tokens#max-tokens-for-reasoning)."
},
"google/gemini-2.5-pro": {
"description": "Gemini 2.5 Pro es el modelo de razonamiento insignia de Google, compatible con contexto largo y tareas complejas."
},
"google/gemini-2.5-pro-free": {
"description": "Versión gratuita de Gemini 2.5 Pro, compatible con contexto largo multimodal con cuota limitada, ideal para pruebas y flujos de trabajo ligeros."
},
"google/gemini-2.5-pro-preview": {
"description": "Gemini 2.5 Pro Preview es el modelo de pensamiento más avanzado de Google, capaz de razonar sobre problemas complejos en código, matemáticas y áreas STEM, así como de analizar grandes conjuntos de datos, bases de código y documentos utilizando contextos extensos."
},
"google/gemini-3-pro-image-preview": {
"description": "Gemini 3 Pro Image (Nano Banana Pro) es el modelo de generación de imágenes de Google, que también admite conversaciones multimodales."
},
"google/gemini-3-pro-image-preview-free": {
"description": "Versión gratuita de Gemini 3 Pro Image, compatible con generación multimodal con cuota limitada."
},
"google/gemini-3-pro-preview": {
"description": "Gemini 3 Pro es la próxima generación de modelos de razonamiento multimodal de la serie Gemini, capaz de comprender texto, audio, imágenes, vídeo y más, y manejar tareas complejas y grandes bases de código."
},
"google/gemini-3-pro-preview-free": {
"description": "Versión de vista previa gratuita de Gemini 3 Pro, con las mismas capacidades de comprensión y razonamiento multimodal que la versión estándar, pero con limitaciones de cuota y velocidad. Más adecuada para pruebas y uso ocasional."
},
"google/gemini-embedding-001": {
"description": "Modelo de incrustaciones de última generación con rendimiento sobresaliente en tareas en inglés, multilingües y de código."
},
"google/gemini-flash-1.5": {
"description": "Gemini 1.5 Flash ofrece capacidades de procesamiento multimodal optimizadas, adecuadas para una variedad de escenarios de tareas complejas."
},
"google/gemini-pro-1.5": {
"description": "Gemini 1.5 Pro combina las últimas tecnologías de optimización, proporcionando una capacidad de procesamiento de datos multimodal más eficiente."
},
"google/gemma-2-27b": {
"description": "Gemma 2 es un modelo eficiente lanzado por Google, que abarca una variedad de escenarios de aplicación desde aplicaciones pequeñas hasta procesamiento de datos complejos."
},
"google/gemma-2-27b-it": {
"description": "Gemma 2 continúa con el concepto de diseño ligero y eficiente."
},
"google/gemma-2-2b-it": {
"description": "Modelo de ajuste de instrucciones ligero de Google."
},
"google/gemma-2-9b": {
"description": "Gemma 2 es un modelo eficiente lanzado por Google, que abarca una variedad de escenarios de aplicación desde aplicaciones pequeñas hasta procesamiento de datos complejos."
},
"google/gemma-2-9b-it": {
"description": "Gemma 2 es una serie de modelos de texto de código abierto y ligeros de Google."
},
"google/gemma-2-9b-it:free": {
"description": "Gemma 2 es una serie de modelos de texto de código abierto y livianos de Google."
},
"google/gemma-2b-it": {
"description": "Gemma Instruct (2B) ofrece capacidades básicas de procesamiento de instrucciones, adecuado para aplicaciones ligeras."
},
"google/gemma-3-12b-it": {
"description": "Gemma 3 12B es un modelo de lenguaje de código abierto de Google que establece nuevos estándares en eficiencia y rendimiento."
},
"google/gemma-3-27b-it": {
"description": "Gemma 3 27B es un modelo de lenguaje de código abierto de Google, que establece nuevos estándares en eficiencia y rendimiento."
},
"google/text-embedding-005": {
"description": "Modelo de incrustaciones de texto enfocado en inglés, optimizado para tareas de código y lenguaje inglés."
},
"google/text-multilingual-embedding-002": {
"description": "Modelo de incrustaciones de texto multilingüe optimizado para tareas translingüísticas, compatible con múltiples idiomas."
},
"gpt-3.5-turbo": {
"description": "GPT 3.5 Turbo, adecuado para diversas tareas de generación y comprensión de texto, actualmente apunta a gpt-3.5-turbo-0125."
},
"gpt-3.5-turbo-0125": {
"description": "GPT 3.5 Turbo, adecuado para diversas tareas de generación y comprensión de texto, actualmente apunta a gpt-3.5-turbo-0125."
},
"gpt-3.5-turbo-1106": {
"description": "GPT 3.5 Turbo, adecuado para diversas tareas de generación y comprensión de texto, actualmente apunta a gpt-3.5-turbo-0125."
},
"gpt-3.5-turbo-instruct": {
"description": "GPT 3.5 Turbo, adecuado para diversas tareas de generación y comprensión de texto, actualmente apunta a gpt-3.5-turbo-0125."
},
"gpt-35-turbo": {
"description": "GPT 3.5 Turbo, un modelo eficiente proporcionado por OpenAI, es adecuado para tareas de conversación y generación de texto, con soporte para llamadas a funciones en paralelo."
},
"gpt-35-turbo-16k": {
"description": "GPT 3.5 Turbo 16k, un modelo de generación de texto de alta capacidad, adecuado para tareas complejas."
},
"gpt-4": {
"description": "GPT-4 ofrece una ventana de contexto más grande, capaz de manejar entradas de texto más largas, adecuado para escenarios que requieren integración de información amplia y análisis de datos."
},
"gpt-4-0125-preview": {
"description": "El último modelo GPT-4 Turbo cuenta con funciones visuales. Ahora, las solicitudes visuales pueden utilizar el modo JSON y llamadas a funciones. GPT-4 Turbo es una versión mejorada que ofrece soporte rentable para tareas multimodales. Encuentra un equilibrio entre precisión y eficiencia, adecuado para aplicaciones que requieren interacción en tiempo real."
},
"gpt-4-0613": {
"description": "GPT-4 ofrece una ventana de contexto más grande, capaz de manejar entradas de texto más largas, adecuado para escenarios que requieren integración de información amplia y análisis de datos."
},
"gpt-4-1106-preview": {
"description": "El último modelo GPT-4 Turbo cuenta con funciones visuales. Ahora, las solicitudes visuales pueden utilizar el modo JSON y llamadas a funciones. GPT-4 Turbo es una versión mejorada que ofrece soporte rentable para tareas multimodales. Encuentra un equilibrio entre precisión y eficiencia, adecuado para aplicaciones que requieren interacción en tiempo real."
},
"gpt-4-32k": {
"description": "GPT-4 ofrece una ventana de contexto más grande, capaz de manejar entradas de texto más largas, adecuado para escenarios que requieren integración de información amplia y análisis de datos."
},
"gpt-4-32k-0613": {
"description": "GPT-4 ofrece una ventana de contexto más grande, capaz de manejar entradas de texto más largas, adecuado para escenarios que requieren integración de información amplia y análisis de datos."
},
"gpt-4-turbo": {
"description": "El último modelo GPT-4 Turbo cuenta con funciones visuales. Ahora, las solicitudes visuales pueden utilizar el modo JSON y llamadas a funciones. GPT-4 Turbo es una versión mejorada que ofrece soporte rentable para tareas multimodales. Encuentra un equilibrio entre precisión y eficiencia, adecuado para aplicaciones que requieren interacción en tiempo real."
},
"gpt-4-turbo-2024-04-09": {
"description": "El último modelo GPT-4 Turbo cuenta con funciones visuales. Ahora, las solicitudes visuales pueden utilizar el modo JSON y llamadas a funciones. GPT-4 Turbo es una versión mejorada que ofrece soporte rentable para tareas multimodales. Encuentra un equilibrio entre precisión y eficiencia, adecuado para aplicaciones que requieren interacción en tiempo real."
},
"gpt-4-turbo-preview": {
"description": "El último modelo GPT-4 Turbo cuenta con funciones visuales. Ahora, las solicitudes visuales pueden utilizar el modo JSON y llamadas a funciones. GPT-4 Turbo es una versión mejorada que ofrece soporte rentable para tareas multimodales. Encuentra un equilibrio entre precisión y eficiencia, adecuado para aplicaciones que requieren interacción en tiempo real."
},
"gpt-4-vision-preview": {
"description": "El último modelo GPT-4 Turbo cuenta con funciones visuales. Ahora, las solicitudes visuales pueden utilizar el modo JSON y llamadas a funciones. GPT-4 Turbo es una versión mejorada que ofrece soporte rentable para tareas multimodales. Encuentra un equilibrio entre precisión y eficiencia, adecuado para aplicaciones que requieren interacción en tiempo real."
},
"gpt-4.1": {
"description": "GPT-4.1 es nuestro modelo insignia para tareas complejas. Es ideal para resolver problemas en múltiples dominios."
},
"gpt-4.1-mini": {
"description": "GPT-4.1 mini ofrece un equilibrio entre inteligencia, velocidad y costo, lo que lo convierte en un modelo atractivo para muchos casos de uso."
},
"gpt-4.1-nano": {
"description": "GPT-4.1 mini ofrece un equilibrio entre inteligencia, velocidad y costo, lo que lo convierte en un modelo atractivo para muchos casos de uso."
},
"gpt-4.5-preview": {
"description": "GPT-4.5-preview es el modelo de propósito general más reciente, con un profundo conocimiento del mundo y una mejor comprensión de las intenciones de los usuarios; destaca en tareas creativas y en la planificación de agentes. El conocimiento de este modelo está actualizado hasta octubre de 2023."
},
"gpt-4o": {
"description": "ChatGPT-4o es un modelo dinámico que se actualiza en tiempo real para mantener la versión más actual. Combina una poderosa comprensión y generación de lenguaje, adecuado para aplicaciones a gran escala, incluyendo servicio al cliente, educación y soporte técnico."
},
"gpt-4o-2024-05-13": {
"description": "ChatGPT-4o es un modelo dinámico que se actualiza en tiempo real para mantener la versión más actual. Combina una poderosa comprensión y generación de lenguaje, adecuado para aplicaciones a gran escala, incluyendo servicio al cliente, educación y soporte técnico."
},
"gpt-4o-2024-08-06": {
"description": "ChatGPT-4o es un modelo dinámico que se actualiza en tiempo real para mantener la versión más actual. Combina una poderosa comprensión y generación de lenguaje, adecuado para aplicaciones a gran escala, incluyendo servicio al cliente, educación y soporte técnico."
},
"gpt-4o-2024-11-20": {
"description": "ChatGPT-4o es un modelo dinámico que se actualiza en tiempo real para mantener la versión más reciente. Combina una poderosa comprensión del lenguaje con habilidades de generación, adecuada para escenarios de aplicación a gran escala, incluidos servicio al cliente, educación y soporte técnico."
},
"gpt-4o-audio-preview": {
"description": "Modelo GPT-4o Audio Preview, compatible con entrada y salida de audio."
},
"gpt-4o-mini": {
"description": "GPT-4o mini es el último modelo lanzado por OpenAI después de GPT-4 Omni, que admite entradas de texto e imagen y genera texto como salida. Como su modelo más avanzado de menor tamaño, es mucho más económico que otros modelos de vanguardia recientes y es más de un 60% más barato que GPT-3.5 Turbo. Mantiene una inteligencia de vanguardia mientras ofrece una relación calidad-precio significativa. GPT-4o mini obtuvo un puntaje del 82% en la prueba MMLU y actualmente se clasifica por encima de GPT-4 en preferencias de chat."
},
"gpt-4o-mini-audio-preview": {
"description": "Modelo GPT-4o mini Audio, que soporta entrada y salida de audio."
},
"gpt-4o-mini-realtime-preview": {
"description": "Versión en tiempo real de GPT-4o-mini, que admite entrada y salida de audio y texto en tiempo real."
},
"gpt-4o-mini-search-preview": {
"description": "GPT-4o mini versión preliminar de búsqueda es un modelo entrenado específicamente para comprender y ejecutar consultas de búsqueda web, utilizando la API de Chat Completions. Además de los costos por tokens, las consultas de búsqueda web incurren en cargos por cada llamada a la herramienta."
},
"gpt-4o-mini-transcribe": {
"description": "GPT-4o Mini Transcribe es un modelo de conversión de voz a texto que utiliza GPT-4o para transcribir audio. En comparación con el modelo Whisper original, mejora la tasa de error de palabras y aumenta la precisión y el reconocimiento del idioma. Úselo para obtener transcripciones más precisas."
},
"gpt-4o-mini-tts": {
"description": "GPT-4o mini TTS es un modelo de texto a voz basado en GPT-4o mini, que ofrece generación de voz de alta calidad a un costo más bajo."
},
"gpt-4o-realtime-preview": {
"description": "Versión en tiempo real de GPT-4o, que admite entrada y salida de audio y texto en tiempo real."
},
"gpt-4o-realtime-preview-2024-10-01": {
"description": "Versión en tiempo real de GPT-4o, que admite entrada y salida de audio y texto en tiempo real."
},
"gpt-4o-realtime-preview-2025-06-03": {
"description": "Versión en tiempo real de GPT-4o, que soporta entrada y salida de audio y texto en tiempo real."
},
"gpt-4o-search-preview": {
"description": "GPT-4o versión preliminar de búsqueda es un modelo entrenado específicamente para comprender y ejecutar consultas de búsqueda web, utilizando la API de Chat Completions. Además de los costos por tokens, las consultas de búsqueda web incurren en cargos por cada llamada a la herramienta."
},
"gpt-4o-transcribe": {
"description": "GPT-4o Transcribe es un modelo de conversión de voz a texto que utiliza GPT-4o para transcribir audio. En comparación con el modelo Whisper original, mejora la tasa de error de palabras y aumenta la precisión y el reconocimiento del idioma. Úselo para obtener transcripciones más precisas."
},
"gpt-5": {
"description": "El mejor modelo para tareas de codificación y agentes multidisciplinarios. GPT-5 logra avances en precisión, velocidad, razonamiento, reconocimiento contextual, pensamiento estructurado y resolución de problemas."
},
"gpt-5-chat": {
"description": "GPT-5 Chat es una versión preliminar optimizada para escenarios conversacionales. Admite entrada de texto e imagen, y solo genera salida de texto. Ideal para chatbots y aplicaciones de IA conversacional."
},
"gpt-5-chat-latest": {
"description": "Modelo GPT-5 utilizado en ChatGPT. Combina una potente comprensión y generación del lenguaje, ideal para aplicaciones de interacción conversacional."
},
"gpt-5-codex": {
"description": "GPT-5 Codex es una versión optimizada de GPT-5 para tareas de codificación de agentes en entornos Codex o similares."
},
"gpt-5-mini": {
"description": "Versión más rápida y económica de GPT-5, adecuada para tareas bien definidas. Ofrece respuestas más rápidas manteniendo una salida de alta calidad."
},
"gpt-5-nano": {
"description": "Versión más rápida y económica de GPT-5. Perfecta para escenarios que requieren respuestas rápidas y son sensibles al costo."
},
"gpt-5-pro": {
"description": "GPT-5 pro utiliza más capacidad de cómputo para pensar de forma más profunda y ofrecer respuestas de mayor calidad de manera constante."
},
"gpt-5.1": {
"description": "GPT-5.1: modelo insignia optimizado para tareas de codificación y agentes, con soporte para intensidad de razonamiento configurable y contextos más largos."
},
"gpt-5.1-chat-latest": {
"description": "GPT-5.1 Chat: variante de GPT-5.1 para ChatGPT, ideal para escenarios conversacionales."
},
"gpt-5.1-codex": {
"description": "GPT-5.1 Codex: versión de GPT-5.1 optimizada para tareas de codificación agentica, disponible en la API de Respuestas para flujos de trabajo de código/agente más complejos."
},
"gpt-5.1-codex-mini": {
"description": "GPT-5.1 Codex mini: variante de Codex más compacta y económica, optimizada para tareas de codificación agentica."
},
"gpt-audio": {
"description": "GPT Audio es un modelo de chat general para entrada y salida de audio, compatible con el uso de audio I/O en la API de Chat Completions."
},
"gpt-image-1": {
"description": "Modelo nativo multimodal de generación de imágenes de ChatGPT."
},
"gpt-image-1-mini": {
"description": "Una versión más económica de GPT Image 1, con soporte nativo para entrada de texto e imagen y generación de salida en formato de imagen."
},
"gpt-oss-120b": {
"description": "Este modelo requiere solicitud para su uso. GPT-OSS-120B es un modelo de lenguaje de código abierto a gran escala desarrollado por OpenAI, con potentes capacidades de generación de texto."
},
"gpt-oss-20b": {
"description": "Este modelo requiere solicitud para su uso. GPT-OSS-20B es un modelo de lenguaje de código abierto de tamaño medio desarrollado por OpenAI, con capacidades eficientes de generación de texto."
},
"gpt-oss:120b": {
"description": "GPT-OSS 120B es un modelo de lenguaje abierto de gran escala lanzado por OpenAI, que emplea la tecnología de cuantificación MXFP4, siendo un modelo insignia. Requiere múltiples GPU o estaciones de trabajo de alto rendimiento para su ejecución, y ofrece un rendimiento sobresaliente en razonamiento complejo, generación de código y procesamiento multilingüe, soportando llamadas avanzadas a funciones e integración de herramientas."
},
"gpt-oss:20b": {
"description": "GPT-OSS 20B es un modelo de lenguaje grande de código abierto lanzado por OpenAI, que utiliza la tecnología de cuantificación MXFP4, adecuado para ejecutarse en GPUs de consumo de alta gama o Macs con Apple Silicon. Este modelo destaca en generación de diálogos, escritura de código y tareas de razonamiento, soportando llamadas a funciones y uso de herramientas."
},
"gpt-realtime": {
"description": "Modelo universal en tiempo real que soporta entrada y salida de texto y audio, además de entrada de imágenes."
},
"grok-2-image-1212": {
"description": "Nuestro último modelo de generación de imágenes puede crear imágenes vívidas y realistas a partir de indicaciones textuales. Destaca en generación de imágenes para marketing, redes sociales y entretenimiento."
},
"grok-2-vision-1212": {
"description": "Este modelo ha mejorado en precisión, cumplimiento de instrucciones y capacidades multilingües."
},
"grok-3": {
"description": "Modelo insignia, experto en extracción de datos, programación y resumen de texto para aplicaciones empresariales, con profundo conocimiento en finanzas, medicina, derecho y ciencias."
},
"grok-3-mini": {
"description": "Modelo ligero que piensa antes de responder. Rápido e inteligente, adecuado para tareas lógicas que no requieren conocimientos profundos de dominio y capaz de proporcionar la trayectoria original del pensamiento."
},
"grok-4": {
"description": "Nuestro modelo insignia más reciente y potente, que destaca en procesamiento de lenguaje natural, cálculo matemático y razonamiento — un competidor versátil y perfecto."
},
"grok-4-0709": {
"description": "Grok 4 de xAI, con potentes capacidades de razonamiento."
},
"grok-4-1-fast-non-reasoning": {
"description": "Modelo multimodal de vanguardia, optimizado específicamente para llamadas de herramientas de agente de alto rendimiento."
},
"grok-4-1-fast-reasoning": {
"description": "Modelo multimodal de vanguardia, optimizado específicamente para llamadas de herramientas de agente de alto rendimiento."
},
"grok-4-fast-non-reasoning": {
"description": "Nos complace anunciar Grok 4 Fast, nuestro último avance en modelos de inferencia con alta relación costo-beneficio."
},
"grok-4-fast-reasoning": {
"description": "Nos complace anunciar Grok 4 Fast, nuestro último avance en modelos de inferencia con alta relación costo-beneficio."
},
"grok-code-fast-1": {
"description": "Nos complace presentar grok-code-fast-1, un modelo de inferencia rápido y económico que destaca en la codificación de agentes."
},
"groq/compound": {
"description": "Compound es un sistema de IA compuesto, respaldado por múltiples modelos disponibles públicamente ya soportados en GroqCloud, que puede usar herramientas de manera inteligente y selectiva para responder consultas de usuarios."
},
"groq/compound-mini": {
"description": "Compound-mini es un sistema de IA compuesto, respaldado por modelos disponibles públicamente ya soportados en GroqCloud, que puede usar herramientas de manera inteligente y selectiva para responder consultas de usuarios."
},
"gryphe/mythomax-l2-13b": {
"description": "MythoMax l2 13B es un modelo de lenguaje que combina creatividad e inteligencia, fusionando múltiples modelos de vanguardia."
},
"hunyuan-a13b": {
"description": "El primer modelo de razonamiento híbrido de Hunyuan, una versión mejorada de hunyuan-standard-256K, con un total de 80 mil millones de parámetros y 13 mil millones activados. Por defecto opera en modo de pensamiento lento, pero soporta cambio entre modos rápido y lento mediante parámetros o instrucciones, añadiendo / no_think antes de la consulta para alternar. Su capacidad general mejora integralmente respecto a la generación anterior, con avances notables en matemáticas, ciencias, comprensión de textos largos y habilidades de agente."
},
"hunyuan-code": {
"description": "El último modelo de generación de código de Hunyuan, entrenado con 200B de datos de código de alta calidad, con medio año de entrenamiento de datos SFT de alta calidad, aumentando la longitud de la ventana de contexto a 8K, destacándose en métricas automáticas de generación de código en cinco lenguajes; en evaluaciones de calidad humana de tareas de código en diez aspectos en cinco lenguajes, su rendimiento se encuentra en la primera categoría."
},
"hunyuan-functioncall": {
"description": "El último modelo FunctionCall de Hunyuan con arquitectura MOE, entrenado con datos de FunctionCall de alta calidad, con una ventana de contexto de 32K, liderando en múltiples dimensiones de métricas de evaluación."
},
"hunyuan-large": {
"description": "El modelo Hunyuan-large tiene un total de aproximadamente 389B de parámetros, con aproximadamente 52B de parámetros activados, siendo el modelo MoE de código abierto con la mayor escala de parámetros y el mejor rendimiento en la arquitectura Transformer en la industria actual."
},
"hunyuan-large-longcontext": {
"description": "Especializado en tareas de texto largo como resúmenes de documentos y preguntas y respuestas de documentos, también tiene la capacidad de manejar tareas generales de generación de texto. Destaca en el análisis y generación de textos largos, pudiendo abordar eficazmente las necesidades de procesamiento de contenido largo y complejo."
},
"hunyuan-large-vision": {
"description": "Este modelo es adecuado para escenarios de comprensión de imágenes y texto, basado en el modelo visual-lingüístico Hunyuan Large. Soporta entrada de múltiples imágenes de cualquier resolución junto con texto, generando contenido textual, con un enfoque en tareas relacionadas con la comprensión de imágenes y texto, mostrando mejoras significativas en capacidades multilingües."
},
"hunyuan-lite": {
"description": "Actualizado a una estructura MOE, con una ventana de contexto de 256k, lidera en múltiples conjuntos de evaluación en NLP, código, matemáticas, industria y más, superando a muchos modelos de código abierto."
},
"hunyuan-lite-vision": {
"description": "El modelo multimodal más reciente de 7B de Hunyuan, con una ventana de contexto de 32K, soporta diálogos multimodales en chino e inglés, reconocimiento de objetos en imágenes, comprensión de documentos y tablas, matemáticas multimodales, entre otros, superando a modelos competidores de 7B en múltiples dimensiones de evaluación."
},
"hunyuan-pro": {
"description": "Modelo de texto largo MOE-32K con un tamaño de parámetros de billones. Alcanzando niveles de liderazgo absoluto en varios benchmarks, con capacidades complejas de instrucciones y razonamiento, habilidades matemáticas complejas, soporte para llamadas a funciones, optimizado para aplicaciones en traducción multilingüe, finanzas, derecho y medicina."
},
"hunyuan-role": {
"description": "El último modelo de rol de Hunyuan, un modelo de rol ajustado y entrenado oficialmente por Hunyuan, que se basa en el modelo Hunyuan y se entrena con un conjunto de datos de escenarios de rol, logrando un mejor rendimiento en escenarios de rol."
},
"hunyuan-standard": {
"description": "Adopta una estrategia de enrutamiento mejorada, al tiempo que mitiga problemas de equilibrio de carga y convergencia de expertos. En el caso de textos largos, el índice de precisión alcanza el 99.9%. MOE-32K ofrece una mejor relación calidad-precio, equilibrando efectividad y costo, permitiendo el procesamiento de entradas de texto largo."
},
"hunyuan-standard-256K": {
"description": "Adopta una estrategia de enrutamiento mejorada, al tiempo que mitiga problemas de equilibrio de carga y convergencia de expertos. En el caso de textos largos, el índice de precisión alcanza el 99.9%. MOE-256K rompe barreras en longitud y efectividad, ampliando enormemente la longitud de entrada permitida."
},
"hunyuan-standard-vision": {
"description": "El modelo multimodal más reciente de Hunyuan, que soporta respuestas en múltiples idiomas, con capacidades equilibradas en chino e inglés."
},
"hunyuan-t1-20250321": {
"description": "Construye de manera integral las capacidades de modelos en ciencias exactas y humanidades, con una fuerte capacidad para capturar información de textos largos. Soporta la inferencia y respuesta a problemas científicos de diversas dificultades, incluyendo matemáticas, lógica, ciencias y código."
},
"hunyuan-t1-20250403": {
"description": "Mejora la capacidad de generación de código a nivel de proyecto; mejora la calidad de la escritura generada en texto; mejora la comprensión de temas en texto, el seguimiento de instrucciones tob en múltiples rondas y la comprensión de palabras; optimiza problemas de salida con mezcla de caracteres tradicionales y simplificados, así como mezcla de chino e inglés."
},
"hunyuan-t1-20250529": {
"description": "Optimiza la creación de textos, redacción de ensayos, mejora habilidades en programación frontend, matemáticas y razonamiento lógico, y aumenta la capacidad de seguir instrucciones."
},
"hunyuan-t1-20250711": {
"description": "Mejora significativa en habilidades avanzadas de matemáticas, lógica y codificación, optimización de la estabilidad de salida del modelo y aumento de la capacidad para textos largos."
},
"hunyuan-t1-latest": {
"description": "Mejora significativamente las capacidades del modelo principal de pensamiento lento en matemáticas avanzadas, razonamiento complejo, código difícil, cumplimiento de instrucciones y calidad en la creación de textos."
},
"hunyuan-t1-vision-20250619": {
"description": "La última versión del modelo de pensamiento profundo multimodal t1-vision de Hunyuan, que soporta cadenas de pensamiento nativas multimodales, con mejoras integrales respecto a la versión predeterminada anterior."
},
"hunyuan-t1-vision-20250916": {
"description": "La última versión del modelo de pensamiento visual profundo Hunyuan t1-vision ofrece mejoras integrales respecto a su versión anterior en tareas como preguntas y respuestas generales sobre imágenes, localización visual, OCR, interpretación de gráficos, resolución de problemas a partir de fotos y creación visual. También se ha optimizado notablemente su rendimiento en inglés y lenguas minoritarias."
},
"hunyuan-turbo": {
"description": "Versión preliminar de la nueva generación del modelo de lenguaje de Hunyuan, que utiliza una nueva estructura de modelo de expertos mixtos (MoE), con una eficiencia de inferencia más rápida y un rendimiento más fuerte en comparación con Hunyuan-Pro."
},
"hunyuan-turbo-20241223": {
"description": "Optimización de esta versión: escalado de instrucciones de datos, mejora significativa de la capacidad de generalización del modelo; mejora significativa de las capacidades de matemáticas, código y razonamiento lógico; optimización de la comprensión de texto y de palabras relacionadas; optimización de la calidad de generación de contenido en la creación de texto."
},
"hunyuan-turbo-latest": {
"description": "Optimización de la experiencia general, incluyendo comprensión de NLP, creación de texto, conversación casual, preguntas y respuestas de conocimiento, traducción, entre otros; mejora de la humanización, optimización de la inteligencia emocional del modelo; mejora de la capacidad del modelo para aclarar proactivamente en caso de ambigüedad en la intención; mejora de la capacidad de manejo de problemas de análisis de palabras; mejora de la calidad y la interactividad de la creación; mejora de la experiencia en múltiples turnos."
},
"hunyuan-turbo-vision": {
"description": "El nuevo modelo insignia de lenguaje visual de Hunyuan de nueva generación, que utiliza una nueva estructura de modelo de expertos mixtos (MoE), mejorando de manera integral las capacidades de reconocimiento básico, creación de contenido, preguntas y respuestas de conocimiento, y análisis y razonamiento en comparación con la generación anterior de modelos."
},
"hunyuan-turbos-20250313": {
"description": "Unificación del estilo de pasos para resolver problemas matemáticos, fortaleciendo las preguntas y respuestas multilínea en matemáticas. Optimización del estilo de respuesta en creación de texto, eliminando el tono artificial de IA y aumentando la elegancia literaria."
},
"hunyuan-turbos-20250416": {
"description": "Actualización de la base de preentrenamiento para fortalecer la comprensión y el seguimiento de instrucciones; mejora en matemáticas, programación, lógica y ciencias durante la fase de alineación; mejora en calidad de escritura creativa, comprensión de texto, precisión en traducción y preguntas de conocimiento en humanidades; refuerzo de capacidades de agentes en diversos campos, con especial énfasis en la comprensión de diálogos multilínea."
},
"hunyuan-turbos-20250604": {
"description": "Actualización de la base de preentrenamiento, mejora en la escritura y comprensión lectora, aumento significativo en habilidades de programación y ciencias, y progreso continuo en el seguimiento de instrucciones complejas."
},
"hunyuan-turbos-20250926": {
"description": "Mejora en la calidad de los datos base de preentrenamiento. Optimización de la estrategia de entrenamiento en la fase postentrenamiento, con mejoras continuas en capacidades de agente, idiomas menores en inglés, cumplimiento de instrucciones, código y ciencias."
},
"hunyuan-turbos-latest": {
"description": "hunyuan-TurboS es la última versión del modelo insignia Hunyuan, con una mayor capacidad de pensamiento y una mejor experiencia."
},
"hunyuan-turbos-longtext-128k-20250325": {
"description": "Especializado en tareas de texto largo como resúmenes de documentos y preguntas sobre documentos, también tiene la capacidad de manejar tareas generales de generación de texto. Destaca en el análisis y generación de textos largos, capaz de abordar eficazmente las necesidades complejas y detalladas de procesamiento de contenido extenso."
},
"hunyuan-turbos-role-plus": {
"description": "Modelo de rol más reciente de Hunyuan, afinado oficialmente por Hunyuan, entrenado adicionalmente con conjuntos de datos de escenarios de juego de roles, ofreciendo mejores resultados básicos en dichos escenarios."
},
"hunyuan-turbos-vision": {
"description": "Este modelo está diseñado para escenarios de comprensión de imágenes y texto, basado en la última generación de modelos insignia visual-lingüísticos turbos de Hunyuan. Se enfoca en tareas relacionadas con la comprensión de imágenes, incluyendo reconocimiento de entidades basado en imágenes, preguntas de conocimiento, creación de textos y resolución de problemas mediante fotos, con mejoras integrales respecto a la generación anterior."
},
"hunyuan-turbos-vision-20250619": {
"description": "La última versión del modelo insignia visual-lingüístico turbos-vision de Hunyuan, que mejora integralmente la comprensión de imágenes y texto, incluyendo reconocimiento de entidades basado en imágenes, preguntas de conocimiento, creación de textos y resolución de problemas mediante fotos, respecto a la versión predeterminada anterior."
},
"hunyuan-vision": {
"description": "El último modelo multimodal de Hunyuan, que admite la entrada de imágenes y texto para generar contenido textual."
},
"image-01": {
"description": "Nuevo modelo de generación de imágenes con detalles finos, soporta generación de imágenes a partir de texto e imagen."
},
"image-01-live": {
"description": "Modelo de generación de imágenes con detalles finos, soporta generación a partir de texto y configuración de estilo artístico."
},
"imagen-4.0-fast-generate-001": {
"description": "Versión Fast de la serie de modelos Imagen de texto a imagen de cuarta generación"
},
"imagen-4.0-generate-001": {
"description": "Serie Imagen de cuarta generación para generar imágenes a partir de texto."
},
"imagen-4.0-generate-preview-06-06": {
"description": "Serie de modelos de generación de imágenes de texto a imagen de cuarta generación de Imagen."
},
"imagen-4.0-ultra-generate-001": {
"description": "Imagen, serie de modelos de texto a imagen de cuarta generación, versión Ultra"
},
"imagen-4.0-ultra-generate-preview-06-06": {
"description": "Versión Ultra de la serie de modelos de generación de imágenes de texto a imagen de cuarta generación de Imagen."
},
"inception/mercury-coder-small": {
"description": "Mercury Coder Small es la opción ideal para tareas de generación, depuración y refactorización de código, con latencia mínima."
},
"inclusionAI/Ling-flash-2.0": {
"description": "Ling-flash-2.0 es el tercer modelo de la serie Ling 2.0 basado en la arquitectura MoE, lanzado por el equipo Bailing de Ant Group. Cuenta con 100 mil millones de parámetros totales, pero solo activa 6.1 mil millones por token (4.8 mil millones sin incluir embeddings). Como un modelo de configuración ligera, Ling-flash-2.0 demuestra en múltiples evaluaciones oficiales un rendimiento comparable o superior a modelos densos de 40 mil millones y a modelos MoE de mayor escala. Este modelo busca explorar caminos eficientes bajo el consenso de que un modelo grande equivale a muchos parámetros, mediante un diseño arquitectónico y estrategias de entrenamiento extremas."
},
"inclusionAI/Ling-mini-2.0": {
"description": "Ling-mini-2.0 es un modelo de lenguaje grande de alto rendimiento y tamaño reducido basado en arquitectura MoE. Cuenta con 16 mil millones de parámetros totales, pero solo activa 1.4 mil millones por token (789 millones sin incluir embeddings), logrando una velocidad de generación muy alta. Gracias a un diseño MoE eficiente y a un entrenamiento masivo con datos de alta calidad, Ling-mini-2.0 ofrece un rendimiento de primer nivel en tareas downstream, comparable a modelos densos de menos de 10 mil millones y a modelos MoE de mayor escala."
},
"inclusionAI/Ring-flash-2.0": {
"description": "Ring-flash-2.0 es un modelo de pensamiento de alto rendimiento profundamente optimizado basado en Ling-flash-2.0-base. Utiliza arquitectura MoE con 100 mil millones de parámetros totales, pero solo activa 6.1 mil millones en cada inferencia. Gracias al algoritmo innovador icepop, resuelve la inestabilidad de los grandes modelos MoE en entrenamiento por refuerzo (RL), mejorando continuamente su capacidad de razonamiento complejo en entrenamientos prolongados. Ring-flash-2.0 ha logrado avances significativos en competencias matemáticas, generación de código y razonamiento lógico, superando modelos densos de hasta 40 mil millones de parámetros y equiparándose a modelos MoE de mayor escala y modelos de pensamiento de alto rendimiento cerrados. Aunque está enfocado en razonamiento complejo, también destaca en tareas creativas de escritura. Además, su diseño eficiente permite un rendimiento rápido y reduce significativamente los costos de despliegue en escenarios de alta concurrencia."
},
"inclusionai/ling-1t": {
"description": "Ling-1T es el modelo MoE de 1T de inclusionAI, optimizado para tareas de razonamiento intensivo y contexto a gran escala."
},
"inclusionai/ling-flash-2.0": {
"description": "Ling-flash-2.0 es un modelo MoE de inclusionAI, optimizado en eficiencia y rendimiento de razonamiento, adecuado para tareas medianas y grandes."
},
"inclusionai/ling-mini-2.0": {
"description": "Ling-mini-2.0 es un modelo MoE ligero de inclusionAI, que reduce significativamente los costes manteniendo la capacidad de razonamiento."
},
"inclusionai/ming-flash-omini-preview": {
"description": "Ming-flash-omni Preview es un modelo multimodal de inclusionAI, compatible con entradas de voz, imagen y vídeo, optimizado para renderizado de imágenes y reconocimiento de voz."
},
"inclusionai/ring-1t": {
"description": "Ring-1T es el modelo MoE de un billón de parámetros de inclusionAI, diseñado para razonamiento a gran escala y tareas de investigación."
},
"inclusionai/ring-flash-2.0": {
"description": "Ring-flash-2.0 es una variante del modelo Ring de inclusionAI para escenarios de alto rendimiento, centrado en velocidad y eficiencia de costes."
},
"inclusionai/ring-mini-2.0": {
"description": "Ring-mini-2.0 es la versión ligera de alto rendimiento del modelo MoE de inclusionAI, diseñada principalmente para escenarios concurrentes."
},
"internlm/internlm2_5-7b-chat": {
"description": "InternLM2.5 ofrece soluciones de diálogo inteligente en múltiples escenarios."
},
"internlm2.5-latest": {
"description": "Nuestra última serie de modelos, con un rendimiento de inferencia excepcional, que admite una longitud de contexto de 1M y una mayor capacidad de seguimiento de instrucciones y llamadas a herramientas."
},
"internlm3-latest": {
"description": "Nuestra última serie de modelos, con un rendimiento de inferencia excepcional, lidera el mercado de modelos de código abierto de tamaño similar. Apunta por defecto a nuestra serie de modelos InternLM3 más reciente."
},
"internvl2.5-38b-mpo": {
"description": "InternVL2.5 38B MPO, modelo multimodal preentrenado, compatible con tareas complejas de inferencia de imágenes y texto."
},
"internvl2.5-latest": {
"description": "La versión InternVL2.5 que seguimos manteniendo, que ofrece un rendimiento excelente y estable. Por defecto, apunta a nuestra serie de modelos InternVL2.5 más reciente, actualmente apuntando a internvl2.5-78b."
},
"internvl3-14b": {
"description": "InternVL3 14B, modelo multimodal de tamaño medio, equilibrando rendimiento y coste."
},
"internvl3-1b": {
"description": "InternVL3 1B, modelo multimodal ligero, ideal para despliegue en entornos con recursos limitados."
},
"internvl3-38b": {
"description": "InternVL3 38B, modelo multimodal de código abierto a gran escala, ideal para tareas de comprensión de imágenes y texto de alta precisión."
},
"internvl3-latest": {
"description": "Nuestro modelo multimodal más reciente, que posee una mayor capacidad de comprensión de texto e imagen, así como una comprensión de imágenes a largo plazo, con un rendimiento comparable a los mejores modelos cerrados. Por defecto, apunta a nuestra serie de modelos InternVL más reciente, actualmente apuntando a internvl3-78b."
},
"irag-1.0": {
"description": "ERNIE iRAG, modelo de generación mejorada por recuperación de imágenes, compatible con búsqueda por imagen, recuperación de imágenes y texto, y generación de contenido."
},
"jamba-large": {
"description": "Nuestro modelo más potente y avanzado, diseñado para manejar tareas complejas a nivel empresarial, con un rendimiento excepcional."
},
"jamba-mini": {
"description": "El modelo más eficiente de su categoría, que combina velocidad y calidad, con un tamaño más pequeño."
},
"jina-deepsearch-v1": {
"description": "La búsqueda profunda combina la búsqueda en la web, la lectura y el razonamiento para realizar investigaciones exhaustivas. Puedes considerarlo como un agente que acepta tus tareas de investigación: realiza una búsqueda amplia y pasa por múltiples iteraciones antes de proporcionar una respuesta. Este proceso implica una investigación continua, razonamiento y resolución de problemas desde diferentes ángulos. Esto es fundamentalmente diferente de los grandes modelos estándar que generan respuestas directamente a partir de datos preentrenados y de los sistemas RAG tradicionales que dependen de búsquedas superficiales únicas."
},
"kimi-k2": {
"description": "Kimi-K2 es un modelo base con arquitectura MoE lanzado por Moonshot AI, con capacidades avanzadas de codificación y agentes, totalizando 1 billón de parámetros y 32 mil millones de parámetros activados. En pruebas de referencia en categorías principales como razonamiento general, programación, matemáticas y agentes, el rendimiento del modelo K2 supera a otros modelos de código abierto populares."
},
"kimi-k2-0711-preview": {
"description": "kimi-k2 es un modelo base con arquitectura MoE que posee capacidades excepcionales en código y agentes, con un total de 1T parámetros y 32B parámetros activados. En pruebas de rendimiento en categorías principales como razonamiento general, programación, matemáticas y agentes, el modelo K2 supera a otros modelos de código abierto populares."
},
"kimi-k2-0905-preview": {
"description": "El modelo kimi-k2-0905-preview tiene una longitud de contexto de 256k, con una mayor capacidad de codificación agentiva, una estética y funcionalidad mejoradas en el código frontend, y una mejor comprensión del contexto."
},
"kimi-k2-instruct": {
"description": "Kimi K2 Instruct, modelo de inferencia oficial de Kimi, compatible con contexto largo, código, preguntas y respuestas, entre otros escenarios."
},
"kimi-k2-thinking": {
"description": "El modelo kimi-k2-thinking, proporcionado por Moonshot AI, es un modelo de pensamiento con capacidades generales de agente y razonamiento. Se destaca en el razonamiento profundo y puede utilizar herramientas en múltiples pasos para ayudar a resolver diversos problemas complejos."
},
"kimi-k2-thinking-turbo": {
"description": "Versión rápida del modelo de pensamiento K2, compatible con contexto de 256k, especializado en razonamiento profundo, con velocidad de salida de 60-100 tokens por segundo."
},
"kimi-k2-turbo-preview": {
"description": "kimi-k2 es un modelo base con arquitectura MoE que ofrece potentes capacidades para código y agentes, con 1T parámetros totales y 32B parámetros activados. En las pruebas de referencia en categorías principales como razonamiento de conocimiento general, programación, matemáticas y agentes, el rendimiento del modelo K2 supera al de otros modelos de código abierto más extendidos."
},
"kimi-k2:1t": {
"description": "Kimi K2 es un modelo de lenguaje de expertos mixtos a gran escala (MoE) desarrollado por la IA del lado oscuro de la luna, con un total de un billón de parámetros y 32 mil millones de parámetros activados por cada pasada hacia adelante. Está optimizado para capacidades de agente, incluyendo el uso avanzado de herramientas, razonamiento y síntesis de código."
},
"kimi-latest": {
"description": "El producto asistente inteligente Kimi utiliza el último modelo grande de Kimi, que puede incluir características que aún no están estables. Soporta la comprensión de imágenes y seleccionará automáticamente el modelo de facturación de 8k/32k/128k según la longitud del contexto de la solicitud."
},
"kuaishou/kat-coder-pro-v1": {
"description": "KAT-Coder-Pro-V1 (gratis por tiempo limitado) se centra en la comprensión de código y programación automatizada, ideal para tareas de agente de programación eficiente."
},
"learnlm-1.5-pro-experimental": {
"description": "LearnLM es un modelo de lenguaje experimental y específico para tareas, entrenado para cumplir con los principios de la ciencia del aprendizaje, capaz de seguir instrucciones sistemáticas en escenarios de enseñanza y aprendizaje, actuando como un tutor experto, entre otros."
},
"learnlm-2.0-flash-experimental": {
"description": "LearnLM es un modelo de lenguaje experimental y específico para tareas, entrenado para cumplir con los principios de la ciencia del aprendizaje, capaz de seguir instrucciones sistemáticas en escenarios de enseñanza y aprendizaje, actuando como un tutor experto, entre otros."
},
"lite": {
"description": "Spark Lite es un modelo de lenguaje grande y ligero, con una latencia extremadamente baja y una capacidad de procesamiento eficiente, completamente gratuito y de código abierto, que admite funciones de búsqueda en línea en tiempo real. Su característica de respuesta rápida lo hace destacar en aplicaciones de inferencia y ajuste de modelos en dispositivos de baja potencia, brindando a los usuarios una excelente relación costo-beneficio y experiencia inteligente, especialmente en escenarios de preguntas y respuestas, generación de contenido y búsqueda."
},
"llama-3.1-70b-versatile": {
"description": "Llama 3.1 70B ofrece una capacidad de razonamiento AI más potente, adecuada para aplicaciones complejas, soportando un procesamiento computacional extenso y garantizando eficiencia y precisión."
},
"llama-3.1-8b-instant": {
"description": "Llama 3.1 8B es un modelo de alto rendimiento que ofrece una rápida capacidad de generación de texto, ideal para aplicaciones que requieren eficiencia a gran escala y rentabilidad."
},
"llama-3.1-instruct": {
"description": "El modelo Llama 3.1 ajustado para instrucciones está optimizado para escenarios de conversación, superando a muchos modelos de chat de código abierto existentes en pruebas de referencia comunes de la industria."
},
"llama-3.2-11b-vision-instruct": {
"description": "Capacidad excepcional de razonamiento visual en imágenes de alta resolución, adecuada para aplicaciones de comprensión visual."
},
"llama-3.2-11b-vision-preview": {
"description": "Llama 3.2 está diseñado para manejar tareas que combinan datos visuales y textuales. Destaca en tareas como la descripción de imágenes y preguntas visuales, cruzando la brecha entre la generación de lenguaje y el razonamiento visual."
},
"llama-3.2-90b-vision-instruct": {
"description": "Capacidad avanzada de razonamiento de imágenes para aplicaciones de agentes de comprensión visual."
},
"llama-3.2-90b-vision-preview": {
"description": "Llama 3.2 está diseñado para manejar tareas que combinan datos visuales y textuales. Destaca en tareas como la descripción de imágenes y preguntas visuales, cruzando la brecha entre la generación de lenguaje y el razonamiento visual."
},
"llama-3.2-vision-instruct": {
"description": "El modelo Llama 3.2-Vision con ajuste fino de instrucciones está optimizado para reconocimiento visual, razonamiento sobre imágenes, descripción de imágenes y respuesta a preguntas generales relacionadas con imágenes."
},
"llama-3.3-70b": {
"description": "Llama 3.3 70B: un modelo Llama de tamaño medio-grande que equilibra capacidad de razonamiento y rendimiento."
},
"llama-3.3-70b-versatile": {
"description": "El modelo de lenguaje multilingüe Meta Llama 3.3 (LLM) es un modelo generativo preentrenado y ajustado para instrucciones de 70B (entrada/salida de texto). El modelo de texto puro ajustado para instrucciones de Llama 3.3 está optimizado para casos de uso de conversación multilingüe y supera a muchos modelos de chat de código abierto y cerrado en benchmarks industriales comunes."
},
"llama-3.3-instruct": {
"description": "El modelo de instrucción Llama 3.3, optimizado para escenarios de diálogo, supera a muchos modelos de chat de código abierto existentes en pruebas de referencia comunes de la industria."
},
"llama3-70b-8192": {
"description": "Meta Llama 3 70B proporciona una capacidad de procesamiento de complejidad inigualable, diseñado a medida para proyectos de alta demanda."
},
"llama3-8b-8192": {
"description": "Meta Llama 3 8B ofrece un rendimiento de razonamiento de alta calidad, adecuado para diversas necesidades de aplicación."
},
"llama3-groq-70b-8192-tool-use-preview": {
"description": "Llama 3 Groq 70B Tool Use ofrece una potente capacidad de invocación de herramientas, apoyando el procesamiento eficiente de tareas complejas."
},
"llama3-groq-8b-8192-tool-use-preview": {
"description": "Llama 3 Groq 8B Tool Use es un modelo optimizado para el uso eficiente de herramientas, que admite cálculos paralelos rápidos."
},
"llama3.1": {
"description": "Llama 3.1 es el modelo líder lanzado por Meta, que admite hasta 405B de parámetros, aplicable en diálogos complejos, traducción multilingüe y análisis de datos."
},
"llama3.1-8b": {
"description": "Llama 3.1 8B: una variante ligera y de baja latencia de Llama, adecuada para inferencia en línea y escenarios interactivos de bajo consumo."
},
"llama3.1:405b": {
"description": "Llama 3.1 es el modelo líder lanzado por Meta, que admite hasta 405B de parámetros, aplicable en diálogos complejos, traducción multilingüe y análisis de datos."
},
"llama3.1:70b": {
"description": "Llama 3.1 es el modelo líder lanzado por Meta, que admite hasta 405B de parámetros, aplicable en diálogos complejos, traducción multilingüe y análisis de datos."
},
"llava": {
"description": "LLaVA es un modelo multimodal que combina un codificador visual y Vicuna, utilizado para una poderosa comprensión visual y lingüística."
},
"llava-v1.5-7b-4096-preview": {
"description": "LLaVA 1.5 7B proporciona capacidades de procesamiento visual integradas, generando salidas complejas a partir de entradas de información visual."
},
"llava:13b": {
"description": "LLaVA es un modelo multimodal que combina un codificador visual y Vicuna, utilizado para una poderosa comprensión visual y lingüística."
},
"llava:34b": {
"description": "LLaVA es un modelo multimodal que combina un codificador visual y Vicuna, utilizado para una poderosa comprensión visual y lingüística."
},
"magistral-medium-latest": {
"description": "Magistral Medium 1.2 es un modelo de inferencia de vanguardia con soporte visual, lanzado por Mistral AI en septiembre de 2025."
},
"magistral-small-2509": {
"description": "Magistral Small 1.2 es un modelo de inferencia pequeño y de código abierto con soporte visual, lanzado por Mistral AI en septiembre de 2025."
},
"mathstral": {
"description": "MathΣtral está diseñado para la investigación científica y el razonamiento matemático, proporcionando capacidades de cálculo efectivas y explicación de resultados."
},
"max-32k": {
"description": "Spark Max 32K está equipado con una capacidad de procesamiento de contexto grande, con una comprensión contextual más fuerte y habilidades de razonamiento lógico, soportando entradas de texto de 32K tokens, adecuado para la lectura de documentos largos, preguntas y respuestas de conocimiento privado y otros escenarios."
},
"megrez-3b-instruct": {
"description": "Megrez 3B Instruct es un modelo eficiente de bajo número de parámetros desarrollado por Wuwen Xinqiong."
},
"meituan/longcat-flash-chat": {
"description": "Modelo base no reflexivo de código abierto de Meituan, optimizado para interacciones conversacionales y tareas de agentes inteligentes, con un rendimiento destacado en llamadas a herramientas y escenarios complejos de múltiples turnos."
},
"meta-llama-3-70b-instruct": {
"description": "Un poderoso modelo de 70 mil millones de parámetros que sobresale en razonamiento, codificación y amplias aplicaciones de lenguaje."
},
"meta-llama-3-8b-instruct": {
"description": "Un modelo versátil de 8 mil millones de parámetros optimizado para tareas de diálogo y generación de texto."
},
"meta-llama-3.1-405b-instruct": {
"description": "Los modelos de texto solo ajustados por instrucciones Llama 3.1 están optimizados para casos de uso de diálogo multilingüe y superan muchos de los modelos de chat de código abierto y cerrados disponibles en los benchmarks de la industria."
},
"meta-llama-3.1-70b-instruct": {
"description": "Los modelos de texto solo ajustados por instrucciones Llama 3.1 están optimizados para casos de uso de diálogo multilingüe y superan muchos de los modelos de chat de código abierto y cerrados disponibles en los benchmarks de la industria."
},
"meta-llama-3.1-8b-instruct": {
"description": "Los modelos de texto solo ajustados por instrucciones Llama 3.1 están optimizados para casos de uso de diálogo multilingüe y superan muchos de los modelos de chat de código abierto y cerrados disponibles en los benchmarks de la industria."
},
"meta-llama/Llama-2-13b-chat-hf": {
"description": "LLaMA-2 Chat (13B) ofrece una excelente capacidad de procesamiento de lenguaje y una experiencia de interacción sobresaliente."
},
"meta-llama/Llama-2-70b-hf": {
"description": "LLaMA-2 ofrece excelentes capacidades de procesamiento del lenguaje y una experiencia de interacción excepcional."
},
"meta-llama/Llama-3-70b-chat-hf": {
"description": "LLaMA-3 Chat (70B) es un modelo de chat potente, que soporta necesidades de conversación complejas."
},
"meta-llama/Llama-3-8b-chat-hf": {
"description": "LLaMA-3 Chat (8B) ofrece soporte multilingüe, abarcando un amplio conocimiento en diversos campos."
},
"meta-llama/Llama-3.2-11B-Vision-Instruct-Turbo": {
"description": "LLaMA 3.2 está diseñado para manejar tareas que combinan datos visuales y textuales. Se destaca en tareas como descripción de imágenes y preguntas visuales, cruzando la brecha entre la generación de lenguaje y el razonamiento visual."
},
"meta-llama/Llama-3.2-3B-Instruct-Turbo": {
"description": "LLaMA 3.2 está diseñado para manejar tareas que combinan datos visuales y textuales. Se destaca en tareas como descripción de imágenes y preguntas visuales, cruzando la brecha entre la generación de lenguaje y el razonamiento visual."
},
"meta-llama/Llama-3.2-90B-Vision-Instruct-Turbo": {
"description": "LLaMA 3.2 está diseñado para manejar tareas que combinan datos visuales y textuales. Se destaca en tareas como descripción de imágenes y preguntas visuales, cruzando la brecha entre la generación de lenguaje y el razonamiento visual."
},
"meta-llama/Llama-3.3-70B-Instruct-Turbo": {
"description": "El modelo de lenguaje grande multilingüe Meta Llama 3.3 (LLM) es un modelo generativo preentrenado y ajustado por instrucciones de 70B (entrada de texto/salida de texto). El modelo de texto puro ajustado por instrucciones de Llama 3.3 está optimizado para casos de uso de diálogo multilingüe y supera a muchos modelos de chat de código abierto y cerrados en benchmarks de la industria."
},
"meta-llama/Llama-Vision-Free": {
"description": "LLaMA 3.2 está diseñado para manejar tareas que combinan datos visuales y textuales. Se destaca en tareas como descripción de imágenes y preguntas visuales, cruzando la brecha entre la generación de lenguaje y el razonamiento visual."
},
"meta-llama/Meta-Llama-3-70B-Instruct-Lite": {
"description": "Llama 3 70B Instruct Lite es ideal para entornos que requieren alto rendimiento y baja latencia."
},
"meta-llama/Meta-Llama-3-70B-Instruct-Turbo": {
"description": "Llama 3 70B Instruct Turbo ofrece una capacidad excepcional de comprensión y generación de lenguaje, ideal para las tareas de cálculo más exigentes."
},
"meta-llama/Meta-Llama-3-8B-Instruct-Lite": {
"description": "Llama 3 8B Instruct Lite es adecuado para entornos con recursos limitados, ofreciendo un excelente equilibrio de rendimiento."
},
"meta-llama/Meta-Llama-3-8B-Instruct-Turbo": {
"description": "Llama 3 8B Instruct Turbo es un modelo de lenguaje de alto rendimiento, adecuado para una amplia gama de escenarios de aplicación."
},
"meta-llama/Meta-Llama-3.1-405B-Instruct": {
"description": "LLaMA 3.1 405B es un potente modelo de preentrenamiento y ajuste de instrucciones."
},
"meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo": {
"description": "El modelo Llama 3.1 Turbo de 405B proporciona un soporte de contexto de gran capacidad para el procesamiento de grandes datos, destacándose en aplicaciones de inteligencia artificial a gran escala."
},
"meta-llama/Meta-Llama-3.1-70B": {
"description": "Llama 3.1 es el modelo líder lanzado por Meta, que soporta hasta 405B de parámetros, aplicable en diálogos complejos, traducción multilingüe y análisis de datos."
},
"meta-llama/Meta-Llama-3.1-70B-Instruct-Turbo": {
"description": "El modelo Llama 3.1 70B está finamente ajustado para aplicaciones de alta carga, cuantificado a FP8 para ofrecer una capacidad de cálculo y precisión más eficientes, asegurando un rendimiento excepcional en escenarios complejos."
},
"meta-llama/Meta-Llama-3.1-8B-Instruct-Turbo": {
"description": "El modelo Llama 3.1 8B utiliza cuantificación FP8, soportando hasta 131,072 tokens de contexto, destacándose entre los modelos de código abierto, ideal para tareas complejas y superando muchos estándares de la industria."
},
"meta-llama/llama-3-70b-instruct": {
"description": "Llama 3 70B Instruct está optimizado para escenarios de conversación de alta calidad, destacándose en diversas evaluaciones humanas."
},
"meta-llama/llama-3-8b-instruct": {
"description": "Llama 3 8B Instruct optimiza los escenarios de conversación de alta calidad, con un rendimiento superior a muchos modelos cerrados."
},
"meta-llama/llama-3.1-70b-instruct": {
"description": "Llama 3.1 70B Instruct está diseñado para conversaciones de alta calidad, destacándose en evaluaciones humanas, especialmente en escenarios de alta interacción."
},
"meta-llama/llama-3.1-8b-instruct": {
"description": "Llama 3.1 8B Instruct es la última versión lanzada por Meta, optimizada para escenarios de conversación de alta calidad, superando a muchos modelos cerrados líderes."
},
"meta-llama/llama-3.1-8b-instruct:free": {
"description": "LLaMA 3.1 ofrece soporte multilingüe y es uno de los modelos generativos más avanzados de la industria."
},
"meta-llama/llama-3.2-11b-vision-instruct": {
"description": "LLaMA 3.2 está diseñado para manejar tareas que combinan datos visuales y textuales. Destaca en tareas como la descripción de imágenes y preguntas visuales, superando la brecha entre la generación de lenguaje y el razonamiento visual."
},
"meta-llama/llama-3.2-3b-instruct": {
"description": "meta-llama/llama-3.2-3b-instruct"
},
"meta-llama/llama-3.2-90b-vision-instruct": {
"description": "LLaMA 3.2 está diseñado para manejar tareas que combinan datos visuales y textuales. Destaca en tareas como la descripción de imágenes y preguntas visuales, superando la brecha entre la generación de lenguaje y el razonamiento visual."
},
"meta-llama/llama-3.3-70b-instruct": {
"description": "Llama 3.3 es el modelo de lenguaje de código abierto multilingüe más avanzado de la serie Llama, que ofrece un rendimiento comparable al modelo de 405B a un costo extremadamente bajo. Basado en la estructura Transformer, y mejorado en utilidad y seguridad a través de ajuste fino supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF). Su versión ajustada para instrucciones está optimizada para diálogos multilingües, superando a muchos modelos de chat de código abierto y cerrado en múltiples benchmarks de la industria. La fecha límite de conocimiento es diciembre de 2023."
},
"meta-llama/llama-3.3-70b-instruct:free": {
"description": "Llama 3.3 es el modelo de lenguaje de código abierto multilingüe más avanzado de la serie Llama, que ofrece un rendimiento comparable al modelo de 405B a un costo extremadamente bajo. Basado en la estructura Transformer, y mejorado en utilidad y seguridad a través de ajuste fino supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF). Su versión ajustada para instrucciones está optimizada para diálogos multilingües, superando a muchos modelos de chat de código abierto y cerrado en múltiples benchmarks de la industria. La fecha límite de conocimiento es diciembre de 2023."
},
"meta.llama3-1-405b-instruct-v1:0": {
"description": "Meta Llama 3.1 405B Instruct es el modelo más grande y potente de la serie Llama 3.1 Instruct, un modelo de generación de datos de diálogo y razonamiento altamente avanzado, que también puede servir como base para un preentrenamiento o ajuste fino especializado en dominios específicos. Los modelos de lenguaje de gran tamaño (LLMs) multilingües que ofrece Llama 3.1 son un conjunto de modelos generativos preentrenados y ajustados por instrucciones, que incluyen tamaños de 8B, 70B y 405B (entrada/salida de texto). Los modelos de texto ajustados por instrucciones de Llama 3.1 (8B, 70B, 405B) están optimizados para casos de uso de diálogo multilingüe y superan a muchos modelos de chat de código abierto disponibles en pruebas de referencia de la industria. Llama 3.1 está diseñado para usos comerciales y de investigación en múltiples idiomas. Los modelos de texto ajustados por instrucciones son adecuados para chats similares a asistentes, mientras que los modelos preentrenados pueden adaptarse a diversas tareas de generación de lenguaje natural. El modelo Llama 3.1 también admite el uso de su salida para mejorar otros modelos, incluida la generación de datos sintéticos y el refinamiento. Llama 3.1 es un modelo de lenguaje autorregresivo que utiliza una arquitectura de transformador optimizada. Las versiones ajustadas utilizan ajuste fino supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF) para alinearse con las preferencias humanas de ayuda y seguridad."
},
"meta.llama3-1-70b-instruct-v1:0": {
"description": "La versión actualizada de Meta Llama 3.1 70B Instruct incluye una longitud de contexto ampliada de 128K, multilingüismo y capacidades de razonamiento mejoradas. Los modelos de lenguaje a gran escala (LLMs) de Llama 3.1 son un conjunto de modelos generativos preentrenados y ajustados por instrucciones, que incluyen tamaños de 8B, 70B y 405B (entrada/salida de texto). Los modelos de texto ajustados por instrucciones de Llama 3.1 (8B, 70B, 405B) están optimizados para casos de uso de diálogo multilingüe y superan muchos modelos de chat de código abierto disponibles en pruebas de referencia de la industria comunes. Llama 3.1 está diseñado para usos comerciales y de investigación en múltiples idiomas. Los modelos de texto ajustados por instrucciones son adecuados para chats similares a asistentes, mientras que los modelos preentrenados pueden adaptarse a diversas tareas de generación de lenguaje natural. El modelo Llama 3.1 también admite el uso de su salida de modelo para mejorar otros modelos, incluyendo la generación de datos sintéticos y refinamiento. Llama 3.1 es un modelo de lenguaje autoregresivo utilizando una arquitectura de transformador optimizada. La versión ajustada utiliza ajuste fino supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF) para alinearse con las preferencias humanas de utilidad y seguridad."
},
"meta.llama3-1-8b-instruct-v1:0": {
"description": "La versión actualizada de Meta Llama 3.1 8B Instruct incluye una longitud de contexto ampliada de 128K, multilingüismo y capacidades de razonamiento mejoradas. Los modelos de lenguaje a gran escala (LLMs) de Llama 3.1 son un conjunto de modelos generativos preentrenados y ajustados por instrucciones, que incluyen tamaños de 8B, 70B y 405B (entrada/salida de texto). Los modelos de texto ajustados por instrucciones de Llama 3.1 (8B, 70B, 405B) están optimizados para casos de uso de diálogo multilingüe y superan muchos modelos de chat de código abierto disponibles en pruebas de referencia de la industria comunes. Llama 3.1 está diseñado para usos comerciales y de investigación en múltiples idiomas. Los modelos de texto ajustados por instrucciones son adecuados para chats similares a asistentes, mientras que los modelos preentrenados pueden adaptarse a diversas tareas de generación de lenguaje natural. El modelo Llama 3.1 también admite el uso de su salida de modelo para mejorar otros modelos, incluyendo la generación de datos sintéticos y refinamiento. Llama 3.1 es un modelo de lenguaje autoregresivo utilizando una arquitectura de transformador optimizada. La versión ajustada utiliza ajuste fino supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF) para alinearse con las preferencias humanas de utilidad y seguridad."
},
"meta.llama3-70b-instruct-v1:0": {
"description": "Meta Llama 3 es un modelo de lenguaje de gran tamaño (LLM) abierto dirigido a desarrolladores, investigadores y empresas, diseñado para ayudarles a construir, experimentar y escalar de manera responsable sus ideas de IA generativa. Como parte de un sistema base para la innovación de la comunidad global, es ideal para la creación de contenido, IA de diálogo, comprensión del lenguaje, I+D y aplicaciones empresariales."
},
"meta.llama3-8b-instruct-v1:0": {
"description": "Meta Llama 3 es un modelo de lenguaje de gran tamaño (LLM) abierto dirigido a desarrolladores, investigadores y empresas, diseñado para ayudarles a construir, experimentar y escalar de manera responsable sus ideas de IA generativa. Como parte de un sistema base para la innovación de la comunidad global, es ideal para dispositivos de borde con recursos y capacidades computacionales limitadas, así como para tiempos de entrenamiento más rápidos."
},
"meta/Llama-3.2-11B-Vision-Instruct": {
"description": "Destaca en razonamiento de imágenes de alta resolución, ideal para aplicaciones de comprensión visual."
},
"meta/Llama-3.2-90B-Vision-Instruct": {
"description": "Capacidades avanzadas de razonamiento de imágenes para aplicaciones de agentes de comprensión visual."
},
"meta/Llama-3.3-70B-Instruct": {
"description": "Llama 3.3 es el modelo de lenguaje grande multilingüe de código abierto más avanzado de la serie Llama, que ofrece un rendimiento comparable a modelos de 405 mil millones de parámetros a un costo muy bajo. Basado en la arquitectura Transformer, mejorado mediante ajuste fino supervisado (SFT) y aprendizaje por refuerzo con retroalimentación humana (RLHF) para mejorar su utilidad y seguridad. Su versión ajustada por instrucciones está optimizada para diálogos multilingües y supera a muchos modelos de chat abiertos y cerrados en varios puntos de referencia industriales. Fecha de corte de conocimiento: diciembre de 2023."
},
"meta/Meta-Llama-3-70B-Instruct": {
"description": "Un potente modelo de 70 mil millones de parámetros, que destaca en razonamiento, codificación y aplicaciones lingüísticas amplias."
},
"meta/Meta-Llama-3-8B-Instruct": {
"description": "Un modelo versátil de 8 mil millones de parámetros, optimizado para tareas de diálogo y generación de texto."
},
"meta/Meta-Llama-3.1-405B-Instruct": {
"description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para casos de uso de diálogo multilingüe, con un rendimiento destacado en muchos modelos de chat abiertos y cerrados disponibles y en puntos de referencia industriales comunes."
},
"meta/Meta-Llama-3.1-70B-Instruct": {
"description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para casos de uso de diálogo multilingüe, con un rendimiento destacado en muchos modelos de chat abiertos y cerrados disponibles y en puntos de referencia industriales comunes."
},
"meta/Meta-Llama-3.1-8B-Instruct": {
"description": "Modelo de texto ajustado por instrucciones Llama 3.1, optimizado para casos de uso de diálogo multilingüe, con un rendimiento destacado en muchos modelos de chat abiertos y cerrados disponibles y en puntos de referencia industriales comunes."
},
"meta/llama-3-70b": {
"description": "Modelo de código abierto de 70 mil millones de parámetros ajustado cuidadosamente por Meta para cumplimiento de instrucciones. Operado por Groq con su hardware personalizado de unidad de procesamiento de lenguaje (LPU) para ofrecer inferencia rápida y eficiente."
},
"meta/llama-3-8b": {
"description": "Modelo de código abierto de 8 mil millones de parámetros ajustado cuidadosamente por Meta para cumplimiento de instrucciones. Operado por Groq con su hardware personalizado de unidad de procesamiento de lenguaje (LPU) para ofrecer inferencia rápida y eficiente."
},
"meta/llama-3.1-405b-instruct": {
"description": "LLM avanzado, que soporta generación de datos sintéticos, destilación de conocimiento y razonamiento, adecuado para chatbots, programación y tareas de dominio específico."
},
"meta/llama-3.1-70b": {
"description": "Versión actualizada de Meta Llama 3 70B Instruct, que incluye una longitud de contexto extendida de 128K, soporte multilingüe y capacidades de razonamiento mejoradas."
},
"meta/llama-3.1-70b-instruct": {
"description": "Potencia diálogos complejos, con excelente comprensión del contexto, capacidad de razonamiento y generación de texto."
},
"meta/llama-3.1-8b": {
"description": "Llama 3.1 8B soporta una ventana de contexto de 128K, lo que lo hace ideal para interfaces de conversación en tiempo real y análisis de datos, ofreciendo un ahorro de costos significativo en comparación con modelos más grandes. Operado por Groq con su hardware personalizado de unidad de procesamiento de lenguaje (LPU) para ofrecer inferencia rápida y eficiente."
},
"meta/llama-3.1-8b-instruct": {
"description": "Modelo de última generación avanzado, con comprensión del lenguaje, excelente capacidad de razonamiento y generación de texto."
},
"meta/llama-3.2-11b": {
"description": "Modelo de generación de razonamiento visual ajustado por instrucciones (entrada de texto + imagen / salida de texto), optimizado para reconocimiento visual, razonamiento de imágenes, generación de títulos y respuestas a preguntas generales sobre imágenes."
},
"meta/llama-3.2-11b-vision-instruct": {
"description": "Modelo de visión-lenguaje de vanguardia, experto en razonamiento de alta calidad a partir de imágenes."
},
"meta/llama-3.2-1b": {
"description": "Modelo solo de texto, compatible con casos de uso en dispositivos, como recuperación de conocimiento local multilingüe, resumen y reescritura."
},
"meta/llama-3.2-1b-instruct": {
"description": "Modelo de lenguaje pequeño de última generación, con comprensión del lenguaje, excelente capacidad de razonamiento y generación de texto."
},
"meta/llama-3.2-3b": {
"description": "Modelo solo de texto, ajustado cuidadosamente para soportar casos de uso en dispositivos, como recuperación de conocimiento local multilingüe, resumen y reescritura."
},
"meta/llama-3.2-3b-instruct": {
"description": "Modelo de lenguaje pequeño de última generación, con comprensión del lenguaje, excelente capacidad de razonamiento y generación de texto."
},
"meta/llama-3.2-90b": {
"description": "Modelo de generación de razonamiento visual ajustado por instrucciones (entrada de texto + imagen / salida de texto), optimizado para reconocimiento visual, razonamiento de imágenes, generación de títulos y respuestas a preguntas generales sobre imágenes."
},
"meta/llama-3.2-90b-vision-instruct": {
"description": "Modelo de visión-lenguaje de vanguardia, experto en razonamiento de alta calidad a partir de imágenes."
},
"meta/llama-3.3-70b": {
"description": "Combinación perfecta de rendimiento y eficiencia. Este modelo soporta IA conversacional de alto rendimiento, diseñado para creación de contenido, aplicaciones empresariales e investigación, ofreciendo capacidades avanzadas de comprensión del lenguaje, incluyendo resumen de texto, clasificación, análisis de sentimientos y generación de código."
},
"meta/llama-3.3-70b-instruct": {
"description": "Modelo LLM avanzado, experto en razonamiento, matemáticas, sentido común y llamadas a funciones."
},
"meta/llama-4-maverick": {
"description": "La colección de modelos Llama 4 es una IA multimodal nativa que soporta experiencias de texto y multimodales. Estos modelos utilizan una arquitectura de expertos mixtos para ofrecer un rendimiento líder en la industria en comprensión de texto e imágenes. Llama 4 Maverick, un modelo de 17 mil millones de parámetros con 128 expertos. Proporcionado por DeepInfra."
},
"meta/llama-4-scout": {
"description": "La colección de modelos Llama 4 es una IA multimodal nativa que soporta experiencias de texto y multimodales. Estos modelos utilizan una arquitectura de expertos mixtos para ofrecer un rendimiento líder en la industria en comprensión de texto e imágenes. Llama 4 Scout, un modelo de 17 mil millones de parámetros con 16 expertos. Proporcionado por DeepInfra."
},
"microsoft/Phi-3-medium-128k-instruct": {
"description": "El mismo modelo Phi-3-medium, pero con un tamaño de contexto mayor, adecuado para RAG o indicaciones breves."
},
"microsoft/Phi-3-medium-4k-instruct": {
"description": "Un modelo de 14 mil millones de parámetros, con mejor calidad que Phi-3-mini, enfocado en datos de alta calidad y razonamiento intensivo."
},
"microsoft/Phi-3-mini-128k-instruct": {
"description": "El mismo modelo Phi-3-mini, pero con un tamaño de contexto mayor, adecuado para RAG o indicaciones breves."
},
"microsoft/Phi-3-mini-4k-instruct": {
"description": "El miembro más pequeño de la familia Phi-3, optimizado para calidad y baja latencia."
},
"microsoft/Phi-3-small-128k-instruct": {
"description": "El mismo modelo Phi-3-small, pero con un tamaño de contexto mayor, adecuado para RAG o indicaciones breves."
},
"microsoft/Phi-3-small-8k-instruct": {
"description": "Un modelo de 7 mil millones de parámetros, con mejor calidad que Phi-3-mini, enfocado en datos de alta calidad y razonamiento intensivo."
},
"microsoft/Phi-3.5-mini-instruct": {
"description": "Versión actualizada del modelo Phi-3-mini."
},
"microsoft/Phi-3.5-vision-instruct": {
"description": "Versión actualizada del modelo Phi-3-vision."
},
"microsoft/WizardLM-2-8x22B": {
"description": "WizardLM 2 es un modelo de lenguaje proporcionado por Microsoft AI, que destaca en diálogos complejos, multilingüismo, razonamiento y asistentes inteligentes."
},
"microsoft/wizardlm-2-8x22b": {
"description": "WizardLM-2 8x22B es el modelo Wizard más avanzado de Microsoft AI, mostrando un rendimiento extremadamente competitivo."
},
"minicpm-v": {
"description": "MiniCPM-V es la nueva generación de modelos multimodales lanzada por OpenBMB, que cuenta con una excelente capacidad de reconocimiento OCR y comprensión multimodal, soportando una amplia gama de escenarios de aplicación."
},
"minimax-m2": {
"description": "MiniMax M2 es un modelo de lenguaje grande y eficiente, diseñado para flujos de trabajo de codificación y agentes."
},
"minimax/minimax-m2": {
"description": "MiniMax-M2 es un modelo de alto rendimiento y rentabilidad, excelente en tareas de codificación y agentes, adecuado para diversos escenarios de ingeniería."
},
"minimaxai/minimax-m2": {
"description": "MiniMax-M2 es un modelo de expertos mixtos (MoE) compacto, rápido y rentable, con un total de 230 mil millones de parámetros y 10 mil millones de parámetros activos. Está diseñado para ofrecer un rendimiento de primer nivel en tareas de codificación y agentes, manteniendo una inteligencia general robusta. El modelo destaca en edición de múltiples archivos, ciclos cerrados de codificación-ejecución-corrección, verificación y corrección de pruebas, así como en complejas cadenas de herramientas de enlaces largos, lo que lo convierte en una opción ideal para los flujos de trabajo de los desarrolladores."
},
"ministral-3b-latest": {
"description": "Ministral 3B es el modelo de borde de primer nivel mundial de Mistral."
},
"ministral-8b-latest": {
"description": "Ministral 8B es el modelo de borde con la mejor relación calidad-precio de Mistral."
},
"mistral": {
"description": "Mistral es un modelo de 7B lanzado por Mistral AI, adecuado para necesidades de procesamiento de lenguaje variables."
},
"mistral-ai/Mistral-Large-2411": {
"description": "El modelo insignia de Mistral, adecuado para tareas complejas que requieren capacidades de razonamiento a gran escala o alta especialización (generación de texto sintético, generación de código, RAG o agentes)."
},
"mistral-ai/Mistral-Nemo": {
"description": "Mistral Nemo es un modelo de lenguaje avanzado (LLM) que ofrece capacidades de razonamiento, conocimiento mundial y codificación líderes en su categoría de tamaño."
},
"mistral-ai/mistral-small-2503": {
"description": "Mistral Small está disponible para cualquier tarea basada en lenguaje que requiera alta eficiencia y baja latencia."
},
"mistral-large": {
"description": "Mixtral Large es el modelo insignia de Mistral, combinando capacidades de generación de código, matemáticas y razonamiento, soportando una ventana de contexto de 128k."
},
"mistral-large-instruct": {
"description": "Mistral-Large-Instruct-2407 es un modelo avanzado de lenguaje denso (LLM) con 123 mil millones de parámetros, que posee capacidades de razonamiento, conocimiento y codificación de última generación."
},
"mistral-large-latest": {
"description": "Mistral Large es el modelo insignia, especializado en tareas multilingües, razonamiento complejo y generación de código, ideal para aplicaciones de alta gama."
},
"mistral-medium-latest": {
"description": "Mistral Medium 3 ofrece un rendimiento de vanguardia a un costo 8 veces menor y simplifica fundamentalmente el despliegue empresarial."
},
"mistral-nemo": {
"description": "Mistral Nemo, desarrollado en colaboración entre Mistral AI y NVIDIA, es un modelo de 12B de alto rendimiento."
},
"mistral-nemo-instruct": {
"description": "Mistral-Nemo-Instruct-2407 es un modelo de lenguaje grande (LLM) que es una versión ajustada por instrucciones de Mistral-Nemo-Base-2407."
},
"mistral-small": {
"description": "Mistral Small se puede utilizar en cualquier tarea basada en lenguaje que requiera alta eficiencia y baja latencia."
},
"mistral-small-latest": {
"description": "Mistral Small es una opción rentable, rápida y confiable, adecuada para casos de uso como traducción, resumen y análisis de sentimientos."
},
"mistral/codestral": {
"description": "Mistral Codestral 25.01 es un modelo de codificación de última generación optimizado para casos de uso de baja latencia y alta frecuencia. Domina más de 80 lenguajes de programación y sobresale en tareas como relleno intermedio (FIM), corrección de código y generación de pruebas."
},
"mistral/codestral-embed": {
"description": "Modelo de incrustación de código que puede integrarse en bases de datos y repositorios de código para apoyar asistentes de codificación."
},
"mistral/devstral-small": {
"description": "Devstral es un modelo de lenguaje grande agente para tareas de ingeniería de software, ideal para agentes de ingeniería de software."
},
"mistral/magistral-medium": {
"description": "Pensamiento complejo respaldado por comprensión profunda, con razonamiento transparente que puede seguir y verificar. Este modelo mantiene un razonamiento de alta fidelidad en múltiples idiomas, incluso cuando cambia de idioma a mitad de tarea."
},
"mistral/magistral-small": {
"description": "Pensamiento complejo respaldado por comprensión profunda, con razonamiento transparente que puede seguir y verificar. Este modelo mantiene un razonamiento de alta fidelidad en múltiples idiomas, incluso cuando cambia de idioma a mitad de tarea."
},
"mistral/ministral-3b": {
"description": "Un modelo compacto y eficiente para tareas en dispositivos como asistentes inteligentes y análisis local, que ofrece un rendimiento de baja latencia."
},
"mistral/ministral-8b": {
"description": "Un modelo más potente con inferencia más rápida y eficiente en memoria, ideal para flujos de trabajo complejos y aplicaciones exigentes en el borde."
},
"mistral/mistral-embed": {
"description": "Modelo de incrustación de texto universal para búsqueda semántica, similitud, agrupamiento y flujos de trabajo RAG."
},
"mistral/mistral-large": {
"description": "Mistral Large es ideal para tareas complejas que requieren capacidades de inferencia grandes o altamente especializadas, como generación de texto sintético, generación de código, RAG o agentes."
},
"mistral/mistral-small": {
"description": "Mistral Small es ideal para tareas simples que pueden procesarse en lotes, como clasificación, soporte al cliente o generación de texto. Ofrece un rendimiento excelente a un precio asequible."
},
"mistral/mixtral-8x22b-instruct": {
"description": "Modelo 8x22b Instruct. 8x22b es un modelo de expertos mixtos de código abierto operado por Mistral."
},
"mistral/pixtral-12b": {
"description": "Un modelo de 12B con capacidades de comprensión de imágenes además de texto."
},
"mistral/pixtral-large": {
"description": "Pixtral Large es el segundo modelo de nuestra familia multimodal, demostrando un nivel avanzado de comprensión de imágenes. En particular, el modelo puede entender documentos, gráficos y imágenes naturales, manteniendo la capacidad líder en comprensión de texto de Mistral Large 2."
},
"mistralai/Mistral-7B-Instruct-v0.1": {
"description": "Mistral (7B) Instruct es conocido por su alto rendimiento, adecuado para diversas tareas de lenguaje."
},
"mistralai/Mistral-7B-Instruct-v0.2": {
"description": "Mistral 7B es un modelo ajustado bajo demanda, proporcionando respuestas optimizadas para tareas."
},
"mistralai/Mistral-7B-Instruct-v0.3": {
"description": "Mistral (7B) Instruct v0.3 ofrece una capacidad de cálculo eficiente y comprensión del lenguaje natural, adecuado para una amplia gama de aplicaciones."
},
"mistralai/Mistral-7B-v0.1": {
"description": "Mistral 7B es un modelo compacto pero de alto rendimiento, ideal para tareas simples como clasificación y generación de texto, con buenas capacidades de razonamiento."
},
"mistralai/Mixtral-8x22B-Instruct-v0.1": {
"description": "Mixtral-8x22B Instruct (141B) es un modelo de lenguaje de gran tamaño, que soporta demandas de procesamiento extremadamente altas."
},
"mistralai/Mixtral-8x7B-Instruct-v0.1": {
"description": "Mixtral 8x7B es un modelo de expertos dispersos preentrenado, utilizado para tareas de texto de uso general."
},
"mistralai/Mixtral-8x7B-v0.1": {
"description": "Mixtral 8x7B es un modelo de expertos dispersos que utiliza múltiples parámetros para aumentar la velocidad de razonamiento, adecuado para tareas de generación de múltiples idiomas y códigos."
},
"mistralai/mistral-nemo": {
"description": "Mistral Nemo es un modelo de 7.3B parámetros con soporte multilingüe y programación de alto rendimiento."
},
"mixtral": {
"description": "Mixtral es el modelo de expertos de Mistral AI, con pesos de código abierto, que ofrece soporte en generación de código y comprensión del lenguaje."
},
"mixtral-8x7b-32768": {
"description": "Mixtral 8x7B ofrece una capacidad de cálculo paralelo de alta tolerancia a fallos, adecuada para tareas complejas."
},
"mixtral:8x22b": {
"description": "Mixtral es el modelo de expertos de Mistral AI, con pesos de código abierto, que ofrece soporte en generación de código y comprensión del lenguaje."
},
"moonshot-v1-128k": {
"description": "Moonshot V1 128K es un modelo con capacidad de procesamiento de contexto ultra largo, adecuado para generar textos extensos, satisfaciendo las demandas de tareas de generación complejas, capaz de manejar hasta 128,000 tokens, ideal para aplicaciones en investigación, académicas y generación de documentos grandes."
},
"moonshot-v1-128k-vision-preview": {
"description": "El modelo visual Kimi (incluyendo moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview, etc.) puede entender el contenido de las imágenes, incluyendo texto en imágenes, colores de imágenes y formas de objetos."
},
"moonshot-v1-32k": {
"description": "Moonshot V1 32K ofrece capacidad de procesamiento de contexto de longitud media, capaz de manejar 32,768 tokens, especialmente adecuado para generar diversos documentos largos y diálogos complejos, aplicable en creación de contenido, generación de informes y sistemas de diálogo."
},
"moonshot-v1-32k-vision-preview": {
"description": "El modelo visual Kimi (incluyendo moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview, etc.) puede entender el contenido de las imágenes, incluyendo texto en imágenes, colores de imágenes y formas de objetos."
},
"moonshot-v1-8k": {
"description": "Moonshot V1 8K está diseñado para tareas de generación de texto corto, con un rendimiento de procesamiento eficiente, capaz de manejar 8,192 tokens, ideal para diálogos breves, toma de notas y generación rápida de contenido."
},
"moonshot-v1-8k-vision-preview": {
"description": "El modelo visual Kimi (incluyendo moonshot-v1-8k-vision-preview/moonshot-v1-32k-vision-preview/moonshot-v1-128k-vision-preview, etc.) puede entender el contenido de las imágenes, incluyendo texto en imágenes, colores de imágenes y formas de objetos."
},
"moonshot-v1-auto": {
"description": "Moonshot V1 Auto puede seleccionar el modelo adecuado según la cantidad de tokens ocupados en el contexto actual."
},
"moonshotai/Kimi-Dev-72B": {
"description": "Kimi-Dev-72B es un modelo de código abierto de gran escala, optimizado mediante aprendizaje reforzado a gran escala, capaz de generar parches robustos y listos para producción. Este modelo alcanzó un nuevo récord del 60.4 % en SWE-bench Verified, estableciendo un nuevo estándar para modelos de código abierto en tareas automatizadas de ingeniería de software como la corrección de errores y la revisión de código."
},
"moonshotai/Kimi-K2-Instruct-0905": {
"description": "Kimi K2-Instruct-0905 es la versión más reciente y potente de Kimi K2. Es un modelo de lenguaje de expertos mixtos (MoE) de primer nivel, con un total de un billón de parámetros y 32 mil millones de parámetros activados. Las principales características de este modelo incluyen: inteligencia mejorada para agentes de codificación, mostrando un rendimiento notable en pruebas de referencia públicas y en tareas reales de agentes de codificación; y una experiencia mejorada en la codificación frontend, con avances tanto en la estética como en la funcionalidad de la programación frontend."
},
"moonshotai/Kimi-K2-Thinking": {
"description": "Kimi K2 Thinking es el modelo de razonamiento de código abierto más reciente y avanzado. Amplía significativamente la profundidad del razonamiento multietapa y mantiene un uso estable de herramientas en 200300 llamadas consecutivas. Ha establecido nuevos estándares en pruebas como Humanity's Last Exam (HLE), BrowseComp y otros benchmarks. Además, K2 Thinking destaca en programación, matemáticas, razonamiento lógico y escenarios con agentes. Basado en una arquitectura de expertos mixtos (MoE), cuenta con aproximadamente 1 billón de parámetros, soporte para ventanas de contexto de 256K y llamadas a herramientas."
},
"moonshotai/kimi-k2": {
"description": "Kimi K2 es un modelo de lenguaje de expertos mixtos (MoE) a gran escala desarrollado por Moonshot AI, con un total de un billón de parámetros y 32 mil millones de parámetros activos por pasada. Está optimizado para capacidades de agente, incluyendo uso avanzado de herramientas, razonamiento y síntesis de código."
},
"moonshotai/kimi-k2-0711": {
"description": "Kimi K2 0711 es la versión Instruct de la serie Kimi, adecuada para escenarios de código de alta calidad y llamadas de herramientas."
},
"moonshotai/kimi-k2-0905": {
"description": "Kimi K2 0905 es la actualización 0905 de la serie Kimi, con mejoras en contexto y rendimiento de razonamiento, optimizado para codificación."
},
"moonshotai/kimi-k2-instruct-0905": {
"description": "El modelo kimi-k2-0905-preview tiene una longitud de contexto de 256k, con una mayor capacidad de codificación agentiva, una estética y funcionalidad mejoradas en el código frontend, y una mejor comprensión del contexto."
},
"moonshotai/kimi-k2-thinking": {
"description": "Kimi K2 Thinking es un modelo de pensamiento optimizado por Moonshot para tareas de razonamiento profundo, con capacidades generales de agente."
},
"moonshotai/kimi-k2-thinking-turbo": {
"description": "Kimi K2 Thinking Turbo es la versión rápida de Kimi K2 Thinking, que mantiene el razonamiento profundo con una latencia de respuesta significativamente reducida."
},
"morph/morph-v3-fast": {
"description": "Morph ofrece un modelo de IA especializado que aplica rápidamente los cambios de código sugeridos por modelos de vanguardia como Claude o GPT-4o a sus archivos de código existentes, con una velocidad de más de 4500 tokens por segundo. Actúa como el último paso en el flujo de trabajo de codificación de IA. Soporta 16k tokens de entrada y 16k tokens de salida."
},
"morph/morph-v3-large": {
"description": "Morph ofrece un modelo de IA especializado que aplica cambios de código sugeridos por modelos de vanguardia como Claude o GPT-4o a sus archivos de código existentes, con una velocidad de más de 2500 tokens por segundo. Actúa como el último paso en el flujo de trabajo de codificación de IA. Soporta 16k tokens de entrada y 16k tokens de salida."
},
"nousresearch/hermes-2-pro-llama-3-8b": {
"description": "Hermes 2 Pro Llama 3 8B es una versión mejorada de Nous Hermes 2, que incluye los conjuntos de datos más recientes desarrollados internamente."
},
"nvidia/Llama-3.1-Nemotron-70B-Instruct-HF": {
"description": "Llama 3.1 Nemotron 70B es un modelo de lenguaje a gran escala personalizado por NVIDIA, diseñado para mejorar la utilidad de las respuestas generadas por LLM a las consultas de los usuarios. Este modelo ha destacado en pruebas de referencia como Arena Hard, AlpacaEval 2 LC y GPT-4-Turbo MT-Bench, ocupando el primer lugar en los tres benchmarks de alineación automática hasta el 1 de octubre de 2024. El modelo se entrena utilizando RLHF (especialmente REINFORCE), Llama-3.1-Nemotron-70B-Reward y HelpSteer2-Preference sobre la base del modelo Llama-3.1-70B-Instruct."
},
"nvidia/llama-3.1-nemotron-51b-instruct": {
"description": "Modelo de lenguaje único, que ofrece una precisión y eficiencia inigualables."
},
"nvidia/llama-3.1-nemotron-70b-instruct": {
"description": "Llama-3.1-Nemotron-70B-Instruct es un modelo de lenguaje grande personalizado por NVIDIA, diseñado para mejorar la utilidad de las respuestas generadas por LLM."
},
"o1": {
"description": "Se centra en el razonamiento avanzado y la resolución de problemas complejos, incluidas tareas matemáticas y científicas. Es muy adecuado para aplicaciones que requieren una comprensión profunda del contexto y flujos de trabajo de agentes."
},
"o1-mini": {
"description": "Más pequeño y rápido que o1-preview, con un coste un 80% menor. Ofrece buen rendimiento en generación de código y operaciones con contextos pequeños."
},
"o1-preview": {
"description": "Enfocado en el razonamiento avanzado y en la resolución de problemas complejos, incluidas tareas de matemáticas y de ciencias. Es ideal para aplicaciones que requieren una comprensión profunda del contexto y flujos de trabajo autónomos."
},
"o1-pro": {
"description": "La serie o1 ha sido entrenada mediante aprendizaje reforzado para pensar antes de responder y ejecutar tareas de razonamiento complejas. El modelo o1-pro utiliza más recursos computacionales para un pensamiento más profundo, proporcionando respuestas de calidad superior de manera constante."
},
"o3": {
"description": "o3 es un modelo versátil y potente, que destaca en múltiples campos. Establece un nuevo estándar para tareas de matemáticas, ciencia, programación y razonamiento visual. También es hábil en redacción técnica y seguimiento de instrucciones. Los usuarios pueden utilizarlo para analizar texto, código e imágenes, resolviendo problemas complejos de múltiples pasos."
},
"o3-2025-04-16": {
"description": "o3 es el nuevo modelo de razonamiento de OpenAI, soporta entrada de texto e imagen y salida de texto, adecuado para tareas complejas que requieren conocimiento general amplio."
},
"o3-deep-research": {
"description": "o3-deep-research es nuestro modelo de investigación profunda más avanzado, diseñado específicamente para manejar tareas complejas de investigación en múltiples pasos. Puede buscar y sintetizar información de Internet, así como acceder y utilizar tus propios datos a través del conector MCP."
},
"o3-mini": {
"description": "o3-mini es nuestro último modelo de inferencia de tamaño pequeño, que ofrece alta inteligencia con los mismos objetivos de costo y latencia que o1-mini."
},
"o3-pro": {
"description": "El modelo o3-pro utiliza más capacidad computacional para pensar más profundamente y siempre ofrecer mejores respuestas, y solo está disponible para uso bajo la API de Responses."
},
"o3-pro-2025-06-10": {
"description": "o3 Pro es el nuevo modelo de razonamiento de OpenAI, soporta entrada de texto e imagen y salida de texto, adecuado para tareas complejas que requieren conocimiento general amplio."
},
"o4-mini": {
"description": "o4-mini es nuestro último modelo de la serie o en formato pequeño. Está optimizado para una inferencia rápida y efectiva, mostrando una alta eficiencia y rendimiento en tareas de codificación y visuales."
},
"o4-mini-2025-04-16": {
"description": "o4-mini es un modelo de razonamiento de OpenAI, soporta entrada de texto e imagen y salida de texto, adecuado para tareas complejas que requieren conocimiento general amplio. Este modelo tiene un contexto de 200K."
},
"o4-mini-deep-research": {
"description": "o4-mini-deep-research es nuestro modelo de investigación profunda más rápido y asequible, ideal para manejar tareas complejas de investigación en múltiples pasos. Puede buscar y sintetizar información de Internet, así como acceder y utilizar tus propios datos a través del conector MCP."
},
"open-codestral-mamba": {
"description": "Codestral Mamba es un modelo de lenguaje Mamba 2 enfocado en la generación de código, que proporciona un fuerte apoyo para tareas avanzadas de codificación y razonamiento."
},
"open-mistral-7b": {
"description": "Mistral 7B es un modelo compacto pero de alto rendimiento, especializado en el procesamiento por lotes y tareas simples, como clasificación y generación de texto, con buenas capacidades de razonamiento."
},
"open-mistral-nemo": {
"description": "Mistral Nemo es un modelo de 12B desarrollado en colaboración con Nvidia, que ofrece un rendimiento de razonamiento y codificación excepcional, fácil de integrar y reemplazar."
},
"open-mixtral-8x22b": {
"description": "Mixtral 8x22B es un modelo de expertos más grande, enfocado en tareas complejas, que ofrece una excelente capacidad de razonamiento y un mayor rendimiento."
},
"open-mixtral-8x7b": {
"description": "Mixtral 8x7B es un modelo de expertos dispersos que utiliza múltiples parámetros para mejorar la velocidad de razonamiento, adecuado para el procesamiento de tareas de múltiples idiomas y generación de código."
},
"openai/gpt-3.5-turbo": {
"description": "El modelo más competente y rentable de la serie GPT-3.5 de OpenAI, optimizado para propósitos de chat, pero que también funciona bien en tareas tradicionales de completado."
},
"openai/gpt-3.5-turbo-instruct": {
"description": "Capacidades similares a los modelos de la era GPT-3. Compatible con puntos finales de completado tradicionales en lugar de puntos finales de completado de chat."
},
"openai/gpt-4-turbo": {
"description": "gpt-4-turbo de OpenAI posee un amplio conocimiento general y experiencia en dominios, permitiéndole seguir instrucciones complejas en lenguaje natural y resolver problemas difíciles con precisión. Su fecha de corte de conocimiento es abril de 2023 y tiene una ventana de contexto de 128,000 tokens."
},
"openai/gpt-4.1": {
"description": "La serie GPT-4.1 ofrece mayor contexto y capacidades mejoradas de ingeniería y razonamiento."
},
"openai/gpt-4.1-mini": {
"description": "GPT-4.1 Mini ofrece menor latencia y mejor relación calidad-precio, ideal para líneas de contexto medio."
},
"openai/gpt-4.1-nano": {
"description": "GPT-4.1 Nano es una opción de muy bajo coste y baja latencia, adecuada para diálogos cortos frecuentes o tareas de clasificación."
},
"openai/gpt-4o": {
"description": "La serie GPT-4o es el modelo Omni de OpenAI, compatible con entrada de texto + imagen y salida de texto."
},
"openai/gpt-4o-mini": {
"description": "GPT-4o-mini es la versión rápida y compacta de GPT-4o, ideal para escenarios mixtos de texto e imagen con baja latencia."
},
"openai/gpt-5": {
"description": "GPT-5 es el modelo de alto rendimiento de OpenAI, adecuado para una amplia gama de tareas de producción e investigación."
},
"openai/gpt-5-chat": {
"description": "GPT-5 Chat es una subversión de GPT-5 optimizada para escenarios conversacionales, con menor latencia para mejorar la experiencia interactiva."
},
"openai/gpt-5-codex": {
"description": "GPT-5-Codex es una variante de GPT-5 optimizada para codificación, ideal para flujos de trabajo de código a gran escala."
},
"openai/gpt-5-mini": {
"description": "GPT-5 Mini es la versión compacta de la familia GPT-5, adecuada para escenarios de baja latencia y bajo coste."
},
"openai/gpt-5-nano": {
"description": "GPT-5 Nano es la versión ultra compacta de la familia, ideal para escenarios con requisitos muy estrictos de coste y latencia."
},
"openai/gpt-5-pro": {
"description": "GPT-5 Pro es el modelo insignia de OpenAI, con capacidades avanzadas de razonamiento, generación de código y funciones empresariales, compatible con enrutamiento de pruebas y políticas de seguridad más rigurosas."
},
"openai/gpt-5.1": {
"description": "GPT-5.1 es el último modelo insignia de la serie GPT-5, con mejoras significativas en razonamiento general, seguimiento de instrucciones y naturalidad en el diálogo, adecuado para una amplia gama de tareas."
},
"openai/gpt-5.1-chat": {
"description": "GPT-5.1 Chat es el miembro ligero de la familia GPT-5.1, optimizado para diálogos de baja latencia, manteniendo sólidas capacidades de razonamiento y ejecución de instrucciones."
},
"openai/gpt-5.1-codex": {
"description": "GPT-5.1-Codex es una variante de GPT-5.1 optimizada para ingeniería de software y flujos de trabajo de codificación, ideal para refactorización a gran escala, depuración compleja y codificación autónoma prolongada."
},
"openai/gpt-5.1-codex-mini": {
"description": "GPT-5.1-Codex-Mini es la versión compacta y acelerada de GPT-5.1-Codex, más adecuada para escenarios de codificación sensibles a latencia y coste."
},
"openai/gpt-oss-120b": {
"description": "Modelo de lenguaje grande universal extremadamente competente con capacidades de razonamiento potentes y controlables."
},
"openai/gpt-oss-20b": {
"description": "Modelo de lenguaje compacto con pesos de código abierto, optimizado para baja latencia y entornos con recursos limitados, incluyendo despliegues locales y en el borde."
},
"openai/o1": {
"description": "o1 de OpenAI es un modelo de inferencia insignia diseñado para problemas complejos que requieren pensamiento profundo. Proporciona capacidades de razonamiento potentes y mayor precisión para tareas complejas de múltiples pasos."
},
"openai/o1-mini": {
"description": "o1-mini es un modelo de inferencia rápido y rentable diseñado para aplicaciones de programación, matemáticas y ciencias. Este modelo tiene un contexto de 128K y una fecha de corte de conocimiento en octubre de 2023."
},
"openai/o1-preview": {
"description": "o1 es el nuevo modelo de inferencia de OpenAI, adecuado para tareas complejas que requieren un amplio conocimiento general. Este modelo tiene un contexto de 128K y una fecha de corte de conocimiento en octubre de 2023."
},
"openai/o3": {
"description": "o3 de OpenAI es el modelo de inferencia más potente, estableciendo nuevos estándares en codificación, matemáticas, ciencias y percepción visual. Sobresale en consultas complejas que requieren análisis multifacético, con ventajas especiales en análisis de imágenes, gráficos y diagramas."
},
"openai/o3-mini": {
"description": "o3-mini es el modelo de inferencia pequeño más reciente de OpenAI, que ofrece alta inteligencia con los mismos objetivos de costo y latencia que o1-mini."
},
"openai/o3-mini-high": {
"description": "o3-mini de alto nivel de razonamiento proporciona alta inteligencia con los mismos objetivos de costo y latencia que o1-mini."
},
"openai/o4-mini": {
"description": "OpenAI o4-mini es un modelo de razonamiento compacto y eficiente de OpenAI, ideal para escenarios de baja latencia."
},
"openai/o4-mini-high": {
"description": "Versión de alto nivel de inferencia de o4-mini, optimizada para una inferencia rápida y efectiva, mostrando una alta eficiencia y rendimiento en tareas de codificación y visuales."
},
"openai/text-embedding-3-large": {
"description": "El modelo de incrustaciones más competente de OpenAI, adecuado para tareas en inglés y otros idiomas."
},
"openai/text-embedding-3-small": {
"description": "Versión mejorada y de mayor rendimiento del modelo de incrustaciones ada de OpenAI."
},
"openai/text-embedding-ada-002": {
"description": "Modelo tradicional de incrustaciones de texto de OpenAI."
},
"openrouter/auto": {
"description": "Según la longitud del contexto, el tema y la complejidad, tu solicitud se enviará a Llama 3 70B Instruct, Claude 3.5 Sonnet (autoajuste) o GPT-4o."
},
"perplexity/sonar": {
"description": "Producto ligero de Perplexity con capacidad de búsqueda fundamentada, más rápido y económico que Sonar Pro."
},
"perplexity/sonar-pro": {
"description": "Producto insignia de Perplexity con capacidad de búsqueda fundamentada, que soporta consultas avanzadas y operaciones de seguimiento."
},
"perplexity/sonar-reasoning": {
"description": "Modelo enfocado en razonamiento que produce cadenas de pensamiento (CoT) en las respuestas, ofreciendo explicaciones detalladas con búsqueda fundamentada."
},
"perplexity/sonar-reasoning-pro": {
"description": "Modelo avanzado enfocado en razonamiento que produce cadenas de pensamiento (CoT) en las respuestas, ofreciendo explicaciones integrales con capacidades de búsqueda mejoradas y múltiples consultas de búsqueda por solicitud."
},
"phi3": {
"description": "Phi-3 es un modelo abierto ligero lanzado por Microsoft, adecuado para una integración eficiente y razonamiento de conocimiento a gran escala."
},
"phi3:14b": {
"description": "Phi-3 es un modelo abierto ligero lanzado por Microsoft, adecuado para una integración eficiente y razonamiento de conocimiento a gran escala."
},
"pixtral-12b-2409": {
"description": "El modelo Pixtral muestra una fuerte capacidad en tareas como comprensión de gráficos e imágenes, preguntas y respuestas de documentos, razonamiento multimodal y seguimiento de instrucciones, capaz de ingerir imágenes en resolución y proporción natural, y manejar una cantidad arbitraria de imágenes en una ventana de contexto larga de hasta 128K tokens."
},
"pixtral-large-latest": {
"description": "Pixtral Large es un modelo multimodal de código abierto con 124 mil millones de parámetros, construido sobre Mistral Large 2. Este es nuestro segundo modelo en la familia multimodal, que muestra un nivel de comprensión de imágenes de vanguardia."
},
"pro-128k": {
"description": "Spark Pro 128K está equipado con una capacidad de procesamiento de contexto extragrande, capaz de manejar hasta 128K de información contextual, especialmente adecuado para el análisis completo y el manejo de relaciones lógicas a largo plazo en contenido extenso, proporcionando una lógica fluida y coherente y un soporte diverso de citas en comunicaciones de texto complejas."
},
"pro-deepseek-r1": {
"description": "Modelo exclusivo para servicios empresariales, incluye servicio concurrente."
},
"pro-deepseek-v3": {
"description": "Modelo exclusivo para servicios empresariales, incluye servicio concurrente."
},
"qianfan-70b": {
"description": "Qianfan 70B, un modelo chino de gran tamaño, ideal para la generación de contenido de alta calidad y tareas de razonamiento complejo."
},
"qianfan-8b": {
"description": "Qianfan 8B, un modelo general de tamaño medio, adecuado para generación de texto y preguntas y respuestas con equilibrio entre coste y rendimiento."
},
"qianfan-agent-intent-32k": {
"description": "Qianfan Agent Intent 32K, modelo orientado al reconocimiento de intenciones y orquestación de agentes, compatible con contextos largos."
},
"qianfan-agent-lite-8k": {
"description": "Qianfan Agent Lite 8K, modelo ligero de agente, ideal para diálogos multivuelta de bajo coste y orquestación empresarial."
},
"qianfan-agent-speed-32k": {
"description": "Qianfan Agent Speed 32K, modelo de agente de alto rendimiento, adecuado para aplicaciones de agentes a gran escala y multitarea."
},
"qianfan-agent-speed-8k": {
"description": "Qianfan Agent Speed 8K, modelo de agente de alta concurrencia, diseñado para diálogos cortos y respuestas rápidas."
},
"qianfan-check-vl": {
"description": "Qianfan Check VL, modelo de revisión y detección de contenido multimodal, compatible con tareas de cumplimiento e identificación de imágenes y texto."
},
"qianfan-composition": {
"description": "Qianfan Composition, modelo de creación multimodal, compatible con comprensión y generación combinada de texto e imagen."
},
"qianfan-engcard-vl": {
"description": "Qianfan EngCard VL, modelo de reconocimiento multimodal enfocado en escenarios en inglés."
},
"qianfan-lightning-128b-a19b": {
"description": "Qianfan Lightning 128B A19B, modelo general de alto rendimiento en chino, ideal para preguntas complejas y tareas de razonamiento a gran escala."
},
"qianfan-llama-vl-8b": {
"description": "Qianfan Llama VL 8B, modelo multimodal basado en Llama, orientado a tareas generales de comprensión de texto e imagen."
},
"qianfan-multipicocr": {
"description": "Qianfan MultiPicOCR, modelo OCR para múltiples imágenes, compatible con detección y reconocimiento de texto en varias imágenes."
},
"qianfan-qi-vl": {
"description": "Qianfan QI VL, modelo de preguntas y respuestas multimodal, diseñado para recuperación precisa y respuestas en escenarios complejos de texto e imagen."
},
"qianfan-singlepicocr": {
"description": "Qianfan SinglePicOCR, modelo OCR para una sola imagen, compatible con reconocimiento de caracteres de alta precisión."
},
"qianfan-vl-70b": {
"description": "Qianfan VL 70B, modelo de lenguaje visual de gran tamaño, ideal para escenarios complejos de comprensión de texto e imagen."
},
"qianfan-vl-8b": {
"description": "Qianfan VL 8B, modelo de lenguaje visual ligero, adecuado para preguntas y respuestas cotidianas sobre imágenes y análisis."
},
"qvq-72b-preview": {
"description": "El modelo QVQ es un modelo de investigación experimental desarrollado por el equipo de Qwen, enfocado en mejorar la capacidad de razonamiento visual, especialmente en el ámbito del razonamiento matemático."
},
"qvq-max": {
"description": "Modelo de razonamiento visual QVQ de Tongyi Qianwen, que soporta entrada visual y salida de cadena de pensamiento, mostrando capacidades superiores en matemáticas, programación, análisis visual, creación y tareas generales."
},
"qvq-plus": {
"description": "Modelo de razonamiento visual. Soporta entrada visual y salida en cadena de pensamiento. Versión plus lanzada tras el modelo qvq-max, con mayor velocidad de razonamiento y un equilibrio mejorado entre eficacia y coste en comparación con qvq-max."
},
"qwen-3-32b": {
"description": "Qwen 3 32B: el modelo de la serie Qwen ofrece un excelente rendimiento en tareas multilingües y de codificación, ideal para aplicaciones de producción a escala media."
},
"qwen-coder-plus": {
"description": "Modelo de código Tongyi Qianwen."
},
"qwen-coder-turbo": {
"description": "Modelo de código Tongyi Qianwen."
},
"qwen-coder-turbo-latest": {
"description": "El modelo de código Tongyi Qwen."
},
"qwen-flash": {
"description": "La serie Tongyi Qianwen ofrece modelos de la mayor rapidez y de coste extremadamente bajo, adecuados para tareas sencillas."
},
"qwen-image": {
"description": "Qwen-Image es un modelo de generación de imágenes de uso general que admite diversos estilos artísticos y destaca por su capacidad para renderizar textos complejos, especialmente textos en chino e inglés. El modelo soporta maquetación en varias líneas, generación de texto a nivel de párrafo y representación de detalles finos, lo que permite crear diseños complejos que combinan texto e imagen."
},
"qwen-image-edit": {
"description": "Qwen Image Edit es un modelo de generación de imágenes que permite la edición y modificación de imágenes basándose en una imagen de entrada y un texto indicativo, capaz de realizar ajustes precisos y transformaciones creativas en la imagen original según las necesidades del usuario."
},
"qwen-long": {
"description": "Qwen es un modelo de lenguaje a gran escala que admite contextos de texto largos y funciones de conversación basadas en documentos largos y múltiples."
},
"qwen-math-plus": {
"description": "Modelo matemático Tongyi Qianwen especializado en resolución de problemas matemáticos."
},
"qwen-math-plus-latest": {
"description": "El modelo de matemáticas Tongyi Qwen está diseñado específicamente para resolver problemas matemáticos."
},
"qwen-math-turbo": {
"description": "Modelo matemático Tongyi Qianwen especializado en resolución de problemas matemáticos."
},
"qwen-math-turbo-latest": {
"description": "El modelo de matemáticas Tongyi Qwen está diseñado específicamente para resolver problemas matemáticos."
},
"qwen-max": {
"description": "El modelo de lenguaje a gran escala Qwen Max, de billones de parámetros, admite entradas en diferentes idiomas como chino e inglés, y actualmente es el modelo API detrás de la versión del producto Qwen 2.5."
},
"qwen-omni-turbo": {
"description": "La serie Qwen-Omni soporta entrada de múltiples modalidades, incluyendo video, audio, imágenes y texto, y produce salida en audio y texto."
},
"qwen-plus": {
"description": "La versión mejorada del modelo de lenguaje a gran escala Qwen admite entradas en diferentes idiomas como chino e inglés."
},
"qwen-turbo": {
"description": "通义千问 Turbo dejará de recibir actualizaciones; se recomienda sustituirlo por 通义千问 Flash. 通义千问 es un modelo de lenguaje a gran escala que admite entradas en chino, inglés y otros idiomas."
},
"qwen-vl-chat-v1": {
"description": "Qwen VL admite formas de interacción flexibles, incluyendo múltiples imágenes, preguntas y respuestas en múltiples rondas, y capacidades creativas."
},
"qwen-vl-max": {
"description": "Modelo visual-lingüístico a gran escala Tongyi Qianwen de máxima capacidad. En comparación con la versión mejorada, incrementa aún más la capacidad de razonamiento visual y el seguimiento de instrucciones, ofreciendo un nivel superior de percepción y cognición visual."
},
"qwen-vl-max-latest": {
"description": "Modelo de lenguaje visual a ultra gran escala Tongyi Qianwen. En comparación con la versión mejorada, mejora aún más la capacidad de razonamiento visual y de seguimiento de instrucciones, ofreciendo un nivel más alto de percepción y cognición visual."
},
"qwen-vl-ocr": {
"description": "Tongyi Qianwen OCR es un modelo especializado en extracción de texto, enfocado en documentos, tablas, exámenes y escritura manuscrita. Puede reconocer múltiples idiomas, incluyendo chino, inglés, francés, japonés, coreano, alemán, ruso, italiano, vietnamita y árabe."
},
"qwen-vl-plus": {
"description": "Versión mejorada del modelo visual-lingüístico a gran escala Tongyi Qianwen. Mejora considerablemente la capacidad de reconocimiento de detalles y texto, soportando imágenes con resolución superior a un millón de píxeles y proporciones de aspecto arbitrarias."
},
"qwen-vl-plus-latest": {
"description": "Versión mejorada del modelo de lenguaje visual a gran escala Tongyi Qianwen. Mejora significativamente la capacidad de reconocimiento de detalles y de texto, soportando imágenes con resolución de más de un millón de píxeles y proporciones de ancho y alto arbitrarias."
},
"qwen-vl-v1": {
"description": "Iniciado con el modelo de lenguaje Qwen-7B, se añade un modelo de imagen, un modelo preentrenado con una resolución de entrada de imagen de 448."
},
"qwen/qwen-2-7b-instruct": {
"description": "Qwen2 es una nueva serie de modelos de lenguaje grande Qwen. Qwen2 7B es un modelo basado en transformador que destaca en comprensión del lenguaje, capacidades multilingües, programación, matemáticas y razonamiento."
},
"qwen/qwen-2-7b-instruct:free": {
"description": "Qwen2 es una nueva serie de modelos de lenguaje de gran tamaño, con una mayor capacidad de comprensión y generación."
},
"qwen/qwen-2-vl-72b-instruct": {
"description": "Qwen2-VL es la última iteración del modelo Qwen-VL, alcanzando un rendimiento de vanguardia en pruebas de comprensión visual, incluyendo MathVista, DocVQA, RealWorldQA y MTVQA. Qwen2-VL puede entender videos de más de 20 minutos, permitiendo preguntas y respuestas, diálogos y creación de contenido de alta calidad basados en video. También posee capacidades complejas de razonamiento y toma de decisiones, pudiendo integrarse con dispositivos móviles, robots, etc., para realizar operaciones automáticas basadas en el entorno visual y las instrucciones de texto. Además del inglés y el chino, Qwen2-VL ahora también admite la comprensión de texto en diferentes idiomas dentro de imágenes, incluyendo la mayoría de los idiomas europeos, japonés, coreano, árabe y vietnamita."
},
"qwen/qwen-2.5-72b-instruct": {
"description": "Qwen2.5-72B-Instruct es una de las últimas series de modelos de lenguaje grande lanzadas por Alibaba Cloud. Este modelo de 72B presenta capacidades significativamente mejoradas en áreas como codificación y matemáticas. También ofrece soporte multilingüe, abarcando más de 29 idiomas, incluidos chino e inglés. El modelo ha mejorado notablemente en el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente JSON)."
},
"qwen/qwen2.5-32b-instruct": {
"description": "Qwen2.5-32B-Instruct es una de las últimas series de modelos de lenguaje grande lanzadas por Alibaba Cloud. Este modelo de 32B presenta capacidades significativamente mejoradas en áreas como codificación y matemáticas. También ofrece soporte multilingüe, abarcando más de 29 idiomas, incluidos chino e inglés. El modelo ha mejorado notablemente en el seguimiento de instrucciones, la comprensión de datos estructurados y la generación de salidas estructuradas (especialmente JSON)."
},
"qwen/qwen2.5-7b-instruct": {
"description": "LLM orientado a chino e inglés, enfocado en áreas como lenguaje, programación, matemáticas y razonamiento."
},
"qwen/qwen2.5-coder-32b-instruct": {
"description": "LLM avanzado, que soporta generación de código, razonamiento y corrección, abarcando lenguajes de programación populares."
},
"qwen/qwen2.5-coder-7b-instruct": {
"description": "Poderoso modelo de código de tamaño mediano, que soporta longitudes de contexto de 32K, experto en programación multilingüe."
},
"qwen/qwen3-14b": {
"description": "Qwen3-14B es la versión de 14B de la serie Qwen, adecuada para razonamiento general y escenarios conversacionales."
},
"qwen/qwen3-14b:free": {
"description": "Qwen3-14B es un modelo de lenguaje causal denso de 14.8 mil millones de parámetros en la serie Qwen3, diseñado para razonamiento complejo y diálogos eficientes. Soporta un cambio sin problemas entre un modo de 'pensamiento' para tareas de matemáticas, programación y razonamiento lógico, y un modo 'no reflexivo' para diálogos generales. Este modelo ha sido ajustado para seguir instrucciones, utilizar herramientas de agentes, escribir creativamente y realizar tareas multilingües en más de 100 idiomas y dialectos. Maneja de forma nativa un contexto de 32K tokens y se puede expandir a 131K tokens utilizando extensiones basadas en YaRN."
},
"qwen/qwen3-235b-a22b": {
"description": "Qwen3-235B-A22B es un modelo de mezcla de expertos (MoE) de 235B parámetros desarrollado por Qwen, que activa 22B parámetros en cada pasada hacia adelante. Soporta un cambio sin problemas entre un modo de 'pensamiento' para razonamiento complejo, matemáticas y tareas de código, y un modo 'no reflexivo' para eficiencia en diálogos generales. Este modelo demuestra una fuerte capacidad de razonamiento, soporte multilingüe (más de 100 idiomas y dialectos), y habilidades avanzadas de seguimiento de instrucciones y llamadas a herramientas de agentes. Maneja de forma nativa una ventana de contexto de 32K tokens y se puede expandir a 131K tokens utilizando extensiones basadas en YaRN."
},
"qwen/qwen3-235b-a22b-2507": {
"description": "Qwen3-235B-A22B-Instruct-2507 es la versión Instruct de la serie Qwen3, compatible con instrucciones multilingües y escenarios de contexto largo."
},
"qwen/qwen3-235b-a22b-thinking-2507": {
"description": "Qwen3-235B-A22B-Thinking-2507 es la variante de pensamiento de Qwen3, reforzada para tareas complejas de matemáticas y razonamiento."
},
"qwen/qwen3-235b-a22b:free": {
"description": "Qwen3-235B-A22B es un modelo de mezcla de expertos (MoE) de 235B parámetros desarrollado por Qwen, que activa 22B parámetros en cada pasada hacia adelante. Soporta un cambio sin problemas entre un modo de 'pensamiento' para razonamiento complejo, matemáticas y tareas de código, y un modo 'no reflexivo' para eficiencia en diálogos generales. Este modelo demuestra una fuerte capacidad de razonamiento, soporte multilingüe (más de 100 idiomas y dialectos), y habilidades avanzadas de seguimiento de instrucciones y llamadas a herramientas de agentes. Maneja de forma nativa una ventana de contexto de 32K tokens y se puede expandir a 131K tokens utilizando extensiones basadas en YaRN."
},
"qwen/qwen3-30b-a3b": {
"description": "Qwen3 es la última generación de la serie de modelos de lenguaje Qwen, con una arquitectura de mezcla densa y de expertos (MoE), que destaca en razonamiento, soporte multilingüe y tareas avanzadas de agentes. Su capacidad única para cambiar sin problemas entre un modo de pensamiento para razonamiento complejo y un modo no reflexivo para diálogos eficientes garantiza un rendimiento versátil y de alta calidad.\n\nQwen3 supera significativamente a modelos anteriores como QwQ y Qwen2.5, ofreciendo capacidades excepcionales en matemáticas, codificación, razonamiento de sentido común, escritura creativa y diálogos interactivos. La variante Qwen3-30B-A3B contiene 30.5 mil millones de parámetros (3.3 mil millones de parámetros activados), 48 capas, 128 expertos (activando 8 por tarea) y admite un contexto de hasta 131K tokens (usando YaRN), estableciendo un nuevo estándar para modelos de código abierto."
},
"qwen/qwen3-30b-a3b:free": {
"description": "Qwen3 es la última generación de la serie de modelos de lenguaje Qwen, con una arquitectura de mezcla densa y de expertos (MoE), que destaca en razonamiento, soporte multilingüe y tareas avanzadas de agentes. Su capacidad única para cambiar sin problemas entre un modo de pensamiento para razonamiento complejo y un modo no reflexivo para diálogos eficientes garantiza un rendimiento versátil y de alta calidad.\n\nQwen3 supera significativamente a modelos anteriores como QwQ y Qwen2.5, ofreciendo capacidades excepcionales en matemáticas, codificación, razonamiento de sentido común, escritura creativa y diálogos interactivos. La variante Qwen3-30B-A3B contiene 30.5 mil millones de parámetros (3.3 mil millones de parámetros activados), 48 capas, 128 expertos (activando 8 por tarea) y admite un contexto de hasta 131K tokens (usando YaRN), estableciendo un nuevo estándar para modelos de código abierto."
},
"qwen/qwen3-32b": {
"description": "Qwen3-32B es un modelo de lenguaje causal denso de 32.8 mil millones de parámetros en la serie Qwen3, optimizado para razonamiento complejo y diálogos eficientes. Soporta un cambio sin problemas entre un modo de 'pensamiento' para tareas de matemáticas, codificación y razonamiento lógico, y un modo 'no reflexivo' para diálogos más rápidos y generales. Este modelo muestra un rendimiento robusto en seguir instrucciones, utilizar herramientas de agentes, escribir creativamente y realizar tareas multilingües en más de 100 idiomas y dialectos. Maneja de forma nativa un contexto de 32K tokens y se puede expandir a 131K tokens utilizando extensiones basadas en YaRN."
},
"qwen/qwen3-32b:free": {
"description": "Qwen3-32B es un modelo de lenguaje causal denso de 32.8 mil millones de parámetros en la serie Qwen3, optimizado para razonamiento complejo y diálogos eficientes. Soporta un cambio sin problemas entre un modo de 'pensamiento' para tareas de matemáticas, codificación y razonamiento lógico, y un modo 'no reflexivo' para diálogos más rápidos y generales. Este modelo muestra un rendimiento robusto en seguir instrucciones, utilizar herramientas de agentes, escribir creativamente y realizar tareas multilingües en más de 100 idiomas y dialectos. Maneja de forma nativa un contexto de 32K tokens y se puede expandir a 131K tokens utilizando extensiones basadas en YaRN."
},
"qwen/qwen3-8b:free": {
"description": "Qwen3-8B es un modelo de lenguaje causal denso de 8.2 mil millones de parámetros en la serie Qwen3, diseñado para tareas intensivas en razonamiento y diálogos eficientes. Soporta un cambio sin problemas entre un modo de 'pensamiento' para matemáticas, codificación y razonamiento lógico, y un modo 'no reflexivo' para diálogos generales. Este modelo ha sido ajustado para seguir instrucciones, integrar agentes, escribir creativamente y utilizar más de 100 idiomas y dialectos. Soporta de forma nativa una ventana de contexto de 32K tokens y se puede expandir a 131K tokens a través de YaRN."
},
"qwen/qwen3-coder": {
"description": "Qwen3-Coder es la familia de generadores de código de Qwen3, especializada en comprensión y generación de código en documentos largos."
},
"qwen/qwen3-coder-plus": {
"description": "Qwen3-Coder-Plus es un modelo de agente de codificación especialmente optimizado de la serie Qwen, compatible con llamadas de herramientas más complejas y conversaciones prolongadas."
},
"qwen/qwen3-max": {
"description": "Qwen3 Max es el modelo de razonamiento avanzado de la serie Qwen3, adecuado para razonamiento multilingüe e integración de herramientas."
},
"qwen/qwen3-max-preview": {
"description": "Qwen3 Max (preview) es la versión Max de la serie Qwen orientada a razonamiento avanzado e integración de herramientas (versión preliminar)."
},
"qwen/qwen3-vl-plus": {
"description": "Qwen3 VL-Plus es la versión mejorada en visión de Qwen3, con capacidades mejoradas de razonamiento multimodal y procesamiento de vídeo."
},
"qwen2": {
"description": "Qwen2 es el nuevo modelo de lenguaje a gran escala de Alibaba, que ofrece un rendimiento excepcional para satisfacer diversas necesidades de aplicación."
},
"qwen2.5": {
"description": "Qwen2.5 es la nueva generación de modelos de lenguaje a gran escala de Alibaba, que ofrece un rendimiento excepcional para satisfacer diversas necesidades de aplicación."
},
"qwen2.5-14b-instruct": {
"description": "El modelo de 14B de Tongyi Qwen 2.5, de código abierto."
},
"qwen2.5-14b-instruct-1m": {
"description": "El modelo de 72B de Qwen2.5 es de código abierto."
},
"qwen2.5-32b-instruct": {
"description": "El modelo de 32B de Tongyi Qwen 2.5, de código abierto."
},
"qwen2.5-72b-instruct": {
"description": "El modelo de 72B de Tongyi Qwen 2.5, de código abierto."
},
"qwen2.5-7b-instruct": {
"description": "Qwen2.5 7B Instruct, modelo de instrucciones de código abierto maduro, adecuado para diálogos y generación en múltiples escenarios."
},
"qwen2.5-coder-1.5b-instruct": {
"description": "La versión de código abierto del modelo Qwen para codificación."
},
"qwen2.5-coder-14b-instruct": {
"description": "Versión de código de código abierto del modelo Tongyi Qianwen."
},
"qwen2.5-coder-32b-instruct": {
"description": "Versión de código abierto del modelo de código Qwen de Tongyi."
},
"qwen2.5-coder-7b-instruct": {
"description": "La versión de código abierto del modelo de código Tongyi Qwen."
},
"qwen2.5-coder-instruct": {
"description": "Qwen2.5-Coder es el modelo de lenguaje de gran tamaño más reciente de la serie Qwen especializado en código (anteriormente conocido como CodeQwen)."
},
"qwen2.5-instruct": {
"description": "Qwen2.5 es la última serie de modelos de lenguaje extenso Qwen. Para Qwen2.5, hemos lanzado varios modelos de lenguaje base y modelos de lenguaje ajustados por instrucciones, con parámetros que van desde 500 millones hasta 7.2 mil millones."
},
"qwen2.5-math-1.5b-instruct": {
"description": "El modelo Qwen-Math tiene habilidades poderosas para resolver problemas matemáticos."
},
"qwen2.5-math-72b-instruct": {
"description": "El modelo Qwen-Math tiene una poderosa capacidad para resolver problemas matemáticos."
},
"qwen2.5-math-7b-instruct": {
"description": "El modelo Qwen-Math tiene una poderosa capacidad para resolver problemas matemáticos."
},
"qwen2.5-omni-7b": {
"description": "La serie de modelos Qwen-Omni admite la entrada de datos de múltiples modalidades, incluyendo video, audio, imágenes y texto, y produce audio y texto como salida."
},
"qwen2.5-vl-32b-instruct": {
"description": "Qwen2.5 VL 32B Instruct, modelo multimodal de código abierto, ideal para despliegue privado y aplicaciones en diversos escenarios."
},
"qwen2.5-vl-72b-instruct": {
"description": "Mejora general en seguimiento de instrucciones, matemáticas, resolución de problemas y código, con capacidades de reconocimiento de objetos mejoradas, soporta formatos diversos para localizar elementos visuales con precisión, y puede entender archivos de video largos (hasta 10 minutos) y localizar eventos en segundos, comprendiendo la secuencia y velocidad del tiempo, soportando el control de agentes en OS o móviles, con fuerte capacidad de extracción de información clave y salida en formato Json. Esta versión es la de 72B, la más potente de la serie."
},
"qwen2.5-vl-7b-instruct": {
"description": "Qwen2.5 VL 7B Instruct, modelo multimodal ligero, que equilibra coste de implementación y capacidad de reconocimiento."
},
"qwen2.5-vl-instruct": {
"description": "Qwen2.5-VL es la última versión del modelo de lenguaje visual de la familia de modelos Qwen."
},
"qwen2.5:0.5b": {
"description": "Qwen2.5 es la nueva generación de modelos de lenguaje a gran escala de Alibaba, que ofrece un rendimiento excepcional para satisfacer diversas necesidades de aplicación."
},
"qwen2.5:1.5b": {
"description": "Qwen2.5 es la nueva generación de modelos de lenguaje a gran escala de Alibaba, que ofrece un rendimiento excepcional para satisfacer diversas necesidades de aplicación."
},
"qwen2.5:72b": {
"description": "Qwen2.5 es la nueva generación de modelos de lenguaje a gran escala de Alibaba, que ofrece un rendimiento excepcional para satisfacer diversas necesidades de aplicación."
},
"qwen2:0.5b": {
"description": "Qwen2 es el nuevo modelo de lenguaje a gran escala de Alibaba, que ofrece un rendimiento excepcional para satisfacer diversas necesidades de aplicación."
},
"qwen2:1.5b": {
"description": "Qwen2 es el nuevo modelo de lenguaje a gran escala de Alibaba, que ofrece un rendimiento excepcional para satisfacer diversas necesidades de aplicación."
},
"qwen2:72b": {
"description": "Qwen2 es el nuevo modelo de lenguaje a gran escala de Alibaba, que ofrece un rendimiento excepcional para satisfacer diversas necesidades de aplicación."
},
"qwen3": {
"description": "Qwen3 es la nueva generación de modelo de lenguaje a gran escala de Alibaba, que ofrece un rendimiento excepcional para satisfacer diversas necesidades de aplicación."
},
"qwen3-0.6b": {
"description": "Qwen3 0.6B, modelo de nivel inicial, adecuado para razonamiento simple y entornos con recursos extremadamente limitados."
},
"qwen3-1.7b": {
"description": "Qwen3 1.7B, modelo ultraligero, fácil de implementar en dispositivos periféricos y terminales."
},
"qwen3-14b": {
"description": "Qwen3 14B, modelo de tamaño medio, ideal para generación de texto y preguntas multilingües."
},
"qwen3-235b-a22b": {
"description": "Qwen3 235B A22B, modelo general de gran tamaño, orientado a tareas complejas diversas."
},
"qwen3-235b-a22b-instruct-2507": {
"description": "Qwen3 235B A22B Instruct 2507, modelo insignia de instrucciones, ideal para generación y razonamiento en múltiples tareas."
},
"qwen3-235b-a22b-thinking-2507": {
"description": "Qwen3 235B A22B Thinking 2507, modelo de pensamiento a gran escala, diseñado para razonamiento de alta dificultad."
},
"qwen3-30b-a3b": {
"description": "Qwen3 30B A3B, modelo general de tamaño medio a grande, equilibrado entre coste y rendimiento."
},
"qwen3-30b-a3b-instruct-2507": {
"description": "Qwen3 30B A3B Instruct 2507, modelo de instrucciones de tamaño medio a grande, ideal para generación y preguntas de alta calidad."
},
"qwen3-30b-a3b-thinking-2507": {
"description": "Qwen3 30B A3B Thinking 2507, modelo de pensamiento de tamaño medio a grande, que equilibra precisión y coste."
},
"qwen3-32b": {
"description": "Qwen3 32B, adecuado para tareas generales que requieren mayor capacidad de comprensión."
},
"qwen3-4b": {
"description": "Qwen3 4B, ideal para aplicaciones pequeñas y medianas y escenarios de inferencia local."
},
"qwen3-8b": {
"description": "Qwen3 8B, modelo ligero, implementación flexible, adecuado para servicios de alta concurrencia."
},
"qwen3-coder-30b-a3b-instruct": {
"description": "Versión de código abierto del modelo de codificación Tongyi Qianwen. El nuevo qwen3-coder-30b-a3b-instruct, basado en Qwen3, es un modelo de generación de código con potentes capacidades como Agente de Programación, especializado en llamadas a herramientas e interacción con entornos, capaz de programar de forma autónoma con habilidades de codificación sobresalientes y capacidades generales."
},
"qwen3-coder-480b-a35b-instruct": {
"description": "Qwen3 Coder 480B A35B Instruct, modelo insignia para programación, compatible con múltiples lenguajes y comprensión de código complejo."
},
"qwen3-coder-flash": {
"description": "Modelo de código Tongyi Qianwen. La última serie de modelos Qwen3-Coder está basada en Qwen3 para generación de código, con una potente capacidad de agente de codificación, experta en llamadas a herramientas e interacción con el entorno, capaz de programación autónoma, combinando una excelente habilidad en código con capacidades generales."
},
"qwen3-coder-plus": {
"description": "Modelo de código Tongyi Qianwen. La última serie de modelos Qwen3-Coder está basada en Qwen3 para generación de código, con una potente capacidad de agente de codificación, experta en llamadas a herramientas e interacción con el entorno, capaz de programación autónoma, combinando una excelente habilidad en código con capacidades generales."
},
"qwen3-coder:480b": {
"description": "Modelo de contexto largo de alto rendimiento de Alibaba, optimizado para tareas de agentes y codificación."
},
"qwen3-max": {
"description": "La serie Max de Tongyi Qianwen 3 representa una mejora significativa en la capacidad general respecto a la serie 2.5, con habilidades mejoradas en comprensión de texto en chino e inglés, seguimiento de instrucciones complejas, tareas abiertas subjetivas, multilingüismo y llamadas a herramientas; además, reduce las alucinaciones de conocimiento del modelo. La última versión qwen3-max ha sido especialmente mejorada en programación de agentes y llamadas a herramientas respecto a la versión previa qwen3-max-preview. El modelo oficial lanzado alcanza un nivel SOTA en su campo, adaptándose a demandas más complejas de agentes."
},
"qwen3-max-preview": {
"description": "El modelo más avanzado de la serie Tongyi Qianwen, ideal para tareas complejas y de múltiples pasos. La versión preliminar ya admite razonamiento."
},
"qwen3-next-80b-a3b-instruct": {
"description": "Modelo de código abierto de nueva generación basado en Qwen3 en modo no reflexivo, que ofrece una mejor comprensión del texto en chino, mayor capacidad de razonamiento lógico y un mejor desempeño en tareas de generación de texto en comparación con la versión anterior (Tongyi Qianwen 3-235B-A22B-Instruct-2507)."
},
"qwen3-next-80b-a3b-thinking": {
"description": "Qwen3 Next 80B A3B Thinking, versión insignia de razonamiento orientada a tareas complejas."
},
"qwen3-omni-flash": {
"description": "El modelo Qwen-Omni puede recibir entradas combinadas de texto, imágenes, audio y video, y generar respuestas en forma de texto o voz. Ofrece múltiples voces humanizadas, admite salida de voz en varios idiomas y dialectos, y puede aplicarse en escenarios como creación de texto, reconocimiento visual y asistentes de voz."
},
"qwen3-vl-235b-a22b-instruct": {
"description": "Qwen3 VL 235B A22B Instruct, modelo multimodal insignia, orientado a escenarios exigentes de comprensión y creación."
},
"qwen3-vl-235b-a22b-thinking": {
"description": "Qwen3 VL 235B A22B Thinking, versión de pensamiento insignia, diseñada para tareas complejas de razonamiento y planificación multimodal."
},
"qwen3-vl-30b-a3b-instruct": {
"description": "Qwen3 VL 30B A3B Instruct, modelo multimodal de gran tamaño, que equilibra precisión y rendimiento de razonamiento."
},
"qwen3-vl-30b-a3b-thinking": {
"description": "Qwen3 VL 30B A3B Thinking, versión de pensamiento para tareas multimodales complejas."
},
"qwen3-vl-32b-instruct": {
"description": "Qwen3 VL 32B Instruct, modelo multimodal ajustado por instrucciones, ideal para preguntas y creación de alta calidad con texto e imagen."
},
"qwen3-vl-32b-thinking": {
"description": "Qwen3 VL 32B Thinking, versión de pensamiento multimodal, reforzada para razonamiento complejo y análisis de cadenas largas."
},
"qwen3-vl-8b-instruct": {
"description": "Qwen3 VL 8B Instruct, modelo multimodal ligero, adecuado para preguntas visuales cotidianas e integración en aplicaciones."
},
"qwen3-vl-8b-thinking": {
"description": "Qwen3 VL 8B Thinking, modelo de cadena de pensamiento multimodal, ideal para razonamiento detallado sobre información visual."
},
"qwen3-vl-flash": {
"description": "Qwen3 VL Flash: versión ligera de inferencia rápida, ideal para escenarios sensibles a la latencia o con solicitudes en gran volumen."
},
"qwen3-vl-plus": {
"description": "Tongyi Qianwen VL es un modelo generativo de texto con capacidad de comprensión visual (imágenes). No solo puede realizar OCR (reconocimiento de texto en imágenes), sino también resumir y razonar, por ejemplo, extrayendo atributos de fotos de productos o resolviendo problemas a partir de imágenes de ejercicios."
},
"qwq": {
"description": "QwQ es un modelo de investigación experimental que se centra en mejorar la capacidad de razonamiento de la IA."
},
"qwq-32b": {
"description": "El modelo de inferencia QwQ, entrenado con el modelo Qwen2.5-32B, ha mejorado significativamente su capacidad de inferencia a través del aprendizaje por refuerzo. Los indicadores clave del modelo, como el código matemático y otros indicadores centrales (AIME 24/25, LiveCodeBench), así como algunos indicadores generales (IFEval, LiveBench, etc.), han alcanzado el nivel del modelo DeepSeek-R1 en su versión completa, superando notablemente a DeepSeek-R1-Distill-Qwen-32B, que también se basa en Qwen2.5-32B."
},
"qwq-32b-preview": {
"description": "El modelo QwQ es un modelo de investigación experimental desarrollado por el equipo de Qwen, enfocado en mejorar la capacidad de razonamiento de la IA."
},
"qwq-plus": {
"description": "Modelo de razonamiento QwQ basado en el modelo Qwen2.5, que mejora significativamente la capacidad de razonamiento mediante aprendizaje reforzado. Los indicadores clave en matemáticas y código (AIME 24/25, LiveCodeBench) y algunos indicadores generales (IFEval, LiveBench, etc.) alcanzan el nivel completo de DeepSeek-R1."
},
"qwq_32b": {
"description": "Modelo de inferencia de tamaño mediano de la serie Qwen. En comparación con los modelos tradicionales de ajuste por instrucciones, QwQ, que posee capacidades de pensamiento y razonamiento, puede mejorar significativamente el rendimiento en tareas de resolución de problemas, especialmente en tareas difíciles."
},
"r1-1776": {
"description": "R1-1776 es una versión del modelo DeepSeek R1, que ha sido entrenada posteriormente para proporcionar información factual sin censura y sin sesgos."
},
"solar-mini": {
"description": "Solar Mini es un LLM compacto que supera a GPT-3.5, con potentes capacidades multilingües, soportando inglés y coreano, ofreciendo soluciones eficientes y compactas."
},
"solar-mini-ja": {
"description": "Solar Mini (Ja) amplía las capacidades de Solar Mini, enfocándose en japonés, mientras mantiene un rendimiento eficiente y excelente en el uso de inglés y coreano."
},
"solar-pro": {
"description": "Solar Pro es un LLM de alta inteligencia lanzado por Upstage, enfocado en la capacidad de seguimiento de instrucciones en un solo GPU, con una puntuación IFEval superior a 80. Actualmente soporta inglés, y se planea lanzar la versión oficial en noviembre de 2024, ampliando el soporte de idiomas y la longitud del contexto."
},
"sonar": {
"description": "Producto de búsqueda ligero basado en contexto de búsqueda, más rápido y económico que Sonar Pro."
},
"sonar-deep-research": {
"description": "Deep Research realiza una investigación exhaustiva a nivel de expertos y la compila en informes accesibles y prácticos."
},
"sonar-pro": {
"description": "Producto de búsqueda avanzada que soporta contexto de búsqueda, consultas avanzadas y seguimiento."
},
"sonar-reasoning": {
"description": "Nuevo producto API respaldado por el modelo de razonamiento de DeepSeek."
},
"sonar-reasoning-pro": {
"description": "Un nuevo producto API respaldado por el modelo de razonamiento DeepSeek."
},
"spark-x": {
"description": "Descripción de capacidades de X1.5: (1) Nuevo ajuste dinámico del modo de pensamiento, controlado mediante el campo 'thinking'; (2) Longitud de contexto aumentada: 64K de entrada y 64K de salida; (3) Soporte para la función FunctionCall."
},
"stable-diffusion-3-medium": {
"description": "El último gran modelo de generación de imágenes a partir de texto lanzado por Stability AI. Esta versión mejora significativamente la calidad de imagen, comprensión textual y diversidad de estilos, heredando las ventajas de generaciones anteriores. Puede interpretar con mayor precisión indicaciones complejas en lenguaje natural y generar imágenes más precisas y variadas."
},
"stable-diffusion-3.5-large": {
"description": "stable-diffusion-3.5-large es un modelo generativo multimodal de difusión transformadora (MMDiT) con 800 millones de parámetros, que ofrece calidad de imagen sobresaliente y alta correspondencia con las indicaciones. Soporta generación de imágenes de alta resolución de hasta 1 millón de píxeles y funciona eficientemente en hardware de consumo común."
},
"stable-diffusion-3.5-large-turbo": {
"description": "stable-diffusion-3.5-large-turbo es un modelo basado en stable-diffusion-3.5-large que utiliza tecnología de destilación de difusión adversarial (ADD) para lograr mayor velocidad."
},
"stable-diffusion-v1.5": {
"description": "stable-diffusion-v1.5 se inicializa con pesos del punto de control stable-diffusion-v1.2 y se ajusta finamente durante 595k pasos a resolución 512x512 sobre \"laion-aesthetics v2 5+\", reduciendo en un 10% la condicionamiento textual para mejorar el muestreo guiado sin clasificador."
},
"stable-diffusion-xl": {
"description": "stable-diffusion-xl presenta mejoras significativas respecto a la versión v1.5 y ofrece resultados comparables al modelo SOTA de código abierto midjourney. Las mejoras incluyen un backbone unet tres veces mayor, un módulo de refinamiento para mejorar la calidad de las imágenes generadas y técnicas de entrenamiento más eficientes."
},
"stable-diffusion-xl-base-1.0": {
"description": "Modelo generativo de imágenes a partir de texto desarrollado y liberado por Stability AI, con capacidades creativas líderes en la industria. Posee excelente comprensión de instrucciones y soporta definiciones de contenido mediante prompts inversos para generación precisa."
},
"step-1-128k": {
"description": "Equilibrio entre rendimiento y costo, adecuado para escenarios generales."
},
"step-1-256k": {
"description": "Capacidad de procesamiento de contexto de longitud ultra larga, especialmente adecuada para análisis de documentos largos."
},
"step-1-32k": {
"description": "Soporta diálogos de longitud media, adecuado para diversas aplicaciones."
},
"step-1-8k": {
"description": "Modelo pequeño, adecuado para tareas ligeras."
},
"step-1-flash": {
"description": "Modelo de alta velocidad, adecuado para diálogos en tiempo real."
},
"step-1.5v-mini": {
"description": "Este modelo tiene una potente capacidad de comprensión de video."
},
"step-1o-turbo-vision": {
"description": "Este modelo tiene una poderosa capacidad de comprensión de imágenes, superando a 1o en matemáticas y programación. El modelo es más pequeño que 1o y tiene una velocidad de salida más rápida."
},
"step-1o-vision-32k": {
"description": "Este modelo posee una poderosa capacidad de comprensión de imágenes. En comparación con la serie de modelos step-1v, ofrece un rendimiento visual superior."
},
"step-1v-32k": {
"description": "Soporta entradas visuales, mejorando la experiencia de interacción multimodal."
},
"step-1v-8k": {
"description": "Modelo visual pequeño, adecuado para tareas básicas de texto e imagen."
},
"step-1x-edit": {
"description": "Modelo especializado en tareas de edición de imágenes, capaz de modificar y mejorar imágenes según descripciones textuales e imágenes de ejemplo proporcionadas por el usuario. Entiende la intención del usuario y genera resultados de edición de imagen que cumplen con los requisitos."
},
"step-1x-medium": {
"description": "Modelo con fuerte capacidad de generación de imágenes, que soporta entrada mediante descripciones textuales. Posee soporte nativo para chino, comprendiendo y procesando mejor descripciones en este idioma, capturando con mayor precisión la semántica para convertirla en características visuales y lograr generación de imágenes más precisa. Puede generar imágenes de alta resolución y calidad, con cierta capacidad de transferencia de estilo."
},
"step-2-16k": {
"description": "Soporta interacciones de contexto a gran escala, adecuado para escenarios de diálogo complejos."
},
"step-2-16k-exp": {
"description": "Versión experimental del modelo step-2, que incluye las características más recientes y se actualiza continuamente. No se recomienda su uso en entornos de producción formales."
},
"step-2-mini": {
"description": "Un modelo de gran velocidad basado en la nueva arquitectura de atención autogestionada MFA, que logra efectos similares a los de step1 a un costo muy bajo, manteniendo al mismo tiempo un mayor rendimiento y tiempos de respuesta más rápidos. Capaz de manejar tareas generales, con habilidades destacadas en programación."
},
"step-2x-large": {
"description": "Nueva generación del modelo Step Star para generación de imágenes, enfocado en tareas de generación basadas en texto, capaz de crear imágenes de alta calidad según descripciones proporcionadas por el usuario. El nuevo modelo produce imágenes con texturas más realistas y mejor capacidad para generar texto en chino e inglés."
},
"step-3": {
"description": "Este modelo cuenta con una destacada capacidad de percepción visual y de razonamiento complejo. Es capaz de realizar con precisión la comprensión de conocimientos complejos entre distintos ámbitos, el análisis cruzado de información matemática y visual, así como una amplia variedad de problemas de análisis visual en la vida cotidiana."
},
"step-r1-v-mini": {
"description": "Este modelo es un gran modelo de inferencia con una poderosa capacidad de comprensión de imágenes, capaz de procesar información de imágenes y texto, generando contenido textual tras un profundo razonamiento. Este modelo destaca en el campo del razonamiento visual, además de poseer capacidades de razonamiento matemático, de código y textual de primer nivel. La longitud del contexto es de 100k."
},
"stepfun-ai/step3": {
"description": "Step3 es un modelo de inferencia multimodal de vanguardia publicado por 阶跃星辰 (StepFun), construido sobre una arquitectura Mixture-of-Experts (MoE) con 321B de parámetros totales y 38B de parámetros de activación. El modelo presenta un diseño de extremo a extremo orientado a minimizar el coste de decodificación, al tiempo que ofrece un rendimiento de primer nivel en razonamiento visual-lingüístico. Gracias al diseño sinérgico entre la atención por descomposición de múltiples matrices (MFA) y el desacoplamiento atenciónFFN (AFD), Step3 mantiene una eficiencia sobresaliente tanto en aceleradores de gama alta como de gama baja. En la fase de preentrenamiento, Step3 procesó más de 20T de tokens de texto y 4T de tokens mixtos imagen-texto, abarcando más de una decena de idiomas. El modelo ha alcanzado niveles líderes entre los modelos de código abierto en múltiples benchmarks, incluidos matemáticas, código y tareas multimodales."
},
"taichu_llm": {
"description": "El modelo de lenguaje Taichu de Zīdōng tiene una poderosa capacidad de comprensión del lenguaje, así como habilidades en creación de textos, preguntas y respuestas, programación de código, cálculos matemáticos, razonamiento lógico, análisis de sentimientos y resúmenes de texto. Combina de manera innovadora el preentrenamiento con grandes datos y un conocimiento rico de múltiples fuentes, perfeccionando continuamente la tecnología algorítmica y absorbiendo nuevos conocimientos en vocabulario, estructura, gramática y semántica de grandes volúmenes de datos textuales, logrando una evolución constante del modelo. Proporciona a los usuarios información y servicios más convenientes, así como una experiencia más inteligente."
},
"taichu_o1": {
"description": "taichu_o1 es un nuevo modelo de inferencia de gran escala, que logra un razonamiento similar al humano a través de interacciones multimodales y aprendizaje por refuerzo, apoyando la deducción de decisiones complejas, mostrando rutas de pensamiento modeladas mientras mantiene una alta precisión en la salida, adecuado para análisis de estrategias y razonamiento profundo."
},
"taichu_vl": {
"description": "Integra capacidades de comprensión de imágenes, transferencia de conocimiento y atribución lógica, destacándose en el campo de preguntas y respuestas basadas en texto e imagen."
},
"tencent/Hunyuan-A13B-Instruct": {
"description": "Hunyuan-A13B-Instruct cuenta con 80 mil millones de parámetros, activando solo 13 mil millones para igualar modelos más grandes, soporta razonamiento híbrido de \"pensamiento rápido/pensamiento lento\"; comprensión estable de textos largos; validado por BFCL-v3 y τ-Bench, con capacidades avanzadas de agente; combina GQA y múltiples formatos de cuantificación para lograr inferencias eficientes."
},
"tencent/Hunyuan-MT-7B": {
"description": "El modelo de traducción Hunyuan (Hunyuan Translation Model) está compuesto por el modelo de traducción Hunyuan-MT-7B y el modelo integrado Hunyuan-MT-Chimera. Hunyuan-MT-7B es un modelo de traducción ligero con 7 mil millones de parámetros, diseñado para traducir texto fuente a un idioma objetivo. Admite traducción entre 33 idiomas y 5 lenguas minoritarias chinas. En la competencia internacional de traducción automática WMT25, Hunyuan-MT-7B obtuvo el primer lugar en 30 de las 31 categorías lingüísticas en las que participó, demostrando su sobresaliente capacidad de traducción. Para escenarios de traducción, Tencent Hunyuan ha propuesto un paradigma de entrenamiento completo que abarca desde el preentrenamiento hasta el ajuste supervisado, seguido de refuerzo para traducción e integración, logrando un rendimiento líder en la industria entre modelos de tamaño similar. El modelo es eficiente en cómputo, fácil de implementar y adecuado para múltiples aplicaciones."
},
"text-embedding-3-large": {
"description": "El modelo de vectorización más potente, adecuado para tareas en inglés y no inglés."
},
"text-embedding-3-small": {
"description": "Un modelo de Embedding de nueva generación, eficiente y económico, adecuado para la recuperación de conocimiento, aplicaciones RAG y más."
},
"thudm/glm-4-32b": {
"description": "GLM-4-32B-0414 es un modelo de lenguaje de pesos abiertos de 32B bilingüe (chino-inglés), optimizado para generación de código, llamadas a funciones y tareas de estilo agente. Ha sido preentrenado en 15T de datos de alta calidad y re-razonamiento, y se ha perfeccionado aún más utilizando alineación de preferencias humanas, muestreo de rechazo y aprendizaje por refuerzo. Este modelo destaca en razonamiento complejo, generación de artefactos y tareas de salida estructurada, alcanzando un rendimiento comparable al de GPT-4o y DeepSeek-V3-0324 en múltiples pruebas de referencia."
},
"thudm/glm-4-32b:free": {
"description": "GLM-4-32B-0414 es un modelo de lenguaje de pesos abiertos de 32B bilingüe (chino-inglés), optimizado para generación de código, llamadas a funciones y tareas de estilo agente. Ha sido preentrenado en 15T de datos de alta calidad y re-razonamiento, y se ha perfeccionado aún más utilizando alineación de preferencias humanas, muestreo de rechazo y aprendizaje por refuerzo. Este modelo destaca en razonamiento complejo, generación de artefactos y tareas de salida estructurada, alcanzando un rendimiento comparable al de GPT-4o y DeepSeek-V3-0324 en múltiples pruebas de referencia."
},
"thudm/glm-4-9b-chat": {
"description": "Versión de código abierto de la última generación del modelo preentrenado GLM-4 lanzado por Zhizhu AI."
},
"thudm/glm-z1-32b": {
"description": "GLM-Z1-32B-0414 es una variante de razonamiento mejorada de GLM-4-32B, construida para resolver problemas de matemáticas profundas, lógica y orientados al código. Aplica aprendizaje por refuerzo extendido (específico para tareas y basado en preferencias emparejadas generales) para mejorar el rendimiento en tareas complejas de múltiples pasos. En comparación con el modelo base GLM-4-32B, Z1 mejora significativamente las capacidades de razonamiento estructurado y en dominios formalizados.\n\nEste modelo admite la ejecución forzada de pasos de 'pensamiento' a través de ingeniería de indicaciones y proporciona una coherencia mejorada para salidas de formato largo. Está optimizado para flujos de trabajo de agentes y admite contextos largos (a través de YaRN), llamadas a herramientas JSON y configuraciones de muestreo de alta precisión para razonamiento estable. Es ideal para casos de uso que requieren razonamiento reflexivo, de múltiples pasos o deducción formal."
},
"thudm/glm-z1-rumination-32b": {
"description": "THUDM: GLM Z1 Rumination 32B es un modelo de razonamiento profundo de 32B parámetros en la serie GLM-4-Z1, optimizado para tareas complejas y abiertas que requieren un pensamiento prolongado. Se basa en glm-4-32b-0414, añadiendo una fase adicional de aprendizaje por refuerzo y estrategias de alineación multietapa, introduciendo una capacidad de 'reflexión' diseñada para simular el procesamiento cognitivo extendido. Esto incluye razonamiento iterativo, análisis de múltiples saltos y flujos de trabajo mejorados por herramientas, como búsqueda, recuperación y síntesis consciente de citas.\n\nEste modelo destaca en escritura de investigación, análisis comparativo y preguntas complejas. Soporta llamadas a funciones para primitivos de búsqueda y navegación (`search`, `click`, `open`, `finish`), lo que permite su uso en tuberías de agentes. El comportamiento reflexivo está moldeado por un control cíclico de múltiples rondas con mecanismos de recompensa basados en reglas y decisiones retrasadas, y se basa en marcos de investigación profunda como el stack de alineación interno de OpenAI. Esta variante es adecuada para escenarios que requieren profundidad en lugar de velocidad."
},
"tngtech/deepseek-r1t-chimera:free": {
"description": "DeepSeek-R1T-Chimera se crea combinando DeepSeek-R1 y DeepSeek-V3 (0324), fusionando la capacidad de razonamiento de R1 con las mejoras de eficiencia de tokens de V3. Se basa en la arquitectura DeepSeek-MoE Transformer y está optimizado para tareas generales de generación de texto.\n\nEste modelo combina los pesos preentrenados de los dos modelos fuente para equilibrar el rendimiento en razonamiento, eficiencia y tareas de seguimiento de instrucciones. Se publica bajo la licencia MIT, destinado a fines de investigación y comerciales."
},
"togethercomputer/StripedHyena-Nous-7B": {
"description": "StripedHyena Nous (7B) proporciona una capacidad de cálculo mejorada a través de estrategias y arquitecturas de modelos eficientes."
},
"tts-1": {
"description": "El modelo más reciente de texto a voz, optimizado para velocidad en escenarios en tiempo real."
},
"tts-1-hd": {
"description": "El modelo más reciente de texto a voz, optimizado para calidad."
},
"upstage/SOLAR-10.7B-Instruct-v1.0": {
"description": "Upstage SOLAR Instruct v1 (11B) es adecuado para tareas de instrucciones detalladas, ofreciendo una excelente capacidad de procesamiento de lenguaje."
},
"us.anthropic.claude-3-5-sonnet-20241022-v2:0": {
"description": "Claude 3.5 Sonnet eleva el estándar de la industria, superando a modelos competidores y a Claude 3 Opus, destacándose en evaluaciones amplias, mientras mantiene la velocidad y costo de nuestros modelos de nivel medio."
},
"us.anthropic.claude-3-7-sonnet-20250219-v1:0": {
"description": "Claude 3.7 sonnet es el modelo de próxima generación más rápido de Anthropic. En comparación con Claude 3 Haiku, Claude 3.7 Sonnet ha mejorado en todas las habilidades y ha superado al modelo más grande de la generación anterior, Claude 3 Opus, en muchas pruebas de referencia de inteligencia."
},
"us.anthropic.claude-haiku-4-5-20251001-v1:0": {
"description": "Claude Haiku 4.5 es el modelo Haiku más rápido e inteligente de Anthropic, con una velocidad relámpago y una capacidad de razonamiento ampliada."
},
"us.anthropic.claude-sonnet-4-5-20250929-v1:0": {
"description": "Claude Sonnet 4.5 es el modelo más inteligente desarrollado por Anthropic hasta la fecha."
},
"v0-1.0-md": {
"description": "El modelo v0-1.0-md es una versión antigua que ofrece servicios a través de la API v0"
},
"v0-1.5-lg": {
"description": "El modelo v0-1.5-lg es adecuado para tareas avanzadas de pensamiento o razonamiento"
},
"v0-1.5-md": {
"description": "El modelo v0-1.5-md es adecuado para tareas cotidianas y generación de interfaces de usuario (UI)"
},
"vercel/v0-1.0-md": {
"description": "Acceso al modelo detrás de v0 para generar, reparar y optimizar aplicaciones web modernas, con razonamiento específico para frameworks y conocimiento actualizado."
},
"vercel/v0-1.5-md": {
"description": "Acceso al modelo detrás de v0 para generar, reparar y optimizar aplicaciones web modernas, con razonamiento específico para frameworks y conocimiento actualizado."
},
"volcengine/doubao-seed-code": {
"description": "Doubao-Seed-Code es el modelo de Byte Volcengine optimizado para programación agentica, con excelente rendimiento en múltiples benchmarks de programación y agentes, compatible con contexto de 256K."
},
"wan2.2-t2i-flash": {
"description": "Versión ultra rápida Wanxiang 2.2, el modelo más reciente. Mejora integral en creatividad, estabilidad y realismo, con velocidad de generación rápida y alta relación calidad-precio."
},
"wan2.2-t2i-plus": {
"description": "Versión profesional Wanxiang 2.2, el modelo más reciente. Mejora integral en creatividad, estabilidad y realismo, con generación de detalles ricos."
},
"wanx-v1": {
"description": "Modelo base de generación de imágenes a partir de texto, correspondiente al modelo general 1.0 del sitio oficial Tongyi Wanxiang."
},
"wanx2.0-t2i-turbo": {
"description": "Especializado en retratos con textura, velocidad media y bajo costo. Corresponde al modelo ultra rápido 2.0 del sitio oficial Tongyi Wanxiang."
},
"wanx2.1-t2i-plus": {
"description": "Versión completamente mejorada. Genera imágenes con detalles más ricos, velocidad ligeramente más lenta. Corresponde al modelo profesional 2.1 del sitio oficial Tongyi Wanxiang."
},
"wanx2.1-t2i-turbo": {
"description": "Versión completamente mejorada. Generación rápida, resultados completos y alta relación calidad-precio. Corresponde al modelo ultra rápido 2.1 del sitio oficial Tongyi Wanxiang."
},
"whisper-1": {
"description": "Modelo universal de reconocimiento de voz que soporta reconocimiento de voz multilingüe, traducción de voz y detección de idioma."
},
"wizardlm2": {
"description": "WizardLM 2 es un modelo de lenguaje proporcionado por Microsoft AI, que destaca en diálogos complejos, multilingües, razonamiento y asistentes inteligentes."
},
"wizardlm2:8x22b": {
"description": "WizardLM 2 es un modelo de lenguaje proporcionado por Microsoft AI, que destaca en diálogos complejos, multilingües, razonamiento y asistentes inteligentes."
},
"x-ai/grok-4": {
"description": "Grok 4 es el modelo de razonamiento insignia de xAI, con potentes capacidades de razonamiento y multimodalidad."
},
"x-ai/grok-4-fast": {
"description": "Grok 4 Fast es un modelo de alto rendimiento y bajo coste de xAI (compatible con ventana de contexto de 2M), ideal para escenarios de alta concurrencia y contexto largo."
},
"x-ai/grok-4-fast-non-reasoning": {
"description": "Grok 4 Fast (Non-Reasoning) es un modelo multimodal de alto rendimiento y bajo coste de xAI (compatible con ventana de contexto de 2M), diseñado para escenarios sensibles a latencia y coste que no requieren razonamiento interno. Funciona junto con la versión con razonamiento de Grok 4 Fast, y se puede activar el razonamiento mediante el parámetro reasoning enable en la API. Los prompts y completions pueden ser utilizados por xAI u OpenRouter para mejorar modelos futuros."
},
"x-ai/grok-4.1-fast": {
"description": "Grok 4 Fast es un modelo de alto rendimiento y bajo coste de xAI (compatible con ventana de contexto de 2M), ideal para escenarios de alta concurrencia y contexto largo."
},
"x-ai/grok-4.1-fast-non-reasoning": {
"description": "Grok 4 Fast (Non-Reasoning) es un modelo multimodal de alto rendimiento y bajo coste de xAI (compatible con ventana de contexto de 2M), diseñado para escenarios sensibles a latencia y coste que no requieren razonamiento interno. Funciona junto con la versión con razonamiento de Grok 4 Fast, y se puede activar el razonamiento mediante el parámetro reasoning enable en la API. Los prompts y completions pueden ser utilizados por xAI u OpenRouter para mejorar modelos futuros."
},
"x-ai/grok-code-fast-1": {
"description": "Grok Code Fast 1 es el modelo rápido de código de xAI, con salidas legibles y adaptadas a la ingeniería."
},
"xai/grok-2": {
"description": "Grok 2 es un modelo de lenguaje de vanguardia con capacidades de razonamiento avanzadas. Sobresale en chat, codificación y razonamiento, superando a Claude 3.5 Sonnet y GPT-4-Turbo en la clasificación LMSYS."
},
"xai/grok-2-vision": {
"description": "El modelo visual Grok 2 sobresale en tareas basadas en visión, ofreciendo un rendimiento de vanguardia en razonamiento matemático visual (MathVista) y preguntas y respuestas basadas en documentos (DocVQA). Puede procesar diversos tipos de información visual, incluyendo documentos, gráficos, diagramas, capturas de pantalla y fotografías."
},
"xai/grok-3": {
"description": "Modelo insignia de xAI que sobresale en casos de uso empresariales como extracción de datos, codificación y resumen de texto. Posee un profundo conocimiento en finanzas, salud, derecho y ciencias."
},
"xai/grok-3-fast": {
"description": "Modelo insignia de xAI que sobresale en casos de uso empresariales como extracción de datos, codificación y resumen de texto. La variante rápida del modelo opera en infraestructura más veloz, ofreciendo tiempos de respuesta mucho más rápidos que el estándar, a un costo mayor por token de salida."
},
"xai/grok-3-mini": {
"description": "Modelo ligero de xAI que piensa antes de responder. Ideal para tareas simples o basadas en lógica que no requieren profundo conocimiento especializado. La trayectoria de pensamiento original es accesible."
},
"xai/grok-3-mini-fast": {
"description": "Modelo ligero de xAI que piensa antes de responder. Ideal para tareas simples o basadas en lógica que no requieren profundo conocimiento especializado. La trayectoria de pensamiento original es accesible. La variante rápida del modelo opera en infraestructura más veloz, ofreciendo tiempos de respuesta mucho más rápidos que el estándar, a un costo mayor por token de salida."
},
"xai/grok-4": {
"description": "El modelo insignia más reciente y avanzado de xAI, que ofrece un rendimiento inigualable en lenguaje natural, matemáticas y razonamiento, siendo un competidor perfecto y versátil."
},
"yi-large": {
"description": "Modelo de mil millones de parámetros completamente nuevo, que ofrece capacidades excepcionales de preguntas y respuestas y generación de texto."
},
"yi-large-fc": {
"description": "Basado en el modelo yi-large, soporta y refuerza la capacidad de llamadas a herramientas, adecuado para diversos escenarios de negocio que requieren la construcción de agentes o flujos de trabajo."
},
"yi-large-preview": {
"description": "Versión inicial, se recomienda usar yi-large (nueva versión)."
},
"yi-large-rag": {
"description": "Servicio de alto nivel basado en el modelo yi-large, combinando técnicas de recuperación y generación para proporcionar respuestas precisas y servicios de búsqueda de información en tiempo real."
},
"yi-large-turbo": {
"description": "Excelente relación calidad-precio y rendimiento excepcional. Ajuste de alta precisión basado en el rendimiento, velocidad de razonamiento y costo."
},
"yi-lightning": {
"description": "Último modelo de alto rendimiento que garantiza una salida de alta calidad y mejora significativamente la velocidad de razonamiento."
},
"yi-lightning-lite": {
"description": "Versión ligera, se recomienda usar yi-lightning."
},
"yi-medium": {
"description": "Modelo de tamaño mediano, ajustado y equilibrado, con una buena relación calidad-precio. Optimización profunda de la capacidad de seguimiento de instrucciones."
},
"yi-medium-200k": {
"description": "Ventana de contexto de 200K, que ofrece una profunda comprensión y generación de texto de largo formato."
},
"yi-spark": {
"description": "Pequeño y ágil, modelo ligero y rápido. Ofrece capacidades mejoradas de cálculo matemático y escritura de código."
},
"yi-vision": {
"description": "Modelo para tareas visuales complejas, que ofrece un alto rendimiento en comprensión y análisis de imágenes."
},
"yi-vision-v2": {
"description": "Modelo para tareas visuales complejas, que ofrece capacidades de comprensión y análisis de alto rendimiento basadas en múltiples imágenes."
},
"z-ai/glm-4.5": {
"description": "GLM 4.5 es el modelo insignia de Z.AI, compatible con modo de razonamiento híbrido y optimizado para ingeniería y tareas de contexto largo."
},
"z-ai/glm-4.5-air": {
"description": "GLM 4.5 Air es la versión ligera de GLM 4.5, adecuada para escenarios sensibles a costes, manteniendo una fuerte capacidad de razonamiento."
},
"z-ai/glm-4.6": {
"description": "GLM 4.6 es el modelo insignia de Z.AI, con contexto extendido y capacidades de codificación mejoradas."
},
"zai-glm-4.6": {
"description": "Rinde excelentemente en tareas de programación y razonamiento, con soporte para transmisión en tiempo real y llamadas a herramientas. Ideal para codificación agentic y escenarios de razonamiento complejo."
},
"zai-org/GLM-4.5": {
"description": "GLM-4.5 es un modelo base diseñado para aplicaciones de agentes inteligentes, utilizando arquitectura Mixture-of-Experts (MoE). Está profundamente optimizado para llamadas a herramientas, navegación web, ingeniería de software y programación frontend, soportando integración fluida con agentes de código como Claude Code y Roo Code. GLM-4.5 emplea un modo de inferencia híbrido que se adapta a escenarios de razonamiento complejo y uso cotidiano."
},
"zai-org/GLM-4.5-Air": {
"description": "GLM-4.5-Air es un modelo base diseñado para aplicaciones de agentes inteligentes, utilizando arquitectura Mixture-of-Experts (MoE). Está profundamente optimizado para llamadas a herramientas, navegación web, ingeniería de software y programación frontend, soportando integración fluida con agentes de código como Claude Code y Roo Code. GLM-4.5 emplea un modo de inferencia híbrido que se adapta a escenarios de razonamiento complejo y uso cotidiano."
},
"zai-org/GLM-4.5V": {
"description": "GLM-4.5V es la última generación de modelo de lenguaje visual (VLM) publicada por Zhipu AI. Este modelo se basa en el modelo de texto insignia GLM-4.5-Air, que cuenta con 106.000 millones de parámetros totales y 12.000 millones de parámetros de activación, y emplea una arquitectura de expertos mixtos (MoE) para lograr un rendimiento excelente con un coste de inferencia reducido. Técnicamente, GLM-4.5V continúa la línea de GLM-4.1V-Thinking e introduce innovaciones como el codificado rotacional de posiciones en 3D (3D-RoPE), que mejora de forma notable la percepción y el razonamiento sobre las relaciones en el espacio tridimensional. Gracias a optimizaciones en preentrenamiento, ajuste supervisado y aprendizaje por refuerzo, este modelo es capaz de procesar diversos tipos de contenido visual, como imágenes, vídeo y documentos largos, y ha alcanzado niveles punteros entre los modelos open source de su categoría en 41 benchmarks multimodales públicos. Además, el modelo incorpora un interruptor de 'modo de pensamiento' que permite a los usuarios alternar entre respuestas rápidas y razonamiento profundo para equilibrar eficiencia y rendimiento."
},
"zai-org/GLM-4.6": {
"description": "En comparación con GLM-4.5, GLM-4.6 presenta varias mejoras clave. Su ventana de contexto se amplió de 128K a 200K tokens, permitiendo al modelo manejar tareas de agente más complejas. El modelo obtuvo puntuaciones más altas en pruebas de referencia de código y mostró un rendimiento superior en aplicaciones como Claude Code, Cline, Roo Code y Kilo Code, incluyendo mejoras en la generación de interfaces front-end visualmente refinadas. GLM-4.6 exhibe un rendimiento de inferencia notablemente mejorado y soporta el uso de herramientas durante la inferencia, lo que aporta una capacidad integral más fuerte. Destaca en el uso de herramientas y agentes basados en búsqueda, y se integra de manera más efectiva en marcos de agentes. En escritura, el modelo se ajusta mejor a las preferencias humanas en estilo y legibilidad, y se comporta de forma más natural en escenarios de juego de roles."
},
"zai/glm-4.5": {
"description": "La serie de modelos GLM-4.5 está diseñada específicamente como modelos base para agentes inteligentes. El modelo insignia GLM-4.5 integra 355 mil millones de parámetros totales (32 mil millones activos), unificando razonamiento, codificación y capacidades de agente para abordar demandas complejas de aplicaciones. Como sistema de razonamiento híbrido, ofrece modos de operación dual."
},
"zai/glm-4.5-air": {
"description": "GLM-4.5 y GLM-4.5-Air son nuestros modelos insignia más recientes, diseñados específicamente como modelos base para aplicaciones de agentes. Ambos utilizan una arquitectura de expertos mixtos (MoE). GLM-4.5 tiene un total de 355 mil millones de parámetros con 32 mil millones activos por pasada, mientras que GLM-4.5-Air presenta un diseño más simplificado con 106 mil millones de parámetros totales y 12 mil millones activos."
},
"zai/glm-4.5v": {
"description": "GLM-4.5V está construido sobre el modelo base GLM-4.5-Air, heredando la tecnología verificada de GLM-4.1V-Thinking y logrando una escalabilidad eficiente mediante una potente arquitectura MoE de 106 mil millones de parámetros."
},
"zenmux/auto": {
"description": "La función de enrutamiento automático de ZenMux selecciona automáticamente el modelo con mejor rendimiento y relación calidad-precio entre los modelos compatibles según el contenido de tu solicitud."
}
}