Новая модель от xAI сочетает быстрые ответы и глубокие рассуждения, снижает стоимость токенов на 98% и впервые становится доступной всем пользователям без ограничений.
📚 Подробности на Хабр: https://habr.com/ru/articles/948878/
Мы — AI for Devs: разбираем модели, ИИ‑агентов и инструменты для разработчиков. Делаем практичные гайды, бенчмарки и выкладываем рабочие паттерны — всё, что помогает быстрее строить продукты с LLM. Меньше шума, больше пользы и кода. Подписывайтесь — будет чем прокачать ваш стек.
Новая модель от xAI сочетает быстрые ответы и глубокие рассуждения, снижает стоимость токенов на 98% и впервые становится доступной всем пользователям без ограничений.
📚 Подробности на Хабр: https://habr.com/ru/articles/948878/


Ключевые выводы OpenRouter по 100 трлн токенов: OSS ≈30%, рост medium‑моделей (15–70B), программирование >50%, Азия резко догоняет.

GLM-4.6 от Z.ai: контекст до 200k токенов, улучшения в кодинге и агентности, ~15% экономии по токенам; ссылки на HuggingFace и ModelScope.

Результаты бенчмарка GPT-4.1-nano: Markdown-KV даёт 60,7% точности, CSV — 44,3%; Markdown-KV дороже по токенам (×2,7). Источник: Habr.