Scaling Laws и compute‑efficient frontier в LLM
Краткий разбор работы 2020 года о scaling laws: качество LLM растёт при синхронном масштабировании модели, данных и вычислений; есть практические ограничения.
Краткий разбор работы 2020 года о scaling laws: качество LLM растёт при синхронном масштабировании модели, данных и вычислений; есть практические ограничения.
Краткий разбор исследования Anthropic «The Assistant Axis»: пространство персон в Gemma 2, Qwen 3 и Llama 3 и как ось ассистентности влияет на поведение моделей.
Короткий обзор: Grok 4.1 Fast лидирует в τ²-bench и Berkeley Function Calling v4; xAI анонсировали Agent Tools API. Доступно бесплатно до 3 декабря.
Анализ материала о том, почему громоздкие MCP‑сервера часто уступают минималистичным CLI/Bash и скриптам; пример скрапинга Hacker News.
xAI представила Grok 4.1: точнее, эмоциональнее и творчески гибче; лидерство в бенчмарках (Thinking/EQ‑Bench) и проблемы с доступом в API.
Короткий разбор Claude Skills от Anthropic: как «папки с навыками» меняют подход к интеграции ИИ и чем они отличаются от MCP.
Claude Agent (Claude 4.5 Sonnet) встроен в AI‑чат IDE JetBrains и доступен в подписке JetBrains AI; поддерживает диффы, Plan, Brave mode и работу с файлами.
По данным SemiAnalysis, Claude Code генерирует 4% публичных коммитов на GitHub; обсуждение качества и заметки о проблемах с компиляцией.
Бесплатный вебинар Veai о проблемах AI‑ассистентов на больших кодовых базах; трансляция 12 февраля в 14:30 МСК. Ссылка на регистрацию в посте.
MiniMax представили M2.5: SOTA в программировании (SWE‑Bench 80,2%), +37% скорости и бесплатный 7‑дневный доступ в OpenCode.
Запись вебинара Veai «Обзор AI-ассистентов для кодинга в 2026» доступна на Rutube; промокод veai_for_devs даёт 5000 Flex‑кредитов до 28 февраля.
Anthropic представили Claude Sonnet 4.6: контекстное окно 1M токенов (бета), преимущество в Claude Code и прежние тарифы $3/$15 за млн токенов.
Сравнение быстрого режима Anthropic (Opus 4.6, batch size) и OpenAI (GPT-5.3-Codex-Spark на Cerebras): скорость, ограничения памяти и практическая ценность.
OpenAI перестала применять SWE-bench Verified из‑за утечек ответов; рекомендован SWE-bench Pro. Anthropic обвиняет DeepSeek и др. в обучении на Claude без доказательств.
Краткий обзор Veai 5.5: поддержка Skills, новые режимы Plan и Review, добавлен Claude 4.6 Opus; 30‑дневный триал и интеграция с JetBrains IDE.
Краткое объявление о голосовом режиме в Claude Code: push-to-talk, команда /voice, поэтапный rollout для планов Pro, Max, Team и Enterprise.
Сравнение газобетона и пенобетона: производство, структура, прочность и теплоизоляция — выводы для малоэтажного и более нагруженного строительства.
НОСТРОЙ запустил сервис «Запрос Выписки» из НРС — официальная электронная выписка для быстрой верификации квалификации инженеров и строителей.
Применение дронов в ИЖС: разметка, 3D‑модели (Pix4D, RealEarth‑Kontext), доставка, контроль качества и анализ данных (Deepblocks).
Анонс второго издания бесплатной книги по Dart: PDF и EPUB на Яндекс.Диске и Google Drive; полная версия и донат доступны на Boosty.