Что нового

Обзор нейросетей на конец июня 2026

Рынок выкатывает новую «самую умную модель в истории» каждые полтора месяца. GPT-5.5, Claude Opus 4.8, Gemini 3.1 Pro, Grok 4.3, DeepSeek V4 — за один квартал весь этот список успел смениться по разу, и маркетинг каждого вендора уверяет, что остальные четыре — мусор. Соблазн понятен: оплатить весь зоопарк по двадцатке за штуку и не думать. Я думаю иначе: под рукой держу один-два платных, остальное гоняю на бесплатных тарифах или через API¹ под конкретную автоматизацию.
1782215009813.png

Ниже — трезвый разбор без рекламы: что каждая реально умеет, где сыпется, и сколько стоит на конец июня 2026.

Сразу про бенчмарки²: это болото. Один источник лепит Opus за 88% на SWE-bench³, другой — 69%, третий ставит открытый DeepSeek выше обоих. Цифры пляшут от харнесса⁴ и варианта теста, и верить им на слово — себя не уважать. Я смотрю на то, что выживает после контакта с боевой задачей, а не на проценты из пресс-релиза. Поэтому красивой таблицы «кто на сколько процентов умнее» тут не будет — будут возможности, грабли и деньги.

Кратко — кому что и для чего​

  • Кодинг и рефакторинг, где важно качество, а не скорость → Claude (Opus / Claude Code). Дёшево при достойном качестве — DeepSeek V4 или Claude Sonnet 4.6.
  • Многошаговый агент, офисная рутина, ресёрч в одном окне → GPT-5.5.
  • Длинный контекст⁵, мультимодал⁶, жизнь внутри Google-стека → Gemini.
  • Реалтайм-новости, X, менее зафильтрованные ответы, дешёвый API → Grok.
  • Self-host⁷ и экономия на масштабе → DeepSeek V4, веса⁸ открыты.
  • Поиск с пруфами на источники → Perplexity.
Теперь по каждому, с ценами и граблями.

GPT-5.5 — OpenAI​

Что это. Текущий флагман OpenAI, вышел 23 апреля 2026. Заточен под агентность⁹: сам ведёт многошаговую задачу — пишет и дебажит код, лезет в веб, ковыряет данные, делает документы и таблицы, рулит софтом до результата с минимумом подсказок. В экосистему встроены Codex (кодинг-агент) и Sora (видео).

Силён. Универсал. Если задача в формате «дай сделать всё в одном окне» — это сюда: agentic coding, computer use¹⁰, ресёрч, офисная рутина. Бесшовно тащит задачу через инструменты, не заставляя дробить её на десять промптов.

Слаб. API-выход кусается. В бесплатном ChatGPT — только старая GPT-5.3 Instant, лимит 10 сообщений на 5 часов, и с февраля 2026 в США под ответами висит реклама. Платные тарифы расползлись на семь штук, где сам чёрт ногу сломит — есть два разных «Pro» по $100 и $200, которые легко перепутать при оплате.

Цена. Подписки: Free $0 / Go $8 / Plus $20 / Pro $100 (5× лимиты) / Pro $200 (20×, Sora, 1M контекст). API: GPT-5.5 — $5 / $30 за 1M токенов¹¹ (вход/выход), окно 1M; GPT-5.5 Pro — $30 / $180.

Claude Opus 4.8 — Anthropic​

Что это. Старший Claude, версия 4.8 вышла 28 мая 2026. 1M контекст по умолчанию, adaptive thinking¹² и ручка effort (low / high / xhigh / max), чтобы крутить глубину рассуждения против цены прямо в вызове. Под кодинг — Claude Code с воркфлоу из параллельных субагентов.

Силён. Кодинг и аккуратность. Anthropic заявляет, что 4.8 примерно вчетверо реже предшественника оставляет незамеченными баги в собственном коде — и по ощущениям за ним реально меньше приходится переделывать. Длинные автономные прогоны, рефакторинги, внятное письмо. На тарифе Max по умолчанию идёт именно Opus.

Слаб. Премиальная цена выхода ($25 за 1M — впятеро против Gemini Pro). Бесплатного API нет, только trial-кредиты. Заточен под работу, а не под «поболтать» или новости из ленты. И над Opus теперь сидит ещё ярус Mythos (Fable 5, $10/$50) — то есть за самый-самый топ Anthropic хочет отдельных денег.

Цена. Подписки: Free $0 / Pro ~$20 (по умолчанию Sonnet 4.6) / Max 5× ~$100 / Max 20× ~$200 (по умолчанию Opus). API: Opus 4.8 — $5 / $25 (Fast-режим $10/$50), Sonnet 4.6 — $3 / $15, Haiku 4.5 — $1 / $5. Кэш¹³ входа режет до ~$0.50 за 1M — на длинных сессиях это решает счёт.

Gemini 3.1 Pro — Google​

Что это. Флагман Google, 3.1 Pro с 19 февраля 2026. Контекст 2M токенов — самое большое окно в проде. Нативный мультимодал (текст, код, аудио, видео, картинки), плотно сросся с Workspace. С 19 мая подъехал Gemini 3.5 Flash — дешевле и быстрее, и по кодингу/агентам обходит сам 3.1 Pro.

Силён. Контекст и мультимодал. Заливай весь репозиторий, часовое видео или толстый отчёт одним промптом. Сильные знания и reasoning. Если команда живёт в Google Docs и Sheets — интеграция родная, без костылей.

Слаб. Точность валится на длинном контексте: retrieval¹⁴ заметно деградирует за 128K, хоть окно и 2M, — рабочую нагрузку выгоднее держать в пределах 128K. С 1 апреля 2026 Pro-модели выпилили из бесплатного API. Платным подписчикам периодически отваливаются фичи из-за багов парности доступа.

Цена. Подписки (после перетряски на I/O 2026): Free $0 / AI Plus $7.99 / AI Pro $19.99 / AI Ultra от $99.99 (верх ~$200, срезали с $249.99). API: 3.1 Pro — $2 / $12 (≤200K), $4 / $18 (>200K), кэш $0.20; 3.5 Flash — $1.50 / $9.

Grok 4.3 — xAI​

Что это. Линейка Grok 4.x от xAI. Главный козырь — живой поток из X (бывш. Twitter) и веба в реальном времени, плюс менее зафильтрованные ответы и узнаваемый дерзкий тон. API дешёвый, особенно Fast-варианты с окном 2M.

Силён. Реалтайм. Что происходит прямо сейчас, тренды, свежие события — Grok видит их через X, остальные узнают с лагом. Дёшево: Fast-модели от $0.20 за 1M входа. Ну и личность, если она вам зачем-то в работе нужна.

Слаб. Организационная турбулентность: xAI в феврале 2026 влилась в SpaceX, бо́льшая часть сооснователей разбежалась, висит иск от whistleblower про безопасность. Модерация хромает — на рубеже декабря 2025 / января 2026 генератор Imagine ловили на выпуске запрещённого контента и дипфейков без согласия; для бренд-чувствительных и регулируемых задач это стоп-фактор. Плюс staged rollout¹⁵: на дешёвых тарифах твой запрос может уехать на старую версию модели, и ты этого даже не заметишь.

Цена. Подписки: Free $0 (≈10 промптов / 2ч) / X Premium $8 / SuperGrok Lite $10 / SuperGrok $30 / X Premium+ $40 / SuperGrok Heavy $300 (Grok Heavy, мультиагент). API: Grok 4.3 — $1.25 / $2.50; Fast-варианты от $0.20 за вход; инструменты (веб/X-поиск, исполнение кода) — $5 за 1000 вызовов, отдельно от токенов.

DeepSeek V4 — открытые веса​

Что это. Китайский DeepSeek, V4 (превью с 24 апреля 2026) — две MoE¹⁶-модели: V4-Pro (1.6T параметров, 49B активных) и V4-Flash (284B / 13B), обе с 1M контекстом и режимами thinking / non-thinking. Веса лежат на Hugging Face под MIT¹⁷ — можно поднять у себя. API говорит и форматом OpenAI, и форматом Anthropic, поэтому цепляется к Claude Code / OpenCode без прокладок.

Силён. Цена и открытость. По стоимости выходного токена V4-Pro дешевле западных флагманов на порядок с лишним. Среди открытых моделей — топ по кодингу и reasoning; закрытым флагманам уступает, но за такие деньги это несущественно. И это единственный из пятёрки, который реально можно держать у себя, без оглядки на чужое облако.

Слаб. Китайская юрисдикция: гонять через их облако чувствительные или регулируемые данные — думай дважды (self-host вопрос снимает, но 1.6T весов дома потянет не каждый). Зрелость API ниже, чем у Tier-1¹⁸. Разрекламированный R2 так и не вышел — его роль закрыл thinking-режим V4, так что не жди.

Цена. Приложение и веб — бесплатно. API: V4-Pro — $0.435 / $0.87, V4-Flash — $0.14 / $0.28 за 1M. Дешевле в этой пятёрке нет.

Картинки, видео, музыка — коротко​

Отдельный пласт, который считается отдельно от чат-моделей. Видео: Sora (OpenAI, поколение Sora 2), Veo (Google, 3.1), Kling (Kuaishou), Runway, Grok Imagine. Голос и озвучка: ElevenLabs. Всё это — свои подписки или кредиты. Если видео нужно изредка, держать ради него топ-тариф за $200 глупо — выгоднее поштучные кредиты или агрегатор.

Сводные цены​

Конец июня 2026, в USD. Цены протухают быстро — за квартал их переписали у всех. Перед оплатой открой прайс вендора и проверь сам.

Подписки (потребительские, $/мес)​

СервисFreeНачальный платныйСреднийТоп
ChatGPT$0Go $8 / Plus $20Pro $100Pro $200
Claude$0Pro ~$20Max 5× ~$100Max 20× ~$200
Gemini$0AI Plus $7.99 / AI Pro $19.99AI Ultra $99.99Ultra ~$200
Grok$0Lite $10 / SuperGrok $30X Premium+ $40Heavy $300
DeepSeek$0
Perplexity$0Pro $20

API ($/1M токенов, вход / выход, стандартный тариф)​

МодельВходВыходКонтекстВеса
GPT-5.5$5$301Mзакр.
GPT-5.5 Pro$30$1801Mзакр.
Claude Opus 4.8$5$251Mзакр.
Claude Sonnet 4.6$3$151Mзакр.
Claude Haiku 4.5$1$5закр.
Gemini 3.1 Pro$2 (>200K: $4)$12 (>200K: $18)2Mзакр.
Gemini 3.5 Flash$1.50$9закр.
Grok 4.3$1.25$2.501Mзакр.
Grok 4.x Fast$0.202Mзакр.
DeepSeek V4-Pro$0.435$0.871MMIT
DeepSeek V4-Flash$0.14$0.281MMIT

Что со всем этим делать​

Не стакай подписки. Стопка из пяти «двадцаток» — это $110+ в месяц непонятно за что; реально ты жуёшь две, остальные открываешь раз в неделю.

Рабочая стратегия простая: один платный под основную задачу плюс остальные на бесплатных тарифах — для второго мнения и перепроверки. Под автоматизацию и скрипты — API, а не подписка: там платишь за факт, а кэш и batch¹⁹ режут счёт на порядок.

Грубая раскладка, как я это держу в голове:
  • DeepSeek V4 — дешёвый рабочий конь и единственный реальный self-host-вариант.
  • Grok — окно в реалтайм и X, когда нужна свежесть, а не глубина.
  • Gemini — длинный контекст и мультимодал, плюс если уже сидишь в Google-стеке.
  • GPT-5.5 — универсальный агент под «сделай всё сам в одном окне».
  • Claude (Opus) — когда код должен быть правильным с первого раза, а не после пятой итерации.
И ещё раз про деньги: тарифы переписывают постоянно. Одна Gemini Ultra за один I/O 2026 съехала с $249.99 до $99.99. Любую цифру отсюда перед оплатой проверяй на сайте вендора — к моменту, когда ты это читаешь, половина уже могла сдвинуться.

Словарик​

¹ API — способ обращаться к модели не через сайт или приложение, а напрямую из своего кода или скрипта. Платишь по факту, за объём обработанного текста, а не фиксированную подписку.

² Бенчмарк — стандартный набор задач, на котором гоняют модели, чтобы сравнить их «в попугаях». Беда в том, что результат сильно зависит от того, как именно поставлен тест.

³ SWE-bench — популярный бенчмарк для кодинга: модели подсовывают реальную задачу-баг из открытого проекта на GitHub и смотрят, починит ли она код так, чтобы прошли тесты.

Харнесс (test harness) — обвязка вокруг теста: код и окружение, которые подсовывают модели задачу, дают ей инструменты, ловят ответ и проверяют его. Один и тот же вопрос в разном харнессе даёт разные цифры — поэтому проценты от разных команд впрямую несравнимы.

Контекстное окно — сколько текста модель удерживает «в голове» за один разговор: твой промпт плюс её ответы. Меряется в токенах. Всё, что вылезло за окно, модель просто забывает.

Мультимодал — модель понимает не только текст, но и картинки, аудио, видео на входе (а иногда и на выходе).

Self-host — запуск модели на своём железе вместо чужого облака. Возможен, только если выложены веса. Плюс — полный контроль и приватность, минус — нужен мощный сервер.

Веса (открытые) — веса это, грубо, сами «мозги» обученной модели: файл с её параметрами. Открытые веса (open weights) можно скачать и запускать у себя; у закрытых моделей доступ только через чужой сервис.

Агент / агентность — режим, в котором модель не просто отвечает текстом, а действует по шагам: вызывает инструменты, лезет в веб, запускает код, проверяет результат и идёт дальше, пока не доведёт задачу до конца.

¹⁰ Computer use — способность модели управлять компьютером как человек: видеть экран, кликать, печатать, ходить по интерфейсу программ.

¹¹ Токен — кусочек текста, которым оперирует модель: примерно 3–4 символа или часть слова. Тарифы API считают за миллион токенов, отдельно за вход (что подаёшь) и отдельно за выход (что модель генерит).

¹² Thinking (режим рассуждения) — когда модель перед ответом «думает» про себя, раскладывая задачу на шаги. Точнее на сложном, но дороже и медленнее: эти размышления тоже считаются как выходные токены.

¹³ Кэш (кэширование промпта) — если большой кусок промпта (кодовая база, системная инструкция) повторяется из запроса в запрос, его кэшируют, и за повторное чтение платишь копейки вместо полной цены входа.

¹⁴ Retrieval — способность реально достать нужный факт из длинного контекста, а не формально его «видеть». На очень длинном окне точность проседает: модель теряет детали из середины.

¹⁵ Staged rollout — раскатка новой версии не всем сразу, а волнами. Поэтому на дешёвом тарифе тот же запрос может временно обслужить ещё старая модель.

¹⁶ MoE (Mixture-of-Experts) — архитектура, где модель разбита на много «экспертов», но на каждый запрос включается лишь часть из них. Поэтому у V4-Pro 1.6 трлн параметров всего, а «активных» на один токен — только 49 млрд: ёмкость большая, а считать дешевле.

¹⁷ MIT — максимально либеральная открытая лицензия: бери, меняй, используй хоть в коммерции, почти без условий.

¹⁸ Tier-1 — первый эшелон: крупнейшие и самые отлаженные поставщики (OpenAI, Google, Anthropic). «Зрелость ниже, чем у Tier-1» значит, что инфраструктура и стабильность пока не дотягивают до них.

¹⁹ Batch (пакетный режим) — складываешь кучу запросов в один пакет и получаешь ответы не мгновенно, а в течение нескольких часов, зато примерно вдвое дешевле.

Данные актуальны на конец июня 2026. Цены — в долларах, по прайсам вендоров; бенчмарки сознательно опущены как недостоверные на текущем рынке.
Об авторе
Guru
Василий, cистемный админ /gnu/linux/windows/macos/mikrotik/troubleshooter, создатель сайта
Интересуюсь всем что делает инфраструктуру быстрой и надёжной
Открыт к общению и проектам, написать мне можно через форму или в личном сообщении

❗ Если есть пожелания по обзору какого-либо вопроса не представленного на сайте - пиши в комментариях

Комментарии

Нет комментариев для отображения.

Информация о статье

Автор
Guru
Время чтения статьи
9 мин чтения
Просмотры
23
Посл. обновление

Ещё в Размышления системного администратора

Ещё от Guru

Поделиться этой статьёй

Назад
Верх