Claude Opus 4.6: що нового що нового у флагманській моделі

Claude Opus 4.6 — оновлення моделі Anthropic із акцентом на кодування та сесії. У релізі зазначають, що вона планує уважніше й довше веде агентні задачі. Також підкреслюють сильніші code review і дебагінг, тобто самоперевірку. Просто кажучи, модель частіше ловить власні помилки ще до того, як їх побачите ви. Її позиціонують і для офісних задач, повідомляє vv.com.ua.

«Ціную, коли модель сама зупиняється й просить перевірити ризик», — коментує тімлід.

Кодування і рев’ю: більше дисципліни

Opus 4.6 описують як модель для задач із кількома кроками та перевірками. Вона швидше проходить прості частини і не губить нитку, коли треба повернутися до складного. У великих репозиторіях це знижує ризик “побічних ефектів” у змінах. Менше дрібних правок після відповіді — більше часу на рішення. Особливо в довгих сесіях.

Claude Opus 4.6 - кодинг і рев’ю, 1M контекст, effort/compaction в API, оновлення Excel і PowerPoint

1M контекст і менше “context rot”

Вперше для Opus-класу заявлено вікно контексту 1M токенів. Реліз також говорить про кращий пошук релевантного у великих наборах документів. Наголошується на меншій деградації якості в довгих діалогах. Як приклад наведено MRCR v2 (8-needle, 1M): Opus 4.6 має 76%, тоді як Sonnet 4.5 — 18,5%. Це подають як доказ користі довгого контексту.

Бенчмарки: ключові заяви

У матеріалі Opus 4.6 називають state-of-the-art. Згадується найвищий результат у Terminal-Bench 2.0 (agentic coding). Також пишуть про лідерство в Humanity’s Last Exam. На GDPval-AA модель, за заявою релізу, випереджає OpenAI GPT-5.2 приблизно на 144 Elo і Opus 4.5 — на 190 Elo. Окремо виділяють BrowseComp для пошуку онлайн.

Тест	Фокус	Заява
Terminal-Bench 2.0	agentic coding	топ
Humanity’s Last Exam	мислення	лідер
GDPval-AA	робота знань	+144 Elo
BrowseComp	пошук	топ

API-оновлення: effort, compaction, adaptive thinking

В API додали рівні effort (low, medium, high, max) та параметр /effort. Це потрібно, щоб зменшувати “overthinking” там, де важливі швидкість і ціна. Описано adaptive thinking, коли модель сама вирішує, чи потрібне розширене мислення. З’явився context compaction (beta): старий контекст підсумовується, коли діалог підходить до межі. Також заявлено до 128k токенів у відповіді та преміум-ціна для промптів понад 200k токенів.

«Ці ручки дають контроль над швидкістю, вартістю і якістю», — пояснює архітектор інтеграцій.

Excel, PowerPoint і швидка перевірка придатності

У релізі наголошують, що модель підходить для досліджень, фінансових аналізів і роботи з документами. Заявлено оновлення Claude в Excel і вихід Claude в PowerPoint у прев’ю для Max, Team та Enterprise. Також з’являються agent teams у Claude Code (research preview), де кілька агентів працюють паралельно. Перед тестуванням корисно звірити свій сценарій із типовими випадками використання. Нижче — короткий чеклист, який допоможе швидко зорієнтуватися.

Довгі агентні задачі з кількома ітераціями правок.
Великі документи і потреба стабільно витягувати деталі.
Критичні рев’ю, дебагінг і самоперевірка помилок.
Автоматизація в Excel і презентації в PowerPoint із даних.

Що нового?

Bolt объяснил, почему в Украине не хватает курьеров, и рассказал, сколько они зарабатывают

Сили безпілотних систем уразили низку військових об’єктів окупантів: від ЗРК та РЛС до складів БпЛА

Як працює кредитний ліміт у Monobank: ставки, грейс, поради

Україна і Польща 2026: політичні відносини, кордон і нові правила для біженців

Як отримати гуманітарну допомогу в Запоріжжі: адреси, документи та умови

Допомога переселенцям у Запоріжжі: які виплати доступні та куди звертатися

Погода в Запоріжжі 28 квітня 2026: прогноз синоптиків, чи будуть сонце і тепло

Коли закінчиться навчальний рік 2026 у Запоріжжі і буде останній дзвоник: точні дати літніх канікул

Bolt объяснил, почему в Украине не хватает курьеров, и рассказал, сколько они зарабатывают

Сили безпілотних систем уразили низку військових об’єктів окупантів: від ЗРК та РЛС до складів БпЛА

Сибіга на полях саміту G7 зустрівся з главою МЗС Єгипту – говорили про експорт зерна та російську агресію

США можуть незабаром поновити санкції проти російської нафти, – Трамп

Яйца дешевеют, а масло дорожает: новые цены в супермаркетах на 16 июня

Як працює кредитний ліміт у Monobank: ставки, грейс, поради

Як працює картка АТБ: знижки, бонуси, мобільний додаток

Японія у фактах: 30 несподіванок про країну сонця

100 цікавих фактів про все на світі

Як працює лазерна епіляція: принцип, типи лазерів, результат

Елтон Джон зізнався, як змінилося життя після втрати зору і чому він не зупиняє боротьбу зі СНІДом

«Выборы во время войны — это не демократия. Не хотелось бы, чтобы нас сравнивали с Беларусью лукашенко…» — Высокий Замок

«Не представляла себя детской писательницей — ею стала с началом великой войны» — Высокий Замок

«Математика у наших учеников… ковыляет» — Высокий Замок

Саудиты могут потерять путина – Высокий Замок.

На 15 сантиметров выше, то мы бы потеряли Генерала Залужного — Высокий Замок

Это всегда дорого стоило мировой экономике — Высокий Замок

В появлении «волшебных тумбочек» есть не только тот, кто берет, а те, кто дают — Высокий Замок

Сегодняшние упакованы долларов по кровати в Хмельницком — это то, что не удивляет ни на секунду — Высокий Замок

Claude Opus 4.6 – кодинг і рев’ю, 1M контекст, effort/compaction в API, оновлення Excel і PowerPoint

Як працює кредитний ліміт у Monobank: ставки, грейс, поради

Як працює картка АТБ: знижки, бонуси, мобільний додаток

Японія у фактах: 30 несподіванок про країну сонця

Bolt объяснил, почему в Украине не хватает курьеров, и рассказал, сколько они зарабатывают

Сили безпілотних систем уразили низку військових об’єктів окупантів: від ЗРК та РЛС до складів БпЛА

Як працює кредитний ліміт у Monobank: ставки, грейс, поради

Сибіга на полях саміту G7 зустрівся з главою МЗС Єгипту – говорили про експорт зерна та російську агресію

США можуть незабаром поновити санкції проти російської нафти, – Трамп

Яйца дешевеют, а масло дорожает: новые цены в супермаркетах на 16 июня

В Україні запустили у «Дії» єдину електронну заяву для ветеранів та їхніх родин

Що нового?

Claude Opus 4.6 – кодинг і рев’ю, 1M контекст, effort/compaction в API, оновлення Excel і PowerPoint

Кодування і рев’ю: більше дисципліни

1M контекст і менше “context rot”

Бенчмарки: ключові заяви

API-оновлення: effort, compaction, adaptive thinking

Excel, PowerPoint і швидка перевірка придатності

Схожі публікації