GPT-5-Codex научится работать автономно и учиться на ошибках, выходя за рамки простых фрагментов кода.
OpenAI представляет Кодирующего Агента. (Графика: Midjourney / t3n)
OpenAI представила новую модель под названием GPT-5-Codex. Это специализированная версия недавно представленного GPT-5, обученная специально для сложных задач программирования. Самым значительным нововведением, пожалуй, является способность к так называемому «агентному программированию».
Согласно сообщению в блоге OpenAI, модель способна автономно работать над задачей в течение семи часов. При этом она должна самостоятельно выявлять ошибки и вносить исправления без необходимости вмешательства разработчика.
Хотите узнать больше по теме? Редакция t3n регулярно публикует практико-ориентированные документы, руководства и онлайн-курсы с лучшими экспертами цифрового бизнеса, которые помогают понять новые технологии, чтобы быть успешными в будущем. Узнать больше
От инструмента к автономному коллеге по команде
Новая способность позиционирует Codex не столько как простой инструмент для автодополнения кода, сколько как самостоятельного цифрового помощника. По словам OpenAI, одним из основных случаев применения является рефакторинг, то есть структурная переработка существующего кода для улучшения его качества. Во внутреннем тесте для таких задач GPT-5-Codex достиг уровня успеха в 51,3%, превзойдя тем самым общую модель GPT-5 более чем на 17 процентных пунктов.
Еще одна ключевая функция — проведение код-ревью. Модель не только анализирует представленный код, но и учитывает зависимости во всей кодовой базе, а также может запускать тесты для проверки функциональности. Созданные ИИ комментарии в пул-реквестах, как утверждается, должны быть значительно реже ошибочными и одновременно более релевантными, чем у модели-предшественницы.
Прямая интеграция в рабочий процесс
Чтобы закрепить использование в повседневной жизни разработчиков, OpenAI предоставляет новые интеграции. Расширение для популярных редакторов кода, таких как Visual Studio Code, позволяет Codex использовать контекст открытых файлов. Это должно приводить к более точным результатам при коротких запросах.
Версия командной строки (CLI) также была переработана и теперь может обрабатывать визуальный ввод, например, эскизы пользовательских интерфейсов. Кроме того, интересна адаптивная производительность: при простых, четко определенных задачах GPT-5-Codex, по словам OpenAI, работает значительно экономнее с точки зрения ресурсов, в то время как для сложных проблем он выделяет больше вычислительного времени на анализ и поиск решений.
Критический взгляд на тесты
Хотя успехи в рефакторинге и код-ревью впечатляют, другой стандартный тест показывает более дифференцированную картину. В тесте «SWE-bench Verified», который измеряет общие способности к решению проблем в разработке программного обеспечения, GPT-5-Codex набирает 72,8%, что на чуть хуже, чем у универсального GPT-5 с 74,5%. OpenAI отмечает по этому поводу, что методика тестирования была адаптирована и расширена до полного набора из 500 задач, что затрудняет прямое сравнение.
Хотя автоматизация трудоемких рутинных задач, таких как рефакторинг или создание тестовых структур, обещает значительное повышение эффективности, это развитие также raises вопросы. Растущая автономия ИИ-систем в долгосрочной перспективе может изменить требования к новичкам в разработке программного обеспечения. Сама OpenAI подчеркивает, что проверка результатов человеком остается essential, и Codex следует рассматривать как дополнительного рецензента, а не как замену человеческой экспертизе.
GPT-5-Codex доступен с сегодняшнего дня для пользователей платных подписок ChatGPT, включая тарифы Plus, Pro и Enterprise. Развертывание через программный интерфейс (API) для deeper интеграции в собственные приложения анонсировано на ближайшее будущее.
Посмотреть 4 изображения Как работает Deepseek – и чем он отличается от других моделей ИИ Источник: (Графика: Dall-E / t3n)