OpenAI запустила EVMbench для проверки ИИ-агентов на уязвимостях в смарт-контрактах
OpenAI представила новый бенчмарк для оценки того, насколько разные модели ИИ умеют находить, исправлять и даже использовать уязвимости безопасности в криптосмарт-контрактах.
В среду компания опубликовала исследование «EVMbench: Evaluating AI Agents on Smart Contract Security», подготовленное совместно с криптоинвестфирмой Paradigm и компанией по безопасности OtterSec. В рамках работы оценивалось, сколько средств ИИ-агенты теоретически могли бы извлечь, эксплуатируя 120 уязвимостей смарт-контрактов.
Лучший результат показал Claude Opus 4.6 от Anthropic со средним показателем «detect award» $37 824. Далее идут OpenAI OC-GPT-5.2 ($31 623) и Google Gemini 3 Pro ($25 112).

В OpenAI отметили, что по мере роста эффективности ИИ в базовых задачах становится важнее проверять его в «экономически значимых средах». По мнению компании, смарт-контракты защищают активы на миллиарды долларов, и ИИ-агенты могут заметно повлиять как на атакующих, так и на защитников.
Также в OpenAI ожидают рост платежей в стейблкоинах, выполняемых агентами. Ранее глава Circle Джереми Аллэйр прогнозировал, что в течение пяти лет миллиарды ИИ-агентов будут проводить повседневные платежи в стейблкоинах от имени пользователей, а экс-глава Binance Чанпэн «CZ» Чжао высказывал мнение, что криптовалюта станет «родной валютой для ИИ-агентов».
Актуальность тестирования агентных ИИ на поиск уязвимостей усиливается на фоне того, что в 2025 году злоумышленники похитили криптоактивы на $3,4 млрд — немного больше, чем в 2024-м.
Для EVMbench отобрали 120 уязвимостей из 40 аудитов смарт-контрактов, причем значительная часть материалов была взята из соревнований по аудитам в открытом доступе. В OpenAI рассчитывают, что бенчмарк поможет отслеживать прогресс ИИ в выявлении и снижении рисков уязвимостей в смарт-контрактах в масштабе.
Dragonfly: смарт-контракты создавались не для людей
Управляющий партнер Dragonfly Хасиб Куреши в публикации в X в среду заявил, что обещание криптоиндустрии заменить права собственности и юридические договоры так и не реализовалось не из-за провала технологии, а потому что она изначально не была рассчитана на человеческую интуицию.
По словам Куреши, подписывать крупные транзакции до сих пор «страшно» — на фоне рисков вроде дрейнер-кошельков и других угроз, тогда как банковские переводы обычно не вызывают такого ощущения.
Он считает, что будущее криптотранзакций — за «самоуправляемыми» кошельками с ИИ-посредником, которые будут снижать риски и выполнять сложные операции от имени пользователя.
«Технология часто встает на место, когда наконец появляется ее “дополнение”. GPS ждал смартфона, TCP/IP — браузера. Для крипто, возможно, таким дополнением стали ИИ-агенты».