OpenAI в партнерстве с крипто-фондом Paradigm представили открытый бенчмарк EVMbench.
Если перевести с технического на человеческий — это виртуальный полигон, где ИИ-агентов натаскивают на нахождение уязвимостей в смарт-контрактах.
Судите сами: в основе теста — 120 реальных уязвимостей, собранных по итогам 40 профессиональных аудитов блокчейн-проектов. Это не абстрактные задачки, а боевые кейсы, включая сценарии из реальной практики аудита платформы Tempo. ИИ предлагают три режима работы: найти дыру, исправить ее или... использовать против системы. Спойлер: с последней задачей модели справляются лучше всего.
На первый взгляд, история выглядит как забота о безопасности цифровых активов (а под защитой кода сейчас находится более $100 млрд). Но давайте посмотрим на это глазами банкира.
По сути, нам презентовали не просто инструмент для аудиторов. Это обкатка технологии, которая завтра может стать стандартом для киберразведки. Пока ИИ учится защищать код, он параллельно оттачивает мастерство его взлома. OpenAI позиционирует EVMbench как сигнал профессиональному сообществу: пора встраивать нейросети в рутину процессов безопасности. Но сигнал этот обоюдоострый.
Мы стоим на пороге ситуации, когда аудит безопасности будут вести не две команды людей (красные против синих), а две армии нейросетей. Одна будет писать идеальный, пуленепробиваемый код, а вторая — искать в нем микротрещины.
Для банков это означает, что гонка вооружений в сфере кибербезопасности окончательно уходит из человеческой плоскости в цифровую. Вопрос теперь не в том, сколько специалистов ты нанял, а в том, насколько мощный кластер ИИ защищает твой периметр. И судя по результатам тестов, нападающие пока выигрывают.
Источник: https://plusworld.ru
Если перевести с технического на человеческий — это виртуальный полигон, где ИИ-агентов натаскивают на нахождение уязвимостей в смарт-контрактах.
Судите сами: в основе теста — 120 реальных уязвимостей, собранных по итогам 40 профессиональных аудитов блокчейн-проектов. Это не абстрактные задачки, а боевые кейсы, включая сценарии из реальной практики аудита платформы Tempo. ИИ предлагают три режима работы: найти дыру, исправить ее или... использовать против системы. Спойлер: с последней задачей модели справляются лучше всего.
На первый взгляд, история выглядит как забота о безопасности цифровых активов (а под защитой кода сейчас находится более $100 млрд). Но давайте посмотрим на это глазами банкира.
По сути, нам презентовали не просто инструмент для аудиторов. Это обкатка технологии, которая завтра может стать стандартом для киберразведки. Пока ИИ учится защищать код, он параллельно оттачивает мастерство его взлома. OpenAI позиционирует EVMbench как сигнал профессиональному сообществу: пора встраивать нейросети в рутину процессов безопасности. Но сигнал этот обоюдоострый.
Мы стоим на пороге ситуации, когда аудит безопасности будут вести не две команды людей (красные против синих), а две армии нейросетей. Одна будет писать идеальный, пуленепробиваемый код, а вторая — искать в нем микротрещины.
Для банков это означает, что гонка вооружений в сфере кибербезопасности окончательно уходит из человеческой плоскости в цифровую. Вопрос теперь не в том, сколько специалистов ты нанял, а в том, насколько мощный кластер ИИ защищает твой периметр. И судя по результатам тестов, нападающие пока выигрывают.
Источник: https://plusworld.ru