
OpenAIとParadigmが開発したEVMbenchは、DeFi(分散型金融)における攻撃件数の増加を背景に、選定された脆弱性を用いてイーサリアム契約向けAIエージェントのセキュリティ性能を多モードで検証する。
2月19日、OpenAIとParadigmはEVMbenchを発表した。このツールは、AIエージェントがイーサリアムのスマートコントラクトにおける脆弱性検出や修正といったセキュリティ業務でどの程度の性能を発揮するかを評価するために設計されている。過去の事例から集めた120件の脆弱性サンプルに基づき、EVMbenchは複数のテストモードを備えて現実世界のDeFi攻撃を模擬する。MoonwellおよびCrossCurveを含む最近のプロトコル侵害の増加を背景に、この枠組みはAIセキュリティ評価の標準化を目指している。