据Sentient透露,这家开源AI实验室的新平台可用于开展企业级AI代理的基准测试,首场测试活动将在旧金山举行,参与机构包括Founders Fund、Pantera Capital以及管理资产规模达1.5万亿美元的富兰克林邓普顿。
Sentient推出了Arena,一个用于在真实运行条件下测试和评估企业AI代理的生产级环境。早期参与者包括Founders Fund、Pantera Capital以及管理资产约1.5万亿美元的富兰克林邓普顿。首项挑战聚焦于文档推理,旨在提升AI代理的分析和可靠性表现。Sentient计划于2026年3月在旧金山举办首次公开活动,标志着朝着为数字资产管理者及其他金融机构所使用的AI系统建立标准化评估框架迈出重要一步。