ChainOpera AIとプリンストンAI研究所、LLMエージェント評価のためのCryptoBenchを発表

LLMエージェント: 複雑なタスクを実行するために設計された大規模言語モデルベースのソフトウェアエージェントであり、自然言語理解や意思決定を含むことが多い。
CryptoBench: 仮想通貨関連タスクにおける大規模言語モデルエージェントのパフォーマンスを評価するために作成されたベンチマークツール。

この新しいベンチマークツールは、仮想通貨関連アプリケーションにおける大規模言語モデルエージェントの評価を目的としている。

141d ago