Qwen 3 MaxがNof1 AIトレードテストで79%の利益を達成

DeepSeekは総額21,000ドル超の利益を維持した一方、Qwen3は最大の下落を経験し、直近の市場変動後におけるAI仮想通貨取引のパフォーマンス変化を反映した。

ETH

132d ago

ファクトチェック

評価は「likely_true」である。数値に関する主張は、情報源の質に重大な問題や相反するデータポイントがあるにもかかわらず、2つの別個の情報源によって裏付けられている。「Nof1 AI Trading Test」と79％（具体的には79.43％）を直接言及している唯一の情報源は、coincu.comに掲載されたスポンサードプレスリリースである。この情報源は権威性が極めて低く、偏りの可能性が高いため、単独では信頼性に欠ける。しかし、この主張は、より信頼性の高い独立系AI比較プラットフォームであるvals.aiによって強く補強されている。この情報源は、Qwen 3 Max Previewが「finance benchmarks」において78.9％のスコアを達成したことを示している。79.43％と78.9％という数値の著しい類似性は、同じ基本的な性能データを指している可能性が高く、主張の数値部分に大きな信憑性を与えている。これとは異なる証拠として、vals-aiのLinkedIn投稿がある。この投稿では、独自の「Finance Agent Benchmark」でモデルの精度がわずか17％と報告されている。これは別のテストでの結果であり、この主張を直接否定するものではない。モデルの性能はテストによって大きく変動し得るためである。しかし、このことは79％という結果が金融関連のすべての課題における性能を代表していないことを示している。最後に、最も権威のある情報源である公式Qwen GitHubリポジトリや学術論文には、このテストや結果に関する記載はない。この公式な検証の欠如により、高い確信度での評価はできない。総括すると、この主張は内容的にはおそらく正しい—すなわち、Qwen 3 Maxが金融関連ベンチマークで約79％のスコアを達成したというものである。「Nof1 AI Trading Test」という名称や「gain」という言葉は、質の低い情報源による宣伝的な言い回しの可能性が高いが、基礎となる数値自体はより信頼できるデータにより裏付けられている。

要約

Alpha Arena AI仮想通貨先物取引コンテストで2日連続の市場上昇の後、競合するAIモデル間で部分的な反落が見られた。DeepSeekは総価値21,000ドル超を維持し、ETHロング最大規模の$4,216での決済により$7,463の利益を確定し、その後$4,189で再び建て直した結果、ROI（投資利益率）112%を達成した。これに対し、Qwen3は戦略を変更したが$4,150の損失を計上し、コンテストでの最大の後退を記録した。

用語解説

AI Trading Model: 人工知能を用いて、事前に設定されたまたは動的に変化する戦略に基づき取引を実行するアルゴリズムシステム。
Crypto Futures: 将来の特定日時と価格で仮想通貨を買う義務を買い手に、または売る義務を売り手に負わせるデリバティブ契約。
ROI (Return on Investment): 投資の収益性を測る指標で、純利益を投資の初期費用で割って算出される。