DeepSeek V3.1、登場:OpenAIに挑む強力なオープンソースAIがAI界を揺るがす
人工知能の分野は、中国のDeepSeek社が最近リリースしたDeepSeek V3.1、すなわち6850億パラメータを持つ巨大なオープンソースAIモデルによって、大きな変革期を迎えています。2025年8月19日にリリースされたこの新しいバージョンは、生成AIにおける世界的な競争を激化させ、画期的な性能とHugging Faceを通じた無料アクセスを提供することで、OpenAIやAnthropicのような既存のプレイヤーに直接挑もうとしています。
DeepSeek V3.1には、大規模言語モデルの限界を押し広げるために設計された一連の機能強化が施されています。特筆すべきは、最大128,000トークンを処理できる拡張されたコンテキストウィンドウです。これは約96,000語に相当し、200ページの英語小説2冊分に匹敵します。この膨大な容量により、モデルはより大量の情報を処理し、より広範で一貫性のある会話を維持し、より深い文脈理解を保持することで、よりニュアンスのある応答を提供できます。さらに、DeepSeekは推論能力において著しい進歩を遂げたとしており、テストでは前モデルと比較して多段階推論で最大43%の改善が見られたと報告されています。ただし、一部の評価では、高度に抽象的または倫理的なジレンマに対する課題が依然として示唆されています。このモデルは、100以上の言語でほぼネイティブな精度を持つ優れた多言語サポートを誇り、幻覚が38%減少したと報告されており、その事実の信頼性が向上しています。
DeepSeek V3.1がHugging Face上で寛容なMITライセンスの下でリリースされたことは、オープンソース哲学へのコミットメントを強調しており、無料でダウンロードおよび利用可能です。このアプローチは、中国がAI技術の世界的な普及を促進するためのより広範な戦略と一致しており、目先の専有利益よりも広範なアクセシビリティを優先しています。同社は以前、欧米の同業他社のわずかなコストで高度なAIを開発する能力を示しています。例えば、V3モデルはわずか600万米ドルでトレーニングされたと報じられており、これは2023年にOpenAIのGPT-4に費やされたと推定される1億米ドルとは対照的です。このコスト効率は、著しく少ない計算能力で達成されており、DeepSeekをAI業界の強力な破壊者として位置付けています。
性能ベンチマークでは、DeepSeek V3.1はいくつかの重要な分野で競争優位性を示しています。一般的な言語理解(MMLU)では、V3バージョンが88.5%を記録し、OpenAIのGPT-4oをわずかに上回る強力な結果を示しました。コーディングタスク、特にHumanEvalベンチマークでは、DeepSeek V3はClaude 3.5 SonnetとGPT-4oの両方を上回りました。しかし、より複雑なソフトウェアエンジニアリングタスク(SWE-bench Verified)や特定の数学的課題では、DeepSeek V3.1は依然としてトップのプロプライエタリモデルに遅れをとっており、将来の改善の余地を示しています。
DeepSeekは2023年7月に梁文鋒によって設立され、中国のヘッジファンドであるHigh-Flyerから資金提供を受け、AI分野の主要プレイヤーとして急速に台頭しました。今年初め、DeepSeek-R1チャットボットが米国のApple iPhoneストアで一時的にChatGPTを上回って最もダウンロードされた無料アプリとなり、同社は国際的な注目を集めました。この急速な台頭は精査なしには進んでいません。米国の議員は、潜在的なデータセキュリティの脆弱性と、中国のオープンソースAIモデルが中国軍によって悪用されるリスクについて懸念を表明しています。DeepSeekとそのクラウドパートナー(AWS、Microsoft Azure、Google Cloudを含む)は、プラットフォーム上でホストされるR1などのモデルがローカライズされ、データが中国に送信されないようにすることで、これらの懸念の一部に対処しています。AIコミュニティがDeepSeekの次の主要なバージョンであるR2のリリースを熱望する中、同社の最新の提供は、進化するオープン人工知能の領域における強力で費用対効果の高い力としての地位を固めています。