AnacondaのPeter Wang氏:AIイノベーションの鍵はオープンソースにあり

Thenewstack

商用PythonディストリビューターであるAnacondaは、AIツール企業としての地位をますます確立し、急速に進化する人工知能エコシステムにおける役割を強固にしています。最先端のAIモデルの追求はリソースを大量に消費し、不確実なリターンをもたらしますが、Anacondaは新しいAIプラットフォームで代替アプローチを提供し、AI開発における基盤となる作業の合理化を目指しています。

最近開催されたPyConカンファレンスで、Anacondaの共同創設者であり、AIおよびイノベーション最高責任者であるPeter Wang氏は、同社の戦略的転換、新しいAIプラットフォーム、そしてAI分野におけるオープンソースの重要な役割について語りました。

AIインキュベーターからの教訓

数年前、AnacondaはAIインキュベーターを立ち上げましたが、現在は廃止されています。その短い存在期間にもかかわらず、Wang氏はAIの爆発的な成長期におけるその有用性を指摘しました。彼は2023年を、イノベーションのペースが速すぎたため「まるで遠い昔のことのよう」だと表現しました。既存の製品と顧客を持つ確立された企業として、AnacondaはAIブームの中で効果的な戦略を見極めるために実験する必要がありました。

インキュベーターは、AIの将来にとって極めて重要と見なされるいくつかの主要分野を探求しました。これには、分散型AIと小規模モデル、解釈可能性(モデルがどのように意思決定を行うかを理解すること)、およびさまざまなデータセットでモデルをトレーニングすることの法的影響が含まれていました。また、主要な資産がソースコードからデータへと移行するAIコンテキストにおけるオープンソースの定義の進化にも重点が置かれました。データはしばしば透明性に欠けます。Wang氏は、「オープンウェイト」モデルがオープンソースとして販売されているにもかかわらず、基盤となるトレーニングデータがプロプライエタリなままであるという問題を強調しました。内部には多少の「混沌とした混乱」があったものの、インキュベーターはAIイノベーションを成功裏に加速させ、学習内容をAnacondaの製品に統合しました。

Anaconda AIプラットフォームの紹介

Anacondaは最近、そのAIプラットフォームを立ち上げました。このプラットフォームは「エンタープライズ向けオープンソース開発のGitHub」と評されています。Wang氏は、このプラットフォームのビジョンは、この比較を超えたものであると説明しました。彼は、AIにおける情報システムの未来は「コードとデータの融合、組み合わせ」になると強調しました。従来のソフトウェア開発とは異なり、AIシステムの管理には、コードとデプロイメントだけでなく、はるかに大規模な継続的なパフォーマンス評価も含まれます。これは、機械学習エンジニアやデータサイエンティストだけでなく、エンドユーザーのような非伝統的なユーザーによって行われることも多いです。

GitHubのようなプラットフォームはソースコードのコラボレーションに優れ、Hugging Faceはモデルのリポジトリとして機能しますが、これらすべてのコンポーネントを実用的なアプリケーションのために統合する包括的なソリューションが必要です。Anaconda AIプラットフォームは、この統一された環境を目指しており、コード、オープンソースの依存関係、モデルの結合から、デプロイメント、ロールバック、再現性まで、AIシステムとエージェントのライフサイクル全体を管理する課題に対処します。Wang氏は、個々の技術的問題(モデルのバージョン管理やデプロイメントなど)には複数の解決策があるものの、アプローチの数が多すぎると、多様なユーザーに一貫したプラットフォームを提供しようとする企業にとって複雑さが増すことを指摘しました。AIプラットフォームの全体的な目標は、Anacondaがデータサイエンスプラットフォームとワークフローで培ってきた豊富な経験に基づいて、企業がAIシステムの整合性と監視を確保するための単一の統合されたスペースを提供することです。

このプラットフォームは、2012年のAnacondaの当初の動機と共鳴しています。それは、特に中央ITの制約に直面する企業のために、Pythonの配布とパッケージ管理を簡素化することでした。企業がオープンソースソフトウェアを管理するための合理化された方法を必要としたように、彼らは今、AIコンポーネントのために同様のソリューションを必要としています。

AIにおけるオープンソースの不可欠な役割

Wang氏は、AIにおけるオープンソースの重要性を強く主張し、透明性と開放性の広範な利点という2つの異なるが関連する側面について述べました。

まず、彼はAIにおける透明性とガバナンスの必要性を強調しました。これは、モデルのトレーニングにどのようなデータが使われたか、そしてコードがどのように結果を計算するかを知ることを意味します。完全なオープンソースはこれを達成しますが、透明性は「成分表示」を通じて満たされることもあります。つまり、すべてのプロプライエタリな詳細を必ずしも開示することなく、説明責任を果たすのに十分な情報を提供することです。Wang氏は、重大な決定を下すAIシステムにとって、透明性は「明白で、必要不可欠で、交渉の余地のない要求」であると主張しました。彼は、透明性への抵抗は主に、議論を支配しようとする高資本の企業から来ると示唆しました。

次に、透明性だけでなく、Wang氏はAIの計り知れない力、影響、そして発展の初期段階を理由に、真のオープンソースモデルへの継続的な需要があると主張しました。彼はオープンソースを深く「市場に有利」であり「人類に有利」であると見ています。オープンソースが反資本主義的であるという歴史的な誤解とは異なり、Wang氏はそれをイノベーションを育む「アイデアの市場」と見なしています。世界中の賢い個人がAI技術を取り上げ、使用し、それを基に構築することを可能にすることで、オープンソースは「イノベーションのn乗効果」を生み出します。これにより、少数の大企業に閉じ込められたイノベーションと比較して、より安価で、より速く、より費用対効果の高い進歩がもたらされます。

オープンソースAI企業への教訓

Wang氏は、オープンソースAI企業が従来のオープンソースソフトウェア企業とは大きく異なると指摘しました。後者はすでに稀で、規模を拡大するのが難しいとされています。根本的な違いは、オープンソースにおけるイノベーションの「事前コモディティ化」にあります。イノベーションは通常、価格を伴いますが、オープンソースは無料で協力的なイノベーションを可能にします。したがって、成功するオープンソースAIビジネスは、「補完物」から収益を得る必要があります。これは、無料のイノベーションを使いやすく価値あるものにする周辺サービス、プラットフォーム、サポートを指します。

AIの始め方

AIの導入を検討している組織、企業、スタートアップ向けに、Anacondaはさまざまなエントリーポイントを提供しています。ユーザーはAnacondaをダウンロードしてAIモデルをローカルで実行でき、クラウドへのアップロードを避けることでデータプライバシーを確保できます。クラウドサービスに慣れているユーザー向けには、AnacondaはJupyter notebooks内でAIコーディング支援を提供し、PyScriptを介してサーバーレスPython開発を可能にします。

オンプレミスまたはプライベートAIデプロイメントを必要とする企業向けには、AnacondaはAIエンタープライズプラットフォームを提供しており、独自の条件でAIを安全に実行したり、プロプライエタリなクラウドモデルを活用したりする柔軟性を提供します。多くの組織がハイブリッド設定(ローカル、オンプレミス、クラウド)で運用していることを認識し、Anacondaのプラットフォームはこれらの環境全体でポータブルなAI開発を可能にします。

Wang氏は「補完物」戦略を改めて述べました。大規模なフロンティアモデルのトレーニングは「魅力的」であり、潤沢な資金を持つ企業が追求し、しばしばモデルを無償で提供しますが、Anacondaは実用的な課題の解決に焦点を当てています。これには、低性能のハードウェアでの推論実行とモデルのファインチューニングのためのソリューション提供、ワンクリックファインチューニングの提供、そしてRetrieval-Augmented Generation(RAG)のような実装におけるベストプラクティスでのユーザーガイドが含まれます。これらの補完的なサービスは、AnacondaのエンタープライズAIプラットフォームを通じて統合されており、企業がAIイノベーションの力を効果的に活用できるようにします。