Peter Wang (Anaconda): Open Source ist der Schlüssel zur KI-Innovation

Thenewstack

Der kommerzielle Python-Distributor Anaconda hat sich zunehmend als KI-Tool-Unternehmen positioniert und damit seine Rolle im sich schnell entwickelnden Ökosystem der künstlichen Intelligenz gefestigt. Während die Verfolgung hochmoderner KI-Modelle ressourcenintensiv ist und unsichere Erträge bietet, bietet Anaconda mit seiner neuen KI-Plattform einen alternativen Ansatz, der darauf abzielt, die grundlegende Arbeit bei der KI-Entwicklung zu optimieren.

Auf der jüngsten PyCon-Konferenz erörterte Peter Wang, Mitbegründer und Chief AI and Innovation Officer bei Anaconda, die strategische Neuausrichtung des Unternehmens, seine neue KI-Plattform und die entscheidende Rolle, die Open Source in der KI-Landschaft spielt.

Lehren aus dem KI-Inkubator

Einige Jahre zuvor startete Anaconda einen KI-Inkubator, der inzwischen stillgelegt wurde. Trotz seines kurzen Bestehens betonte Wang dessen Nützlichkeit in einer Zeit explosiven KI-Wachstums. Er beschrieb das Jahr 2023 als „wie vor einer Ewigkeit“ aufgrund des raschen Innovationstempos. Als etabliertes Unternehmen mit bestehenden Produkten und Kunden musste Anaconda experimentieren, um effektive Strategien inmitten des KI-Hypes zu erkennen.

Der Inkubator untersuchte mehrere Schlüsselbereiche, die als entscheidend für die Zukunft der KI erachtet wurden. Dazu gehörten dezentrale KI und kleinere Modelle, Interpretierbarkeit (Verständnis, wie Modelle Entscheidungen treffen) und die rechtlichen Auswirkungen des Trainings von Modellen auf verschiedenen Datensätzen. Ein signifikanter Fokus lag auch auf der sich entwickelnden Definition von Open Source im KI-Kontext, insbesondere wenn das primäre Asset vom Quellcode zu Daten wechselt, denen es oft an Transparenz mangelt. Wang hob das Problem von “Open Weights”-Modellen hervor, die als Open Source vermarktet werden, obwohl die zugrunde liegenden Trainingsdaten proprietär bleiben. Trotz eines internen “chaotischen Durcheinanders” beschleunigte der Inkubator erfolgreich die KI-Innovation und integrierte die Erkenntnisse in die Produkte von Anaconda.

Vorstellung der Anaconda KI-Plattform

Anaconda hat kürzlich seine KI-Plattform vorgestellt, die als “das GitHub der Open-Source-Entwicklung für Unternehmen” beschrieben wurde. Wang stellte klar, dass die Vision der Plattform über diesen Vergleich hinausgeht. Er betonte, dass die Zukunft der Informationssysteme in der KI eine “Fusion, eine Kombination aus Code und Daten” sein wird. Im Gegensatz zur traditionellen Softwareentwicklung umfasst die Verwaltung von KI-Systemen nicht nur Code und Bereitstellung, sondern auch eine kontinuierliche Leistungsbewertung in viel größerem Maßstab, oft durch nicht-traditionelle Benutzer wie Endbenutzer anstatt nur Machine-Learning-Ingenieure oder Datenwissenschaftler.

Während Plattformen wie GitHub bei der Quellcode-Zusammenarbeit brillieren und Hugging Face als Repository für Modelle dient, wird eine ganzheitliche Lösung benötigt, um all diese Komponenten für die praktische Anwendung zusammenzuführen. Die Anaconda KI-Plattform soll diese vereinheitlichte Umgebung sein und die Herausforderungen bei der Verwaltung des gesamten Lebenszyklus von KI-Systemen und -Agenten bewältigen – von der Kombination von Code, Open-Source-Abhängigkeiten und Modellen bis hin zu Bereitstellung, Rollback und Reproduzierbarkeit. Wang wies darauf hin, dass, obwohl einzelne technische Probleme (wie Modellversionierung oder Bereitstellung) mehrere Lösungen haben, die schiere Anzahl der Ansätze Komplexität für Unternehmen schafft, die eine konsistente Plattform für verschiedene Benutzer bereitstellen möchten. Das übergeordnete Ziel der KI-Plattform ist es, Unternehmen einen einzigen, integrierten Raum zu bieten, um die Integrität und Überwachung ihrer KI-Systeme zu gewährleisten, aufbauend auf Anacondas umfassender Erfahrung mit Datenwissenschaftsplattformen und -workflows.

Diese Plattform stimmt mit Anacondas ursprünglicher Motivation aus dem Jahr 2012 überein: die Python-Distribution und das Paketmanagement zu vereinfachen, insbesondere für Unternehmen, die mit zentralen IT-Einschränkungen zu kämpfen haben. So wie Unternehmen eine optimierte Methode zur Verwaltung von Open-Source-Software benötigten, benötigen sie jetzt eine ähnliche Lösung für KI-Komponenten.

Die essentielle Rolle von Open Source in der KI

Wang plädierte nachdrücklich für die Bedeutung von Open Source in der KI und sprach zwei unterschiedliche, aber verwandte Aspekte an: Transparenz und die breiteren Vorteile der Offenheit.

Erstens betonte er die Notwendigkeit von Transparenz und Steuerbarkeit in der KI. Das bedeutet zu wissen, welche Daten in das Training eines Modells eingeflossen sind und wie der Code Ergebnisse berechnet. Während vollständiges Open Source dies erreicht, kann Transparenz auch durch “Zutatenetiketten” erfüllt werden – Bereitstellung ausreichender Informationen für die Rechenschaftspflicht, ohne notwendigerweise jedes proprietäre Detail preiszugeben. Wang argumentierte, dass für KI-Systeme, die weitreichende Entscheidungen treffen, Transparenz eine “offensichtliche, notwendige und nicht verhandelbare Forderung” sei. Er deutete an, dass der Widerstand gegen Transparenz hauptsächlich von hochkapitalisierten Unternehmen kommt, die das Gespräch dominieren wollen.

Zweitens, jenseits der Transparenz, argumentierte Wang für die anhaltende Nachfrage nach echten Open-Source-Modellen aufgrund der immensen Kraft, des Einflusses und des frühen Entwicklungsstadiums der KI. Er sieht Open Source als zutiefst “marktfreundlich” und “menschenfreundlich”. Im Gegensatz zu der historischen Fehlvorstellung, dass Open Source antikapitalistisch sei, sieht Wang es als einen “Marktplatz der Ideen”, der Innovation fördert. Indem eine globale Gemeinschaft intelligenter Individuen KI-Technologien aufnehmen, nutzen und darauf aufbauen kann, erzeugt Open Source einen “n-Quadrat-Effekt der Innovation”. Dies führt zu billigeren, schnelleren und kostengünstigeren Fortschritten im Vergleich zu Innovationen, die auf wenige große Konzerne beschränkt sind.

Lehren für Open-Source-KI-Unternehmen

Wang bemerkte, dass sich Open-Source-KI-Unternehmen erheblich von traditionellen Open-Source-Softwareunternehmen unterscheiden, die bereits selten und schwer zu skalieren sind. Der Kernunterschied liegt in der “Vorkommodifizierung” der Innovation in Open Source. Während Innovation typischerweise einen Preis hat, ermöglicht Open Source kostenlose, kollaborative Innovation. Daher müssen erfolgreiche Open-Source-KI-Unternehmen das “Komplement” monetarisieren – die umgebenden Dienste, Plattformen und den Support, die die kostenlose Innovation nutzbar und wertvoll machen.

Einstieg in die KI

Für Organisationen, Unternehmen und Start-ups, die KI einführen möchten, bietet Anaconda verschiedene Einstiegspunkte. Benutzer können Anaconda herunterladen, um KI-Modelle lokal auszuführen und die Datenprivatsphäre zu gewährleisten, indem sie Cloud-Uploads vermeiden. Für diejenigen, die mit Cloud-Diensten vertraut sind, bietet Anaconda KI-Codierungsunterstützung innerhalb von Jupyter-Notebooks und ermöglicht die serverlose Python-Entwicklung über PyScript.

Für Unternehmen, die eine On-Premise- oder private KI-Bereitstellung benötigen, bietet Anaconda seine KI-Unternehmensplattform an, die die Flexibilität bietet, KI sicher nach ihren eigenen Bedingungen auszuführen oder proprietäre Cloud-Modelle zu nutzen. Da viele Organisationen hybride Setups (lokal, On-Premise, Cloud) betreiben, ermöglicht Anacondas Plattform die portable KI-Entwicklung in diesen Umgebungen.

Wang wiederholte die “Komplement”-Strategie: Während das Training massiver Frontier-Modelle “sexy” ist und von gut finanzierten Unternehmen verfolgt wird, die Modelle oft verschenken, konzentriert sich Anaconda auf die Lösung praktischer Herausforderungen. Dazu gehören die Bereitstellung von Lösungen für die Ausführung von Inferenz und das Fein-Tuning von Modellen auf weniger leistungsfähiger Hardware, das Anbieten von One-Click-Fein-Tuning und die Anleitung der Benutzer mit Best Practices für Implementierungen wie Retrieval-Augmented Generation (RAG). Diese komplementären Dienste, die über Anacondas Unternehmens-KI-Plattform vereinheitlicht sind, ermöglichen es Unternehmen, die Leistung der KI-Innovation effektiv zu nutzen.