Observe erhält 156 Mio. $ für KI-Ära-Observabilität: Data Lake & AI SRE

Datanami

Die rasante Beschleunigung der künstlichen Intelligenz hat unbeabsichtigt eine erhebliche Herausforderung für IT-Abteilungen ausgelöst: eine überwältigende Flut von Telemetriedaten. Jeder neue KI-Dienst und jedes neue Modell erzeugt einen Strom von Logs, Traces und Metriken, wodurch Observability – die Praxis, den internen Zustand eines Systems aus seinen externen Ausgaben zu verstehen – von einer Hintergrundfunktion zu einem der bedeutendsten Posten in modernen IT-Budgets von Unternehmen wird.

In diese wachsende Herausforderung tritt Observe, ein in San Mateo ansässiges Startup, das kürzlich 156 Millionen US-Dollar in einer Serie-C-Finanzierungsrunde erhielt. Das Unternehmen zielt darauf ab, Observability für die KI-Ära neu zu definieren und Engineering-Teams schnellere Antworten und deutlich reduzierte Kosten zu versprechen. Observe positioniert sich gegen etablierte Marktgiganten wie Splunk, Datadog und Elasticsearch und bietet eine Plattform, die auf einem Telemetriedaten-Lake, einem Echtzeit-Knowledge-Graph und KI-gestütztem Site Reliability Engineering (SRE) basiert.

Ein Haupthindernis für Datenteams ist heute die fragmentierte Natur der gesammelten Informationen. Telemetriedaten verteilen sich oft auf verschiedene Tools, was Ingenieure zwingt, während kritischer Ausfälle oder Leistungsengpässe manuell ein umfassendes Bild zusammenzusetzen. Erschwerend kommt hinzu, dass traditionelle Observability-Plattformen häufig Preismodelle verwenden, die auf der Datenaufnahme oder -speicherung basieren, was zu explodierenden Kosten führt, wenn KI-Workloads expandieren. Für viele Organisationen hat sich das, was als betriebliche Absicherung begann, zu einem erheblichen Budgetproblem entwickelt – eine Lücke, die Observe schließen will.

Binu Mathew, CTO bei Tekion, bestätigte diese Einschätzung und bemerkte, dass ihre bestehenden Observability-Tools Schwierigkeiten hatten, mit ihrem explosiven Wachstum zu skalieren. „Wir hatten große kommerzielle und Open-Source-Tools ausprobiert, aber beide führten zu steigenden Kosten und ständigen Tuning-Anstrengungen, die Ingenieurressourcen aufzehrten“, erklärte Mathew. „Observe gab uns eine kostengünstige, vereinheitlichte Plattform für Logs, Metriken und Traces, mit der Fähigkeit, über all diese hinweg zu korrelieren.“

Die Plattform von Observe wurde entwickelt, um alle Logs, Metriken und Traces in einem einzigen Telemetry Data Lake zu konsolidieren. Daten werden in Echtzeit aufgenommen und in einem offenen, komprimierten Format gespeichert, was laut Unternehmen auch bei Skalierung der Workloads vorhersehbare Speicherkosten gewährleistet. Diese Architektur soll auch die Notwendigkeit der in älteren Systemen üblichen aufwendigen Indexierung und kontinuierlichen Abstimmung eliminieren.

Über dem Data Lake liegt der Live Knowledge Graph von Observe, der die Verbindungen zwischen Diensten, Infrastrukturkomponenten, Bereitstellungen und Vorfällen intelligent abbildet. Dieses kontextbezogene Verständnis ermöglicht es Datenteams laut Unternehmen, die manuelle Korrelation zu umgehen, die bei Systemausfällen oft erforderlich ist. Die letzte Komponente ist das AI SRE, das als ständig aktives System beschrieben wird, das Anomalien erkennen, Ursachen identifizieren und automatisierte Korrekturen empfehlen oder sogar auslösen kann. Zusammen sollen diese Elemente die Fehlerbehebung beschleunigen und die operative Belastung der Verwaltung von Observability in großem Maßstab verringern.

Andrew Katz, CTO und Mitbegründer von mParticle, betonte die Skalierbarkeit und Kosteneffizienz der Plattform. „Unsere Kunden verlassen sich darauf, dass wir Daten aus Hunderten von Quellen vereinheitlichen, was eine hochskalierbare und effiziente Infrastruktur erfordert“, erklärte Katz. „Die Data-Lake-basierte Architektur von Observe ermöglicht es uns, Observability viel einfacher und kostengünstiger zu skalieren als traditionelle Lösungen.“

Obwohl der Observability-Markt von ausgereiften Plattformen dominiert wird, basieren viele davon auf Architekturen, die Schwierigkeiten haben, das schiere Volumen und die Komplexität der von heutigen KI-Workloads generierten Daten zu verwalten. Die ständigen Anforderungen an Indexierung, Tuning und Speicherüberwachung in Altsystemen haben eine Chance für Plattformen geschaffen, die Operationen vereinfachen und gleichzeitig die Kosten im Zaum halten können. Observe zielt darauf ab, dies zu nutzen, indem es ein Modell fördert, das moderne Datenanforderungen ohne den gleichen Wartungsaufwand bewältigen kann.

Groß angelegte Implementierungen zeigen die praktische Anwendung der Plattform. Observe speichert Telemetriedaten im Apache Iceberg-Format, was Kunden die volle Kontrolle über ihre Daten gewährt und eine Anbieterbindung verhindert. Das System nutzt auch OpenTelemetry für die Datenerfassung, was eine nahtlose Integration mit bestehenden Pipelines und Tools ermöglicht. Das Unternehmen hat kürzlich seine Fähigkeiten durch das Hinzufügen eines MCP-Servers erweitert, der es externen AI SREs ermöglicht, direkt mit seinem Observability-Kontext zu interagieren, wodurch Partnern und anderen Tools die Teilnahme an automatisierten Incident-Workflows ermöglicht wird, die vom selben Echtzeit-Knowledge-Graph gesteuert werden.

Observe nennt überzeugende Kundenerfolgsgeschichten, darunter eine große internationale Bank, die Berichten zufolge Splunk durch Observe ersetzte und zunächst täglich 30 TiB an Compliance-Logs verarbeitete und später auf fast 100 TiB mit über 3.000 Benutzern skalierte. Die Bank hat Splunk seitdem vollständig eingestellt und plant, von AppDynamics zu einer OpenTelemetry-nativen Application Performance Monitoring (APM)-Strategie überzugehen.

Die Wachstumsmetriken des Unternehmens unterstreichen seine steigende Attraktivität: Im vergangenen Jahr hat Observe seinen Umsatz verdreifacht, seine Unternehmenskundenbasis verdoppelt und verarbeitet nun mehr als 150 Petabyte Daten. Es weist auch eine beeindruckende Nettoumsatzbindungsrate von 180 % auf, was darauf hindeutet, dass bestehende Kunden ihre Nutzung im Laufe der Zeit erweitern. Bemerkenswerte Kunden sind Topgolf, das Observe verwendet, um die Aufnahmekosten direkt an die Ressourcennutzung anzupassen, und Dialpad, das eine Reduzierung der Fehlerbehebungszeit um 30 % meldet.

Investoren nehmen Notiz. Capital One Ventures sieht Observe beispielsweise als zentral für die Systemzuverlässigkeit. Sean Leach, Partner der Firma, beschrieb die Full-Stack-Observability als „grundlegend für KI“ und entscheidend für die Verfolgung der Ressourcennutzung und die Bereitstellung maßgeschneiderter Kundenerlebnisse. Er bestätigte die Unterstützung von Capital One für Observe aufgrund seiner „kühnen Vision für moderne Observability“. Snowflake Ventures hat sein Engagement ebenfalls vertieft und erkannt, dass das Telemetrie-First-Design von Observe die Snowflake Data Cloud auf natürliche Weise ergänzt und den Weg für gemeinsame Lösungen in Unternehmensumgebungen ebnet.

Mit dieser beträchtlichen Serie-C-Finanzspritze von 156 Millionen Dollar erhält Observe einen erheblichen Spielraum, um seine Plattform weiterzuentwickeln, neue Funktionen einzuführen und seinen Wettbewerbsdruck in einem Markt zu verstärken, der reif für Disruption ist.