Das Collibra-Update zielt auf Datenqualität, Abstammung und Entdeckung ab
HeimHeim > Blog > Das Collibra-Update zielt auf Datenqualität, Abstammung und Entdeckung ab

Das Collibra-Update zielt auf Datenqualität, Abstammung und Entdeckung ab

Jun 24, 2023

Getty Images/iStockphoto

Collibra hat am Dienstag seine Data Intelligence Cloud mit vorgefertigten Workflows aktualisiert, die darauf abzielen, Daten über mehrere Quellen hinweg sichtbarer zu machen, sowie mit neuen Funktionen zur Verbesserung der Datenqualität.

Darüber hinaus stellte der Datenmanagementanbieter eine Reihe neuer und verbesserter Integrationen vor, um die Konnektivität zu seinen Technologiepartnern zu verbessern.

Collibra mit Sitz in New York und Brüssel ist ein cloudbasierter Anbieter, dessen Data Intelligence Cloud es Kunden ermöglicht, den Datenaufbereitungsprozess zu automatisieren. Zu seinen Funktionen gehören die Datenbewertung, die die Datenqualität misst, um zu zeigen, ob Daten vertrauenswürdig sind und für Analysen verwendet werden können, sowie Datenverwaltungsfunktionen, die bei der Einhaltung von Vorschriften helfen.

Zu den Konkurrenten zählen andere unabhängige Datenverwaltungsanbieter wie Alation und Informatica.

Zu den jüngsten Collibra-Updates gehören eine Integration mit Snowflake und die Einführung eines neuen Tools zur Messung der Datenreife eines Unternehmens im Vergleich zu seinen Mitbewerbern.

Darüber hinaus gab der Anbieter letzten Monat bekannt, dass seine Data Intelligence Cloud im Rahmen der Partnerschaft der Anbieter, die mit der Einführung von Datasphere durch SAP im März begann, zu einer empfohlenen Anwendung im SAP Store wurde.

Laut Laura Sellers, Chief Product Officer des Anbieters, sind verbesserte Datenqualität und Beobachtbarkeit nun Schwerpunkte für Collibra.

Daher enthält das neueste Data Intelligence Cloud-Update von Collibra neue Integrationen, die die Konnektivität verbessern und Kunden eine bessere Verwaltung ihrer Daten ermöglichen sollen.

Darunter sind neue Integrationen mit den folgenden:

Darüber hinaus umfasst das Update neue Integrationen mit den Analyseplattformen MicroStrategy, Power BI und Tableau.

Laut Stephen Catanzano, Analyst bei der Enterprise Strategy Group von TechTarget, ist jede der Integrationen von Bedeutung, da sie Collibra-Benutzern einen besseren Einblick in ihre verschiedenen Datensysteme bieten, was zu Kosteneinsparungen führen kann.

„Intelligenz für [Benutzer] ist die Transparenz, um die Effizienz zu verbessern und Kosten zu senken“, sagte er. „Diese neuen Funktionen erweitern die Systeme, mit denen sie verbunden werden können. Durch die Integration mit Google Cloud Storage werden sie in die Google-Struktur integriert, was von Bedeutung ist. Auch die Integrationen mit BI-Tools sind spannend, da sie daten- und verarbeitungsintensiv sind und Bereiche, in denen Kosteneinsparungen möglich sind.“ groß sein.“

Verkäufer stellten unterdessen fest, dass Datenkonsumenten Tools von unzähligen Anbietern nutzen. Um ihren Anforderungen gerecht zu werden, entwickeln Collibra und andere Anbieter Partnerschaften, um Ökosysteme für Datenmanagement und -analysen aufzubauen.

„Partnerschaften sind für uns der Schlüssel“, sagte Sellers. „Ich habe kein einziges Unternehmen gesehen, das seine Daten in nur einer Cloud hat. Sie beschäftigen sich mit Hybridquellen, mehreren Clouds und On-Premise-Software. Bei dieser Veröffentlichung geht es für uns also um alles, was mit Partnerschaften zu tun hat.“

Über die neuen Integrationen hinaus umfassen neue Tools zur Verbesserung der Datenqualität die allgemeine Verfügbarkeit von Data Quality Pushdown für Snowflake und den öffentlichen Betatest von Data Quality für Databricks.

Mit den Tools können gemeinsame Kunden von Collibra und entweder Snowflake oder Databricks Daten direkt in ihren Cloud-Datenspeicher-Repositories verarbeiten, wodurch die Notwendigkeit entfällt, Daten von Snowflake oder Databricks zur Vorbereitung nach Collibra und dann zurück in Snowflake oder Databricks zu verschieben.

Das spart Zeit, Aufwand und Kosten für den Datenaustritt und erhöht die Sicherheit durch die Reduzierung der Datenbewegungen. Darüber hinaus verfügen die Data Quality Pushdown-Versionen über automatische Anomalieerkennungsfunktionen, die die Effizienz weiter verbessern.

Letztlich liegt der Hauptvorteil der Data Quality Pushdowns jedoch laut Sellers in einer längeren Time-to-Value.

„Es geht darum, Daten sicher direkt dort zu verarbeiten, wo sie sind. Es gibt keine Datenbewegung, also ist kein Datenausgang erforderlich“, sagte sie.

Verkäufer fügten hinzu, dass Data Quality Pushdown für Snowflake zwar allgemein verfügbar ist und sich Data Quality Pushdown für Databricks im öffentlichen Betatest befindet, Collibra jedoch plant, ähnliche Data Quality Pushdown-Tools für andere Cloud-Datenspeicher-Repositories hinzuzufügen, darunter Amazon Redshift, Google BigQuery und Microsoft Azure.

„Für diese Cloud-Player wollen wir so weit wie möglich vorgehen, damit wir jeden, der sich in diesen Ökosystemen befindet, mit der gesamten Funktionalität unserer Plattform unterstützen können“, sagte sie.

Von potenzieller Bedeutung für Collibra-Benutzer sind auch neue vorgefertigte Workflows, die sich mit der Datenherkunft und Datenerkennung befassen.

Die Workflows sind Teil von Workflow Designer, der sich derzeit im öffentlichen Betatest befindet. Benutzer können zum Bereitstellen einfach auf die Schaltfläche „Workflow-Bereitstellung“ klicken.

Die Datenherkunftskonfiguration ermöglicht den schnellen Zugriff auf Datenherkunftsinformationen und umfasst vorgefertigte Integrationen. Der Collibra Data Marketplace verfügt nach Angaben des Anbieters über eine Self-Service-Schnittstelle, die es Benutzern erleichtert, Daten zu finden.

Während das neueste Update von Collibra die Sichtbarkeit über mehrere Quellen erhöht und auf die Datenqualität abzielt, werden keine generativen KI-Funktionen hinzugefügt.

In den sieben Monaten seit der Einführung von ChatGPT durch OpenAI, was einen bedeutenden Sprung in den Fähigkeiten großer Sprachmodelle bedeutete, haben zahlreiche Datenmanagement- und Analyseanbieter Pläne vorgestellt, generative KI in ihre Plattformen einzubinden.

Viele Anbieter hoffen, dass generative KI Datenmanagement- und Analysetools nicht nur für Datenexperten in Unternehmen nutzbar machen kann. Dies würde dadurch erreicht, dass die Notwendigkeit, Code zu kennen, entfällt und das Niveau der Datenkompetenz, das derzeit für die Arbeit mit Daten erforderlich ist, verringert wird.

Da jedoch weiterhin Bedenken hinsichtlich der Sicherheit generativer KI-Plattformen und der Genauigkeit ihrer Daten bestehen, haben selbst die Anbieter, die Pläne zur Integration generativer KI angekündigt haben, noch keine generativen KI-gesteuerten Funktionen allgemein verfügbar gemacht.

Laut Sellers plant Collibra unterdessen, generative KI zu integrieren, sobald dies sicher möglich ist.

„Generative KI ist ein großer Umbruch und wirklich aufregend“, sagte sie. „Ich glaube wirklich, dass es die Benutzererfahrungen in jeder Software verändern wird. Aber es ist kein Bereich, in dem wir bereit waren, mit diesem Update irgendetwas zu veröffentlichen. Wir prüfen auf jeden Fall, wie wir es im Produkt nutzen können, um eine bessere Erfahrung zu erzielen.“ intelligentere Automatisierung.“

Über generative KI und weitere Datenqualitäts-Pushdowns hinaus konzentrierte sich die Roadmap von Collibra im Wesentlichen auf die Vereinfachung der Datenverwaltung für Benutzer, fügte Sellers hinzu.

Catanzano sagte unterdessen, er würde sich wünschen, dass Collibra und andere Anbieter Unternehmen dabei helfen, die Kosten der KI-Verarbeitung zu überwachen. Der Großteil der KI-Verarbeitung findet in der Cloud statt und viele Unternehmen haben Schwierigkeiten, die Kosten für Cloud-Computing unter Kontrolle zu halten.

„Ich würde mich gerne mehr auf die Reduzierung der KI-Kosten konzentrieren“, sagte Catanzano. „KI-Verarbeitung kostet ein Vermögen. Wenn [Collibra] dort die Kosten überwachen und verwalten kann, wäre das spannend.“

Eric Avidon ist leitender Nachrichtenautor für TechTarget Editorial und Journalist mit mehr als 25 Jahren Erfahrung. Er deckt die Bereiche Analytik und Datenmanagement ab.

Stephen Catanzano