Datenverwaltungskomplexität in der Cloud lösen

Seien wir ehrlich. Angesichts der Vielzahl von Cloud-nativen Datenbanken für spezielle Zwecke, die wir in Produktion geben, malen wir uns in eine Ecke.

Dies ohne Rücksicht darauf, wie wir diese Datenbanken auf eine Weise verwenden sollten, die einen einfachen Zugriff und ein leichtes Verständnis der Daten ermöglicht. Heutzutage sind sie in der Regel an Anwendungen gekoppelt und verfolgen einen taktischen und keinen strategischen Zweck.

Dies ist nicht der Zweck von Daten und nicht das Versprechen der Cloud. Denken Sie daran, dass Daten in der Cloud in unseren Köpfen aufgebaut wurden, um den Zugriff auf und die Zentralisierung von Daten zu erleichtern. Schließlich könnten wir „wunderbare Dinge mit unseren Daten machen“.

Dies bedeutet nicht, dass die Beschaffung und der Betrieb von Daten und Datenbanken teuer geblieben sind. Das allein war ein großer Vorteil von Public Clouds.

Dank der wundervollen Welt der On-Demand-Cloud-Infrastruktur können Sie von „Datenbank benötigen“ zu „Datenbank haben“ innerhalb eines Tages oder weniger wechseln.

Die einfache Beschaffung von Cloud-nativen Datenbanken und damit der Aufbau neuer Datenbanken hat jedoch zu einem Problem mit der Datenkomplexität geführt, das einige wesentliche Nachteile mit sich bringt:

In der Regel gibt es kein gemeinsames Verständnis aller Unternehmensdaten und des Kontexts dieser Daten. Die Daten sind immer noch weitgehend isoliert, vielleicht sogar noch schlimmer als vor 10 Jahren, als unsere Reise in die öffentliche Cloud begann.
Jetzt sind wir mit unbeabsichtigten Konsequenzen konfrontiert, z. B. mangelndem Verständnis für den Umgang mit Sicherheit, Datenverwaltung oder sogar der Nutzung einer „einzigen Quelle der Wahrheit“.

Wir haben laufende Projekte, die sich mit dem Problem der Datenkomplexität befassen, wie die Linked Open Data Cloud. Die Linked Open Data Cloud bietet eine lose gekoppelte Sammlung von Daten, Informationen und Wissen, auf die jeder Mensch oder jede Maschine mit Zugang zum Internet zugreifen kann.

Ziel ist es, eine vom Web bereitgestellte Abstraktionsschicht zu erstellen. Es ermöglicht sowohl den einfachen als auch den anspruchsvollen Lookup-orientierten Zugriff mit der SPARQL-Abfragesprache oder mit SQL, um den Zugriff auf strukturierte und unstrukturierte Daten auf die gleiche Weise zu ermöglichen wie beim Zugriff auf Webseiten, um auf Bild- und Textseiten zuzugreifen, seit das Web gestartet wurde.

Natürlich bieten auch eine Reihe von Technologieanbietern Lösungen wie Stammdatenverwaltung, Datenvirtualisierung und andere Technologien an, mit denen Sie komplexe Daten auf verbesserte Weise verwalten können. Mit anderen Worten: Bereitstellung von Datensemantik und Metadatenverwaltung außerhalb der Datenbanken, Cloud oder nicht.

Ich verstehe jetzt, dass dieser Ansatz für die Verwaltung von Cloud-, Cross-Cloud- oder Hybrid-Cloud-Datenbanken nicht skalierbar oder altersgemäß ist. Bei der Betrachtung der aktuellen Anforderungen sowie in naher oder ferner Zukunft werden die Daten komplexer und technologisch vielfältiger, wenn man das rasante Innovationstempo berücksichtigt.

Der Versuch, die heute verwendeten Ansätze und Tools zu nutzen, wird die Komplexität erhöhen, bis die Systeme schließlich zusammenbrechen. Denken Sie nur an die Anzahl der Tools in Ihrem Rechenzentrum, die Sie heute dazu veranlassen, sich die Frage zu stellen: „Was haben sie gedacht?“ In der Tat haben sie ähnlich gedacht wie heute, einschließlich der Suche nach taktischen Lösungen, die letztendlich nicht das bieten Wert, den sie einmal hatten – und in einigen Fällen einen negativen Wert liefern.

Ich habe einen langen Weg zurückgelegt, um Ihnen eine Antwort zu geben, aber während ich darüber nachdenke, wie wir dieses Problem lösen, scheint ein Ansatz immer wieder als die wahrscheinlichste Lösung aufzutauchen. In der Tat wurde es in verschiedenen akademischen Kreisen herumgetrampelt. Es ist der Begriff der Selbstidentifizierung von Daten.

Leave a Reply