SAP Vora ist eine In-Memory Query Engine, die erweiterte interaktive Analysen auf Hadoop ermöglicht. Es nutzt und erweitert dazu das Big-Data Framework Apache Spark und basiert auf der In-Memory Technologie SAP HANA.
Update März 2022: Der Verbindungstyp SAP Vora ist veraltet und wird in zukünftigen Releases entfernt. SAP Data Intelligence ist das neue Stichwort.
1. Was ist das Ziel von SAP Vora?
Hauptzweck von SAP Vora ist, große Datenmengen aus Hadoop für Unternehmen zugänglich zu machen und auszuwerten. Es vereinfacht die Komplexität in der Verarbeitung von „Big Data“. Es soll die Nachteile von Hadoop beseitigen, dass Daten in einem Data Lake unstrukturiert und schwer zu verarbeiten sind. SAP Vora baut strukturierte Datenhierarchien für Hadoop-Daten auf. Es integriert sie mit Daten von HANA, um In-Memory-Analysen im OLAP-Stil zu ermöglichen. Dies erfolgt über eine Schnittstelle für die Apache Spark Structured Query Language (SQL).
Die Ziele dabei sind:
- präzise Entscheidungen zu ermöglichen
- Big Data Ownership zu vereinfachen
- Datenzugriff zu demokratisieren
- geschäftskritische Fälle aufzudecken
Das Big-Data-System kann sowohl von SAP Kunden als auch von nicht SAP Kunden genutzt werden.
2. Was bedeutet der Name SAP Vora?
VORA ist die lateinische Wurzel von „VORAcious“, was gefräßig oder unersättlich bedeutet. Da Vora große Datenmengen verarbeiten kann und soll, beschreibt der Name treffend die Funktion.
3. SAP HANA versus SAP Vora
SAP Vora hieß zu Beginn SAP HANA Vora. SAP HANA Vora wurde im September 2015 als On-Premise- und Cloud-Edition veröffentlicht. Dieser Name führte zu Verwirrung über die Beziehung zwischen SAP HANA und SAP HANA Vora. Vora ist eine völlig neue Codebasis und kann auf Standalone-Basis mit einem der Hadoop-Knoten existieren, kann aber auch in die klassische HANA integriert werden. Die Integration mit SAP HANA erfolgt nahtlos.
Mit dem Release von SAP Vora 1.4 im März 2017 wurde dieser Umstand durch die offizielle Umbenennung in SAP Vora deutlich gemacht.
Abb. 1: SAP HANA Integration: SAP Product Road Map, SAP Vora, https://www.sap.com/documents/2017/06/281ab428-c37c-0010-82c7-eda71af511fa.gate.html
4. Wer profitiert von SAP Vora?
SAP Vora bietet vor allen folgenden Nutzern Vorteile:
- Business-Analysten können Ursachenanalysen durchführen, indem sie interaktive Abfragen sowohl für Geschäfts- als auch für Hadoop-Daten durchführen, um den Geschäftskontext besser zu verstehen.
- Data Scientist können Muster entdecken, indem sie neue Modellierungstechniken mit einer Kombination aus Geschäfts- und Hadoop-Daten ausprobieren, ohne Datenkopien innerhalb von Data Lakes zu duplizieren.
- Softwareentwickler können eine Query-Engine in Anwendungen implementieren, die Unternehmens- und Hadoop-Systeme umfassen, indem sie vertraute Programmierwerkzeuge verwenden.
5. Was sind Anwendungsfälle für SAP Vora?
Nach Angaben von SAP eignet sich Vora vor allem für Finanzdienstleister, Telekommunikationsunternehmen und Firmen im Gesundheitswesen und der Fertigungsindustrie.
Vora eignet sich vor allem für folgende Aufgaben:
- Risikominimierung und Betrugsprävention, indem Unregelmäßigkeiten in Finanztransaktionen und historischen Kundendaten in Echtzeit aufgedeckt werden
- Bandbreitenoptimierung in der Telekommunikation, indem Datenverkehrsmuster analysiert werden, um Netzwerkengpässe zu vermeiden und die Servicequalität zu verbessern
- Vorbeugende Instandhaltung und Verbesserung der Prozesse für den Produktrückruf, indem Stücklisten, Datensätzen aus dem Service und Sensordaten gemeinsam untersucht werden.
6. Was sind die Vorteile von SAP Vora?
Ab Vora 1.3 werden sogenannte „Engines“ unterstützt. Diese „Engines“ sind auf speziellen Einsatzbereiche spezialisiert:
- Zeit-Reihe
- Grafiken
- Dokumentenablage
- Disk Engine
- Relational Engine
6.1 In-Memory Datenbank
Alle Engines, außer der Disk-Engine, speichern ihre Daten in der In-Memory Datenbank. Die relationale Engine hat einen Mechanismus zum Auslagern der Daten auf die Festplatte. Dadurch sinkt die Leistung, aber die Datenmenge, die verarbeitet werden kann, steigt. Die Disk-Engine hebt die Daten nur zur Verarbeitung in die In-Memory Datenbank und legt sie anschließend wieder ab.
6.2 Integriertes Produkt
Man hat nun diese verschiedenen Engines in einem integrierten Produkt und muss sich nicht für mehrere, separate Engines entscheiden. Der Dokumentenspeicher umfasst NoSQL-Engines wie MongoDB, die nicht einmal Teil der typischen Hadoop-Auslieferungen sind.
6.3 Skalierbarkeit
Hadoop und Vora sind so konzipiert, dass sie grundsätzlich unendlich skalierbar sind und auch auf handelsüblicher Hardware laufen.
6.4 Verarbeitung von grafikbasierten Daten
Es gibt ein paar Optionen zum Speichern und Verarbeiten von Grafik-Daten in Hadoop, aber keine davon ist sehr komfortabel. Die Grafik-Engine bietet die Möglichkeit, grafikbasierte Daten zu speichern und zu verarbeiten.
6.5 Verarbeitung von zeitreihenbasierten Daten
Die Zeitreihen-Engine kann Sensordaten z.B. für vorausschauende Wartungsarbeiten oder Alarmierungsszenarien verarbeiten.
Abb. 2: SAP Vora: Distributed Computing for the Digital Enterprise
Quelle: SAP Product Road Map, SAP Vora
https://www.sap.com/documents/2017/06/281ab428-c37c-0010-82c7-eda71af511fa.gate.html
Ein Einsatzbeispiel:
Ein Unternehmen verfügt nicht über HANA, die Daten befinden sich in Hadoop. Um eine schnellere Datenanalyse und eine OLAP-Verarbeitung für einen großen Datensatz in Hadoop durchzuführen, kann Vora eingesetzt werden. Es ist eine Komponente, die auf Spark und Hadoop sitzt. SAP Lumira hat eine direkte Verbindung zu Vora hat, d.h. mit Lumira können Kunden Hadoop-Daten mit Hilfe von Vora analysieren und visualisieren.
7. Was ist die aktuelle Version von SAP Vora?
SAP hat SAP Vora 2.0 am 14. September 2017 freigegeben. SAP hatte damals auch den SAP Data Hub veröffentlicht. Data Hub war ein neues Produkt, das die Datenintegrations- und Orchestrierungsprobleme für SAP-Kunden mit Schwerpunkt auf Big Data-Technologien lösen sollte. SAP Vora war Teil dieses Angebots und wurde von SAP nicht mehr als eigenständiges Produkt vermarktet.
Update März 2022: Der Verbindungstyp SAP Vora ist inzwischen veraltet und wird in zukünftigen Releases entfernt. Weitere Informationen finden Sie im SAP-Hinweis 3036489 auf der SAP-Website veröffentlicht.
https://help.sap.com/viewer/b13b5722c8ff4bf9bb097251310031d0/3.2.3/en-US/c0e0c11244da4f6e9a83054a54d503bc.html
Vora 2.0 unterstützt On-Premise-, Cloud- und Hybrid-Bereitstellung über Google Kubernetes und Docker-Container:
Abb.3: Architektur von Vora 2.0,
Quelle: https://blogs.sap.com/2017/09/25/vora-2.0-kubernetes-demystified/
8. Wo kann ich SAP Vora testen?
Für den Vora-Test können Sie eine kostenlose Single Node Developer Edition als virtuelle Maschine herunterladen oder eine Instanz auf AWS ausführen. Mehr Informationen finden Sie im Installation Guide im SAP Help Portal für SAP Data Intelligence. Der SAP Data Hub existiert so nicht mehr. https://help.sap.com/viewer/a8d90a56d61a49718ebcb5f65014bbe7/3.2.3/en-US/427bbc935176421586dd162614254f33.html.
Registrierung ist erforderlich. Entwicklungs- und Testumgebungen sind kostenlos, was sich von anderen Hadoop-Herstellern unterscheidet, Management und Master-Knoten sind ebenfalls kostenlos.
9. Wie kann ich mehr über SAP Vora lernen?
Es gibt eine kostenlose openSAP-Schulung im Selbststudium:
Der Kurs geht über vier Wochen und benötigt zwei bis drei Stunden pro Woche.
Die Kursinhalte sind:
Woche 1: Overview: SAP Vora
Woche 2: Data Analysis Engines/Functionalities
Woche 3: Data Analysis with SAP Vora Tools
Woche 4: SAP Vora Deployment
Woche 5: Final Exam
Unser Fazit
SAP VORA ist eine gute Ergänzung für Unternehmen, die bereits auf SAP-Plattformen arbeiten. Solche Unternehmen können ihre Transaktions-, Data Lake- und anderen Datenquellen in Vora integrieren und Mash-Up-Abfragen für tiefgehende und interaktive Analysen erstellen.
Weitere Quellen:
Weitere Videos:
Coverphoto: Clem Onojeghuo auf Unsplash – Kings Cross, London, United Kingdom – focus photo of white metal frame