Schnellere Datenintegration in die Cloud

Talend: Sommer-Update für schnellere Datenverarbeitung

16. August 2019, 8:45 Uhr | Von Timo Scheibe.

In fast allen Bereichen treffen Unternehmen ihre Entscheidungen basierend auf Daten, die sie zuvor aufbereitet und analysiert haben. Dabei beobachtet Thomas Steinborn, Vice President Product Management bei Talend, den Trend, dass die Daten zur Einsicht immer schneller aufbereitet und dabei zudem auch skalierbar sein müssen, um Enterprise-Anforderungen zu erfüllen. Problematisch sei hierbei, dass die Informationen oft aus verschiedenen Quellen stammen und zuvor integriert werden müssen. Talend unterteilt den Prozess der Datenverarbeitung in die vier Bereiche Sammeln, Verwalten, Transformieren und Teilen. Der Quellort der Daten kann dabei in der Multi-Cloud, in der Hybrid Cloud oder On-Premises liegen.

Das Mittel der Wahl, um Unternehmen eine schnellstmögliche Datenverarbeitung zu ermöglichen, ist die Cloud. Daher schickt sich Talend an, möglichst viele Kunden in die Cloud zu migrieren. Dies will der Hersteller etwa durch das Summer 2019 Release der auseigenen End-to-End-Suite Data Fabric erreichen. Das Update helfe dabei, Integrationsumgebungen aller Art zu beschleunigen. Dies umfasst laut Hersteller sowohl einfache Datenerfassungsaufgaben bis hin zu umfassenden Integrationsszenarien. Auch die Einführung von Datenprojekten mit langfristigen Integrationsbedürfnissen sei so möglich, etwa Governance und Cloud-übergreifender Support.

Das Summer 2019 Release erlaubt es Datenexperten Data-Warehouse-Projekte schnell umzusetzen und reibungslos auf komplexere Anwendungsfälle und Multi-Clouds umzustellen. Derzeit haben laut Steinborn noch nicht viele Kunden ihre Daten in einer Cloud. Dies ändere sich jedoch derzeit. "Die Cloud ist nicht mehr das Thema, aber viele Datenquellen befinden sich noch auf lokalen Infrastrukturen. Die Datenverarbeitung muss aber in gleichen Teilen betrieben werden", erklärt der Talend-Mann gegenüber LANline.

Mit dem Pipeline Designer bietet Talend außerdem eine Lösung an, die Unternehmen einen flexiblen Pay-as-you-go-Ansatz bei Datenintegrationsprojekten bieten soll. Der Designer biete eine einfachere Abrechnung und basiert laut Hersteller auf Ressourcen, die für den schnellen Einstieg in Next-Generation-Datenintegrationsprojekten zum Einsatz kommen. Das neue Bezahlmodell umfasse etwa eine 14-tägige Trial-Phase, sowie die Bezahlung via Kreditkarte und einen Pay-what-you-use-Ansatz, der eine stundenbasierte Abrechnung ermöglicht. Ebenso neu ist der "In Product Chat" (IPC), der bei technischen Problemen eine sofortige Echtzeithilfe durch einen Talend-Mitarbeiter innerhalb des Produkts ermöglichen soll.

Für eine schnellere Integration der Daten beziehungsweise für die Skalierung in Cloud-, Hybrid- und lokalen Umgebungen bringt das Sommer-Update außerdem erweiterte Anbindungsmöglichkeiten, ein breiteres Deployment und eine vereinfachte Vereinfachung mit sich. Dies umfasst laut Hersteller etwa intelligente Daten mit Vorschlägen auf Basis von Machine Learning. Die MagicFill genannte Funktion hilft laut Steinborn bei der Standardisierung von Daten. In Dokumenten mit mehreren Spalten, etwa zu Vor- und Nachnamen sowie einer dazugehörigen E-Mail-Adresse kann die ML-Technik feststellen, ob der Text in der jeweiligen Spalte Sinn macht, etwa ob der Name Jesse James in Spalte 1 zur Abkürzung J. James in Spalte 2 passt und die angegebene E-Mail jjames@gmail.com stimmen kann, berichtet Steinborn. Ebenso könne MagicFill die Richtigkeit der in der E-Mail angegebenen Domain überprüfen. Auch sei es möglich, der Lösung einige Beispiele vorzugeben, anhand derer sie die restlichen Daten entsprechend automatisiert aufbereitet.

Zum weiteren Umfang des neuen Releases gehört außerdem eine zentral verwaltete Hybrid-Bereitstellung aus der Cloud, ein umfassender Support für Databricks sowie die Erweiterung der nativen Unterstützung für Databricks Delta Lake, einem Open-Source-Storage, der Data Lakes auf die Nutzung von Analytics-Lösungen vorbereiten soll. Via dem Pipeline Designer bietet Talend nach eigenen Angaben außerdem verbesserte Verbindungsoptionen zu Microsoft Azure und ermöglicht eine Big-Data-Verarbeitung im großen Maßstab.

Mit der neuen und umkehrbaren Format Preserving Encryption will der Hersteller außerdem einen zuverlässigen Schutz von sensiblen Daten ermöglichen. Die Format Preserving Encryption (FPE) basiert auf dem NIST-FF1-Standard, der Beziehungen zwischen Daten pflegt, wenn diese einmal maskiert sind.

In puncto Entwicklung enthält das Sommer-Release eine verbesserte Docker-Containerunterstützung für Data-(Micro-)Services und Routes, um diese je nach Bedarf in beide Richtungen skalieren zu können, sowie eine einfache Automatisierung der Unternehmens-CI mit dem neuen CI-Plugin, wodurch sich CI/CD (Continuous Integration/Continuous Delivery beziehungsweise Continuous Deployment) automatisch ohne komplizierte Einrichtung und Konfiguration einsetzen lässt.

Weitere Informationen finden sich unter www.talend.com.

Timo Scheibe ist Redakteur bei der LANline.

Lesen Sie mehr zum Thema


Jetzt kostenfreie Newsletter bestellen!

Weitere Artikel zu Conrad Electronic SE

Weitere Artikel zu media concept ORCON GmbH

Matchmaker+