Sie sind hier: Startseite » Markt » Invests

Cloud ein zentrales Element für Daten-Verarbeitung


Talend unterstützt das ICIJ beim Entschlüsseln versteckter Informationen in den Paradise Papers
Mit "Talend Data Integration" deckt eine Gruppe von investigativen Journalisten (ICIJ) die Offshore-Steueroasen von Machthabern und weltweit bekannten Marken auf


Das Internationale Netzwerk investigativer Journalisten (ICIJ) nutzt "Talend Data Fabric" für seine Auswertung der so genannten Paradise Papers. Diese Lösung stammt von Talend, Anbieterin von Integrationslösungen für Cloud und Big Data. Bei den Paradise Papers handelt es sich um 13,4 Millionen verschlüsselte Dokumente von zwei Offshore-Dienstleistern und 19 Steueroasen, die sich der geheimen Abwicklung von Finanztransaktionen politischer Größen und Konzerngiganten verschrieben haben.

Das ICIJ nutzte Talend, um mehr als 1,4 Terabyte unstrukturierter Daten in eine Neo4j-Graphdatenbank zu laden. Mit der Software Linkurious, eine Plattform für die Graphvisualisierung, erfolgen der Informationszugriff und die Datenorganisation.

Der Datenbestand umfasst E-Mails, Excel-, CSV- und PDF-Dateien mit Texten und Bildern zu Unternehmen und Personen, die ein zur Steuervermeidung entwickeltes Geheimsystem nutzten. Das ICIJ setzte zur Unterstützung seines "Knowledge Centers” weitere Open-Source-Tools ein, um die Daten für die Journalisten durchsuchbar zu machen.

"Wenn es um die Bereinigung, Transformation und Integration der erhaltenen Daten geht, ist die Lösung von Talend für uns das Mittel der Wahl. Für den Aufbau einer robusten Datenbank ist die Lösung für uns unentbehrlich", so Pierre Romera, CTO des ICIJ. "Das Arbeiten mit Open-Source-Tools wie Talend gewährleistet die Sicherheit und Zuverlässigkeit der Daten, denn unser umfangreiches Netzwerk investigativer Journalisten prüft Dateien mit einem Gesamtvolumen von mehreren Terabyte. Dank der Unterstützung einer riesigen Community von Mitwirkenden und des Einsatzes von Open-Source-Lösungen können wir innovative und topaktuelle Methoden für die Verarbeitung, Extraktion und Veranschaulichung der Daten nutzen."

Auch die Cloud bildet ein zentrales Element für die Verarbeitung der ICIJ-Daten. Die Organisation macht sich die Leistungsfähigkeit von Amazon Web Services (AWS) zunutze, um alle Daten zu verarbeiten und den Zugriff darauf zu erweitern. Für eine parallele Datenextraktion hat das ICIJ temporäre virtuelle Maschinen eingerichtet. Für die optische Zeichenerkennung und die Extraktion von Texten aus den Dateien werden Ubuntu, Tesseract und ein internes Tool namens Extract eingesetzt.

"In Anbetracht unseres Auftrags und der gigantischen Datenmengen, war die Nutzung von Cloud-Technologien naheliegend. Diese bieten uns bei Bedarf das benötigte Maß an Skalierbarkeit. So können wir unsere Leistungsanforderungen stets sehr einfach erfüllen. Aufgrund seiner robusten Verarbeitungsleistung und der hohen Sicherheit war AWS der geeignetste Anbieter für uns", erläutert Romera.

Die 13,4 Millionen Dokumente wurden der Süddeutschen Zeitung zugespielt. Sie umfassten Daten zweier Offshore-Dienstleister aus Bermuda und Singapur sowie die Unternehmensregister aus 19 Staaten auf der ganzen Welt. Etwa ein Jahr lang arbeiteten hunderte Journalisten und Medienpartner im Auftrag des ICIJ an der Sichtung dieses Bestands. Die Folgen für viele Prominente und Großunternehmen waren beträchtlich.

"Seit das ICIJ 2016 die Panama Papers veröffentlichte und dafür mit dem Pulitzerpreis ausgezeichnet wurde, wissen wir, wie groß der Nutzen von Datenmanagement- und Datenverarbeitungstechnologien für die Gesellschaft ist", sagt Ciaran Dynes, SVP of Products bei Talend. "Wir unterstützen gerne gründlichen investigativen Journalismus und helfen all jenen, die aussagekräftige Erkenntnisse aus Daten gewinnen wollen." (Talend: ra)

eingetragen: 05.02.18
Home & Newsletterlauf: 15.03.18

Talend: Kontakt und Steckbrief

Der Informationsanbieter hat seinen Kontakt leider noch nicht freigeschaltet.


Meldungen: Invests

  • Generative KI in hybrider Cloud

    Red Hat gibt bekannt, dass Rossmann ihre digitale Transformation mit einer agilen Hybrid-Cloud-Strategie auf Basis von "Microsoft Azure Red Hat OpenShift" vorantreibt. Mit der Plattform kann Rossmann nun Anwendungen über seine Infrastrukturen on-premises und in der Cloud hinweg flexibler verwalten und der wachsenden Nachfrage nach plattformübergreifender Interoperabilität gerecht werden.

  • "DMaaS Backup "als Teil des DMaas-Portfolios

    DMP (Data Management Professional) stellte ein weiteres Kundenprojekt vor. Die GfK setzt auf DataManagement-as-a-Service für ihre weltweite IT-Umgebung. Die GfK (Gesellschaft für Konsumforschung) ist eines der weltweit führenden Unternehmen im Bereich Daten und Analysen. Seit über 85 Jahren liefert die GfK Verbraucher- und Markteinblicke. Das Unternehmen beschäftigt mittlerweile mehr als 8.000 Mitarbeiter, die in mehr als 50 Ländern weltweit tätig sind. Aus diesem Grund verfügt die GfK über riesige Mengen an geschäftskritischen Verbraucher- und Marktdaten, die es rund um den Globus zu sichern gilt.

  • Dienstleister übernimmt gesamte IT-Verantwortung

    Ein Wohlfahrtsverband macht vor, was viele Unternehmen nur zögerlich angehen: Der Caritasverband für die Diözese Osnabrück setzt die vollständige digitale Transformation all seiner Prozesse und Strukturen in einem einzigen Großprojekt und in kürzester Zeit um. Dreh- und Angelpunkt der IT-Neuausrichtung ist das ERP-System (Enterprise Ressource Planning) Haufe X360, das als ausgereifte Business Management Plattform eine Vielzahl an geschäftlichen Kernprozessen verarbeitet, als Kundenportal fungiert und zusätzliche Software-Komponenten zentral steuert und orchestriert.

  • IT-Infrastruktur steigert das Order Management

    Seit 2020 unterstützt fulfillmenttools zahlreiche Händler mit ihren Order Management-Lösungen dabei, eine eigene Omnichannel-Erlebniswelt aufzubauen, die stationären und Online-Handel nahtlos verbindet. Auch Thalia, marktführender Omnichannel-Buchhändler im deutschsprachigen Raum setzt künftig auf die Lösungen von fulfillmenttools: Derzeit baut das Unternehmen im Rahmen seiner Logistikstrategie "Log2025" mit dem sogenannten Omnichannel-Hub im westfälischen Marl ein eigenes Logistik- und Produktionszentrum.

  • Wunderwaffe Cloud-ERP-System

    Was, wenn Produktionsunternehmen ihren Zeit- und Kostenaufwand entlang der gesamten Wertschöpfungskette halbieren könnten: vom Materialeinkauf über die Logistik bis hin zur Buchhaltung? Als roter Faden vernetzt ein Cloud-ERP-System alle Geschäftsprozesse und verschlankt sie messbar. Fünf Unternehmen zeigen, wie sich das konkret in ihren Kennzahlen niederschlägt.

  • Dokumente in Echtzeit prüfen

    Als Anbieterin im Bereich internationaler öffentlicher Ausschreibungsverfahren schützt exficon ihre Vergabeplattform exfitender vor Cyberbedrohungen und setzt dabei auf den Cloud-basierten Virenschutz. Die Integration von "Verdict-as-a-Service" (VaaS) von G Data CyberDefense in die Vergabeplattform exfitender ermöglicht eine schnelle und sichere Überprüfung eingehender Dokumente - ohne Verzögerungen im Ausschreibungsprozess.

  • Verteidigung auch abseits des Spielfelds

    Atlético Madrid stärkt seine Verteidigung auch abseits des Spielfelds: Google Cloud wird offizieller Cybersecurity-Partner der Damen- und Herrenmannschaft. Bereits seit dem Frühjahr 2024 arbeiten die beiden Partner zusammen und weiten jetzt ihre erfolgreiche Zusammenarbeit aus.

  • Abläufe weiter verbessern

    Cognizant und Boehringer Ingelheim gaben die Inbetriebnahme einer durchgängigen Technologieplattform bekannt, die auf der "Veeva Development Cloud" basiert. Diese soll die Bereitstellung von lebensverändernden Therapien durch das weltweit führende biopharmazeutische Unternehmen beschleunigen.

  • Nutanix statt Public Cloud

    SMA Solar Technology, Spezialistin für Photovoltaik-Systemtechnik, stellt ihren Kunden digitale Services über Web-Portale zur Verfügung. Allein im "Sunny Portal" sind mehr als eine Million Anlagen in 200 Ländern registriert. Große Solarparks etwa geben Informationen zu den produzierten Strommengen direkt an die Übertragungsnetzbetreiber weiter. Das setzt voraus, dass diese Daten jederzeit bei SMA abrufbar sind.

  • Catena-X-ready in Rekordzeit

    Die Koller Kunststofftechnik, Herstellerin von Spritzgussteilen für die Automobilindustrie, hat gemeinsam mit der German Edge Cloud (GEC) in weniger als einem Monat ein umfassendes Digitalisierungsprojekt erfolgreich umgesetzt. Dadurch hat Koller einen klaren Überblick über seine Produktionsprozesse und die Energieverbräuche. Fehler sind schneller zu identifizieren und Optimierungspotenziale werden sichtbar. Zudem war das Unternehmen in kürzester Zeit Catena-X-ready und hat bereits in einem Test einen Catena-X-konformen Datenaustausch erfolgreich mit der BMW Group durchgeführt.

Wir verwenden Cookies um unsere Website zu optimieren und Ihnen das bestmögliche Online-Erlebnis zu bieten. Mit dem Klick auf "Alle akzeptieren" erklären Sie sich damit einverstanden. Erweiterte Einstellungen