Serveur d'impression

10 outils ETL Open Source – Serveur d’impression

Le 20 août 2019 - 7 minutes de lecture

Les outils ETL sont utilisés pour

  • Extraire des données à partir de sources de données homogènes ou hétérogènes

  • Transformez les données pour les stocker dans un format ou une structure appropriée à des fins d'interrogation et d'analyse

  • Chargez-le dans la cible finale (base de données, en particulier magasin de données opérationnel, magasin de données ou entrepôt de données).

Généralement, dans les outils ETL, les trois phases s’exécutent en parallèle, car l’extraction des données prend du temps. Lors de l’extraction des données, un autre processus de transformation s’exécute, traite les données déjà reçues, prépare les données au chargement et dès qu’il en contient. prêt à être chargé dans la cible, le chargement des données démarre sans attendre la fin des phases précédentes.

Voici la liste de 10 outils ETL open source.

Intégrateur de données Open Source Talend

Talend fournit de multiples solutions pour l’intégration de données, à la fois éditions open source et commerciales. Talend propose une interface basée sur Eclipse, un flux de conception glisser-déposer et une connectivité étendue avec plus de 400 connecteurs d'applications préconfigurés pour relier des bases de données, des systèmes centraux, des systèmes de fichiers, des services Web, des applications d'entreprise packagées, des entrepôts de données, des applications OLAP. , Logiciel en tant que service, applications basées sur le cloud, etc.

Scriptella

Scriptella est un outil d'exécution ETL (Extract-Transform-Load) et de script open source écrit en Java. Son objectif principal est la simplicité. Vous n'avez pas besoin d'étudier encore un autre langage XML complexe – utilisez SQL (ou un autre langage de script adapté à la source de données) pour effectuer les transformations requises. Scriptella est sous licence Apache, Version 2.0

KETL

KETL est un outil ETL open source de premier plan. La plate-forme d'intégration de données repose sur une architecture portable basée sur Java et sur un langage de configuration et de configuration ouvert basé sur XML. Les fonctionnalités de KETL concurrencent avec succès les principaux produits commerciaux disponibles aujourd'hui. Les points forts incluent:

  • Prise en charge de l'intégration des outils de sécurité et de gestion des données

  • Evolutivité éprouvée sur plusieurs serveurs et processeurs et sur tout volume de données

  • Aucun besoin supplémentaire d'outils de planification, de dépendance et de notification tiers

Pentaho Data Integrator – Kettle

Pentaho Data Integration (Kettle) est une application et une bibliothèque Java (Swing). Kettle est un interpréteur de procédures écrites au format XML. Les fonctionnalités et les composants sont un peu moins compressifs que ceux de Talend, mais cela ne limite pas la complexité des procédures ETL pouvant être implémentées. Kettle fournit un moteur JavaScript (ainsi qu'un moteur Java) pour affiner le processus de manipulation des données. Kettle est également un bon outil, avec tout le nécessaire pour construire des procédures même complexes. Kettle est un interpréteur de procédures ETL écrites au format XML. Kettle fournit un moteur Java ou JavaScript pour prendre le contrôle du traitement des données. Kettle (PDI) est l'outil par défaut de la suite Pentaho Business Intelligence. Les procédures peuvent également être exécutées en dehors de la plate-forme Pentaho, à condition que toutes les bibliothèques Kettle et l'interpréteur Java soient installés.

Jaspersoft ETL

Jasper ETL est facile à déployer et surpasse de nombreux systèmes logiciels propriétaires ETL. Il est utilisé pour extraire des données de votre système transactionnel afin de créer un entrepôt de données consolidé ou un magasin de données à des fins de rapport et d'analyse.

GeoKettle

GeoKettle est un puissant outil ETL spatial basé sur les métadonnées et dédié à l'intégration de différentes sources de données spatiales pour la construction et la mise à jour d'entrepôts de données géospatiales. GeoKettle permet l'extraction de données à partir de sources de données, la transformation de données afin de corriger des erreurs, de nettoyer certaines données, de modifier leur structure, de les rendre conformes à des normes définies, ainsi que de charger des données transformées dans un système de gestion de base de données cible ( SGBD) en mode OLTP ou OLAP / SOLAP, fichier SIG ou service Web géospatial.

CloverETL

Le moteur Open Source CloverETL peut être intégré à n’importe quelle application, même commerciale. Le moteur Open Source ne contient pas un certain nombre de composants que contient le moteur complet. Nous ne fournissons pas d'assistance pour le moteur Open Source

Systèmes HPCC

HPCC Systems est une plate-forme open-source pour l’analyse de données volumineuses avec un moteur de raffinerie de données appelé Thor. Thor nettoie, relie, transforme et analyse le Big Data. Thor prend en charge les fonctions ETL (Extraction, Transformation and Loading) telles que l’intégration de données non structurées / structurées, le profilage de données, l’hygiène des données et la liaison immédiate des données. Un grand nombre d’utilisateurs peuvent accéder simultanément aux données traitées par Thor en temps réel à l’aide de Roxie, un moteur de transmission de données. Roxie fournit une capacité de requête en temps réel hautement concurrente et à faible temps de latence.

Jedox

Jedox est une solution de BI à source ouverte pour la gestion des performances, comprenant la planification, l'analyse, la génération de rapports et l'ETL. Open Core se compose d'un serveur OLAP en mémoire, d'un serveur ETL et de bibliothèques de clients OLAP. Supportant puissamment le serveur OLAP Jedox en tant que système source et cible, Jedox ETL est spécialement conçu pour relever les défis de l'analyse OLAP. Travailler avec des cubes et des dimensions est on ne peut plus simple. Générez de manière flexible des hiérarchies temporelles fréquemment utilisées et transformez efficacement le modèle relationnel des systèmes sources en un modèle OLAP – avec JEDOX ETL.

Apatar

Apatar est un projet open source Extract, Transform, and Load (ETL). L'architecture modulaire offre 1. Concepteur / mappage visuel des travaux 2. Connectivité à toutes les sources de données principales 3. Options de déploiement flexibles (interface graphique ou moteur de serveur avec JVM ou incorporé).

Cette liste est compilée par TechRoba.

Commentaires

Laisser un commentaire

Votre commentaire sera révisé par les administrateurs si besoin.