Bonobo: ETL für Python 3.5+

Bonobo is a data-processing toolkit for python 3.5+

Quelle: Bonobo Project

Seit einiger Zeit schreibe ich für meine private SAP HANA, express edition eigene Extraktoren, vorwiegend in Python. Dabei hatte ich zu Beginn hauptsächlich die Daten von A nach B geschoben und einen Großteil der Transformation in der SAP HANA ausgeführt. Allerdings kam es auch zu Fehlern bei der Übertragung, da die Daten meist unstrukturiert überführt wurden und es zu Typfehlern gekommen ist. Also begann ich mit der Bereinigung und Harmonisierung vorab. Ein weiteren Schritt geht das Bonobo Projekt, welches ein ETL-Framework bietet und die Daten vorab sehr gut aufbereiten kann, so dass sich die SAP HANA auf das konzentrieren kann, was sie sehr gut kann: Schneller Auswertungen.

Leave a comment

*