Datensätze für Machine Learning

Selbst die tollste “Künstliche Intelligenz” oder das beste “Deep Learning” System bringt nichts, wenn man keine Daten hat. Irgend etwas muss da sein, um die System zu trainieren, um sie zu spezialisieren und je mehr echte Daten umso besser und genauer die Funktionsweise des Systems. Wenn man allerdings nicht gerade auf einem Big Data Schatz schläft, der nur darauf wartet um in ein solches System gekippt zu werden, ja, wie soll man an die Daten kommen. Ein Vorteil den uns zweifelsfrei Facebook und Google hinsichtlich System zum Marketing voraus hat.

Die Kosten für Daten steigen, Geschäftskonzepte werden dazu entwickelt und dennoch gibt es auch hier gallische Dörfer. Ich kann jedem empfehlen sich auf der Suche nach Daten mit “Open Data” zu beschäftigen, um an zugängliche Datenquellen zu kommen. Zusätzlich gibt es an vielen Ecken weitere Ressourcen. Eine Ressource möchte ich hier jetzt vorstellen

Datasets for start with Machine Learning

Quelle: Github

Diese Datenquellen sind meist ein guter Start für eigene “Proof of Concepts”, um System zu testen und gegenzuprüfen. Für den Aufbau eines Geschäftsmodells rund um eine Künstliche Intelligenz oder eines Deep Learning System bleibt immer noch die Frage “Woher bekommen ich die Daten”.

Posted in: Big Data

Post a Comment

*