Chapter 4 Wie lese ich Daten ein
Der Beitrag wurde das letzte mal am 04 November, 2021 editiert
Wir sind immer noch nicht ganz bei dem Punkt angekommen, was es mit dem Begriff tidy auf sich hat. Soviel soll aber gesagt sein: Daten in der “freien Laufbahn” sind immer dreckig und NICHT tidy.
Anwenden lässt sich das Paretoprinzip auf dieses Schema.
Bei der Datenanalyse werden 80% der Ergebnisse mit 20% des Aufwandes erreicht, die verbleibenden 20% mit 80% des Aufwandes.
In der Datenanylse wird sehr viel Zeit zu Beginn verwendet
- Daten zu erheben
- zu finden
- zu importieren
- zu säubern
- zu transformieren
- zu modifizieren
- zu analysieren
Die echte Analyse der Daten ist dann verhältnismäßig schnell erledigt.