Anmeldung

Grundlegende Methoden der Datenanalyse

Autor:Neo-Yang Zeit:2020/10/04 Lesen: 10310
1. Klären Sie das Problem. Bei der Datenanalyse kommt es nicht auf die Datenanalyse selbst an, sondern auf das Problem. Das heißt, was möchten Sie wissen? Stelle eine Frage […]

1. Klären Sie das Problem

Bei der Datenanalyse kommt es nicht auf die Datenanalyse selbst an, sondern auf das Problem.

Das heißt, was möchten Sie wissen?

Die Fähigkeit, Fragen zu stellen, ist wichtiger als die Fähigkeit, sie zu lösen.

Ich stimme dieser Aussage voll und ganz zu.

Diese Aussage gilt insbesondere, wenn es um die Datenanalyse geht.

Unterschiedliche Menschen stellen unterschiedliche Fragen aus unterschiedlichen Richtungen und Blickwinkeln zu derselben Sache. Klare, eindeutige und spezifische Fragen machen die Datenanalyse selbst einfach und effektiv.

Ein wichtiger Grund, warum viele Datenanalysen schwierig sind, liegt darin, dass die Fragen unklar und unspezifisch sind.

2. Analysieren Sie das Problem

Aus welchen Datendimensionen stammen die Antworten auf die Fragen?

Stehen für alle diese Daten die Originaldaten zur Verfügung?

Wenn alle Originaldaten erhalten werden können, kann mit der Punktvergrabungsphase begonnen werden.

Wenn für einige Daten die Originaldaten nicht ermittelt werden können, können Sie anhand einfacher Berechnungen beurteilen, ob die Ergebnisse ermittelt werden können. Wenn es möglich ist, können Sie in die Phase der Vergrabungspunkte eintreten, um Daten zu erhalten. Wenn einfache Berechnungen keine Ergebnisse liefern, muss das Problem in kleinere, einfachere Probleme zerlegt werden.

Kurz gesagt, es gibt zwei wichtige Punkte bei der Analyse des Problems: Der eine besteht darin, dass die Daten dieser Dimensionen die Antwort auf die Frage bestimmen, und der andere besteht darin, so viele Originaldaten wie möglich zu erhalten.

Der Grund, warum es notwendig ist, so viele Originaldaten wie möglich zu erhalten, liegt darin, dass nach meiner bisherigen Erfahrung mit einer großen Datenanalyse, zu vielen und zu komplexen Berechnungen das Endergebnis leicht von der tatsächlichen Situation abweichen wird, d. h. Die Wahrscheinlichkeit einer Verzerrung wird relativ hoch sein. Die Verzerrung wird auch relativ groß sein.

Dies ist natürlich nicht absolut. Wenn der Algorithmus streng genug ist, können Sie auch Methoden in Betracht ziehen, um Ergebnisse durch komplexe Berechnungen zu erhalten.

3. Daten beschaffen

1. Bury-Punkt

Das Vergraben von Punkten ist eine sehr technische Sache und kann auch leicht zu Verwirrung führen. Am besten ist eine einheitliche Planung und Verwaltung der Grabstätten.

2. Crawlen von Daten

Sag nichts mehr.

3. Benutzerbefragung

Sag nichts mehr.

4. Datenvisualisierung und -vergleich

Die Ergebnisse der Datenanalyse müssen visualisiert werden. Nur so können Probleme erkannt und Antworten gewonnen werden.
Bei der Visualisierung von Daten stoßen wir häufig auf die Frage, welche Art von Diagramm wir verwenden sollten.

Eine Datentabelle kann ein Balkendiagramm, ein Liniendiagramm oder sogar ein Kreisdiagramm usw. sein. Wie soll man zu diesem Zeitpunkt wählen?

Verglichen.

Dies sind die Kriterien für die Auswahl von Diagrammen.

Die Datenvisualisierung dient in erster Linie dem Vergleich. Nur durch Vergleiche können wir Probleme entdecken und Antworten finden.

Es gibt zwei Arten von Vergleichen. Die eine ist der Vergleich von Daten im selben Diagramm. In einem Histogramm können Sie beispielsweise die Menge/Größe der Daten in einer bestimmten Dimension deutlich erkennen.

Das andere ist der Vergleich mehrerer Diagramme, der viele Dinge aufdecken kann.

Welches Diagramm Sie also zur Visualisierung verwenden, hängt davon ab, welche Daten Sie vergleichen möchten und wie.



Copyright © www.lyustu.com, alle Rechte vorbehalten.
Thema: TheMoon V3.0. Autor: neo yang