Авторизоваться

Основные методы анализа данных

Автор:нео Ян Время:2020/10/04 Читать: 10616
1. Уточните проблему. Для анализа данных самым важным является не сам анализ данных, а проблема. То есть, что ты хочешь знать? Задайте вопрос […]

1. Уточните проблему

Для анализа данных самое главное — не сам анализ данных, а проблема.

То есть, что ты хочешь знать?

Умение задавать вопросы важнее умения их решать.

Я глубоко согласен с этим утверждением.

Это утверждение особенно верно, когда речь идет об анализе данных.

Разные люди будут задавать разные вопросы, с разных сторон и под разными углами об одном и том же. Четкие, недвусмысленные и конкретные вопросы сделают сам анализ данных простым и эффективным.

Основная причина сложности анализа данных заключается в том, что вопросы неясны и неконкретны.

2. Проанализируйте проблему

Из каких измерений данных берутся ответы на вопросы?

Доступны ли исходные данные для всех этих данных?

Если все исходные данные удалось получить, можно переходить к этапу закапывания точки.

Если для некоторых данных исходные данные получить невозможно, можно судить о том, можно ли получить результаты путем простых расчетов. Если есть возможность, то можно войти в стадию закапывания точек для получения данных. Если простые расчеты не дают результатов, то проблему необходимо разбить на более мелкие и простые задачи.

Короче говоря, в анализе проблемы есть два ключевых момента: один заключается в том, что данные этих измерений определяют ответ на вопрос, а другой — получить как можно больше исходных данных.

Причина, по которой необходимо получить как можно больше исходных данных, заключается в том, что, по моему предыдущему опыту анализа большого количества данных, слишком большого количества и слишком сложных вычислений, конечный результат легко отклоняется от реальной ситуации, то есть вероятность искажения будет относительно высокой.Искажение также будет относительно большим.

Конечно, это не абсолютно, если алгоритм достаточно строг, можно рассмотреть и методы получения результатов посредством сложных вычислений.

3. Получить данные

1. Точка захоронения

Захоронение точек — это очень техническая вещь, которая также может легко привести к путанице. Лучше всего иметь единое планирование и управление местами захоронения.

2. Сканирование данных

Больше ни слова.

3. Опрос пользователей

Больше ни слова.

4. Визуализация и сравнение данных

Результаты анализа данных необходимо визуализировать, только так можно увидеть проблемы и получить ответы.
При визуализации данных мы часто сталкиваемся с тем, какой тип диаграммы нам следует использовать?

Таблица данных может использовать гистограмму, линейную диаграмму или даже круговую диаграмму и т. д. В это время, как выбрать?

В сравнении.

Это критерии выбора графиков.

Визуализация данных предназначена в первую очередь для сравнения. Только посредством сравнения мы можем выявить проблемы и найти ответы.

Существует два типа сравнения. Один — сравнение данных на одной диаграмме. Например, на гистограмме вы можете четко увидеть количество/размер данных в определенном измерении.

Другой вариант — сравнение нескольких диаграмм, которое может выявить многие вещи.

Итак, какую диаграмму использовать для визуализации, зависит от того, какие данные вы хотите сравнить и как.



авторские права © www.lyustu.com, все права защищены.
Тема: TheMoon V3.0 Автор: neo yang