تسجيل الدخول

الطرق الأساسية لتحليل البيانات

مؤلف:نيو يانغ وقت:2020/10/04 يقرأ: 10317
1. توضيح المشكلة بالنسبة لتحليل البيانات، فإن الشيء الأكثر أهمية ليس تحليل البيانات نفسها، بل المشكلة. يعني ماذا تريد أن تعرف؟ طرح سؤال […]

一、明确问题

对于数据分析来说,最重要的不是数据分析本身,而是——问题。

也就是,你,到底想知道什么?

提出问题的能力比解决问题的能力更重要。

对于这句话,我深以为然。

在数据分析方面,这句话显得尤为明显。

同一件事情,不同的人会从不同的方向和角度提出不同的问题。清晰、明确和具体的问题会让数据分析本身变得简单和有效。

很多数据分析之所以困难,很大的原因就在于,问题的不清晰和不具体。

二、解析问题

问题的答案来自哪些维度的数据?

这些数据是否全部都能得到原始数据?

如果全部都能得到原始数据,那么可以进入埋点阶段了。

如果有些数据不能得到原始数据,可以判断一下,是否通过简单的计算可以得到结果。如果可以,那么,就可以进入埋点获取数据阶段了。如果简单的计算无法得到结果,那么,就需要将问题分解成一些简单的小问题。

总之,问题的解析,有两个关键点,一个是那些维度的数据决定了问题的答案,另一个就是尽可能地获取原始数据。

之所以要尽可能地获取原始数据,是因为,在我以前大量的数据分析的经验,太多和太复杂的计算,最终得到的结果比较容易偏离实际情况,也就是失真的概率会比较大,失真度也会比较大。

当然,这一点并不是绝对的,如果算法足够严谨,也可以考虑复杂计算获取结果的方法。

三、获取数据

1、埋点

埋点,是一件很有技巧性的事情,也是一个很容易产生混乱的事情。最好能有一个统一的埋点规划和管理。

2、爬数据

不说了。

3、用户调查

不说了。

四、数据可视化和对比

数据分析的结果都是要可视化出来的,只有这样才能看出问题,得到答案。
数据的可视化,经常遇到的一件事,就是用什么样的图表?

一个数据表,可以用柱状图、可以用折线图、甚至也可以用饼状图等等。这个时候,如何选择?

对比。

这就是选择图表的标准。

数据的可视化主要是为了对比。只有对比,才能发现问题,找到答案。

对比,有两种,一种是同一张图表中的数据的对比,比如,一张柱状图,很明显可以看出某一维度数据的多少/大小等。

另一种就是多张图表的对比,可以看出很多很多事情。

所以,使用哪种图表进行可视化,取决于要对比什么数据和如何对比。



حقوق الطبع والنشر © www.lyustu.com جميع الحقوق محفوظة.
الموضوع: TheMoon V3.0 الكاتب:نيو يانغ