新媒易动态
NEWS CENTER
NEWS CENTER
2020-04-22
时间具有多变性,日、月、年对我们的意义是不同的,因为其呈现出来的时间段是不一致的,日体现的时间长度肯定远小于月,长短不一的时间长度组成了时间的多样性,而不同时间长度下统计出来的数据结果具有不同的意义,这就是数据对“时间”的敏感性。
通过一个案例来看一下,蹲点观察楼下十足便利店3月份的人流情况,可以发现“3月1号的人流量”和“3月份一整个月的人流量”是不一样的,前者表现了单天的人流量,后者表现了整个月的人流量。
我们发现,不同的“时间”产生的数据结果有其各自的意义,所以我们要怎么去选择这些不同的“时间”呢?
首先我们需要了解时间的多样性,从“时间颗粒度”的角度来认识,主要分为“分时维度”和“日期维度”。
分时维度是反映日内情况下随着小时或者分钟的变化,展示单位小时或分钟下的数据,具有较强的时效性。我们可以通过观察“一天内不同分时”和“多个日期相同分时”呈现出来的数据现象,来发现“分时维度”下的数据特点。
1. 观察一整天不同时段的数据
通过“分时维度”得到一天内不同时间段的数据值,将这些数据“图表可视化”为随着时间段变化的折线图,从图中我们可以了解下面的这些信息:
这些信息能让我们对数据在不同时段的趋势情况有一个了解,为对时间段要求比较精确的产品动作提供了依据,帮助我们发现短时间内的异常波动,为发现问题提供了异常数据的支持。
看个案例,下图是一张访问用户量分时段折线图,我们就可以基于数据最大值出现在14:00的这一现象,发起一次push消息的行为,因为该时间段下用户数量最大,可以尽可能的获得曝光量;我们也可以在0:00-5:00这个时间段安排产品上线等需要服务器发布的行为,基于的现象就是这个时间段访问用户量少,对用户的干扰低。
访问用户量分时段折线图
我们也可以把一天内不同时段的数据“图表可视化”为饼图,从图中我们可以了解到下面的这些信息:
这些信息能让我们对数据在不同时间段的分布情况有一个了解,单独了解占比的意义不是特别大,但是可以配合其他的数据分析方法得到一些更细致的结论。
比如下图是12:00-18:00不同时间段用户访问量的饼图,结合“二八定理”,我们就可以得出12:00和13:00这两个时间段提供了80%的访问量,这两个时间段就是我们主要需要维护的时间。
访问用户量分时段饼图
2. 观察多个不同日期,相同时间段的数据
通过将多个日期下的相同时间段的数据“图表可视化”为随着时间段变化的对比柱形图,从图中我们可以了解到这些信息:
这些信息有助于我们归纳出数据的共性,一方面我们可以根据这些共性设计和优化产品;另一方面也可以以此作为异常值的判别方式,如果观察多个日期下都是在01:00~05:00的数据为0,这个时候发现突然有1天在01:00有大量的数据,就可以断定为是异常数据了。
同样来看一个案例:
下图是星期五和星期六的访问用户量的分时段柱形图(截取部分时间段),运用上面提到的观察角度,很容易就能发现虽然日期不同,同时段的数据有大小差异,但是数据趋势是具有共性,都从12点开始呈增长趋势,在16点达到峰值,之后呈下降趋势,我们就可以得出我们用户访问行为的规律。