教你有效的数据分析之剔除干扰数据

来源:青莓时代 发布时间:2021-05-10 15:52:38

选取正确的样本数量,选取足够大的数量,剔除极端或偶然性数据的影响。08年奥运会上,姚明的三分投篮命中率为100%,科比的三分投篮命中率为32%,那么是不是说姚明的三分投篮命中率要比科比高?显示有问题,因为那届奥运会,姚明只投了一个三分球,科比投了53个。

制定相同的抽样规则,减少分析结论的偏差性。比如两条Push文案,第1条“您有一个外卖暖心红包未领取,最大的红包只留给最会吃的你,点击进入”,第2条“送你一个外卖低温福利,足不出户吃喝热腾美味,点击领取 ”。实验数据表明,第二条Push文案的点击率比第一条同比高了30%。那么真的是第二条文案更有吸引力嘛?结果发现是第二条Push文案的接收人群的活跃度明显高于第一条造成的。

剔除版本或节假日因素的干扰,新版本刚上线时的数据表现往往会很好,因为主动升级的用户一般是高活跃度的用户。临近周末或大型节假日的时候,用户的消费需求会被触发,电商类应用的订单转化率也会直线上升。因此,在数据对比的时候,实验组和对照组的数据在时间维度上要保持对应。

对历史数据遗忘。人与数据技术不同,数据技术有着100%的记忆能力,而人类根据艾浩宾斯遗忘定律1天后只能记起33%6天后25%31天后21%。因此,我们要合理的选择筛选时间段。比如猜你喜欢模块不仅要对兴趣标签的计分进行一定的加权处理,也要结合商品的生命周期等因素做一系列的回归实验,得出受众人群对各类兴趣和购买倾向的衰退曲线,利用有规律的时间变化有效删除老数据,去提升模块的点击率。

实验需拆分A1组,也就是在实验组B和对照组A上再增加一组A1A1A的规则保持一致,然后探究AB的数据波动与AA1比较,剔除数据的自然/异常波动带来的影响。以我实际的A/B实验表明,设立A1组是非常重要且必要的,不管数据量级有多大,相同实验规则的两组在数据也会有一定的小幅波动,而这小幅波动在精细化运营的今天,对我们的判断可能形成较大的干扰偏差。

中企动力是一家专注于网站建设网站设计网站制作建网站制作网站的高端网站制作公司,专注网站建设17年,成功建站案例超30万,对建设运营企业网站和提高用户体验有自己的独到见解

中企动力网站建设专家为您讲述最新的网站运营、网站优化、网站推广知识,有何疑问就赶紧点击旁边的咨询按钮吧

 


相关文章