- ?
雨沐田:数据分析最牛工具之Excel
向明辉
展开
如果想高效的解决问题,必须要借助工具,数据分析有极强的专业性,工具的作用更为重要。
大数据分析也是数据分析,虽然有很多不同,但初级分析都是一样的,大数据分析师也要接地气,而Excel就是最接地气的工具。
数据分析能用到的工具太多太多了,如果全部罗列,少说几十种,多则上百种!!一听这数字,感觉很吓人的样子,啥时候能学的完呢?其实不用担心,我们根本不需要、也没必要掌握所有工具,再说,很多工具是类似的,会了一个其他的也就差不多了。
这篇文章主要说说数据分析入门必须要掌握的一个工具,那就是Excel。
Excel虽然可以零门槛使用,但玩转高级功能并不是人人都行的,数据分析工作,特别是业务分析最常用的工具就是Excel。
数据分析用的最多的模块主要有:
1、各种函数
Excel内置有大量的函数可用,善于利用各种函数能解决很多问题:
这些函数不需要死记硬背,但都大概了解,知道有这么个函数,用到的时候再仔细研究,久而久之也就熟练运用了!
2、数据透视表
数据透视表是学习数据分析应该掌握的第一个重要功能,只需要点几下鼠标,拖动一些字段,就能轻松实现对原始数据的各种加工和汇总,还能根据原始数据的变动实现自动刷新。
学习建议:多练多动手。
3、数据模块
对于普通使用而言,数据模块是经常被忽略的,但对于数据分析来说,简直就是宝贝盒子,数据模块主要分为获取外部数据、排序和筛选、数据工具、分组显示、数据分析等几大子模块,也是数据分析经常用到的一些操作:
这一块的学习使用,建议买一本好的工具书,全面了解,用到了随时翻阅深入研究,是一个孰能生巧的过程。
4、数据分析模块
数据分析模块是数据菜单下的一个子模块,单独拉出来说,是因为其重要性,功能包含了常见的一些数据分析方法:
这个模块的使用就要有一定的数据分析和统计的理论基础才可以,不然无从用起,但放心,也没那么难,初入门只了解必须的内容即可
学习建议是按照这些分析方法名逐个去了解,知道其用在什么地方,能分析什么样的问题等等。
5、图表模块
之前的文章说过,数据分析的重要一步就是组织数据、展现数据,也就是数据可视化,而最直接高效的就是将数据转为各种图表,Excel能轻松实现:
图表的使用和学习,必须要知道具体的图适合表达什么样的数据,要用的恰当,如果用不恰当,反而会引起误会。
图表使用的第一原则是简单,不要为了追求华丽丽的效果而违背了数据可视化的初衷,以最简单的方式表达出数据要反馈的信息就好。
常用的数据分析工具很多,如SAS、SPSS、SQL、Tableau、BDP、R、Python等等,但是作为初学入门来说,先熟练使用Excel就好,其他这些工具随着数据分析工作的需要再去学习不迟。
数据分析是个复合型技能,要学的东西不少,特别是高级数据分析,正因为如此,初学者要学会做减法,不要把一堆东西都摆到眼前,先从最常用最基础的学起,其实入门并不难,只要入门了,其他的内容就可以逐步消化了。
所以工具篇在众多的工具中只推荐Excel,马上学起来吧!
我是公号「大数据分析狮」,只谈大数据力量!
- ?
史上最全数据分析工具及网址---拿走,不谢!
邵亦旋
展开
工欲善其事,必先利其器。
一位优秀的数据分析师应该是全能型的,我们需要具备更多的硬能力。写报告时需要优秀的文案能力、做可视化分析时需要创意策划能力、分析问题时需要有热点捕捉的能力。同时还要懂PPT、PS、Visio、脑图、Excel、Axure、SPSS、SQL、SAS………等各种数据分析工具。
下面是小编精心为大家准备的数据分析,必知网站,必备工具,请各位笑纳!
热点捕捉工具
无论你是数据分析师,还是公司的管理者,你都要对社会的热点有捕捉能力。为了增强对市场敏锐度的观察,你需要以下工具的辅助。
1、百度指数http://index.baidu/
2、IWebChoicehttp://iwebchoice/
3、阿里指数https://alizs.taobao/
4、艾瑞网http://iresearch/
5、企鹅智库http://re.qq/
6、微博指数http://data.weibo/index/
7、友盟指数http://umeng/
8、百度预测http://trends.baidu/
9、199IT互联网数据资讯中心http://199it/
10、亿邦动力网http://ebrun/
数据来源网址工具
1、 国家统计局http://stats.gov/
这个就不做解释了,想必大家都知道,国家每个季度的GDP就是他们出的。反正在天国,他算是老大。
2、 中商情报局http://askci/
专业的研究报告及金融咨询服务机构,主要提供行业分析,市场调研,财经资讯,行业研究分析报告,市场调查报告,投资咨询报告。
3、 易观http://analysys/
目前中国互联网市场为数不多的一家领先大数据分析公司。以用户数据及大数据算法模型为核心,打造了强大的数据分析服务体系,通过对用户资产的运营分析,帮企业打开互联网应用新通路。官网的所有数据都是可以免费使用的。
2016年排名前三的国外数据公司网址:
1、Nielsenhttp://nielsen/us/en.html/
全球性的市场研究公司,它的调研集中在快消、汽车、电信等领域,数据涉及消费者偏好、购买行为等多项内容,有时还会提供具有代表性的案例研究。
2、 IMS Healthhttp://imshealth/
艾美仕是一家工作效率高,专业的药企数据分析(据说数据分析强大到可怕!)
3、 Kantarhttp://kantar/
一家综合性的市场研究公司,研究覆盖快消、健康、品牌、金融等领域,数据涉及产品的用户喜好、品牌认知度等内容。Kantar对公众比较开放,网站上的数据和分析可以免费查看。
词云工具
我经常看到一些网站有标签云,现实生活中,应该也会有很多人想做词云,但找不到合适的工具。这就是我分析给大家词云制作工具的原因。
1、 Wordlehttp://wordle/
这些年国内外一直很火的一款词云软件。Wordle优点是可以快速的分析文本或网站的词频,并以多种风格,字体,配色进行展现。做完词云图,生成图像后还可以保存在网络之中供你查看、链接、下载以及与好友分享。
2、 Tagulhttps://tagul/
Tagul是专为网络大师们要放置在网页上漂亮的云彩而准备的。Tagul云可以自定义字体、词云的形状,颜色等,做出来的词云图很酷炫,为网站访问者提供良好的用户体验。
3、 WordItOuthttp://worditout/
操作简单,进入网站后只需要输入一段文本,然后就可以生成各种样式的“云”文字。用户可以根据自己的需要对WordItOut进行再设计,比如颜色、字符、字体、背景、文字位置等,保存下载后,可以复制。
4、 图悦http://picdata/
5、 BDP个人版https://me.bdp/home.html
两款国内词云工具,相对比较容易上手,首先页面全体都是中文简体,操作一番就能了解大概。
数据可视化工具
以下是一些非常狂拽酷炫叼炸天的数据可视化工具。你可以看到各种题材,像人口、世界状况,甚至人类的情感,都可以将进行可视化,帮助你更好地理解数据。
1、Tableauhttp://tableau/zh-cn
2、Infogr.amhttps://infogr.am/
3、ChartBlockshttp://chartblocks/en/
4、iChartshttp://icharts.in/
5、Visual.lyhttp://visual.ly/
6、NVD3http://nvd3.org/
7、Leaflethttp://leafletjs/
8、n3-chartshttps://oschina/p/n3-charts
9、百度EChartshttp://echarts.baidu/
10、Datawrapperhttps://github/datawrapper/datawrapper/
在线调查工具
1、 腾讯问卷调查http://wj.qq/
2、 麦客http://mikecrm/
3、 调查派http://diaochapai/
4、 问道网http://askform/
5、 问卷星http://sojump/
思维导图制作工具/网站
1、XMindhttp://xmindchina/ 价格:免费
2、Cogglehttps://coggle.it/ 价格:免费
3、Freemindhttp://freemind.en.softonic/ 价格:免费
4、LucidCharthttps://lucidchart/ 价格:基础版本 每月4.95美元
5、MindManagerhttps://mindjet/ 价格:完整版 349美元,179美元升级费用
6、SpiderScribehttps://spiderscribe/ 价格:免费(个人版本)
7、 Bubbl.ushttps://bubbl.us/ 价格:免费
8、 Text2MindMaphttps://text2mindmap/ 价格:免费
PPT模板工具
1、 我图网http://so.ooopic/
2、 无忧PPThttp://51ppt/
3、 51PPT模板http://51pptmoban/ppt/
4、 站长之家http://sc.chinaz/ppt/
5、 设计师网址导航http://hao.uisdc/
其他数据分析网址
1、 人大经济论坛-计量经济学与统计区http://pinggu.org/bbs/index.php?gid=148
2、 数据挖掘学习交流论坛http://businessanalysis/
3、 网站数据分析http://webdataanalysis/
4、 数据分析网http://afenxi/
5、 数据分析论坛http://spsschina/
以上网址和网站,都是经过小编亲自从众多网址中精心筛选出来的,赶紧收藏吧!
- ?
巧用工具,快速入门数据分析
基尔夫港
展开
一提到数据分析,很多人可能脑海中可能会浮现出各式各样的数据画面。
比如下图所示,这样的中国式复杂报表在企业中经常被使用,精密的复杂表格样式中蕴含着国人庞大的数据信息量。
再比如这样的数据Dashboard可视化,通常应用于展示KPI业务指标,例如销售额、毛利率、利润率等等,数据的可视化呈现形式清晰直观。
再就是目前火热的不行的可视化大屏,比如下图所示的双11全球天猫狂欢节当日的实时交易统计大屏,除了清晰直观地展示企业核心的KPI指标之外,狂拽炫酷是它至关重要的特征。
大道至简的数据分析方法
但无论是以上的哪一种,无论数据如何变换,所有看似神秘的数据分析过程都可以归纳总结为各种“维度+度量”的组合分析。
维度用于描述事物的属性信息,例如统计各个地区的交易数量时,地区就是维度。
度量(指标)是可以量化统计的数值,例如统计各个地区的交易数量时,交易数量就是度量。但是需要注意的是并不一定所有的数值都是度量,例如学生的学号虽然是数值类型,但是其实它是维度而非度量。
如此一来,我们对数据分析有了从整体上的解释。但是实际应用中,我们并非盲目地去进行各种维度和度量的拼凑组合,而是希望得出的数据分析结果能够指引业务进行决策,终而形成业务闭环效果的。
根据我自身的一些数据分析项目经验,90%以上的基本数据分析问题都可以套用我总结的这七步完成(深入的数据分析需涉及描述性统计分析、相关性分析等专业的统计分析技能):
数据分析必然需要借助工具,Excel、BI或者R和Python语言都可以帮助实现。
这里为了帮大家更快速地理解数据清洗建模和数据差异分析环节的内容,借助比较简单的BI工具FineBI,为大家进行一个销售数据分析实例,加深大家对数据建模和数据分析过程的理解。感兴趣的可以到官网下载,个人完全免费。
一、确定分析目标
这是分析前的第一步,我们需要明确进行数据分析的对象,也就是需要确定分析目标。
通常来说我们会选取最关心的核心KPI指标,例如电商行业的销量、销售额、利润,制造行业的次品率,互联网行业的用户留存率等等。
一般来说,分析目标不要过多,如果实在是需要同时分析多个关键核心业务KPI指标,那么我们便可以将这些核心指标分解给对应业务负责人,例如销售总监负责提升公司销售业绩,运营总监负责降低成本花费。
二、核心目标拆解
确定好分析目标之后,通常来说我们需要再对核心目标进行子目标分解,这也符合企业各团队分工协作的特性。
核心目标拆解的过程中需要遵循MECE原则,也就是“完全穷举,相互独立”。例如下图所示的电子商务数据分析指标体系,就分别从网站运营指标、经营环境指标、销售指标、营销活动指标、客户价值指标几个方面进行了详尽的拆解,然后交由各个团队进行分工达成。
三、数据清洗和业务建模
确立和分解好数据分析目标之后,下一步就可以进入到数据清洗和业务建模环节了。
数据清洗方面,很多人可能会想到国外传统的一些ETL工具,但是这类工具过于庞大和复杂,国内真正成功落地的案例很少。FineBI商业智能工具其实就提供了轻量级的ETL功能可供用户对数据进行计算和处理,鼠标点击和拖拽操作即可完成轻量的ETL数据处理过程。
业务建模方面,FineBI也是提供了根据不同业务主题分类建立业务包的功能,一般来说按照维度表和事实表建立好关联关系即可,这样一来就为前端的数据差异分析准备好了数据模型。
四、数据差异分析
终于到了数据差异分析这一步,这也是离发现问题原因和业务决策最近的一步。
所谓数据差异分析,自然是需要有差异,才能有分析。
例如今年某某企业7月份的销售额是600万,那么大家会觉得对于这个企业来说是好还是坏?如果只有这一个数据,自然是无所谓数据差异分析的。
如果这家企业的6月份的历史销售额是400万,那么7月份600万的销售额自然是非常好的了,可是如果这家企业的6月份历史销售额是800万,7月份600万的销售额明显是有问题的。
a.纵向对比
按照这个基础的数据差异分析逻辑,我们借助FineBI来初步分析一下某家企业今年各月度的销售额统计走势图:
如上图所示,通过纵向对比不难看出该企业在7月份销售额下降严重,环比6月份的企业销售额下降了22.47%,不是个好现象。老板看到这个数据自然会前来问责,说为什么7月份公司销售业绩下滑这么厉害。那么会是什么原因导致企业7月的销售业绩相对6月下滑这么多呢?我们需要更新一步地进行数据分析,以排查出导致产生问题的”真凶“。
b.横向对比
一般来说销售型企业都会在全国划分各个销售区域,那么这样一来我们除了对时间进行纵向对比之外,还可以结合销售大区维度进行横向比较,分析探索看看能不能发现一些问题。
果不其然,如上图所示,通过时间维度结合销售大区进行横向对比发现,企业的东南大区7月份的销售额相对6月份反而是增长的,看来问题主要出在北方区和中西区,特别是北方区7月份的销售业绩下滑更为严重,最终导致企业7月份总的销售额比6月份严重下滑。
数据分析的丰富度一定程度上依赖于分析工具的功能,比如Excel可能需要写VBA,R和Python需要写代码。
由于FineBI是一款商业智能工具,故而这边可以轻松通过其提供的OLAP联动分析功能,以更进一步的观察各个区域7月份的表现情况,直接点击饼图区域即可联动到月度销售额统计,非常方便。这边我们可以看出,中西区7月份销售额环比轻微下降17.86%,北方区下降严重到50.07%,而东南区则提高了6.06%,综合三个大区的总体销售状况,导致最终表现为7月份销售额环比下降了22.47%。
c.综合对比
上面分析了时间、区域维度相关的销售额结果统计,为了避免结论片面,我们尽量采用多维度的综合对比方式来观察数据,甚至可以是友商的销售情况对比进行差异分析(此处不单独举例说明)。
如上图所示,我们通过时间维度结合产品类型来进行销售额分析,观察7月份各个产品线的数据发现各个产品线在7月份销售额环比都是有所下降的,这说明企业7月份销售额下降和产品种类本身是没有关系的。
五、发现问题原因
综合北方区域和中西区域导致7月份销售额环比下降的各种影响因素,最终发现是由于6、7月份北方区域降雨严重,导致物流周转严重滞后,库存商品无法及时供应,最终导致北方区域7月份销售业绩严重下滑了50.07%。而中西区域本身仓库比较小,按照之前各区域商品物流周转的设计,中西区域的本土供应的差额商品主要是由北方区域供应,但是北方区域由于严重的降雨导致物流周转严重滞后,进而导致中西区域7月份销售业绩也同比下滑了17.86%。
六、制定业务决策
通过结合FineBI工具的OLAP多维数据综合分析方法成功定位到问题原因之后,企业及时调整仓库商品物流周转策略,北方区域物流模式调整为水运,同时将东南区域的部分商品通过物流周转到中西区域。
七、评估决策效果
企业领导决策层8月份通过及时调整北方区域和中西区域的物流策略,北方区域物流模式调整为水运,东南区域的部分商品通过物流周转到中西区域,补充了北方区域和中西区域的库存商品周转。最终8月份企业的总体销售额达到了943万,环比7月销售额提高到了37.32%。
后记
随着信息化的飞速发展,大数据产业呈指数式增长。在我们不断地积累着企业的历史数据的同时,如何利用和分析好这些数据,真正利用大数据分析驱动企业的业务增长也成为了一个很重要的难题。希望本文给大家分享的数据分析方法,结合FineBI商业智能分析工具的OLAP多维分析能力,能够让大家下次在面对企业业务数据分析时不再迷惑,做到步步为营,让数据分析真正释放出潜能,驱动业务快速增长,形成数据和业务之间的闭环
- ?
推荐一款可以替代 Excel 的可视化报表神器!
Oliver
展开
很多读者看到漂亮的图表都会问“这个怎么做”,“用什么工具实现”。制作漂亮的可视化一般有这样几个方式:
利用Excel内置的图表做一些常规的统计图。高级复杂的譬如动态图表,图表的筛选展示可以通过写VBA来实现。通过R、Python一类的数据分析语言,调用图表功能包,呈现可视化的数据,数据分析常用。借助Echarts、HighCharts、D3.js等开源的可视化插件,嵌入代码,开发成插件包,可视化工程师和前端开发常用。
可视化最实用的场景就是做报表。既然这次的主题是可视化,那小编今天就细细地讲一下酷炫的可视化报表是怎么做的?有哪些基础和高级的可视化图表?代码开发是怎么一回事?大屏又是如何操作?
代表工具FineReport,此前介绍过FineReport的使用场景和功能。大家若不熟悉,可自行和Excel绑定对比。
你用过Excel,却不知还有一款神器“FineReport”这款效率远超Excel的表格工具,没用过就可惜了!
基础图表+表格
柱形图、折线图、饼图、气泡图、散点图等能满足常规的数据统计。拿到数据后,先分析要展示几个维度,选用什么样的图表,需要几个图表展示等。
如何选择图表的类型?
基础图表的制作流程
在FineReport中,图表的操作流程类似Excel,数据准备——插入图表——选择图表类型—选择分类轴、系列名称和系列值——选择图表样式。
各式各样的表格
表格主要在于文字、数字、格间的美感,以及整体的色彩搭配和谐,这些在FineReport中都可通过自定义来是实现。
高级图表
高级图表都是在基本图表的基础上展开来一些新特性。
饼图类:等弧度玫瑰图、不等弧度玫瑰图…
柱形图类:堆积柱形图、百分比堆积柱形图…
条形图类:堆积条形图、百分比堆积条形图…
折线图类:堆积折线图、面积图…
仪表盘类:多指针的仪表盘360度、多指针的仪表盘180度、百分比圆环仪表盘、百分比刻度槽型仪表盘、试管型仪表盘…
雷达图类:普通雷达图、堆积柱形雷达图…
气泡图类:普通气泡图、力学气泡图、十字象限气泡图…
地图类:区域地图、点地图、大数据流向地图…
还有各种组合图,比如“柱形图—折线图、柱形图—面积图、堆积柱形图—折线图、自定义地图”…
其他,还有漏斗图、甘特图、词云、框架图等等。
这些图在FineReport都是现成使用的。在其他工具或其他使用场景中,可由交由可视化工程师开发。
为了高度结合数据分析的过程,更好的理解数据背后的业务意义。可视化图表除了形态还有动态展示部分,就是所谓的动态可视化。
例1:地图的钻取和联动
例2:图表联动
例3:点击词云跳转链接
例4:图表切换
过去这些动态特效和交互属性都要写代码开发,这个在FineReport都已经封装成一个个功能,还有图表缩放、自动刷新、数据提示。再复杂点,就是设动态参数加超链。
利用开源插件开发
就是用市面上开源的数据可视化工具, 譬如Highcharts、D3.js、百度Echarts、蚂蚁金服AntV、GoogleCharts、Raphael.js、Sigma.js、three.js等。
像在7月,我们举办了一场可视化插件开发大赛上,很多开发者开发了令人心动的图表插件。
譬如下方的3D城市全景地图,作者Little使用Echart-GL开源库和MapBox,与地图结合,基于真实地图和基本建筑数据构造都市圈级别的宏大场景,适用于政府部门、连锁企业、LBS提供商等对真实经纬度和展现区域范围敏感的用户。插件的底层是WebGL(Web Graphic Library),它是一个 JavaScript API,用于在任何兼容的 Web 浏览器中渲染 3D 图形。WebGL 程序由用 JavaScript 编写的控制代码和用 OpenGL 着色语言(GLSL)编写的着色器代码构成,这种语言类似于 C 或 C++,可在 GPU 上执行。
比如滚动报表图。传统的决策报表块是静态的,列表不会滚动,数据必须一次性展现,在大屏中效果不够酷炫,无法自动获取最新的数据,除非编写大量的js代码,对一般人来说就只能望洋兴叹。
而插件安装后,可以用图表的形式展现报表,通过设置数据集,显示成类似报表块列表,零代码获取数据库信息并配置自动更新时间,支持通过字段名称配置表头,支持自定义颜色配置等多种丰富的配置项,这样制作的决策报表效果也更酷炫。
数据大屏
大屏展现作为数据可视化的一个典型使用场景,涵盖的知识太多。一个完整的大屏项目从开始调研到实施交付可能需要开发工程师、项目经理、视觉工程师、UI工程师、硬件工程师等等众多专业人员的参与。
于数据大屏设计美学:大屏做成这样,领导不重用你都难!数据大屏的具体制作:4步教你玩转可视化大屏设计|内附实际操作
-----------------
最后,12月28日晚上20:00,帆软将在知乎上举办 “如何成为企业需要的数据分析人才” Live 直播,教大家如何找到数据职业生涯的破局点,欢迎大家参加!
- ?
Excel系列:Excel数据分析——参数估计
负荷
展开
一、描述统计
在数据分析的时候,一般首先要对数据进行描述性统计分析(Descriptive Analysis),以发现其内在的规律,再选择进一步分析的方法。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形,常用的指标有均值、中位数、众数、方差、标准差等等。
数据的集中趋势一般采用平均值、中位数表示。数据的离散程度一般采用方差、标准差表示。数据的分布情况一般采用直方图表示。
案例:北京房屋价格(数据文件:house_price.xlsx)
分析问题:
1)北京市政府为调控房地产价格,希望知道北京各小区房屋价格的分布,请分析房地产价格的集中趋势,并选择合适的图形呈现。
2)房地产商想知道北京各个环线房屋装修状况的对比情况,以便进行产品设计和市场拓展,计算指标并设计合适的图形呈现结果,最后给房地产商一些建议。
3)选择合适的图形反映北京各个区住宅区房屋分布情况
操作步骤:
1)基本描述统计
打开excel数据文件house_price.xlsx
选择描述统计,单击“确定”按钮。
2)直方图
根据描述统计的结果,在空白列构造间隔为0.5的等差数列作为接收区域D1:D19,最大值为9,最小值为0。
选择数据,单击“数据”选项卡,选择“数据分析”选项框中的“直方图”选项
输入区域选择房屋价格avgprice列$B$2:$B$186,接收区域选择第一步构造的接收数据,即D1:D19数据。
输出区域选择G3,勾选图表输出,然后单击“确定”按钮。
选中整个直方图,右键单击选择“设置数据系列格式”,单击“系列选项”,分类间距设为0。
备注:
基本概念:数据的集中趋势 离散程度 数据分布情况 透视表 直方图 柱形图 饼形图 堆积柱形图
二、排位与百分比排位
“排位与百分比排位”分析工具可以产生一个数据表,在其中包含数据集中各个数值的顺序排位和百分比排位。该工具用来分析数据集中各数值间的相对位置关系。该工具使用工作表函数 RANK 和 PERCENTRANK。
例:10名同学统计学考试成绩如下:
试进行排位和百分比排位。
(1)在EXCEL数据分析工具库中选择“排位与百分比排位”,弹出对话框如下:
排位与百分比排位对话框设置
(2)单击“确定”生成排位结果如图。
排位与百分比排位结果
(3)其中的百分比排位为:小于该值的个数/(小于该值的个数+大于该值的个数)
如88,小于该值的有7个,大于该值的有2个,百分比排位为7/9=77.78%,该工具截去了十分位数。
- ?
简单几步掌握Excel数据统计分析必备功能-数据透视表
雨桐
展开
上一篇给大家分享了一下筛选功能的使用,特别要注意不能随意复制粘贴的原因和解决办法。有兴趣的朋友们可以点击或关注百家号,进去查看历史文章。
那么,今天给大家分享下EXCEL透视表功能的简单使用。通常情况下,我们需要做批量数据的统计、用excel出图表等等的时候,需要计数或者求和的结果作展示的时候都会用到。可以说是在大数据分析以及展示结果的时候,所必须会使用到的一个功能。
在此,让我们一起通过一个实例来看一下,excel数据透视表的具体使用方法。只需要简单几步,就可以完成一个简单的数据透视!
首先,我们打开一个要处理的EXCEL,比如需要统计各部门总工资。如下图的数据。通过1月到5月每个人的工资记录,来计算出部门工资的总数及每个月的走势。
第一步:选定A列到H列,即包含所有数据的列。
第二步:点击插入-数据透视表,出现一个创建数据透视表的小窗口,直接点击确定。
此时出现了一个新的sheet页,如下图。这里为了方便大家看全,我把表格横向缩小到了一起。实际上数据透视表字段是在EXCEL最右侧。
第三步:新sheet页的最右侧数据透视表字段,有一个选择要添加到报表的字段,可以看到原始表格的标题列。继续往下看,有四个区域,分别为筛选器,列,行,值。我们把月份点住,拖动到列的区域中。
再分别把部门、姓名拖动到行,部门在上。最后把工资拖动到值。
第四步:值里边默认是计数项,我们需要修改一下,工资是以求和来统计。点击计数项:工资,会出现值字段设置。打开后,选择求和,然后点击确定。
第五步:此时已经可以看到表中的数据都已经出现,每个部门每个人1月到5月工资以及总计的工资。可以点击技术部、科研部、运营部前边的-号,代表隐藏姓名;最后一列的总计,每一行代表这一行数据的总计,比如第一行代表技术部1月到5月的总计工资数目;最后一行的总计,每一列代表的是这一列数据的总计,比如1月的那一列代表1月各个部门的总计工资。这样就满足我们的需求了,可以看到每个部门在每个月以及合计的工资数目。
习惯而言,统计的数据都喜欢有高低顺序来浏览,方便一眼看出哪个部门的工资总额高低。我们可以再点击一下总计那列,然后点击排序,选择降序排列。这样就可以看到一个按高到低排序的工资图表了。
好了,本篇就给大家讲到这里,大家可以自己试着随意在四个区域里,把其他的标题也拖进去,看看会出现什么变化?其实看似枯燥的Excel工具也有非常有趣的一面,更多的技巧就留给大家自己开发吧!有什么问题欢迎留言给我们哦!
- ?
如何用EXCEL线性回归分析法快速做数据分析预测
姚唯雪
展开
回归分析法,即二元一次线性回归分析预测法
先以一个小故事开始本文的介绍。十三多年前,笔者就职于深圳F集团时,曾就做年度库存预测报告,与笔者新入职一台籍高管Edwin分别按不同的方法模拟预测下一个年度公司总存货库存。令我吃惊的是,本人以完整的数据推算做依据,做出的报告结果居然与仅入职数周,数据不齐全的Edwin制定的报告结果吻合度达到99%以上。仍清楚记得,笔者曾用得是标准的周转天数计算公式反推法,而Edwin用的正是本文重点介绍的二元一次线性回归分析法。
二元一次线性回归分析法是一种数据分析模型。
在EXCEL函数公式是FORECAST(英文意思是:预测),其用途是根据一条线性回归拟合线返回一个预测值,此函数使用可对未来销售额、库存需求或未来数据趋势进行预测分析。
要做好库存预测须具备几个条件,首先须具备过去较长的某个时间段的完整整的数据。这里说的时间段最好是上一年度一整年或最近两年的数据。
完整的数库据指的是需要有年度对应每个月的实际库存与营收额或销货成本。
同样我们把库存预测肢解成几个关键步骤。
第一步:数据准备,依要求对EXCEL公式数据输入
先看一组实际的数据,其中蓝色字体是已知具备的数据,黄色则是需要预测的库存数据。预测库存,则至少需要具备的数据是标注蓝色三行数据。为别是:上一年度月营收,上一年度月实际库存,本年度月营收目标。可参照始下截图与视频。
二元一次回归分析法实例截图二元一次回归分析公式实例示图第二步:依KPI目标调整预测数据
假设要求实际目标要求对总体存货周转率提升10%,则总体平均存货库存也减少10%,具体数据如下截图标注粉色行。
依目标进行调整数据截图第三步:把总库存分解成不同物料形态的库存。这里讲的不同类别可以指的是:
物料形态分类:原材料、半成品、在制品以及成品等。
仓码分类:原材料仓、包装仓、成品仓、重要物资仓、五金仓、配件仓以及辅助物料仓等。
这里我们以第一种物料类型实例说明。须依据上年度不同物料类别占总库存的比率,再计算对应类别库存总额,如下截图。
依比率计别算出不同物料库存截图第四:验证二无一次线性回归分析方法的准确度。
存货周转天数=((期初库存+期末库存)/2*30)/(营收*物料成本率)=(平均库存*30)/销售成本。
依公式反推预测库存,平均库存=(目标周转天数*营收*物料成本率)/30,前提需要更多的数据信息,包括物料成本率与以往的周转天数做为计划依据。
如下截图,两种不同的方法得出库存预测吻度为97%(或103%)。
二元一次回归分析法验证截图企业管理中,要快速地对企业活动做出判断,需要完整的数据管理积累支撑
二元一次回归分析法做库存预测速度快,效率更高。而标准的周转天数计算预法会更准确与准确。到底应当选择哪个方法?不同的时期,不同的方法如何选择则是仁者见仁,没有对或错,只有合适与否。但有肯定的一点,那就是类似二元一次回归分析法管理工具的熟练应用,则一定对会对企业管理起到更好的帮助,在做数据调研时也是个好的选择。
- ?
Excel的作用之一:数据分析,做运营人员要懂点
盼晴
展开
随着数据量的增大,数据统计分析的计算量和复杂性也随之剧增,所以需要借助各种统计分析软件来提高运算效率与分析准确性。
Excel也提供一组数据分析工具,包含常用的数据统计分析工具,能够满足基本的数据分析需求。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适宜的统计或工程函数,在输出表格中显示相应的结果,某些工具在生成输出表格时还能同时生成图表。
一、常用的函数
1、Vlooup():它可以帮助你在表格中搜索并返回相应的值。让我们来看看下面Policy表和Customer表。在Policy表中,我们需要根据共同字段 “Customer id”将Customer表内City字段的信息匹配到Policy表中。这时,我们可以使用Vlookup()函数来执行这项任务。
2、CONCATINATE():这个函数可以将两个或更多单元格的内容进行联接并存入到一个单元格中。例如:我们希望通过联接Host Name和Request path字段来创建一个新的URL字段。
3、LEN()-这个公式可以以数字的形式返回单元格内数据的长度,包括空格和特殊符号。
4、LOWER(), UPPER() and PROPER()—这三个函数用以改变单元格内容的小写、大写以及首字母大写(即每个单词的第一个字母)。
5、TRIM():这是一个简单方便的函数,可以被用于清洗具有前缀或后缀的文本内容。通常,当你将数据库中的数据进行转储时,这些正在处理的文本数据将会保留字符串内部作为词与词之间分隔的空格。并且,如果你对这些内容不进行处理,后面的分析中将产生很多麻烦。
二、由数据得出结论
1. 数据透视表:每当你在处理公司的数据时,你需要从“北区分公司贡献的收入是多少?”或“客户购买产品A订单的平均价格是多少?”以及许多类似的其它问题中寻找答案。
创建数据透视表的方法: 第一步:点击数据列表内的任何区域,选择:插入—数据透视表。EXCEL将会自动选择包含数据的区域,包括标题名称。如果系统自动选择的区域不正确,则可人为的进行修改。建议将数据透视表创建到新的工作表,点击New Worksheet(新工作表),然后点击OK。
第二步:现在,你可以看到数据透视表的选项板了,包含了所有已选的字段。你要做的就是把他们放在选项板的过滤器中,就可以看到在左边生成相应的数据透视表。
从上图可以看到,我们将“Region”放入行,“Productid”放入列中,“Premium”放入值中。现在,数据透视表中展示了“Premium”按照不同区域、不同产品费用的汇总情况。你也可以选择计数、平均值、最小值、最大值以及其他的统计指标。
2.创建图表:在EXCEL里面创建一个图表,你只要选择相应的数据,然后按F11,就会自动生成系统默认的图表。除此之外,你可以手工改变不同的图表类型。如果你倾向于在当前工作表中生成图表,可以按ALT+F1,而不是F11。
当然,在任何一种情况下,只要你创建了图表,就可以通过定义特定数据源来展示期望的信息。
三、数据清洗
1.删除重复值:EXCEL有内置的功能,可以删除表中的重复值。它可以删除所选列中所含的重复值,也就是说,如果选择了两列,就会查找两列数据的相同组合,并删除。
如上图所示,可以看到A001 和 A002有重复的值,但是如果同时选定“ID”和“Name”列,将只会删除重复值(A002,2)。
按照下列步骤操作可以删除重复值:选择所需数据-转到数据面板-删除重复值
2.文本分列:假设你的数据存储在一列中,如下图所示:
如上如所示,我们可以看到A列中单元格内容被“;”所区分。我们需要将其进行分列,建议使用EXCEL的文本分列功能。按照下面的步骤可以实现分列:1.选择A1:A62.点击:数据—分列
上图中,有两个选项,“分隔符号”和“固定宽度”。我选择“分隔符号”是因为有分隔符“;”。如果我们希望按照宽度分列,例如:前四个字符为第一列,第五到第十个字符为第二列,则可以选择按固定宽度分列。3.点击下一步—点击“分号”,然后下一步,然后点击完成。
评语:EXCEL作为使用最广泛的数据统计分析软件,无论你是小白还是资深用户,总会有一些东西值得你去学习。
- ?
EXCEL数据分析师常用操作技巧
流浪
展开
快捷键
Excel的快捷键很多,以下主要是能提高效率。
Ctrl+方向键,对单元格光标快速移动,移动到数据边缘(空格位置)。
Ctrl+Shift+方向键,对单元格快读框选,选择到数据边缘(空格位置)。
Ctrl+空格键,选定整列。
Shift+空格键,选定整行。
Ctrl+A,选择整张表。
Alt+Enter,换行。
Ctrl+Enter,以当前单元格为始,往下填充数据和函数。
Ctrl+S,快读保存。
Ctrl+Z,撤回当前操作。
如果是效率达人,可以学习更多快捷键。Mac用户的Ctrl一般需要用command替换。
格式转换
Excel的格式及转换很容易忽略,但格式会如影随形伴随数据分析者的一切场景。
通常我们将Excel格式分为数值、文本、时间。
数值常见整数型 Int和小数/浮点型 Float。两者的界限很模糊。
文本分为中文和英文,存储字节,字符长度不同。
时间格式在Excel中可以和数值直接互换,也能用加减法进行天数换算。
时间格式有不同表达。例如2016年11月11日,2016/11/11,2016-11-11等。当数据源多就会变得混乱。我们可以用自定义格式规范时间。
数组
数组很多人都不会用到,甚至不知道有这个功能。。
数组由多个元素组成。普通函数的计算结果是一个值,数组类函数的计算结果返回多个值。
数组用大括号表示,当函数中使用到数组,应该用Ctrl+Shift+Enter输入,不然会报错。
先看数组的最基础使用。选择A1
1区域,输入={1,2,3,4}。记住是大括号。然后Ctrl+Shift+Enter。我们发现数组里的四个值被分别传到四个单元格中,这是数组的独有用法。
我们再来看一下数组和函数的应用。利用{},我们能做到1匹配a,2匹配b,3匹配c。也就是一一对应。专业说法是Mapping。
=lookup(查找值,{1,2,3},{"a","b","c"})
分列
Excel可以将多个单元格的内容合并,但是不擅长拆分。分列功能可以将某一列按照特定规则拆分。常常用来进行数据清洗。
上文我有一列地区的数据,我想要将市和区分成两列。我们可以用mid和find函数查找市截取字符。但最快的做法就是用“市”分列。
合并单元个格
单元格作为报表整理使用,除非是最终输出格式,例如打印。否则不要随意合并单元格。
一旦使用合并单元格,绝大多数函数都不能正常使用,影响批量的数据处理和格式转换。合并单元格也会造成Python和SQL的读取错误。
数据透视表
数据透视表的主要功能是将数据聚合,按照各子段进行sum( ),count( )的运算。
下图我选择想要计算的数据,然后点击创建透视表。
此时会新建一个Sheet,这是数据透视表的优点,将原始数据和汇总计算数据分离。
数据透视表的核心思想是聚合运算,将字段名相同的数据聚合起来,所谓数以类分。
列和行的设置,则是按不同轴向展现数据。简单说,你想要什么结构的报表,就用什么样的拖拽方式。
删除重复项
一种数据清洗和检验的快速方式。想要验证某一列有多少个唯一值,或者数据清洗,都可以使用。
条件格式
条件格式可以当作数据可视化的应用。如果我们要使用函数在大量数据中找出前三的值,可能会用到rank( )函数,排序,然后过滤出1,2,3。
用条件格式则是另外一种快速方法,直接用颜色标出,非常直观。
冻结首行首列
Excel的首行一般是各字段名Header,俗称表头,当行数和列数过多的时候,观察数据比较麻烦。我们可以通过固定住首行,方便浏览和操作。
Header是一个较为重要的概念。在Python和R中,read_csv函数,会有一个专门的参数header=true,来判断是否读取表头作为columns的名字。
自定义下拉菜单(数据有效性)
数据有效性是一种约束,针对单元格限制其输入,也就是让其只能固定几个值。下拉菜单是一种高阶应用,通过允许下拉箭头即可。
自定义名称
自定义名称是一个很好用的技巧,我们可以为一个区域,变量、或者数组定义一个名称。后续要经常使用的话,直接引用即可,无需再次定位。这是复用的概念。
我们将A1:A3区域命名为NUM
直接使用=sum(NUM) ,等价于sum(A1:A3)。
查找公式错误
公式报错也不知道错在哪里的时候可以使用,尤其是各类IF嵌套或者多表关联,逻辑复杂时。查找公式错误是逐步运算的,方便定位。
分组和分级显示
分组和分级显示,常用在报表中,在报表行数多到一定程度时,通过分组达到快速切换和隐藏的目的。越是专业度的报表(咨询、财务等),越可以学习这块。在数据菜单下。
分析工具库
分析工具库是高阶分析的利器,包含很多统计计算,检验功能等工具。Excel是默认不安装的,要安装需要加载项,在工具菜单下(不同版本安装方式会有一点小差异)。
分析工具库是统计包,规划求解是计算最优解,类似决策树。
内容来源:网络整理
百家号-【袁帅数据分析运营】运营者:袁帅,互联网数据分析运营实践者。会展业信息化、数字化领域专家。认证数据分析师、网络营销师、SEM搜索引擎营销师、SEO工程师、电子商务职业经理人。
- ?
数据分析都用什么工具
含蕾
展开
欢迎关注天善智能,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习,问答、求职一站式搞定!
本文是上一篇文章《全国及重点城市“数据分析”岗位需求量及工资水平分析》的续篇,从“数据分析”职位招聘单位给出的职位描述中分析各种工具的热门程度。
1.整体概览
经常看见有网友争论R和python谁才是主流的数据分析工具,网友们分门别派各抒己见。今天我们从实际需求出发,在招聘单位的职位描述中用正则表达式匹配统计常用的数据分析工具出现的频率,看看谁才是你最应该掌握的工具。
话不多说,先上图
毫无疑问,excel才是最主流的数据分析工具,在招聘单位的职位描述中出现频率远远高于其他工具(实际上居第八位的office也含有excel,其真实数据应该比这还高),作为最基础的工具,excel是一个数据分析工作者的必备技能。excel之后的4门工具分别是sqlsever、spss、sas和r,其中排名第二位的sqlsever频率高出另外两门主流数据库语言mysql、oracle近两倍,spss作为无需编程的专业统计软件也在职位描述中有较高的频率,sas则是编程类统计软件的代表,今年来火热的r语言也水涨船高,另一门火热的程序语言python在数据分析方面则要稍稍落后。
2.各职位具体情况
数据分析也有细分很多具体职位,那么不同的职位以上各种工具的要求是否存在差异呢?
表中数据显示“大数据分析师”需掌握的工具主要是r、python、hadoop、spark和java;“数据分析工程师”需要掌握的工具主要是sqlsever、r、python和hadoop,这两个职位都很看重编程开发能力。
“数据分析经理”、“高级数据分析师”和“数据分析师”需要掌握的工具大体一致,均为excel、sqlsever、spss、sas和r。
“数据分析主管”、“数据分析”、“数据分析专员”和“数据分析员”等职位对基础技能的要求更为突出,excel、ppt、word等office办公软件出现的频率较其他工具明显更高。
作为一名数据分析从业者或者想转行过来的人来说,要想有好的职业发展,首先,必须熟练掌握office办公软件,尤其是excel(不要瞧不起excel,你不一定玩得转);其次,还需要学习一门数据库语言,sqlsever是不错的选择(mysql、oracle与sqlsever较为类似,通一门后,其他的学起来也很容易);专业的统计分析工具也需要掌握一门,如果讨厌编程,可以选择spss,如果有编程能力那么sas和r可以选择一个学习,如果你精通python也可以用python做统计分析;如果想往大数据方向发展,或者是做数据分析工程师那就还需要掌握python、hadoop等工具。
最后附上一张数据分析职位描述的词云图,可以看出招聘单位除了看重工具的使用外,也很注重分析、业务、经验、沟通、团队等方面的能力。
本文作者:Mr.Hu,转自:一胡诌先生
excel数据分析工具
-
1、只需3秒快速实现求和
-
2、如何快速填充序号
-
3、如何自动填充序号(公式法)
-
4、数据条的神奇应用
-
5、多文本快速合并
-
6、查找与替换的不同玩法
-
7、快速定位到指定区域
-
8、数据排序、工资条制作
-
9、快速筛选(模糊、精确筛选)
-
10、快速插入空行
-
11、快速删除空行
-
12.快速跳转到天涯海角
-
13、.同时查看两个Excel文件
-
14、用条件格式扮靓报表
-
15、一键插入Excel图表
-
16、批量处理行高、列宽
-
17、利用拆分功能查看数据
-
18、批量录入相同内容
-
19、工作表快速跳转
-
20、批量录入表格模板(精品课程)
-
21、Excel函数与公式的应用、公式循环引用的查找
-
22、IF函数单条件判断同比增长
-
23、用sum函数 格式相同,连续多表数据汇总
-
24、excel快捷键
-
25、VLOOKUP函数——根据销售员匹配销售额
-
26、统计各部门销售总额
-
27、统计指定条件个数
-
28、怎样输入当前日期和时间、星期数
-
29、销售业绩排名
-
30、Sumproduct函数-万能函数(销售额汇总求和)
-
31、根据销售员,地区,商品名称汇总
-
32、批量替换PPT字体
-
33、给销售额数据批量添加万元单位
-
34、一秒快速核对两列数据
-
35、快速定位到指定单元格或区域
-
36、快速制作双行标题工资条
-
37、给你的表格做个瘦身
-
38、快速打开常用的Excel文件
-
39、快速打开多个Excel文件
-
40、利用创建组—快速隐藏/展开多列数据
-
41、快速制作下拉菜单
-
42、复制粘贴表格,如何保留数据源列宽格式一致?
-
43、两列数据位置互换
-
44、1秒钟扮靓报表——如何实现表格隔行换色
-
45、快速删除重复记录——保留唯一值
-
46、快速向下填充、向右填充,文本或公式
-
47、给Excel文件添加密码
-
48、插入带图片的批注
-
49、输入公式后不计算?
-
50、如何设置单元格缩进
-
51、快速解决Excel表格总显示货币格式
-
52、批量添加万元单位
-
53、你会四舍五入么?
-
54、用RAND函数机选彩票
-
55、冻结首行你会么?
-
56、超链接的高级应用
-
57、IFERROR函数-屏蔽错误值
-
58、批量填充颜色
-
59、录入数据
-
60、快速输入工号
-
61、快速行列转置
-
62、自定义缩放界面
-
63、多个单元格同时输入
-
64、如何计算立方米?
-
65、快速制作双行标题工资条
-
66、输入带方框的√和×
-
67、快速将姓名对齐
-
68、快速输入性别
-
69、按单位职务排序
-
70、自动计算合同到期日期
-
71、计算时间间隔
-
72、日期和时间的拆分
-
73、快速处理不规范的日期格式
-
74、快速填充合并单元格
-
75、效率加倍的快捷键
-
76、快速复制表格和对象
-
77、快速创建工作表副本
-
78、快速复制序列号
-
79、快速显示公式
-
80、多个单元格同时输入
-
81、快速调整显示比例
-
82、快速自动填充
-
83、快速填充(Ctrl+E)
-
84、Ctrl与数字键结合
-
85、快速将多列数据整理为1列
-
86、快速将1列数据拆分为多列
-
87、快速定位公式
-
88、快速录入数据
-
89、快速累计求和
-
90、身份证号码显示为0怎么办?
-
91、快速制作斜线表头
-
92、文本竖向显示
-
93、神奇的监视窗口
-
94、不一样的格式刷
-
95、快速美化图表
-
96、快速生成当前日期
-
97、快速找出循环引用
-
98、快速提取信息
-
99、二维表快速转换为一维表
-
100、快速多表合并