中企动力 > 商学院 > 数据分析excel练习题
  • ?

    Excel数据分析高手常用的技巧,您与高手就差这一步,领导都说好

    小文

    展开

    朋友们大家好,很多时候我们做表格需要对数据进行分析,面对一大堆的数据,看的眼花缭乱,别着急,学会了Excel这个技巧,我们也加入了高手的行列,涨工资还会远吗!看图说话:

    打开UC浏览器 查看更多精彩图片

    打开UC浏览器 查看更多精彩图片

    在两张表中我相信大家一定发现了不同之处,对,第一张表格数据一片,看的头都大了,第二章表格,直接把每月前两名用橙色底纹显示出来,一目了然,那么如果数据量比较大是不是很麻烦,NO,同样很简单,下面就和大家分享一下,看下图:

    打开UC浏览器 查看更多精彩图片

    选中一月数据的单元格,选择工具栏上的条件格式—项目选取规则—其他规则,然后弹出下图对话框,这里介绍下项目选取规则子菜单里面的内容,“值最大的10项”:不管有几十几百项,只突出显示值最大的十项。“值最大的10%项”:如果有100条数据,突出显示10%就是10项,如果有1000条数据,10%就是100项。后面几项意思一样,当然我们也可以自定义设置,就是最下面的“其他规则”,看下图:

    打开UC浏览器 查看更多精彩图片

    在弹出的对话框里面,排名框输入2,想显示前几名就输入几,这里我只需要前两名,所以输入2,下面的格式选择一种喜欢的颜色吧,最后点击确定,效果如下图所示:

    打开UC浏览器 查看更多精彩图片

    如图所示,一月销售量突出显示两项,后面的月份依次操作。

    关注或者收藏可以免费观看Excel全系列教程,欢迎评论吐槽,小编等你哦!

  • ?

    Excel数据统计分析中36个小技巧

    捡爱

    展开

    1、一列数据同时除以10000

    复制10000所在单元格,选取数据区域 - 选择粘性粘贴 - 除

    2、同时冻结第1行和第1列

    选取第一列和第一行交汇处的墙角位置B2,窗口 - 冻结窗格

    3、快速把公式转换为值

    选取公式区域 - 按右键向右拖一下再拖回来 - 选取只保留数值。

    4、显示指定区域所有公式

    查找 = 替换为“ =”(空格+=号) ,即可显示工作表中所有公式

    5、同时编辑所有工作表

    全选工作表,直接编辑,会更新到所有工作表。

    6、删除重复值

    选取数据区域 - 数据 - 删除重复值

    7、显示重复值

    选取数据区域 - 开始 - 条件格式 - 显示规则 - 重复值

    8、把文本型数字转换成数值型

    选取文本数字区域,打开左上角单元格的绿三角,选取 转换为数值

    9、隐藏单元格内容

    选取要隐藏的区域 - 设置单元格格式 - 数字 - 自定义 - 输入三个分号;;;

    10、给excel文件添加密码

    文件 - 信息 - 保护工作簿 - 用密码进行加密

    11、给单元格区域添加密码

    审阅 - 允许用户编辑区域 - 添加区域和设置密码

    12、把多个单元格内容粘贴一个单元格

    复制区域 - 打开剪贴板 - 选取某个单元格 - 在编辑栏中点击剪贴板中复制的内容

    13、同时查看一个excel文件的两个工作表

    视图 - 新建窗口 - 全部重排

    14、输入分数

    先后输入 0 ,再输入 空格, 再输入分数即可

    15、强制换行

    在文字后按alt+回车键即可换到下一行

    16、删除空行

    选取A列 - Ctrl+g打开定位窗口 - 定位条件:空值 - 整行删除

    17、隔行插入空行

    在数据表旁拖动复制1~N,然后再复制序号到下面,然后按序号列排序即可。

    18、快速查找工作表

    在进度条右键菜单中选取要找的工作表即可。

    19、快速筛选

    右键菜单中 - 筛选 - 按所选单元格值进行筛选

    20、让PPT的图表随excel同步更新

    复制excel中的图表 - 在PPT界面中 - 选择性粘贴 - 粘贴链接

    21、隐藏公式

    选取公式所在区域 - 设置单元格格式 - 保护:选取隐藏 - 保护工作表

    22、行高按厘米设置

    点右下角“页面布局”按钮,行高单位即可厘米

    23、复制时保护行高列宽不变

    整行选取复制,粘贴后选取“保持列宽。

    24、输入以0开始的数字或超过15位的长数字

    先输入单引号,然后再输入数字。或先设置格式为文本再输入。

    25、全部显示超过11的长数字

    选数区域 - 设置单元格格式 - 自定义 - 输入0

    26、快速调整列宽

    选取多列,双击边线即可自动调整适合的列宽

    27、图表快速添加新系列

    复制 - 粘贴,即可给图表添加新的系列

    28、设置大于72磅的字体

    excel里的最大字并不是72磅,而是409磅。你只需要输入数字即可。

    29、设置标题行打印

    页面设置 - 工作表 - 顶端标题行

    30、不打印错误值

    页面设置 - 工作表 - 错误值打印为:空

    31、隐藏0值

    文件 - 选项 - 高级 - 去掉“显在具有零值的单元格中显示零”

    32、设置新建文件的字体和字号

    文件 - 选项 - 常规 - 新建工作簿时....

    33、快速查看函数帮助

    在公式中点击下面显示的函数名称,即可打开该函数的帮助页面。

    34、加快excel文件打开速度

    如果文件公式过多,在关闭时设置为手动,打开时会更快。

    35、按行排序

    在排序界面,点击选项,选中按行排序

    36、设置可以打印的背景图片

    在页眉中插入图片即要

    来源:网络整理

    百家号-【袁帅数据分析运营】运营者:袁帅,会展业信息化、数字化领域专家。新社汇平台联合创始人,永洪数据科学研究院MVP。认证数据分析师、网络营销师、SEM搜索引擎营销师、SEO工程师、中国电子商务职业经理人。畅销书《互联网销售宝典》联合出品人。

  • ?

    Excel的作用之一:数据分析,做运营人员要懂点

    毕沛芹

    展开

      随着数据量的增大,数据统计分析的计算量和复杂性也随之剧增,所以需要借助各种统计分析软件来提高运算效率与分析准确性。

      Excel也提供一组数据分析工具,包含常用的数据统计分析工具,能够满足基本的数据分析需求。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适宜的统计或工程函数,在输出表格中显示相应的结果,某些工具在生成输出表格时还能同时生成图表。

      一、常用的函数

      1、Vlooup():它可以帮助你在表格中搜索并返回相应的值。让我们来看看下面Policy表和Customer表。在Policy表中,我们需要根据共同字段 “Customer id”将Customer表内City字段的信息匹配到Policy表中。这时,我们可以使用Vlookup()函数来执行这项任务。

      2、CONCATINATE():这个函数可以将两个或更多单元格的内容进行联接并存入到一个单元格中。例如:我们希望通过联接Host Name和Request path字段来创建一个新的URL字段。

      3、LEN()-这个公式可以以数字的形式返回单元格内数据的长度,包括空格和特殊符号。

      4、LOWER(), UPPER() and PROPER()—这三个函数用以改变单元格内容的小写、大写以及首字母大写(即每个单词的第一个字母)。

      5、TRIM():这是一个简单方便的函数,可以被用于清洗具有前缀或后缀的文本内容。通常,当你将数据库中的数据进行转储时,这些正在处理的文本数据将会保留字符串内部作为词与词之间分隔的空格。并且,如果你对这些内容不进行处理,后面的分析中将产生很多麻烦。

      二、由数据得出结论

      1. 数据透视表:每当你在处理公司的数据时,你需要从“北区分公司贡献的收入是多少?”或“客户购买产品A订单的平均价格是多少?”以及许多类似的其它问题中寻找答案。

    创建数据透视表的方法: 第一步:点击数据列表内的任何区域,选择:插入—数据透视表。EXCEL将会自动选择包含数据的区域,包括标题名称。如果系统自动选择的区域不正确,则可人为的进行修改。建议将数据透视表创建到新的工作表,点击New Worksheet(新工作表),然后点击OK。

    第二步:现在,你可以看到数据透视表的选项板了,包含了所有已选的字段。你要做的就是把他们放在选项板的过滤器中,就可以看到在左边生成相应的数据透视表。

    从上图可以看到,我们将“Region”放入行,“Productid”放入列中,“Premium”放入值中。现在,数据透视表中展示了“Premium”按照不同区域、不同产品费用的汇总情况。你也可以选择计数、平均值、最小值、最大值以及其他的统计指标。

    2.创建图表:在EXCEL里面创建一个图表,你只要选择相应的数据,然后按F11,就会自动生成系统默认的图表。除此之外,你可以手工改变不同的图表类型。如果你倾向于在当前工作表中生成图表,可以按ALT+F1,而不是F11。

    当然,在任何一种情况下,只要你创建了图表,就可以通过定义特定数据源来展示期望的信息。

    三、数据清洗

    1.删除重复值:EXCEL有内置的功能,可以删除表中的重复值。它可以删除所选列中所含的重复值,也就是说,如果选择了两列,就会查找两列数据的相同组合,并删除。

    如上图所示,可以看到A001 和 A002有重复的值,但是如果同时选定“ID”和“Name”列,将只会删除重复值(A002,2)。

    按照下列步骤操作可以删除重复值:选择所需数据-转到数据面板-删除重复值

    2.文本分列:假设你的数据存储在一列中,如下图所示:

    如上如所示,我们可以看到A列中单元格内容被“;”所区分。我们需要将其进行分列,建议使用EXCEL的文本分列功能。按照下面的步骤可以实现分列:1.选择A1:A62.点击:数据—分列

    上图中,有两个选项,“分隔符号”和“固定宽度”。我选择“分隔符号”是因为有分隔符“;”。如果我们希望按照宽度分列,例如:前四个字符为第一列,第五到第十个字符为第二列,则可以选择按固定宽度分列。3.点击下一步—点击“分号”,然后下一步,然后点击完成。

    评语:EXCEL作为使用最广泛的数据统计分析软件,无论你是小白还是资深用户,总会有一些东西值得你去学习。

  • ?

    想进大公司?先试试这4个Excel面试题

    劳伦斯

    展开

    无意中偶遇某知名大公司的Excel面试题,就下载看了一下。题目出的有一定难度,看来进大公司还真的不容易。

    第一题:

    请提取左侧表格中每位客户的最后一次拜访记录。正确结果下图G列所示。

    分析:最后意味着从后向前查找,在excel中lookup函数正好可以完成这个功能,套路为:

    =LOOKUP(1,0/(条件1)*(条件2)),返回值区域)

    G2公式:

    =LOOKUP(1,0/((A$2:A$101=E2)*(B$2:B$101=F2)),C$2:C$101)

    第二题:

    在I列设置公式,根据客户名称和产品类别统计销量。

    分析:这是典型的多条件求和问题,没什么可说的,直接上Sumifs函数。

    i2公式

    =SUMIFS(D:D,A:A,G2,B:B,H2)

    第三题:

    本题为图表制作,要求根据表中的目标、四个季度的完成数量制作图片,如下图所示。

    分析:四个季度叠加在一起和目标对标,一对多的柱形图+叠加,思路只有一条:利用双坐标图表。

    1、选取区域,插入堆积柱形图。

    2、分别选取4个季度的系列,手工填充颜色。

    3、选取销售目标系列,修改为次坐标轴,然后调整分类间距。

    4、设置销售目标填充色为无,边框为实线。

    5、选取图例设置为靠右,再选取右侧坐标,按delete删除。完工!

    第四题:

    要求用数据透视表统计出每个客户的销售数量,然后进行评级。如下图所示。

    分析:制作数据透视表很容易,关键是★列怎么设置。常见的有两种方法,一种是添加辅助列用公式生成级别,第二种是手工组合。由于本题没有说明判断标准,只是让模仿制作,所以用手工组合即可。

    1、添加数据透视表

    2、排序后依照图示,分别选取姓名,右键 - 创建组

    3、直接修改组名为★

    选取组名位置,可以用拼音输入法打出★,在后面不能直接粘贴,可以按F2进入编辑状态后再粘。

    4、合并居中显示。

    选取分组列,右键数据透视表选项 - 布局 - 选取 "合并且居中....."

    兰色说:这4个题目难度属中等但出的很刁钻,可以从不同角度考核面试者的Excel综合应用能力。如果你是HR,你们单位也正在招聘有Excel能力要求的相关岗位,可以用这4个测试题去考核面试者。

    End.

    文章转载自:Excel精英培训

  • ?

    做数据分析,这两个Excel功能很神奇很有用!

    彭可冥

    展开

    下面为各种产品1~9月份的出口数据。由于数据太多,很难看出每个产品一年来的数量变化情况。

    我们可以借助2个excel工具,表格马上变得直观起来。(2010以前版本无法使用)

    1、条件格式的色阶

    根据颜色深浅,可以很清晰的看出某种产品在一年中的出口变化情况。

    制作演示:

    2、迷你图

    同样,通过在单元格中添加微型折线图,同样可以看出每一种产品在一年中的出口变化情况。

  • ?

    作为数据分析师,用的最多的竟是Excel表格

    黎谷云

    展开

    【摘要】:结合实际数据分析工作,简要介绍了VLOOKUP函数的基础应用,重点介绍亲测高效有难度的VLOOKUP函数高级应用。最后分享我运用Excel的一点技巧。

    毕业后,第一份工作是在一家互联网公司做数据分析。

    尽管和所学专业没那么匹配,但我还是挺满意。因为向来对数字很敏感,对常用统计软件也都有所了解。

    正式入职,发现面试时说的什么SPSS,Eviews统统都不用,基本就是用Excel。对于研究生毕业,第一份工作,我多少有些落差。既来之则安之,我心想用什么工具最方便,工作中应该可以自己选择。对于word和ppt还算熟练,Excel也就一般。多学点总不会差。

    开始工作,我发现Excel的功能简直太强大,我之前了解的仅是皮毛。尤其在更新到2013版后,操作更智能和快捷,数据量大时计算较费时。对于日常工作影响倒不大,借助Excel我的数据分析工作也很快上手。

    除了宏不太会,工作之余也会多琢磨一些公式和操作。以至于同办公室的同事,甚至外部门的同事都来找我帮忙解决Excel的问题。时间久了,领导特意让我在部门内部定期做教学分享。

    我确实喜欢和数据打交道的感觉,从冗杂的繁琐数据中分析出最终的结果相当有成就感。在简书上也看到了许多实用的Excel操作指南或技巧。

    今天分享一个职场中最常用,功能强大,却少有人掌握的VLOOKUP函数。很多文章都提到过这个函数的基础应用,此外还有一个高级应用,是我在工作中遇到,亲测高效快捷的有力工具。

    VLOOKUP函数---最最最常用的查找函数

    四个必备参数=(要查找的值,要查找的区域,返回数据在查找区域的第几列数,逻辑值)

    注: FALSE或0,则返回精确匹配,如果找不到,则返回错误值 #N/A(首选)

    TRUE或1,则返回近似匹配值,如果找不到,则返回小于第一个参数的最大值。

    VLOOKUP函数的基础应用:一对一的匹配

    理解上述文字很晦涩,用实例来说明。

    例1: 下图中左表为源数据:各类产品在三个城市的日销售数据。

    需求:查询产品B和F在上海的销售额。

    因为提供的数据量很少,人工查找就能完成。但实际工作中数据量很庞大,人工查找费时费力且准确率低。这时用VLOOKUP一秒搞定。

    做法:在G2单元格内,输入公式,见红框内。回车后,出现结果;将公式复制或下拉至G3,同理可得结果。

    参数解释:

    (1)“F2”为我们要查找的参照值,即在源数据第一列查找“产品B”。当公式下拉复制时,自动切换为查找F3。

    (2)“A:C”指我们要在此范围内查找数据。该参数也可写为“$A$2:$C$9”,即绝对引用。这样可保证无论公式如何拖拽复制,数据源始终固定引用该区域。

    (3)参数“3”指在选择的数据源“A列-C列”范围内,要查询的销量在引用的第三列,即C列。

    (4)FALSE,即精确查找。

    这样,通过应用该函数,实现了产品型号和销量一对一的匹配查找。

    应用该公式的硬性条件:

    (1)必须保证需要查找的参照值与源数据格式一致。

    即例1中:F列与A列完全一致,不仅内容相同,尤其保证单元格格式一致,否则只会返回错误值 #N/A。如不一致,查找前需转换成一致的格式。有时较难分辨。

    (2)必须保证源数据表中的第一列没有重复项。

    即A列中没有出现重复的产品类型。假如源数据中出现了多行“产品B”,那么在查找时只能返回第一次“产品B”出现时对应的销量。

    当(2)无法满足时,查找不再是一对一,而是一对多的匹配。需要对VLOOKUP函数进行扩展才得以实现查找功能。

    VLOOKUP函数的高级应用:一对多的匹配

    例2:下图左表为客服中心的每日工作记录,日积月累,这个表数据量庞大且信息冗杂。

    需求:王丹和张鹏岗位变动,需将他们接待过的全部客户汇总转交其他同事维护。

    数据量小手动筛选即可,使用透视表也可完成。这里我借助简单的例子,介绍如何使用VLOOKUP完成。当数据量庞大,这是较便利的方法。

    做法:

    第一步:将A列排序,在A与B列间新插入两列。

    第二步:计数。在B2输入公式=COUNTIF(A$2:A2,A2),回车,下拉即可。

    目的是对A列中同一个名字的出现次数进行计算。如图李珊出现了四次。

    第三步:构建辅助列。在C2输入公式=A2&B2,回车,下拉即可。目的在于将A列B列的内容合并。这时C列即为辅助列。保证了源数据的唯一性,此时已满足VLOOKUP基础应用的第二个硬性条件。

    第四步:进行匹配查找。在H2输入公式=VLOOKUP($G2&H$1,$C$2:$D$18,2,FALSE), 复制公式至其他单元格即可得到结果。

    与基础应用相比,仅参数1有变化,涉及相对引用和绝对引用问题。

    参数1:将“客服姓名&序号“合并作为第一个参数。公式向右向下复制后,“客服姓名”行变列不变,所以锁定列。“序号”列变行不变,所以锁定行。即为:“$G2&H$1”。锁定即绝对引用。(此处较难理解,操作中通过尝试能够理解透)

    参数2:绝对引用C2至D18区域。即为:“$C$2:$D$18”,新数据源。

    参数3:返回所选区域C2至D18中的第2列数据。即为:客户姓名

    参数4:FALSE,即精确查找。

    第五步:将H2中的公式向下向右复制至K3,即得全部结果。可对比源数据表验证是否正确。

    在序号为4的单元格内出现了#N/A值。表明没有找到“王丹4”和“张鹏4”对应的内容,说明这两人接待的客户仅有3人。

    这样,通过其他功能辅助,实现了客服与客户一对多的匹配查找。

    总结:VLOOKUP的高级应用是在基础应用的基础上,借助了COUNTIF和&函数,构建辅助列,使得源数据表中第一列无重复。四个必备参数中仅参数1涉及绝对引用和相对引用,略有难度。

    应用Excel的技巧

    1.填充了公式的单元格,在得到结果后,最好将计算结果转换为“值”。

    两个好处:一是避免源数据的任何变动再次影响公式的计算结果;二是Excel本身计算较费时。如公式一直存在,每次打开该文件,或是刷新时都会重新计算,严重影响Excel运算速度。

    2.Excel的数据承载量相对较小。2013版每个sheet能够填充接近105万行。

    如果涉及较多sheet,数据量可想而知。因此在上一条的基础上,必须及时保存,否则数据量大时Excel难免会出现重启。毕竟多数人用的都是免费版,为了避免做无用功,及时保存很重要。这可是次次抓狂的经验教训。

    3.Excel的功能很丰富,没有哪一本书或是哪一个老师能够完全教会所有功能。

    更实际的是,从点到面去学习。比如说我介绍了VLOOKUP函数的应用,其中涉及到了绝对引用的概念,以及countif函数的应用,这时就引导你去学习新知识。

    任何功能的组合都能起到耳目一新的作用。

    4.Excel做不到死记硬背,多练习才利于掌握。

    比如说,在工作中我给同事教过无数次VLOOKUP函数的应用,当时似懂非懂,勉强会用。想不到的是他们下一次遇到早已忘得一干二净。在我看来是很简单的一个公式而已,仅需掌握四个参数。关键是他们不常用,而我几乎天天用。

    任何技能都是如此。孰能生巧,才能更快掌握更多功能。哪怕是多记几个快捷键,都会为你使用Excel加分不少。

    多学一点技能,就能少求助别人,且让别人来求助于你。普通离优秀,永远差一项技能。

    写出来为分享,也为记录。

    PS:如果没有看懂,或是觉得现在用不到我介绍的公式。没关系,请收藏,因为工作后,无论做什么工作一定一定一定会用到VLOOKUP。

    请尊重原创的辛苦。欢迎分享,欢迎交流。

  • ?

    数据分析培训学习,怎么用Excel做数据分析

    静竹

    展开

    今天科多大数据小课堂来教大家用Excel怎么做数据分析。

    现如今,各行各业的求职都需要简历包装。尤其是文职类简历,想要赢得offer,你不得在精通Excel等办公软件上下点功夫么?那么,你真的了解Excel嘛?或者,你知道用它怎么做数据分析嘛?

    所谓数据分析在手,走遍天下都不怕。而 Excel 作为最简单的办公软件,功能却不容小觑,同样可以实现分类、聚类、关联和预测来进行数据分析。这些概念听起来比较抽象,其实一点都不难,今日文章直接来一波干货,从具体操作开始讲起。

    01 掌握基本 Excel 快捷键

    工欲善其事,必先利其器,自从笔者发现了excel快捷键,就打开了新世界的大门。 虽然都是很基础的操作,一旦运用熟练将会大幅提升效率。

    最好用的复制命令: Ctrl + R 向右复制 Ctrl + D 向下复制

    选择格式粘贴:Ctrl + Alt + V

    求和功能:Alt + = 然后按回车键

    格式调整:Ctrl + Shift + 7 加上外边框 Ctrl + Shift + - 去掉边框 Ctrl + Shift + 5 改成%数值格式

    视图调整及编辑: Ctrl + Shift + = 插入行 Ctrl + - 删除

    终极:开始工具栏所有的命令都可以通过 Alt - H - 调用

    Alt: 激活选项,配合选项英文字母使用

    Shift:连续选择,配合方向键,翻页键等使用; 上位键

    Ctrl:配合其他键可以执行一项命令 如Ctrl + C 复制;快速移动光标,配合方向键使用,如向右快速移动光标 (Ctrl + →)

    02 数据收集

    在数据分析之前,首先需要找到可靠的数据源。国内的公司数据可以在 wind 上下载,宏观数据可以在国家统计局上找到,而国外比较常用的网站有 SEC,WRDS (Wharton Research Data Services)。

    需要注意的是,原始数据一般保留不做处理,通过 Excel 或其他编程软件做后续处理。

    03 数据清洗与筛选等基础操作

    杂乱无章的原始数据是难以分辨的,因此需要对海量数据进行清洗和筛选才能找出其中的规律。

    常见的方法有如下几种:

    运用描述性统计命令观察数据的离散程度等基本情况:通过添加“分析工具库”加载项找到数据-数据分析-描述统计,可以得到这组数据的中位数、众数、峰度、偏度等基本指标,观察这组数据的特征。此外,数据分析中还有方差分析等其他命令。

    运用 VLOOKUP 将数据合理分组,收放自如:VLOOKUP 函数是 Excel 中的一个纵向查找函数,可以用来核对数据,多个表格之间快速导入数据等函数功能。功能是按列查找,最终返回该列所需查询列序所对应的值。比如,我们导出公司的原始报表后,可以通过 VLOOKUP 函数将报表中的数字一一导入到新的管理用的财务报表,这样既不会破坏原始数据,又可以建立良好的模板,方便后续使用。VLOOKUP 的四个参数用通俗的话来说,就是(要找谁,要在哪里找,要找哪一列内容,是精确的还是模糊的)

    运用数据透视表分组求平均数、标准差、计数等多个指标:数据透视表是一个非常容易上手的分组工具,对于简单的数据处理甚至在便捷程度上打败了很多编程工具呢。比如要对每个省份的所有专业分数线求一个平均数,将年份和省份轻松地拖动到对应的列和行,就可以得到结果啦。试想,如果在原始表格中手动一个一个求平均数该有多麻烦。

    运用条件函数计算融资缺口,检查配平:比如在预测财务报表时,我们常常要判断资产是否等于负债+所有者权益。此时可以用 IF 函数 (资产=负债+所有者权益,TRUE,FALSE)如果是配平的,直接返回 TRUE。此外,还有一些函数如 IRR 可以计算项目的投资回报率。

    04 挖掘数据背后的规律

    在完成了数据清洗和筛选之后,我们还是要落实到数据分析的重点,也就是数据背后的逻辑。

    首先我们可以采用画图的方式。画图可以非常直观地佐证结论,不同情况下要用不同类型的图,比如饼图显示比重,折线图发现趋势,还可以采用叠加多种形式的图。

    下面这张图就是一个数据分析应用的经典例子,显示的是一个教育公司在扩张过程中,学习中心同比增速与营业毛利率的关系。试想,如果只是一堆数据放在你的面前,可能根本无法发现其中的规律,但是通过下图,我们可以发现,学习中心的同比增速一般与营业毛利率呈反向关系,这也就意味着,扩张的过程必然要伴随利润下降的阵痛,这样的数据分析就是有效的,可以为公司的扩张战略提供参考依据。

    另一种比较常见的数据分析应用就是从历史预测未来。比如如果公司过去几年的存货周转率都比较稳定,可以以此来预测未来几年的存货周转率。又或者通过线性回归发现某两个指标之间过去的线性关系,并以此来预测未来走势,这个操作方法可以用散点图——添加趋势线——选择回归类型(线性)来得出简单的结论。

    说了这么多,列举 Excel 数据分析的一个常见运用。

    大家知道,金融领域的工作往往要考察搭建财务模型的技巧,而这个模型就是完完全全从 0 开始通过 Excel 制作的。

    1. 计算各项指标了解公司的历史经营状态。这一步不仅可以看出公司在盈利能力、成长性、营运能力等多个维度的历史发展状况,还可以与同行业的可比公司进行比较,看出这个公司所处的地位(比如公司的应收账款周转率可以直观看出公司是强势地位还是弱势地位,应收账款周转率如果显著低于同业,那就说明应收账款很容易收到,议价能力强)。

    2. 预测公司未来的盈利状况,并通过财务报表的勾稽关系完善财务模型。这一步一定要打开 Excel 的自动迭代功能(选项——公式——启用迭代计算),具体的财务方面知识在此就不再详述。

    3. 现金流 DCF 模型及敏感性分析。以之前制作的财务报表为基础,就可以测算出公司未来的自由现金流,在计算出公司资本成本的前提下对现金流进行贴现得到公司绝对估值。其中,基于不同的资本成本和公司永续增长率还可以做成敏感性分析的表格,得出在不同情形下公司的估值。这就需要使用Excel的数据——模拟运算——模拟运算表功能了。如下图所示,将输入引用行的单元格和引用列的单元格分别设为 Equity Valuation 中的永续增长率和Wacc对应的数值,就可以实现啦。

    以上这些介绍都只是冰山一角,Excel的功能博大精深,加上VBA等高端操作将会释放更大的威力。配合现当代大数据盛行时期。想要深入,就还得不断学习!

  • ?

    怎么样Excel做数据分析?这几个步骤帮到你

    华惜灵

    展开

    每个人都会有机会进行数据展示,为什么别人展示永远获得正视,而我的展示永远只有自己愿意去看,别人在看手机?那怎样做数据图表分析呢请看以下步骤:

    如何对表格进行修饰,本次小编带来两个技巧,一是使用“套用表格格式”,和使用“条件格式”。二是带领大家学会养成修饰表格的思维。

    第一步是对表格进行粗略的修饰调整,思维:行高、列宽、对齐方式、表格线等;

    使用“套用表格格式”、“条件格式”之后看数据不再枯燥无味,而且还更有看头。“条件格式”可以将筛选条件转换为颜色可视化,从而达到一目了然的效果。

    第一个技巧,①“套用表格格式”。方法:任一单元格→开始→套用表格格式。

    ②“条件格式”,方法:选中单元格区域→开始→条件格式。

    条件1:高于平均值

    条件2:数据条

    条件3:色阶

    第二个技巧:养成修饰图表的思维。这次举例柱形图的修饰例子,其他希望大家动用类似的方法进行模拟实践。

    步骤一:根据销售数据建立柱状图,建立方法可参考。选择数据源→插入→柱状图→选择数据源→编辑坐标

    步骤二:添加辅助线。选择数据源→→添加→点击柱体右键,设置数据系列格式→次坐标轴→选中柱体,右键更改图表类型→折线图。

    希望回答对你能有所帮助,如果觉得不错就来点个赞或关注吧,感谢各位了!

  • ?

    Top30数据分析师常见面试题(附答案)!

    猫王

    展开

    【IT168 评论】这是一个用数据说话的时代,也是一个依靠数据竞争的时代。各大互联网公司都在不断完善自己的数据分析团队,数据分析师的薪酬也是水涨船高。业内人士透露,应届毕业生的平均薪资大概在6K左右,1至3年经验的大概在10K到20K之间,5至10年经验的大概在25K以上。薪资还是十分诱人的,那么,如何快速成长为一名年薪百万的数据分析师呢?快来看看,以下30道数据分析相关面试题,你会多少?

    1、分析数据还要写java代码是不是效率有点低?

    2、成为一名数据分析师需要具备哪些技能?

    要成为一名数据分析师,需要掌握丰富的报告软件包(Business Objects),编程语言(XML,Javascript或ETL框架),数据库(SQL,SQLite等);能够准确分析、组织、收集或传播数据;掌握数据库设计,数据模型,数据挖掘等方面的技术知识以及分析大型数据集(SAS,Excel,SPSS等)的统计软件包知识。

    3、分析项目的各个步骤是什么?

    分析项目的各个步骤包括:

    ·问题定义

    ·数据挖掘

    数据准备

    模型化

    数据认证

    实施跟踪

    4、分析的结果数据特别大,在线请求这些结果数据扛不住了,咋搞?

    5、列出数据清理的最佳实践?

    一些数据清理的最佳实践包括:

    按不同的属性排序数据

    对于大数据集,逐步清理并改进数据,直到获得良好的数据质量

    对大型数据集,可以先将其分解为小数据集,使用更少的数据将增加迭代速度

    要处理常见的清理任务,请创建一组实用程序函数/工具/脚本。它可能包括基于CSV文件或SQL数据库重映射值,或者正则表达式搜索和替换,消除所有不匹配正则表达式的值

    如果在数据清理方面存在问题,请按照估计的频率进行安排并解决问题

    分析每列的汇总统计数据(标准差,均值,缺失值的数量)

    保持对每一个清理操作的跟踪,以便可以根据需要更改或删除操作

    6、海量日志数据,提取出某日访问百度次数最多的那个IP。

    7、可用于数据分析的一些最佳工具清单有什么?

    Tableau

    RapidMiner

    OpenRefine

    KNIME

    Google Search Operators

    Solver

    NodeXL

    io

    Wolfram Alpha’s

    Google Fusion tables

    8、数据挖掘和数据分析之间的区别是什么?

    数据挖掘和数据分析之间的区别在于:

    数据分析:针对个别属性的实例分析。提供有关属性的各种信息,如值范围,离散值及其频率,空值的发生,数据类型,长度等。

    数据挖掘:重点关注聚类分析,异常记录检测,依赖关系,序列发现,多个属性之间的关系控制等。

    9、给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?

    10、用于处理分布式计算环境中应用程序大数据集的Apache框架有哪些?

    Hadoop和MapReduce是由Apache开发的用于处理分布式计算环境中应用程序大数据集的编程框架。

    11、腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在40亿个数当中?

    12、解释KNN插补方法是什么?

    在KNN插补中,通过使用与其值缺失的属性最相似的属性值来推断缺少的属性值。通过使用距离函数,确定两个属性的相似度。

    13、数据分析师使用的数据验证方法是什么?

    通常,数据分析师用于数据验证的方法是数据筛选和数据验证。

    14、解释应该如何处理可疑或缺失数据?

    准备提供所有可疑数据信息的验证报告。它应该提供信息,如失败的验证标准以及发生的日期和时间

    有经验的数据分析师应该检查可疑数据以确定其可接受性

    应该找出无效数据并用验证码替换

    对缺失数据进行处理,使用最佳分析策略,如删除,单一插补方法,基于模型的方法等。

    15、如何避免过拟合?

    过拟合表现在训练数据上的误差非常小,而在测试数据上误差反而增大。其原因一般是模型过于复杂,过分得去拟合数据的噪声和outliers。常见的解决办法是正则化:增大数据集,正则化

    16、解释异常值是什么?

    异常值是分析师使用的一个术语,指的是一个远远超出样本总体模式的值。有两种类型的异常值:

    Univariate

    Multivariate

    17、解释分层聚类算法是什么?

    分层聚类算法结合并划分现有的组,创建分层结构并展示组划分或合并的顺序。

    18、解释K均值算法是什么?

    K均值是一种著名的分区方法。对象被分类为属于K个组中的一个,k是先验选择的。

    在K均值算法中:

    簇是球形的:簇中的数据点以该簇为中心

    簇的方差/扩展是相似的:每个数据点属于最接近的簇

    19、数据分析师所需掌握的关键技能是什么?

    数据科学家必须具备以下技能:

    数据库知识

    数据库管理

    数据混合

    数据查询

    数据操作

    预测分析

    基本描述性统计

    预测建模

    高级分析

    大数据知识

    大数据分析

    非结构化数据分析

    机器学习

    演示技巧

    数据可视化

    报告设计

    20、解释协同过滤是什么?

    协同过滤是一种基于用户行为数据创建推荐系统的简单算法。协同过滤最重要的组件是用户对项目的兴趣。

    协同过滤一个很好的例子就是购物网站上出现的类似“为您推荐”的模块,该模块通常会获取用户的浏览记录信息,以弹出用户可能喜欢或需要的商品。

    21、大数据中通常会使用到哪些工具?

    大数据中使用的工具包括:

    Hadoop

    Hive

    Pig

    Flume

    Mahout

    Sqoop

    22、解释什么是KPI,实验设计和80/20规则?

    关键绩效指标(KPI):它代表关键绩效指标(Key Performance Indicator),它是关于业务流程的报告或图表

    实验设计:这是用于分解数据,采样和建立数据以进行统计分析的初始过程

    80/20规则:这意味着你收入的80%来自客户的20%

    23、解释Map Reduce是什么?

    Map-Reduce是一个处理大型数据集的框架,可以将它们分解成子集,在不同的服务器上处理每个子集,然后混合每个子集上获得的结果。

    24、解释聚类是什么?聚类算法的属性?

    聚类是一种应用于数据的分类方法。聚类算法将数据集划分为自然组或集群。

    聚类算法的属性是:

    Hierarchical or flat

    Iterative

    Hard and soft

    Disjunctive

    25、对数据分析师有用的统计方法是什么?

    对数据科学家有用的统计方法是

    贝叶斯方法

    马尔科夫过程

    空间和集群进程

    统计数据,百分位数,异常值检测

    计算技巧等

    简单的算法

    数学优化

    26、时间序列分析是什么?

    时间序列分析可以在频域和时域两个域中完成。在时间序列分析中,可以通过指数平滑,对数线性回归等各种方法分析数据,来预测特定过程输出。

    27、解释空间自相关分析是什么?

    空间自相关分析是地理空间分析的常用形式。它由一系列为不同空间关系计算的估计自相关系数组成。当原始数据表示为距离而不是单个点的值时,它可以用于构建基于距离的数据相关图。

    28、散列表是什么?散列表冲突是什么?如何避免?

    在计算中,哈希表(散列表)是键值对的映射,这是一个用于实现关联数组的数据结构。它使用散列函数来计算一个时隙阵列的索引,从中可以获取所需的值。

    当两个不同的键散列到相同的值时,发生散列表冲突。两个数据不能存储在阵列的同一个插槽中。

    为了避免散列表碰撞,有很多技巧,这里列出两个:

    分离链接:它使用数据结构来存储散列到同一个插槽的多个项目。

    再探测:在找到查找位置的index的index-1,index+1位置查找,index-2,index+2查找,依次类推。这种方法称为线性再探测。

    29、解释 imputation是什么?列出不同类型的插补技术?哪种插补方法更有利?

    在插补过程中,我们用替代值替换丢失的数据。插补技术涉及的类型有:

    单一插补

    热点插补:从随机选择的类似记录中推断缺失值

    冷却板插补:与热点插补相同,但更先进,从其他数据集中选择供体

    平均估算:在所有其他情况下,用该变量的平均值代替缺失值

    回归插补:用基于其他变量的变量预测值替换缺失值

    随机回归:与回归插补一样,但它将平均回归方差加入到回归估计中

    多重插补:与单个插补不同,多重插补会多次估计值

    虽然单一插补法被广泛使用,但并不能反映随机丢失数据所造成的不确定性。因此,在数据丢失的情况下,多重插补更有利。

    30、解释N-gram是什么?

    N-gram是来自给定序列文本或语音的n个项目的连续序列。这是一种以(n-1)形式预测下一个项目的概率语言模型。

  • ?

    EXCEL数据分析师常用操作技巧

    庞翠绿

    展开

    快捷键

    Excel的快捷键很多,以下主要是能提高效率。

    Ctrl+方向键,对单元格光标快速移动,移动到数据边缘(空格位置)。

    Ctrl+Shift+方向键,对单元格快读框选,选择到数据边缘(空格位置)。

    Ctrl+空格键,选定整列。

    Shift+空格键,选定整行。

    Ctrl+A,选择整张表。

    Alt+Enter,换行。

    Ctrl+Enter,以当前单元格为始,往下填充数据和函数。

    Ctrl+S,快读保存。

    Ctrl+Z,撤回当前操作。

    如果是效率达人,可以学习更多快捷键。Mac用户的Ctrl一般需要用command替换。

    格式转换

    Excel的格式及转换很容易忽略,但格式会如影随形伴随数据分析者的一切场景。

    通常我们将Excel格式分为数值、文本、时间。

    数值常见整数型 Int和小数/浮点型 Float。两者的界限很模糊。

    文本分为中文和英文,存储字节,字符长度不同。

    时间格式在Excel中可以和数值直接互换,也能用加减法进行天数换算。

    时间格式有不同表达。例如2016年11月11日,2016/11/11,2016-11-11等。当数据源多就会变得混乱。我们可以用自定义格式规范时间。

    数组

    数组很多人都不会用到,甚至不知道有这个功能。。

    数组由多个元素组成。普通函数的计算结果是一个值,数组类函数的计算结果返回多个值。

    数组用大括号表示,当函数中使用到数组,应该用Ctrl+Shift+Enter输入,不然会报错。

    先看数组的最基础使用。选择A1

    1区域,输入={1,2,3,4}。记住是大括号。然后Ctrl+Shift+Enter。我们发现数组里的四个值被分别传到四个单元格中,这是数组的独有用法。

    我们再来看一下数组和函数的应用。利用{},我们能做到1匹配a,2匹配b,3匹配c。也就是一一对应。专业说法是Mapping。

    =lookup(查找值,{1,2,3},{"a","b","c"})

    分列

    Excel可以将多个单元格的内容合并,但是不擅长拆分。分列功能可以将某一列按照特定规则拆分。常常用来进行数据清洗。

    上文我有一列地区的数据,我想要将市和区分成两列。我们可以用mid和find函数查找市截取字符。但最快的做法就是用“市”分列。

    合并单元个格

    单元格作为报表整理使用,除非是最终输出格式,例如打印。否则不要随意合并单元格。

    一旦使用合并单元格,绝大多数函数都不能正常使用,影响批量的数据处理和格式转换。合并单元格也会造成Python和SQL的读取错误。

    数据透视表

    数据透视表的主要功能是将数据聚合,按照各子段进行sum( ),count( )的运算。

    下图我选择想要计算的数据,然后点击创建透视表。

    此时会新建一个Sheet,这是数据透视表的优点,将原始数据和汇总计算数据分离。

    数据透视表的核心思想是聚合运算,将字段名相同的数据聚合起来,所谓数以类分。

    列和行的设置,则是按不同轴向展现数据。简单说,你想要什么结构的报表,就用什么样的拖拽方式。

    删除重复项

    一种数据清洗和检验的快速方式。想要验证某一列有多少个唯一值,或者数据清洗,都可以使用。

    条件格式

    条件格式可以当作数据可视化的应用。如果我们要使用函数在大量数据中找出前三的值,可能会用到rank( )函数,排序,然后过滤出1,2,3。

    用条件格式则是另外一种快速方法,直接用颜色标出,非常直观。

    冻结首行首列

    Excel的首行一般是各字段名Header,俗称表头,当行数和列数过多的时候,观察数据比较麻烦。我们可以通过固定住首行,方便浏览和操作。

    Header是一个较为重要的概念。在Python和R中,read_csv函数,会有一个专门的参数header=true,来判断是否读取表头作为columns的名字。

    自定义下拉菜单(数据有效性)

    数据有效性是一种约束,针对单元格限制其输入,也就是让其只能固定几个值。下拉菜单是一种高阶应用,通过允许下拉箭头即可。

    自定义名称

    自定义名称是一个很好用的技巧,我们可以为一个区域,变量、或者数组定义一个名称。后续要经常使用的话,直接引用即可,无需再次定位。这是复用的概念。

    我们将A1:A3区域命名为NUM

    直接使用=sum(NUM) ,等价于sum(A1:A3)。

    查找公式错误

    公式报错也不知道错在哪里的时候可以使用,尤其是各类IF嵌套或者多表关联,逻辑复杂时。查找公式错误是逐步运算的,方便定位。

    分组和分级显示

    分组和分级显示,常用在报表中,在报表行数多到一定程度时,通过分组达到快速切换和隐藏的目的。越是专业度的报表(咨询、财务等),越可以学习这块。在数据菜单下。

    分析工具库

    分析工具库是高阶分析的利器,包含很多统计计算,检验功能等工具。Excel是默认不安装的,要安装需要加载项,在工具菜单下(不同版本安装方式会有一点小差异)。

    分析工具库是统计包,规划求解是计算最优解,类似决策树。

    内容来源:网络整理

    百家号-【袁帅数据分析运营】运营者:袁帅,互联网数据分析运营实践者。会展业信息化、数字化领域专家。认证数据分析师、网络营销师、SEM搜索引擎营销师、SEO工程师、电子商务职业经理人。

数据分析excel练习题

所有视频需要登录后,才能观看

请先登录您的帐号,即可完整播放,如果您尚未注册帐号,请先点击注册。

img

在线咨询

建站在线咨询

img

微信咨询

扫一扫添加
动力姐姐微信

img
img

TOP