中企动力 > 商学院 > excel数据分析练习题
  • ?

    Excel数据分析包含哪些知识

    章中道

    展开

    相信大家对即将讲述的数据分析内容很感兴趣,想知道Excel数据分析包含哪些知识?本文就言简意赅地后面的系列文章会涉及到的一些内容,在这里进行一下简单的概括,大致分为八大部分分别如下:

    第一部分引入数据挖掘的概念。简要介绍什么是数据挖掘,介绍Excel强大的数据挖掘功能,excel不支持的功能需要使用“加载宏”。

    第二部分介绍简单的数据挖掘和问卷调查;介绍最基本的数据挖掘方法,即利用“平均数”这种最简单的数据统计模型,分析身边的数据或少量数据,介绍问卷调查这种收集数据的常用手段的设计技巧。通过预测商品预期价格。证明从少量样本中也能提取重要信息。

    第三部融入案例预估二手车价格,介绍使信用回归分析进行预测和因子分析的知识,多重回归分析是预估数值和分析因子时非常有效的统计方法,是多变量分析中最常用的统计方法之一.本章以“拍卖行的二手车数据”为例对其进行解说。数据包含定性数据和定量数据,统称为“混合型数据”、经常出现在商务领域中。

    第四部分内容涉及求最优化的问题“规划求解”。Excel支持“规划求解”这个强大的工具。本章介绍用“规划求解”求最优化问题的方法。经营管理中经常遇到如何利用有限的资源,实现营业额和利润最大化,以及费用和成本最小化的问题.用一次方程表示约束条件和目标叫做线性规划,求解方法叫做线性规划法。 “规划求解”不仅适合线性规划法,也适合非线性规划法。还支持整数规划法(这些统称为数理规划法或最优化规划法).本章通过具体实例说明“规划求解”的使用方法。

    第五部分一起来学习分析交叉表,介绍用交叉表判断属性(年龄、性别、职业等)是否有差异的方法。用Excel的函数功能求解;用大量实例详细说明。

    第六部分会通过开发畅销产品的概念组合的案例介绍联合分析,消费者选择或决定购买商品时最重视什么?若能预知消费者重视的内容,就能开发山非常畅销的产品。“联合分析”是以“开发畅销产品的概念组合”为目的。为了把把握消费者和巾场的动向,被广泛运用在市场营销领域中的一种分析方法。计多企业都采用这种调查方法.联合分析也可以用Excel数据分析。

    第七部分通过软件故障何时了的案例,来介绍用规划求解制作生长曲线,预估故障总数,生长曲线可以根据初始数据对商品的需求趋势,未来的人口数量和知识的掌握程度等的变化结果进行预测。本章用规划求解得出最优生长曲线。介绍预测软件停止发生故障的时间的方法。

    最后一部分就也很有趣,是经典的求最优投资组合问题。近年来,对股票感兴趣的人越来越多.投资者最关心资产的运营安全。大部分人都希望:(a)收益越高越好(b)风险越低越好.但是,鱼与熊掌难以兼得。投贤中最基础的理论是“高风险、高收益”,“低风险、低收益”。本章介绍能够兼得鱼与熊掌的“投资组合”方法。即将资产划分成几部分,使各部分之间的正负变动相抵消,尽量降低投资风险。

    以上就是Excel数据分析包含哪些知识的一个概要介绍,当然内容远远不止这些,在接下来的系列精彩文章会运用大量实例介绍了许多数据挖掘的方法。小编希望通过普及这些方法,使所有人都能够将其灵活运用到自己的工作或研究中.这将是我们最大的愿望

  • ?

    简单几步掌握Excel数据统计分析必备功能-数据透视表

    中道

    展开

    上一篇给大家分享了一下筛选功能的使用,特别要注意不能随意复制粘贴的原因和解决办法。有兴趣的朋友们可以点击或关注百家号,进去查看历史文章。

    那么,今天给大家分享下EXCEL透视表功能的简单使用。通常情况下,我们需要做批量数据的统计、用excel出图表等等的时候,需要计数或者求和的结果作展示的时候都会用到。可以说是在大数据分析以及展示结果的时候,所必须会使用到的一个功能。

    在此,让我们一起通过一个实例来看一下,excel数据透视表的具体使用方法。只需要简单几步,就可以完成一个简单的数据透视!

    首先,我们打开一个要处理的EXCEL,比如需要统计各部门总工资。如下图的数据。通过1月到5月每个人的工资记录,来计算出部门工资的总数及每个月的走势。

    第一步:选定A列到H列,即包含所有数据的列。

    第二步:点击插入-数据透视表,出现一个创建数据透视表的小窗口,直接点击确定。

    此时出现了一个新的sheet页,如下图。这里为了方便大家看全,我把表格横向缩小到了一起。实际上数据透视表字段是在EXCEL最右侧。

    第三步:新sheet页的最右侧数据透视表字段,有一个选择要添加到报表的字段,可以看到原始表格的标题列。继续往下看,有四个区域,分别为筛选器,列,行,值。我们把月份点住,拖动到列的区域中。

    再分别把部门、姓名拖动到行,部门在上。最后把工资拖动到值。

    第四步:值里边默认是计数项,我们需要修改一下,工资是以求和来统计。点击计数项:工资,会出现值字段设置。打开后,选择求和,然后点击确定。

    第五步:此时已经可以看到表中的数据都已经出现,每个部门每个人1月到5月工资以及总计的工资。可以点击技术部、科研部、运营部前边的-号,代表隐藏姓名;最后一列的总计,每一行代表这一行数据的总计,比如第一行代表技术部1月到5月的总计工资数目;最后一行的总计,每一列代表的是这一列数据的总计,比如1月的那一列代表1月各个部门的总计工资。这样就满足我们的需求了,可以看到每个部门在每个月以及合计的工资数目。

    习惯而言,统计的数据都喜欢有高低顺序来浏览,方便一眼看出哪个部门的工资总额高低。我们可以再点击一下总计那列,然后点击排序,选择降序排列。这样就可以看到一个按高到低排序的工资图表了。

    好了,本篇就给大家讲到这里,大家可以自己试着随意在四个区域里,把其他的标题也拖进去,看看会出现什么变化?其实看似枯燥的Excel工具也有非常有趣的一面,更多的技巧就留给大家自己开发吧!有什么问题欢迎留言给我们哦!

  • ?

    Excel的作用之一:数据分析,做运营人员要懂点

    易真

    展开

      随着数据量的增大,数据统计分析的计算量和复杂性也随之剧增,所以需要借助各种统计分析软件来提高运算效率与分析准确性。

      Excel也提供一组数据分析工具,包含常用的数据统计分析工具,能够满足基本的数据分析需求。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适宜的统计或工程函数,在输出表格中显示相应的结果,某些工具在生成输出表格时还能同时生成图表。

      一、常用的函数

      1、Vlooup():它可以帮助你在表格中搜索并返回相应的值。让我们来看看下面Policy表和Customer表。在Policy表中,我们需要根据共同字段 “Customer id”将Customer表内City字段的信息匹配到Policy表中。这时,我们可以使用Vlookup()函数来执行这项任务。

      2、CONCATINATE():这个函数可以将两个或更多单元格的内容进行联接并存入到一个单元格中。例如:我们希望通过联接Host Name和Request path字段来创建一个新的URL字段。

      3、LEN()-这个公式可以以数字的形式返回单元格内数据的长度,包括空格和特殊符号。

      4、LOWER(), UPPER() and PROPER()—这三个函数用以改变单元格内容的小写、大写以及首字母大写(即每个单词的第一个字母)。

      5、TRIM():这是一个简单方便的函数,可以被用于清洗具有前缀或后缀的文本内容。通常,当你将数据库中的数据进行转储时,这些正在处理的文本数据将会保留字符串内部作为词与词之间分隔的空格。并且,如果你对这些内容不进行处理,后面的分析中将产生很多麻烦。

      二、由数据得出结论

      1. 数据透视表:每当你在处理公司的数据时,你需要从“北区分公司贡献的收入是多少?”或“客户购买产品A订单的平均价格是多少?”以及许多类似的其它问题中寻找答案。

    创建数据透视表的方法: 第一步:点击数据列表内的任何区域,选择:插入—数据透视表。EXCEL将会自动选择包含数据的区域,包括标题名称。如果系统自动选择的区域不正确,则可人为的进行修改。建议将数据透视表创建到新的工作表,点击New Worksheet(新工作表),然后点击OK。

    第二步:现在,你可以看到数据透视表的选项板了,包含了所有已选的字段。你要做的就是把他们放在选项板的过滤器中,就可以看到在左边生成相应的数据透视表。

    从上图可以看到,我们将“Region”放入行,“Productid”放入列中,“Premium”放入值中。现在,数据透视表中展示了“Premium”按照不同区域、不同产品费用的汇总情况。你也可以选择计数、平均值、最小值、最大值以及其他的统计指标。

    2.创建图表:在EXCEL里面创建一个图表,你只要选择相应的数据,然后按F11,就会自动生成系统默认的图表。除此之外,你可以手工改变不同的图表类型。如果你倾向于在当前工作表中生成图表,可以按ALT+F1,而不是F11。

    当然,在任何一种情况下,只要你创建了图表,就可以通过定义特定数据源来展示期望的信息。

    三、数据清洗

    1.删除重复值:EXCEL有内置的功能,可以删除表中的重复值。它可以删除所选列中所含的重复值,也就是说,如果选择了两列,就会查找两列数据的相同组合,并删除。

    如上图所示,可以看到A001 和 A002有重复的值,但是如果同时选定“ID”和“Name”列,将只会删除重复值(A002,2)。

    按照下列步骤操作可以删除重复值:选择所需数据-转到数据面板-删除重复值

    2.文本分列:假设你的数据存储在一列中,如下图所示:

    如上如所示,我们可以看到A列中单元格内容被“;”所区分。我们需要将其进行分列,建议使用EXCEL的文本分列功能。按照下面的步骤可以实现分列:1.选择A1:A62.点击:数据—分列

    上图中,有两个选项,“分隔符号”和“固定宽度”。我选择“分隔符号”是因为有分隔符“;”。如果我们希望按照宽度分列,例如:前四个字符为第一列,第五到第十个字符为第二列,则可以选择按固定宽度分列。3.点击下一步—点击“分号”,然后下一步,然后点击完成。

    评语:EXCEL作为使用最广泛的数据统计分析软件,无论你是小白还是资深用户,总会有一些东西值得你去学习。

  • ?

    Excel数据分析高手常用的技巧,您与高手就差这一步,领导都说好

    丹尼尔

    展开

    朋友们大家好,很多时候我们做表格需要对数据进行分析,面对一大堆的数据,看的眼花缭乱,别着急,学会了Excel这个技巧,我们也加入了高手的行列,涨工资还会远吗!看图说话:

    打开UC浏览器 查看更多精彩图片

    打开UC浏览器 查看更多精彩图片

    在两张表中我相信大家一定发现了不同之处,对,第一张表格数据一片,看的头都大了,第二章表格,直接把每月前两名用橙色底纹显示出来,一目了然,那么如果数据量比较大是不是很麻烦,NO,同样很简单,下面就和大家分享一下,看下图:

    打开UC浏览器 查看更多精彩图片

    选中一月数据的单元格,选择工具栏上的条件格式—项目选取规则—其他规则,然后弹出下图对话框,这里介绍下项目选取规则子菜单里面的内容,“值最大的10项”:不管有几十几百项,只突出显示值最大的十项。“值最大的10%项”:如果有100条数据,突出显示10%就是10项,如果有1000条数据,10%就是100项。后面几项意思一样,当然我们也可以自定义设置,就是最下面的“其他规则”,看下图:

    打开UC浏览器 查看更多精彩图片

    在弹出的对话框里面,排名框输入2,想显示前几名就输入几,这里我只需要前两名,所以输入2,下面的格式选择一种喜欢的颜色吧,最后点击确定,效果如下图所示:

    打开UC浏览器 查看更多精彩图片

    如图所示,一月销售量突出显示两项,后面的月份依次操作。

    关注或者收藏可以免费观看Excel全系列教程,欢迎评论吐槽,小编等你哦!

  • ?

    数据分析培训学习,怎么用Excel做数据分析

    良心

    展开

    今天科多大数据小课堂来教大家用Excel怎么做数据分析。

    现如今,各行各业的求职都需要简历包装。尤其是文职类简历,想要赢得offer,你不得在精通Excel等办公软件上下点功夫么?那么,你真的了解Excel嘛?或者,你知道用它怎么做数据分析嘛?

    所谓数据分析在手,走遍天下都不怕。而 Excel 作为最简单的办公软件,功能却不容小觑,同样可以实现分类、聚类、关联和预测来进行数据分析。这些概念听起来比较抽象,其实一点都不难,今日文章直接来一波干货,从具体操作开始讲起。

    01 掌握基本 Excel 快捷键

    工欲善其事,必先利其器,自从笔者发现了excel快捷键,就打开了新世界的大门。 虽然都是很基础的操作,一旦运用熟练将会大幅提升效率。

    最好用的复制命令: Ctrl + R 向右复制 Ctrl + D 向下复制

    选择格式粘贴:Ctrl + Alt + V

    求和功能:Alt + = 然后按回车键

    格式调整:Ctrl + Shift + 7 加上外边框 Ctrl + Shift + - 去掉边框 Ctrl + Shift + 5 改成%数值格式

    视图调整及编辑: Ctrl + Shift + = 插入行 Ctrl + - 删除

    终极:开始工具栏所有的命令都可以通过 Alt - H - 调用

    Alt: 激活选项,配合选项英文字母使用

    Shift:连续选择,配合方向键,翻页键等使用; 上位键

    Ctrl:配合其他键可以执行一项命令 如Ctrl + C 复制;快速移动光标,配合方向键使用,如向右快速移动光标 (Ctrl + →)

    02 数据收集

    在数据分析之前,首先需要找到可靠的数据源。国内的公司数据可以在 wind 上下载,宏观数据可以在国家统计局上找到,而国外比较常用的网站有 SEC,WRDS (Wharton Research Data Services)。

    需要注意的是,原始数据一般保留不做处理,通过 Excel 或其他编程软件做后续处理。

    03 数据清洗与筛选等基础操作

    杂乱无章的原始数据是难以分辨的,因此需要对海量数据进行清洗和筛选才能找出其中的规律。

    常见的方法有如下几种:

    运用描述性统计命令观察数据的离散程度等基本情况:通过添加“分析工具库”加载项找到数据-数据分析-描述统计,可以得到这组数据的中位数、众数、峰度、偏度等基本指标,观察这组数据的特征。此外,数据分析中还有方差分析等其他命令。

    运用 VLOOKUP 将数据合理分组,收放自如:VLOOKUP 函数是 Excel 中的一个纵向查找函数,可以用来核对数据,多个表格之间快速导入数据等函数功能。功能是按列查找,最终返回该列所需查询列序所对应的值。比如,我们导出公司的原始报表后,可以通过 VLOOKUP 函数将报表中的数字一一导入到新的管理用的财务报表,这样既不会破坏原始数据,又可以建立良好的模板,方便后续使用。VLOOKUP 的四个参数用通俗的话来说,就是(要找谁,要在哪里找,要找哪一列内容,是精确的还是模糊的)

    运用数据透视表分组求平均数、标准差、计数等多个指标:数据透视表是一个非常容易上手的分组工具,对于简单的数据处理甚至在便捷程度上打败了很多编程工具呢。比如要对每个省份的所有专业分数线求一个平均数,将年份和省份轻松地拖动到对应的列和行,就可以得到结果啦。试想,如果在原始表格中手动一个一个求平均数该有多麻烦。

    运用条件函数计算融资缺口,检查配平:比如在预测财务报表时,我们常常要判断资产是否等于负债+所有者权益。此时可以用 IF 函数 (资产=负债+所有者权益,TRUE,FALSE)如果是配平的,直接返回 TRUE。此外,还有一些函数如 IRR 可以计算项目的投资回报率。

    04 挖掘数据背后的规律

    在完成了数据清洗和筛选之后,我们还是要落实到数据分析的重点,也就是数据背后的逻辑。

    首先我们可以采用画图的方式。画图可以非常直观地佐证结论,不同情况下要用不同类型的图,比如饼图显示比重,折线图发现趋势,还可以采用叠加多种形式的图。

    下面这张图就是一个数据分析应用的经典例子,显示的是一个教育公司在扩张过程中,学习中心同比增速与营业毛利率的关系。试想,如果只是一堆数据放在你的面前,可能根本无法发现其中的规律,但是通过下图,我们可以发现,学习中心的同比增速一般与营业毛利率呈反向关系,这也就意味着,扩张的过程必然要伴随利润下降的阵痛,这样的数据分析就是有效的,可以为公司的扩张战略提供参考依据。

    另一种比较常见的数据分析应用就是从历史预测未来。比如如果公司过去几年的存货周转率都比较稳定,可以以此来预测未来几年的存货周转率。又或者通过线性回归发现某两个指标之间过去的线性关系,并以此来预测未来走势,这个操作方法可以用散点图——添加趋势线——选择回归类型(线性)来得出简单的结论。

    说了这么多,列举 Excel 数据分析的一个常见运用。

    大家知道,金融领域的工作往往要考察搭建财务模型的技巧,而这个模型就是完完全全从 0 开始通过 Excel 制作的。

    1. 计算各项指标了解公司的历史经营状态。这一步不仅可以看出公司在盈利能力、成长性、营运能力等多个维度的历史发展状况,还可以与同行业的可比公司进行比较,看出这个公司所处的地位(比如公司的应收账款周转率可以直观看出公司是强势地位还是弱势地位,应收账款周转率如果显著低于同业,那就说明应收账款很容易收到,议价能力强)。

    2. 预测公司未来的盈利状况,并通过财务报表的勾稽关系完善财务模型。这一步一定要打开 Excel 的自动迭代功能(选项——公式——启用迭代计算),具体的财务方面知识在此就不再详述。

    3. 现金流 DCF 模型及敏感性分析。以之前制作的财务报表为基础,就可以测算出公司未来的自由现金流,在计算出公司资本成本的前提下对现金流进行贴现得到公司绝对估值。其中,基于不同的资本成本和公司永续增长率还可以做成敏感性分析的表格,得出在不同情形下公司的估值。这就需要使用Excel的数据——模拟运算——模拟运算表功能了。如下图所示,将输入引用行的单元格和引用列的单元格分别设为 Equity Valuation 中的永续增长率和Wacc对应的数值,就可以实现啦。

    以上这些介绍都只是冰山一角,Excel的功能博大精深,加上VBA等高端操作将会释放更大的威力。配合现当代大数据盛行时期。想要深入,就还得不断学习!

  • ?

    Top30数据分析师常见面试题(附答案)!

    郝雅山

    展开

    【IT168 评论】这是一个用数据说话的时代,也是一个依靠数据竞争的时代。各大互联网公司都在不断完善自己的数据分析团队,数据分析师的薪酬也是水涨船高。业内人士透露,应届毕业生的平均薪资大概在6K左右,1至3年经验的大概在10K到20K之间,5至10年经验的大概在25K以上。薪资还是十分诱人的,那么,如何快速成长为一名年薪百万的数据分析师呢?快来看看,以下30道数据分析相关面试题,你会多少?

    1、分析数据还要写java代码是不是效率有点低?

    2、成为一名数据分析师需要具备哪些技能?

    要成为一名数据分析师,需要掌握丰富的报告软件包(Business Objects),编程语言(XML,Javascript或ETL框架),数据库(SQL,SQLite等);能够准确分析、组织、收集或传播数据;掌握数据库设计,数据模型,数据挖掘等方面的技术知识以及分析大型数据集(SAS,Excel,SPSS等)的统计软件包知识。

    3、分析项目的各个步骤是什么?

    分析项目的各个步骤包括:

    ·问题定义

    ·数据挖掘

    数据准备

    模型化

    数据认证

    实施跟踪

    4、分析的结果数据特别大,在线请求这些结果数据扛不住了,咋搞?

    5、列出数据清理的最佳实践?

    一些数据清理的最佳实践包括:

    按不同的属性排序数据

    对于大数据集,逐步清理并改进数据,直到获得良好的数据质量

    对大型数据集,可以先将其分解为小数据集,使用更少的数据将增加迭代速度

    要处理常见的清理任务,请创建一组实用程序函数/工具/脚本。它可能包括基于CSV文件或SQL数据库重映射值,或者正则表达式搜索和替换,消除所有不匹配正则表达式的值

    如果在数据清理方面存在问题,请按照估计的频率进行安排并解决问题

    分析每列的汇总统计数据(标准差,均值,缺失值的数量)

    保持对每一个清理操作的跟踪,以便可以根据需要更改或删除操作

    6、海量日志数据,提取出某日访问百度次数最多的那个IP。

    7、可用于数据分析的一些最佳工具清单有什么?

    Tableau

    RapidMiner

    OpenRefine

    KNIME

    Google Search Operators

    Solver

    NodeXL

    io

    Wolfram Alpha’s

    Google Fusion tables

    8、数据挖掘和数据分析之间的区别是什么?

    数据挖掘和数据分析之间的区别在于:

    数据分析:针对个别属性的实例分析。提供有关属性的各种信息,如值范围,离散值及其频率,空值的发生,数据类型,长度等。

    数据挖掘:重点关注聚类分析,异常记录检测,依赖关系,序列发现,多个属性之间的关系控制等。

    9、给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?

    10、用于处理分布式计算环境中应用程序大数据集的Apache框架有哪些?

    Hadoop和MapReduce是由Apache开发的用于处理分布式计算环境中应用程序大数据集的编程框架。

    11、腾讯面试题:给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在40亿个数当中?

    12、解释KNN插补方法是什么?

    在KNN插补中,通过使用与其值缺失的属性最相似的属性值来推断缺少的属性值。通过使用距离函数,确定两个属性的相似度。

    13、数据分析师使用的数据验证方法是什么?

    通常,数据分析师用于数据验证的方法是数据筛选和数据验证。

    14、解释应该如何处理可疑或缺失数据?

    准备提供所有可疑数据信息的验证报告。它应该提供信息,如失败的验证标准以及发生的日期和时间

    有经验的数据分析师应该检查可疑数据以确定其可接受性

    应该找出无效数据并用验证码替换

    对缺失数据进行处理,使用最佳分析策略,如删除,单一插补方法,基于模型的方法等。

    15、如何避免过拟合?

    过拟合表现在训练数据上的误差非常小,而在测试数据上误差反而增大。其原因一般是模型过于复杂,过分得去拟合数据的噪声和outliers。常见的解决办法是正则化:增大数据集,正则化

    16、解释异常值是什么?

    异常值是分析师使用的一个术语,指的是一个远远超出样本总体模式的值。有两种类型的异常值:

    Univariate

    Multivariate

    17、解释分层聚类算法是什么?

    分层聚类算法结合并划分现有的组,创建分层结构并展示组划分或合并的顺序。

    18、解释K均值算法是什么?

    K均值是一种著名的分区方法。对象被分类为属于K个组中的一个,k是先验选择的。

    在K均值算法中:

    簇是球形的:簇中的数据点以该簇为中心

    簇的方差/扩展是相似的:每个数据点属于最接近的簇

    19、数据分析师所需掌握的关键技能是什么?

    数据科学家必须具备以下技能:

    数据库知识

    数据库管理

    数据混合

    数据查询

    数据操作

    预测分析

    基本描述性统计

    预测建模

    高级分析

    大数据知识

    大数据分析

    非结构化数据分析

    机器学习

    演示技巧

    数据可视化

    报告设计

    20、解释协同过滤是什么?

    协同过滤是一种基于用户行为数据创建推荐系统的简单算法。协同过滤最重要的组件是用户对项目的兴趣。

    协同过滤一个很好的例子就是购物网站上出现的类似“为您推荐”的模块,该模块通常会获取用户的浏览记录信息,以弹出用户可能喜欢或需要的商品。

    21、大数据中通常会使用到哪些工具?

    大数据中使用的工具包括:

    Hadoop

    Hive

    Pig

    Flume

    Mahout

    Sqoop

    22、解释什么是KPI,实验设计和80/20规则?

    关键绩效指标(KPI):它代表关键绩效指标(Key Performance Indicator),它是关于业务流程的报告或图表

    实验设计:这是用于分解数据,采样和建立数据以进行统计分析的初始过程

    80/20规则:这意味着你收入的80%来自客户的20%

    23、解释Map Reduce是什么?

    Map-Reduce是一个处理大型数据集的框架,可以将它们分解成子集,在不同的服务器上处理每个子集,然后混合每个子集上获得的结果。

    24、解释聚类是什么?聚类算法的属性?

    聚类是一种应用于数据的分类方法。聚类算法将数据集划分为自然组或集群。

    聚类算法的属性是:

    Hierarchical or flat

    Iterative

    Hard and soft

    Disjunctive

    25、对数据分析师有用的统计方法是什么?

    对数据科学家有用的统计方法是

    贝叶斯方法

    马尔科夫过程

    空间和集群进程

    统计数据,百分位数,异常值检测

    计算技巧等

    简单的算法

    数学优化

    26、时间序列分析是什么?

    时间序列分析可以在频域和时域两个域中完成。在时间序列分析中,可以通过指数平滑,对数线性回归等各种方法分析数据,来预测特定过程输出。

    27、解释空间自相关分析是什么?

    空间自相关分析是地理空间分析的常用形式。它由一系列为不同空间关系计算的估计自相关系数组成。当原始数据表示为距离而不是单个点的值时,它可以用于构建基于距离的数据相关图。

    28、散列表是什么?散列表冲突是什么?如何避免?

    在计算中,哈希表(散列表)是键值对的映射,这是一个用于实现关联数组的数据结构。它使用散列函数来计算一个时隙阵列的索引,从中可以获取所需的值。

    当两个不同的键散列到相同的值时,发生散列表冲突。两个数据不能存储在阵列的同一个插槽中。

    为了避免散列表碰撞,有很多技巧,这里列出两个:

    分离链接:它使用数据结构来存储散列到同一个插槽的多个项目。

    再探测:在找到查找位置的index的index-1,index+1位置查找,index-2,index+2查找,依次类推。这种方法称为线性再探测。

    29、解释 imputation是什么?列出不同类型的插补技术?哪种插补方法更有利?

    在插补过程中,我们用替代值替换丢失的数据。插补技术涉及的类型有:

    单一插补

    热点插补:从随机选择的类似记录中推断缺失值

    冷却板插补:与热点插补相同,但更先进,从其他数据集中选择供体

    平均估算:在所有其他情况下,用该变量的平均值代替缺失值

    回归插补:用基于其他变量的变量预测值替换缺失值

    随机回归:与回归插补一样,但它将平均回归方差加入到回归估计中

    多重插补:与单个插补不同,多重插补会多次估计值

    虽然单一插补法被广泛使用,但并不能反映随机丢失数据所造成的不确定性。因此,在数据丢失的情况下,多重插补更有利。

    30、解释N-gram是什么?

    N-gram是来自给定序列文本或语音的n个项目的连续序列。这是一种以(n-1)形式预测下一个项目的概率语言模型。

  • ?

    怎么样Excel做数据分析?这几个步骤帮到你

    奢求

    展开

    每个人都会有机会进行数据展示,为什么别人展示永远获得正视,而我的展示永远只有自己愿意去看,别人在看手机?那怎样做数据图表分析呢请看以下步骤:

    如何对表格进行修饰,本次小编带来两个技巧,一是使用“套用表格格式”,和使用“条件格式”。二是带领大家学会养成修饰表格的思维。

    第一步是对表格进行粗略的修饰调整,思维:行高、列宽、对齐方式、表格线等;

    使用“套用表格格式”、“条件格式”之后看数据不再枯燥无味,而且还更有看头。“条件格式”可以将筛选条件转换为颜色可视化,从而达到一目了然的效果。

    第一个技巧,①“套用表格格式”。方法:任一单元格→开始→套用表格格式。

    ②“条件格式”,方法:选中单元格区域→开始→条件格式。

    条件1:高于平均值

    条件2:数据条

    条件3:色阶

    第二个技巧:养成修饰图表的思维。这次举例柱形图的修饰例子,其他希望大家动用类似的方法进行模拟实践。

    步骤一:根据销售数据建立柱状图,建立方法可参考。选择数据源→插入→柱状图→选择数据源→编辑坐标

    步骤二:添加辅助线。选择数据源→→添加→点击柱体右键,设置数据系列格式→次坐标轴→选中柱体,右键更改图表类型→折线图。

    希望回答对你能有所帮助,如果觉得不错就来点个赞或关注吧,感谢各位了!

  • ?

    EXCEL数据分析师常用操作技巧

    访天

    展开

    快捷键

    Excel的快捷键很多,以下主要是能提高效率。

    Ctrl+方向键,对单元格光标快速移动,移动到数据边缘(空格位置)。

    Ctrl+Shift+方向键,对单元格快读框选,选择到数据边缘(空格位置)。

    Ctrl+空格键,选定整列。

    Shift+空格键,选定整行。

    Ctrl+A,选择整张表。

    Alt+Enter,换行。

    Ctrl+Enter,以当前单元格为始,往下填充数据和函数。

    Ctrl+S,快读保存。

    Ctrl+Z,撤回当前操作。

    如果是效率达人,可以学习更多快捷键。Mac用户的Ctrl一般需要用command替换。

    格式转换

    Excel的格式及转换很容易忽略,但格式会如影随形伴随数据分析者的一切场景。

    通常我们将Excel格式分为数值、文本、时间。

    数值常见整数型 Int和小数/浮点型 Float。两者的界限很模糊。

    文本分为中文和英文,存储字节,字符长度不同。

    时间格式在Excel中可以和数值直接互换,也能用加减法进行天数换算。

    时间格式有不同表达。例如2016年11月11日,2016/11/11,2016-11-11等。当数据源多就会变得混乱。我们可以用自定义格式规范时间。

    数组

    数组很多人都不会用到,甚至不知道有这个功能。。

    数组由多个元素组成。普通函数的计算结果是一个值,数组类函数的计算结果返回多个值。

    数组用大括号表示,当函数中使用到数组,应该用Ctrl+Shift+Enter输入,不然会报错。

    先看数组的最基础使用。选择A1

    1区域,输入={1,2,3,4}。记住是大括号。然后Ctrl+Shift+Enter。我们发现数组里的四个值被分别传到四个单元格中,这是数组的独有用法。

    我们再来看一下数组和函数的应用。利用{},我们能做到1匹配a,2匹配b,3匹配c。也就是一一对应。专业说法是Mapping。

    =lookup(查找值,{1,2,3},{"a","b","c"})

    分列

    Excel可以将多个单元格的内容合并,但是不擅长拆分。分列功能可以将某一列按照特定规则拆分。常常用来进行数据清洗。

    上文我有一列地区的数据,我想要将市和区分成两列。我们可以用mid和find函数查找市截取字符。但最快的做法就是用“市”分列。

    合并单元个格

    单元格作为报表整理使用,除非是最终输出格式,例如打印。否则不要随意合并单元格。

    一旦使用合并单元格,绝大多数函数都不能正常使用,影响批量的数据处理和格式转换。合并单元格也会造成Python和SQL的读取错误。

    数据透视表

    数据透视表的主要功能是将数据聚合,按照各子段进行sum( ),count( )的运算。

    下图我选择想要计算的数据,然后点击创建透视表。

    此时会新建一个Sheet,这是数据透视表的优点,将原始数据和汇总计算数据分离。

    数据透视表的核心思想是聚合运算,将字段名相同的数据聚合起来,所谓数以类分。

    列和行的设置,则是按不同轴向展现数据。简单说,你想要什么结构的报表,就用什么样的拖拽方式。

    删除重复项

    一种数据清洗和检验的快速方式。想要验证某一列有多少个唯一值,或者数据清洗,都可以使用。

    条件格式

    条件格式可以当作数据可视化的应用。如果我们要使用函数在大量数据中找出前三的值,可能会用到rank( )函数,排序,然后过滤出1,2,3。

    用条件格式则是另外一种快速方法,直接用颜色标出,非常直观。

    冻结首行首列

    Excel的首行一般是各字段名Header,俗称表头,当行数和列数过多的时候,观察数据比较麻烦。我们可以通过固定住首行,方便浏览和操作。

    Header是一个较为重要的概念。在Python和R中,read_csv函数,会有一个专门的参数header=true,来判断是否读取表头作为columns的名字。

    自定义下拉菜单(数据有效性)

    数据有效性是一种约束,针对单元格限制其输入,也就是让其只能固定几个值。下拉菜单是一种高阶应用,通过允许下拉箭头即可。

    自定义名称

    自定义名称是一个很好用的技巧,我们可以为一个区域,变量、或者数组定义一个名称。后续要经常使用的话,直接引用即可,无需再次定位。这是复用的概念。

    我们将A1:A3区域命名为NUM

    直接使用=sum(NUM) ,等价于sum(A1:A3)。

    查找公式错误

    公式报错也不知道错在哪里的时候可以使用,尤其是各类IF嵌套或者多表关联,逻辑复杂时。查找公式错误是逐步运算的,方便定位。

    分组和分级显示

    分组和分级显示,常用在报表中,在报表行数多到一定程度时,通过分组达到快速切换和隐藏的目的。越是专业度的报表(咨询、财务等),越可以学习这块。在数据菜单下。

    分析工具库

    分析工具库是高阶分析的利器,包含很多统计计算,检验功能等工具。Excel是默认不安装的,要安装需要加载项,在工具菜单下(不同版本安装方式会有一点小差异)。

    分析工具库是统计包,规划求解是计算最优解,类似决策树。

    内容来源:网络整理

    百家号-【袁帅数据分析运营】运营者:袁帅,互联网数据分析运营实践者。会展业信息化、数字化领域专家。认证数据分析师、网络营销师、SEM搜索引擎营销师、SEO工程师、电子商务职业经理人。

  • ?

    Excel数据统计分析中36个小技巧

    心微颤

    展开

    1、一列数据同时除以10000

    复制10000所在单元格,选取数据区域 - 选择粘性粘贴 - 除

    2、同时冻结第1行和第1列

    选取第一列和第一行交汇处的墙角位置B2,窗口 - 冻结窗格

    3、快速把公式转换为值

    选取公式区域 - 按右键向右拖一下再拖回来 - 选取只保留数值。

    4、显示指定区域所有公式

    查找 = 替换为“ =”(空格+=号) ,即可显示工作表中所有公式

    5、同时编辑所有工作表

    全选工作表,直接编辑,会更新到所有工作表。

    6、删除重复值

    选取数据区域 - 数据 - 删除重复值

    7、显示重复值

    选取数据区域 - 开始 - 条件格式 - 显示规则 - 重复值

    8、把文本型数字转换成数值型

    选取文本数字区域,打开左上角单元格的绿三角,选取 转换为数值

    9、隐藏单元格内容

    选取要隐藏的区域 - 设置单元格格式 - 数字 - 自定义 - 输入三个分号;;;

    10、给excel文件添加密码

    文件 - 信息 - 保护工作簿 - 用密码进行加密

    11、给单元格区域添加密码

    审阅 - 允许用户编辑区域 - 添加区域和设置密码

    12、把多个单元格内容粘贴一个单元格

    复制区域 - 打开剪贴板 - 选取某个单元格 - 在编辑栏中点击剪贴板中复制的内容

    13、同时查看一个excel文件的两个工作表

    视图 - 新建窗口 - 全部重排

    14、输入分数

    先后输入 0 ,再输入 空格, 再输入分数即可

    15、强制换行

    在文字后按alt+回车键即可换到下一行

    16、删除空行

    选取A列 - Ctrl+g打开定位窗口 - 定位条件:空值 - 整行删除

    17、隔行插入空行

    在数据表旁拖动复制1~N,然后再复制序号到下面,然后按序号列排序即可。

    18、快速查找工作表

    在进度条右键菜单中选取要找的工作表即可。

    19、快速筛选

    右键菜单中 - 筛选 - 按所选单元格值进行筛选

    20、让PPT的图表随excel同步更新

    复制excel中的图表 - 在PPT界面中 - 选择性粘贴 - 粘贴链接

    21、隐藏公式

    选取公式所在区域 - 设置单元格格式 - 保护:选取隐藏 - 保护工作表

    22、行高按厘米设置

    点右下角“页面布局”按钮,行高单位即可厘米

    23、复制时保护行高列宽不变

    整行选取复制,粘贴后选取“保持列宽。

    24、输入以0开始的数字或超过15位的长数字

    先输入单引号,然后再输入数字。或先设置格式为文本再输入。

    25、全部显示超过11的长数字

    选数区域 - 设置单元格格式 - 自定义 - 输入0

    26、快速调整列宽

    选取多列,双击边线即可自动调整适合的列宽

    27、图表快速添加新系列

    复制 - 粘贴,即可给图表添加新的系列

    28、设置大于72磅的字体

    excel里的最大字并不是72磅,而是409磅。你只需要输入数字即可。

    29、设置标题行打印

    页面设置 - 工作表 - 顶端标题行

    30、不打印错误值

    页面设置 - 工作表 - 错误值打印为:空

    31、隐藏0值

    文件 - 选项 - 高级 - 去掉“显在具有零值的单元格中显示零”

    32、设置新建文件的字体和字号

    文件 - 选项 - 常规 - 新建工作簿时....

    33、快速查看函数帮助

    在公式中点击下面显示的函数名称,即可打开该函数的帮助页面。

    34、加快excel文件打开速度

    如果文件公式过多,在关闭时设置为手动,打开时会更快。

    35、按行排序

    在排序界面,点击选项,选中按行排序

    36、设置可以打印的背景图片

    在页眉中插入图片即要

    来源:网络整理

    百家号-【袁帅数据分析运营】运营者:袁帅,会展业信息化、数字化领域专家。新社汇平台联合创始人,永洪数据科学研究院MVP。认证数据分析师、网络营销师、SEM搜索引擎营销师、SEO工程师、中国电子商务职业经理人。畅销书《互联网销售宝典》联合出品人。

  • ?

    Excel数据分析表格你能够玩转吗?看看你属于哪一级

    冯蹇

    展开

    小R刚毕业,每天都在公司忙到10点半回家。

    作为室友的我,总是打趣地问他:“是不是又在公司蹭空调蹭网络,干嘛不早点回来陪我吃鸡!”

    没想到小R低下头落寞地抱怨道:“我也想早点回来,可是我真的搞不定啊!”

    原来,小R每天的工作标配就是统计数据。可同事们十几分钟就能轻松搞定的Excel表格,他经常要加几个小时班才能勉强完成。刚开始,他以为是自己不够熟练,多多练习就好了。没想到埋头苦练了半个月,他还是全组最慢的那个,每天被领导催到怀疑人生,甚至被质疑工作能力。

    没有对比就没有伤害。看着旁边妹子敲几下键盘就能轻松搞定表格,小R开始惧怕做Excel和数据统计。

    如今,几乎所有公司在招聘时都离不开这条要求:熟练使用Excel,精通数据分析者优先。

    做方案、汇报工作、数据分析、总账录入、项目进度、工作记录、写代码、帮助记忆、思维导图.......Excel几乎能解决你工作中的所有问题,它不仅仅是某一职业的必备技能,而真实涵盖所有行业:

    做行政,你要学会做考勤表;做财务,你要学会做财会报表;做销售,你要学会做销售业绩表;做运营,你要数据分析、工作汇报;做数据分析师,Excel玩得6也是最最最基本的条件.....

    大数据是眼下非常时髦的热词,同时也催生出了一些与大数据处理相关的职业,数据分析师便是其中之一。由于专业技能和量化的数据分析为客户或所在公司控制决策分析、保证利益最大化,“数据分析师”一职备受各界青睐,甚至被视为21世纪的黄金职业。

    虽然发展前景大好,但很多想要转行数据分析的小白心里多少都会有些疑惑:不会R、Python、SPSS、Tableau,是不是做不了数据分析师?

    事实上,精通Excel,对于转行数据分析来说相当重要。因为Excel拥有最大的客户群体,基本上所有的企业、个人的电脑中装的都是office,这也就意味着90%以上使用电脑的人,都会用到Excel,即便如BAT这样的企业,在处理百万级、千万级数据的时候,也会优先使用Excel。

    那么,在没有统计学、数学、计算编程等基础的情况下,如何只用Excel,成功转行成为数据分析师呢?

    这里就不得不介绍三款用Excel就可以实现数据分析的插件:Power Query(数据查询)、Power Pivot(数据建模)、Power View(数据可视化)。

    这三个模块组成了数据分析全过程,这个过程就好比烹饪过程:

    第一个模块数据查询——Power Query。与数据源直接对接,就像获取新鲜的食材,对食材进行清洗、分类、整理,使其达到准备入锅的使用状态。这一步非常重要,因为如果食材不新鲜,那么再厉害的大厨也不可能做出一道健康的美味,所以好的数据源是成功的一半。

    第二个模块是数据建模——Power Pivot。这一步是数据分析过程中最具有技术含量的核心部分。我们把数据组合起来实现不同维度的分析,就像把食物组合起来利用烹、炸、煎、炒等方式,再添加油、盐、酱、醋等调料,以烹制出想要的味道。

    但是光有味道是不够的,最后我们要呈现给顾客的是一道色、香、味俱全的菜,是否能以视觉效果吸引顾客品尝你的美味,这就要看第三个模块——Power View(数据可视化)的功力了。

    例如,如果以前你的做表是这样的 :

    那现在通过Power View几秒钟就可以做成这样:

    是不是相当神奇?!

    无论你是像小R一样的职场小白想要提高工作效率实现逆袭,还是零基础转行成为高大上的数据分析师,精通Excel可以让你彻底告别被数据搞晕的日子,实现加薪不加班!

    Excel这么重要,如何在短时间内熟练掌握呢?这有一套为你打造的Excel精品课程:容大教育《Excel速成班——数据处理与分析实战》在线课程,教你用Excel实现数据采集、数据转换和清洗、数据分析与建模等,关注容大教育IT培训机构百家号获取学习资料!

excel数据分析练习题

所有视频需要登录后,才能观看

请先登录您的帐号,即可完整播放,如果您尚未注册帐号,请先点击注册。

img

在线咨询

建站在线咨询

img

微信咨询

扫一扫添加
动力姐姐微信

img
img

TOP