- ?
超实用:通过Excel进行数据采集
玛丽亚
展开
前言
IBM大中华区总经理胡世忠曾说:数据构成了智慧地球的三大元素——智能化、互联化和物联化,而这三大元素又改变了数据来源、传送方式和利用方式,带来“大数据”这场信息社会的变革。
从上可见,时代的变革是源于对数据的利用,对企业而言,数据也同样是其发展、转型的命脉。在工作中,我的前辈不止一次地强调,数据是公司的资产,而且举足轻重。我们对待数据,一定要严谨,经得起考验,对自己的数据负责,这是一个数据人的基本要求。
数据资源
大数据时代,数据虽然很多,但是也不是随意得来的,需要利用各种渠道和方式获得。不管从哪个角度来说,数据可分为内部数据和外部数据。内部数据是企业在日积月累的经营中得来的,我们应该对这些数据挖掘、收集有价值的东西,形成企业的数据资产。内部数据重在后期的处理和分析上。
下面先说外部数据的获取方式,以及通过Excel操作来获取外部数据。
外部数据获取方式
1、专业网站看数据(某一个行业、某一件产品)2、通过收费渠道买数据(第三方数据平台等)3、通过特殊形式引数据(网站爬虫,统计网站等)4、自身积累数据(时间久、跨度长)
Excel获取外部数据
作为一个数据分析师以及想更进一步成长为数据科学家,熟练操作基本的办公软件以及SQL查询是很重要的。请看下面通过Excel获取外部数据的步骤。
第1步:打开“新建web查询”框。新建Excel工作簿,在打开的工作表中单击“数据”选项卡,然后在“获取外部数据”组中单击“自网站”按钮,如下图。
第2步:输入网址并选择要导入的表格数据。在弹出的“新建web查询”对话框中的“地址”文本框中复制粘贴上述网页的网址,然后单击“转到”,找到网站中的表格数据后单击表格左上角的箭头→,图标变成选中状态的复选框√。如下图。最后单击下方的“导入”按钮。
第3步:选择数据的放置区域。点击导入后,Excel会出现“导入数据”对话框,如下图,选中你想放置的单元格,单击“确定”开始导入。
第4步:美化导入的数据。由于导入的数据多且乱,要调整格式使数据规范,并启用冻结窗格功能方便浏览。如下图。
好了,上面就是通过Excel操作来获取网站上的外部数据,很简单吧,但网站中的数据并非都是以表格的形式呈现,现在大部分是以json格式呈现,Excel不是万能的,而且现在很多网站需要付费才能导数据(上面说过数据就是企业的资产)。
小结
希望通过上面的操作能帮助大家。如果你有什么好的意见,建议,或者有不同的看法,我都希望你留言和我们进行交流、讨论。
End.
- ?
Excel中如何快速统计一列中相同数据的个数
诗翠
展开
Excel是办公中必不可少的工具,但是我们经常会遇到一个表格中有好多数据,并且要统计出数据相同的个数,那么我们该如何做呢?
今天给大家分享一下,如何在Excel中快速统计出一列数据中相同数据的个数。如下:
在这里我们要用到sumif函数。
sumif函数是用来根据指定条件对若干单元格进行求和。(即按条件求和)
sumif函数的语法格式=sumif(range,criteria,sum_range) Sumif(条件区域,求和条件,实际求和区域),第二个求和条件参数在第一个条件区域里。
如何做呢?
1、我们在表格中将B列设置为标记,数字均为1个
2、在F列中写入函数=sumif(A:A,E2,B:B)
即条件区域是A列,E列为求和条件,B列为实际求和区域。
这样就很迅速简单的统计出来了。
- ?
Excel数据统计分析中36个小技巧
水手
展开
1、一列数据同时除以10000
复制10000所在单元格,选取数据区域 - 选择粘性粘贴 - 除
2、同时冻结第1行和第1列
选取第一列和第一行交汇处的墙角位置B2,窗口 - 冻结窗格
3、快速把公式转换为值
选取公式区域 - 按右键向右拖一下再拖回来 - 选取只保留数值。
4、显示指定区域所有公式
查找 = 替换为“ =”(空格+=号) ,即可显示工作表中所有公式
5、同时编辑所有工作表
全选工作表,直接编辑,会更新到所有工作表。
6、删除重复值
选取数据区域 - 数据 - 删除重复值
7、显示重复值
选取数据区域 - 开始 - 条件格式 - 显示规则 - 重复值
8、把文本型数字转换成数值型
选取文本数字区域,打开左上角单元格的绿三角,选取 转换为数值
9、隐藏单元格内容
选取要隐藏的区域 - 设置单元格格式 - 数字 - 自定义 - 输入三个分号;;;
10、给excel文件添加密码
文件 - 信息 - 保护工作簿 - 用密码进行加密
11、给单元格区域添加密码
审阅 - 允许用户编辑区域 - 添加区域和设置密码
12、把多个单元格内容粘贴一个单元格
复制区域 - 打开剪贴板 - 选取某个单元格 - 在编辑栏中点击剪贴板中复制的内容
13、同时查看一个excel文件的两个工作表
视图 - 新建窗口 - 全部重排
14、输入分数
先后输入 0 ,再输入 空格, 再输入分数即可
15、强制换行
在文字后按alt+回车键即可换到下一行
16、删除空行
选取A列 - Ctrl+g打开定位窗口 - 定位条件:空值 - 整行删除
17、隔行插入空行
在数据表旁拖动复制1~N,然后再复制序号到下面,然后按序号列排序即可。
18、快速查找工作表
在进度条右键菜单中选取要找的工作表即可。
19、快速筛选
右键菜单中 - 筛选 - 按所选单元格值进行筛选
20、让PPT的图表随excel同步更新
复制excel中的图表 - 在PPT界面中 - 选择性粘贴 - 粘贴链接
21、隐藏公式
选取公式所在区域 - 设置单元格格式 - 保护:选取隐藏 - 保护工作表
22、行高按厘米设置
点右下角“页面布局”按钮,行高单位即可厘米
23、复制时保护行高列宽不变
整行选取复制,粘贴后选取“保持列宽。
24、输入以0开始的数字或超过15位的长数字
先输入单引号,然后再输入数字。或先设置格式为文本再输入。
25、全部显示超过11的长数字
选数区域 - 设置单元格格式 - 自定义 - 输入0
26、快速调整列宽
选取多列,双击边线即可自动调整适合的列宽
27、图表快速添加新系列
复制 - 粘贴,即可给图表添加新的系列
28、设置大于72磅的字体
excel里的最大字并不是72磅,而是409磅。你只需要输入数字即可。
29、设置标题行打印
页面设置 - 工作表 - 顶端标题行
30、不打印错误值
页面设置 - 工作表 - 错误值打印为:空
31、隐藏0值
文件 - 选项 - 高级 - 去掉“显在具有零值的单元格中显示零”
32、设置新建文件的字体和字号
文件 - 选项 - 常规 - 新建工作簿时....
33、快速查看函数帮助
在公式中点击下面显示的函数名称,即可打开该函数的帮助页面。
34、加快excel文件打开速度
如果文件公式过多,在关闭时设置为手动,打开时会更快。
35、按行排序
在排序界面,点击选项,选中按行排序
36、设置可以打印的背景图片
在页眉中插入图片即要
来源:网络整理
百家号-【袁帅数据分析运营】运营者:袁帅,会展业信息化、数字化领域专家。新社汇平台联合创始人,永洪数据科学研究院MVP。认证数据分析师、网络营销师、SEM搜索引擎营销师、SEO工程师、中国电子商务职业经理人。畅销书《互联网销售宝典》联合出品人。
- ?
数据分析Excel、SAS、R、SPSS、Python这5大软件优势
詹妮
展开
工欲善其事,必先利其器。说起来道理大家都懂,只是到了要学习的时候就开始各种退缩。殊不知一款好的数据分析工具可以让你事半功倍,瞬间提高学习工作效率。
虽然数据分析的工具千万种,综合起来万变不离其宗。无非是数据获取、数据存储、数据管理、数据计算、数据分析、数据展示等几个方面。而SAS、R、SPSS、python、excel是被提到频率最高的数据分析工具。那么,这些工具本身到底有什么特点呢?
Excel
Excel 是微软办公套装软件的一个重要的组成部分,它可以进行各种数据的处理、统计分析和辅助决策操作,广泛地应用于管理、统计财经、金融等众多领域。
1、数据透视功能
一个数据透视表演变出10几种报表,只需吹灰之力。一个新手,只要认真使用向导1-2小时就可以马马虎虎上路。
2、统计分析
其实包含在数据透视功能之中,但是非常独特,常用的检验方式一键搞定。
3、图表功能
这几乎是Excel的独门武工,其他程序望其项背而自杀。
4、高级筛选
这是Excel提供的高级查询功能,而操作之简单。非常超值享受。
5、自动汇总功能
这个功能其他程序都有,但是Excel简便灵活。
6、高级数学计算
只要一两个函数轻松搞定
SAS软件
SAS是全球最大的软件公司之一,是由美国NORTH CAROLINA州立大学1966年开发的统计分析软件。SAS把数据存取、管理、分析和展现有机地融为一体。
主要优点如下:
1、功能强大,统计方法齐,全,新
SAS提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法,其分析技术先进,可靠。分析方法的实现通过过程调用完成。许多过程同时提供了多种算法和选项。
2、使用简便,操作灵活
SAS以一个通用的数据(DATA)步产生数据集,尔后以不同的过程调用完成各种数据分析。
其编程语句简洁,短小,通常只需很小的几句语句即可完成一些复杂的运算,得到满意的结果。结果输出以简明的英文给出提示,统计术语规范易懂,具有初步英语和统计基础即可。使用者只要告诉SAS“做什么”,而不必告诉其“怎么做”。
同时SAS的设计,使得任何SAS能够“猜”出的东西用户都不必告诉它(即无需设定),并且能自动修正一些小的错误(例如将DATA语句的DATA拼写成DATE,SAS将假设为DATA继续运行,仅在LOG中给出注释说明)。对运行时的错误它尽可能地给出错误原因及改正方法。因而SAS将统计的科学,严谨和准确与便于使用者有机地结合起来,极大地方便了使用者。
3、提供联机帮助功能
使用过程中按下功能键F1,可随时获得帮助信息,得到简明的操作指导。
R软件
R是一套完整的数据处理、计算和制图软件系统。
主要优点如下:
数据存储和处理系统数组运算工具(其向量、矩阵运算方面功能尤其强大)完整连贯的统计分析工具优秀的统计制图功能简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能
与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。
R的思想是:它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。
该语言的语法表面上类似 C,但在语义上是函数设计语言的(functional programming language)的变种并且和Lisp 以及APL有很强的兼容性。特别的是,它允许在“语言上计算”(computing on the language)。这使得它可以把表达式作为函数的输入参数,而这种做法对统计模拟和绘图非常有用。
R是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免费下载和使用的。在R主页那儿可以下载到R的安装程序、各种外挂程序和文档。在R的安装程序中只包含了8个基础模块,其他外在模块可以通过CRAN获得。
SPSS
SPSS是世界上最早的统计分析软件。
主要优点如下:
操作简便:界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
编程方便:具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。
功能强大:具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。
数据接口:能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件,Excel的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt及html格式的文件。
模块组合:SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。
针对性强:SPSS针对初学者、熟练者及精通者都比较适用。并且很多群体只需要掌握简单的操作分析,大多青睐于SPSS。
Python
Python是一种面向对象、解释型计算机程序设计语言。Python语法简洁而清晰,具有丰富和强大的类库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。
常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其中有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。
主要优点如下:
简单:Python是一种代表简单主义思想的语言。阅读一个良好的Python程序就感觉像是在读英语一样。它使你能够专注于解决问题而不是去搞明白语言本身。
易学:Python极其容易上手,因为Python有极其简单的说明文档 。
速度快:Python 的底层是用 C 语言写的,很多标准库和第三方库也都是用 C 写的,运行速度非常快。
免费、开源:Python是FLOSS(自由/开放源码软件)之一。使用者可以自由地发布这个软件的拷贝、阅读它的源代码、对它做改动、把它的一部分用于新的自由软件中。FLOSS是基于一个团体分享知识的概念。
高层语言:用Python语言编写程序的时候无需考虑诸如如何管理你的程序使用的内存一类的底层细节。
可移植性:由于它的开源本质,Python已经被移植在许多平台上(经过改动使它能够工作在不同平台上)。
解释性:一个用编译性语言比如C或C++写的程序可以从源文件(即C或C++语言)转换到一个你的计算机使用的语言(二进制代码,即0和1)。这个过程通过编译器和不同的标记、选项完成。运行程序的时候,连接/转载器软件把你的程序从硬盘复制到内存中并且运行。而Python语言写的程序不需要编译成二进制代码。你可以直接从源代码运行程序。
在计算机内部,Python解释器把源代码转换成称为字节码的中间形式,然后再把它翻译成计算机使用的机器语言并运行。这使得使用Python更加简单。也使得Python程序更加易于移植。
面向对象:Python既支持面向过程的编程也支持面向对象的编程。在“面向过程”的语言中,程序是由过程或仅仅是可重用代码的函数构建起来的。在“面向对象”的语言中,程序是由数据和功能组合而成的对象构建起来的。
可扩展性:如果需要一段关键代码运行得更快或者希望某些算法不公开,可以部分程序用C或C++编写,然后在Python程序中使用它们。
可嵌入性:可以把Python嵌入C/C++程序,从而向程序用户提供脚本功能。
丰富的库:Python标准库确实很庞大。它可以帮助处理各种工作,包括正则表达式、文档生成、单元测试、线程、数据库、网页浏览器、CGI、FTP、电子邮件、XML、XML-RPC、HTML、WAV文件、密码系统、GUI(图形用户界面)、Tk和其他与系统有关的操作。这被称作Python的“功能齐全”理念。除了标准库以外,还有许多其他高质量的库,如wxPython、Twisted和Python图像库等等。
规范的代码:Python采用强制缩进的方式使得代码具有较好可读性。而Python语言写的程序不需要编译成二进制代码。
工具不是万能的,业务和数据建模方法才是万法之源。不要被工具迷花了眼哦!
- ?
推荐一款神器,不用写函数的“Excel”,统计数据比透视表还牛!
朱醉蝶
展开
做业务分析、做业务报表的人都离不开和数据打交道。一般我们要做一次统计分析报告,比如月底的销售业绩汇报,可能就要提前向IT部门提需求,让他们把我们需要的数据取数来,然后他们会写SQL把数据遍历出来,然后一份excel发给你。最后呢,我们拿着这份Excel,吭哧吭哧写函数、用透视表,画图表、帖报告。
听着貌似流程很简单,但有一次,小编就是这么悲催:
我要做6月销售数据的统计分析,于是就向IT部门提需求,说把对应的CRM的数据取出类给我。
1个小时后,数据邮箱发我了,唉哟不错,效率很快。但是78M,不可能有这么大的数据,况且我电脑打不开,数据一定有问题。
于是我就跑去询问情况,看了数据库的数据,扫视了几下,明显看到大量订单取消的数据,还有字段缺失的。这些数据于我无用,好吧,怪我需求提出的不清楚,于是我又向IT同事说明了我的需求。期间又强调了几次,最后总算按着需求给了我一份excel,但是数据有378986行,我那内存仅不知道是2G还是4G的电脑,愣是花了2分钟打开,然后当我全选+新建数据透视表时,电脑卡机了,Excel程序关闭了。
卡吧卡吧,我心想,这样一份数据,我要先汇总成单日的销售额,还要拿着这个数据和另外一张客户名单合并,分析ABC类客户的销售份额,想想都要放弃了。
太高估自己了,最后还是舔着脸向IT提需求,然他们直接写代码帮我出这份报表,然后又是无尽的沟通,花了2天拿到了这张报表。
细细回顾这样一个过程,从提需求——取数,多多少少会遇到这样的问题:
1、需求响应不够及时和灵活,一般企业信息部人员工作都是比较繁忙的,对于业务部门提出的数据分析需求可能需要排期等待好几天时间才能有所响应。
2、需求沟通存在误差,业务人员最终拿到的数据结果可能并不是最初想要的那些数据,可能由于沟通表达上的传递导致存在一定偏差。
3、Excel是万能的,但一旦数据量庞大,要写的函数多,真是挺影响效率的,而且在某些数据分析统计场景下,表现的不够丰富灵活,不如代码操作。
......
想必大家也深有所感,如果有这样的工具,能够早早的帮你把数据准备好,或者说你有账号权限拿到自己需要的那部分数据,能自动的把数据ETL清洗;再者,在统计分析方面,内置常用的函数,拖拽生成报表和图表,不用写函数,不用数据透视表,也不用VBA;每周每月固定格式的报表能直接自动导出。简直完美!
这样的分析工具确实有,小编在此给大家推荐一款,效率胜过Excel,操作感类似透视表的数据可视化神器——FineBI!
关于FineBI
关于FineBI,可能很多小伙伴或多或少了解过这款商务智能工具,这是目前市面上应用最为广泛的自助式BI工具之一,与之同行的还有Tableau、PowerBI等。
你可以把它视作为是可视化工具,因为它里面自带几十种常用图表,以及动态效果;你也可以把它作为报表工具,因为它具有强大的可视化数据分析能力;你还可以把它看作是数据分析工具,因为如果你有数据,你想分析,可以借助FineBI做一些探索性的分析,其内置等数据模型、图表。
但严格定义来讲,他其实一款自助式BI。常常被用作大数据前端展现的工具,对接hadoop、Spark等平台,有了这一款工具之后,IT部门只需要将数据按照业务模块分类准备好,业务部门即可在浏览器前端通过鼠标点击拖拽操作轻松得到自己想要的数据分析结果。
它的操作就像是Excel中的数据透视表,相信很多小伙伴儿特别是已经在职场已经混迹很多年的小伙伴儿,对Excel中的数据透视表非常熟悉,没错,FineBI的操作堪比一个升级版的数据透视表。
它不仅仅可以将原始的一维表数据透视为二维表格,它还可以将原始数据直接透视成多维图表,流程跟用Excel做数据透视表几无二致。
分析过程
如上图所示的一个企业月度合同数据分析案例,如果使用Excel透视表,可以将年份、月份字段拖拽到行区域,将合同金额字段拖拽到数据区域以完成每个年月的合同金额统计,但是对于求组内排名、组内累计值、累计达成率、同比环比等计算,Excel透视表处理起来则比较麻烦了。
之前强调过数据处理的效率和类数据透视表的操作性,如果用FineBI,是如何一步步简单快速完成的?用一个安利来展示一下!小伙伴们也可以到FineBI官网下载安装,边学边体会!
1.分组统计
首先我们选择FineBI的分组表组件,使用FineBI的内置销售DEMO业务包,找到合同事实表,将合同签约时间的年份、月份字段拖拽到分组表的行表头,然后将合同金额字段拖拽到指标栏进行求和汇总(还可以修改汇总方式为求最大值、最小值、平均值等等),即可完成每个年月的销售额基础数据统计。
2.数据排名
接下来我们继续用FineBI来新增一个每个月合同金额的排名列,直接点击添加计算指标,计算方式选择组内排名,根据合同金额进行降序方式排名即可得到每个月的合同金额排名。
3.数据过滤
下面我们只想看2015年和2016年的数据,那么在FineBI中直接对合同签约时间的年份字段进行过滤,然后选择2015年和2016年即可。
4.累计求和
在看每个月度的合同金额数据时,我们往往可能需要把每个月份的合同金额进行累加,以计算截至到当月的总目标达成率,这个在FineBI中添加合同金额月度累计值计算指标,然后对合同金额进行组内累计求和,然后再进行组内所有值计算得到合同金额年度总值,最后直接用合同合同金额月度累计值除以金额年度总值即可得到当月的年度目标达成率。
5.同比环比
计算完每个月的合同金额达成率之后,再分析每个月的同比环比数据自然是需要的。对于同期环期和同比环比,我们可以直接在FineBI中添加计算指标,然后选择对应计算方式即可,非常简单,这样一来我们的基础数据分析统计就完成了。
6.条件格式
在统计好基本的数据指标之后,可能会需要添加一些条件样式以便于观察数据,例如我们这边可以通过FineBI给合同金额指标添加图表样式标记,使得当月大于5000000合同金额的数据标绿色,小于5000000的则标红色。另外再对每个月的合同金额同期比数据添加条件样式,使得当月同比去年同期增长的数据打上上升标记,下降的则打上下降标记。通过以上的简单操作,看似复杂的一个企业月度合同数据分析案例就轻松完成!
分析总结
除了以上的一些分组统计、数据排名、累计值&&所有值、同比环比、条件格式的基础分析功能之外,FineBI还具有强大的ETL处理能力,例如多表JOIN、UNION、关联模型、行列转换、对多层级数据构建自循环列等等,许多原本我们可能需要使用SQL或者Kettle等复杂ETL工具来实现的功能都可以在FineBI中轻松进行可视化配置,可极大提高数据的处理效率。
大屏数据可视化
最后还值得一提是,除了强大的数据自助式分析能力,FineBI还可以做可视化大屏!
公司综合运营驾驶舱:
如上图所示的一些综合数据大屏应用,在数据都已经准备好的前提下,想做可视化其实也就是用FineBI在通过鼠标拖拖拽拽的事情~基本在15分钟左右就能轻松搞定!
- ?
Excel的作用之一:数据分析,做运营人员要懂点
岑念波
展开
随着数据量的增大,数据统计分析的计算量和复杂性也随之剧增,所以需要借助各种统计分析软件来提高运算效率与分析准确性。
Excel也提供一组数据分析工具,包含常用的数据统计分析工具,能够满足基本的数据分析需求。只需为每一个分析工具提供必要的数据和参数,该工具就会使用适宜的统计或工程函数,在输出表格中显示相应的结果,某些工具在生成输出表格时还能同时生成图表。
一、常用的函数
1、Vlooup():它可以帮助你在表格中搜索并返回相应的值。让我们来看看下面Policy表和Customer表。在Policy表中,我们需要根据共同字段 “Customer id”将Customer表内City字段的信息匹配到Policy表中。这时,我们可以使用Vlookup()函数来执行这项任务。
2、CONCATINATE():这个函数可以将两个或更多单元格的内容进行联接并存入到一个单元格中。例如:我们希望通过联接Host Name和Request path字段来创建一个新的URL字段。
3、LEN()-这个公式可以以数字的形式返回单元格内数据的长度,包括空格和特殊符号。
4、LOWER(), UPPER() and PROPER()—这三个函数用以改变单元格内容的小写、大写以及首字母大写(即每个单词的第一个字母)。
5、TRIM():这是一个简单方便的函数,可以被用于清洗具有前缀或后缀的文本内容。通常,当你将数据库中的数据进行转储时,这些正在处理的文本数据将会保留字符串内部作为词与词之间分隔的空格。并且,如果你对这些内容不进行处理,后面的分析中将产生很多麻烦。
二、由数据得出结论
1. 数据透视表:每当你在处理公司的数据时,你需要从“北区分公司贡献的收入是多少?”或“客户购买产品A订单的平均价格是多少?”以及许多类似的其它问题中寻找答案。
创建数据透视表的方法: 第一步:点击数据列表内的任何区域,选择:插入—数据透视表。EXCEL将会自动选择包含数据的区域,包括标题名称。如果系统自动选择的区域不正确,则可人为的进行修改。建议将数据透视表创建到新的工作表,点击New Worksheet(新工作表),然后点击OK。
第二步:现在,你可以看到数据透视表的选项板了,包含了所有已选的字段。你要做的就是把他们放在选项板的过滤器中,就可以看到在左边生成相应的数据透视表。
从上图可以看到,我们将“Region”放入行,“Productid”放入列中,“Premium”放入值中。现在,数据透视表中展示了“Premium”按照不同区域、不同产品费用的汇总情况。你也可以选择计数、平均值、最小值、最大值以及其他的统计指标。
2.创建图表:在EXCEL里面创建一个图表,你只要选择相应的数据,然后按F11,就会自动生成系统默认的图表。除此之外,你可以手工改变不同的图表类型。如果你倾向于在当前工作表中生成图表,可以按ALT+F1,而不是F11。
当然,在任何一种情况下,只要你创建了图表,就可以通过定义特定数据源来展示期望的信息。
三、数据清洗
1.删除重复值:EXCEL有内置的功能,可以删除表中的重复值。它可以删除所选列中所含的重复值,也就是说,如果选择了两列,就会查找两列数据的相同组合,并删除。
如上图所示,可以看到A001 和 A002有重复的值,但是如果同时选定“ID”和“Name”列,将只会删除重复值(A002,2)。
按照下列步骤操作可以删除重复值:选择所需数据-转到数据面板-删除重复值
2.文本分列:假设你的数据存储在一列中,如下图所示:
如上如所示,我们可以看到A列中单元格内容被“;”所区分。我们需要将其进行分列,建议使用EXCEL的文本分列功能。按照下面的步骤可以实现分列:1.选择A1:A62.点击:数据—分列
上图中,有两个选项,“分隔符号”和“固定宽度”。我选择“分隔符号”是因为有分隔符“;”。如果我们希望按照宽度分列,例如:前四个字符为第一列,第五到第十个字符为第二列,则可以选择按固定宽度分列。3.点击下一步—点击“分号”,然后下一步,然后点击完成。
评语:EXCEL作为使用最广泛的数据统计分析软件,无论你是小白还是资深用户,总会有一些东西值得你去学习。
- ?
数据分析都用什么工具
九眼
展开
欢迎关注天善智能,我们是专注于商业智能BI,大数据,数据分析领域的垂直社区,学习,问答、求职一站式搞定!
本文是上一篇文章《全国及重点城市“数据分析”岗位需求量及工资水平分析》的续篇,从“数据分析”职位招聘单位给出的职位描述中分析各种工具的热门程度。
1.整体概览
经常看见有网友争论R和python谁才是主流的数据分析工具,网友们分门别派各抒己见。今天我们从实际需求出发,在招聘单位的职位描述中用正则表达式匹配统计常用的数据分析工具出现的频率,看看谁才是你最应该掌握的工具。
话不多说,先上图
毫无疑问,excel才是最主流的数据分析工具,在招聘单位的职位描述中出现频率远远高于其他工具(实际上居第八位的office也含有excel,其真实数据应该比这还高),作为最基础的工具,excel是一个数据分析工作者的必备技能。excel之后的4门工具分别是sqlsever、spss、sas和r,其中排名第二位的sqlsever频率高出另外两门主流数据库语言mysql、oracle近两倍,spss作为无需编程的专业统计软件也在职位描述中有较高的频率,sas则是编程类统计软件的代表,今年来火热的r语言也水涨船高,另一门火热的程序语言python在数据分析方面则要稍稍落后。
2.各职位具体情况
数据分析也有细分很多具体职位,那么不同的职位以上各种工具的要求是否存在差异呢?
表中数据显示“大数据分析师”需掌握的工具主要是r、python、hadoop、spark和java;“数据分析工程师”需要掌握的工具主要是sqlsever、r、python和hadoop,这两个职位都很看重编程开发能力。
“数据分析经理”、“高级数据分析师”和“数据分析师”需要掌握的工具大体一致,均为excel、sqlsever、spss、sas和r。
“数据分析主管”、“数据分析”、“数据分析专员”和“数据分析员”等职位对基础技能的要求更为突出,excel、ppt、word等office办公软件出现的频率较其他工具明显更高。
作为一名数据分析从业者或者想转行过来的人来说,要想有好的职业发展,首先,必须熟练掌握office办公软件,尤其是excel(不要瞧不起excel,你不一定玩得转);其次,还需要学习一门数据库语言,sqlsever是不错的选择(mysql、oracle与sqlsever较为类似,通一门后,其他的学起来也很容易);专业的统计分析工具也需要掌握一门,如果讨厌编程,可以选择spss,如果有编程能力那么sas和r可以选择一个学习,如果你精通python也可以用python做统计分析;如果想往大数据方向发展,或者是做数据分析工程师那就还需要掌握python、hadoop等工具。
最后附上一张数据分析职位描述的词云图,可以看出招聘单位除了看重工具的使用外,也很注重分析、业务、经验、沟通、团队等方面的能力。
本文作者:Mr.Hu,转自:一胡诌先生
- ?
excel数据共享困难?有了这个软件那都不是事儿!免费拿走!
诗兰
展开
Excel用户都很清楚,excel用起来确实比较方便,但是互联网办公时代,却有很多弊端,比如说数据共享协作,用户权限控制等是个很大的麻烦,一般人在这个问题上都玩不转。举个例子:销售部经理,每天或每周让销售人员填报一个销售报表,于是就做了一个表分发给各个销售员,然后销售员各自填好了,发给销售经理或其助理,然后他们就复制粘贴汇总了,如果说销售队伍小人员少,那这个工作还好做,但如果销售人员很多,表格数量大,表格复杂,再加上有那么些个人不太听指挥,总想着去修改表格的格式,那完蛋了,这个活真是干不下去了,一不小心,数据就会错乱了漏了……,咱们负责报表处理的excel或WPS的“表哥”“表妹”们那真是叫一个苦不堪言啊。
看了网络上有很多这样的需求,也有很多人出招,多半解决方案都是要用到VBA编程,这可不是一般人能玩的,而且即使会编程,做出来的东西也难以令人满意。怎样才能更好的解决EXCEL数据共享的问题呢?小编认为,EXCEL主要是为个人单机应用比较好,互联网协同办公那就不那么灵,所以,我建议另外其他的软件来做这个工作。今天推荐云表软件,长得和EXCEL很像,操作也有几分类似,还有永久免费版使用。接下来我来看云表是如何解决数据共享问题的。
第一步,先到云表官网注册下载个免费版使用。给个链接免得迷路:https://iyunbiao/。如果想得到协助,你可以搜他们的客服群,也有专业客服在线指导。
第二步:画表单模板,这个和excel画表格很像似。当然,云表除了可以自定义表单样式(模板),还可以设置填写规范,这个让填写的人员不能随便改动,必须按要求填写,另外,还有校验功能,没按要求填的,会提示错误。
上图为证:
在模板属性还可以设置生成APP,这样用户没有带电脑的时候也可以用手机完成数据的填报、查看和审批工作。关于表单设计,还可以设置智能自动录入,自动编号,自动计算等……功能很多很实用也很简单,安装好软件,照着操作说明,很快就能设置好,就不一一详解。
第三步:如果表单数据需要汇总统计,那就另外画一个报表模板,这个要用到业务公式,放心,这个业务公式是纯中文的,不用编程,也难不到你。所有的操作都是中文的,都能看得懂。具体操作细节,根据你要实现的功能和需求会有不同,这个要用软件实践一下,看看教程,就能实现,当然也可以找官方客服教你。
第四步,报表统计查询分析。可以根据需求设计不同的报表,数据透视,图表分析都是可以的。
第五步,设计组织架构和人员权限。把公司组构和不同角色人员的权限明确了。
第六步,设计流程。如果你的数据填报中要审批审核等流程,可以自定义,像画流程图一样,也很简单。
做完这几步,数据按权限录入填报查看审批,都做完了,完成后,把每个人员的账号分配一下,下次再填报表时,他们登录各自的账号填报就好了,领导只需要查看最终报表。数据管理方便,,也不会出错,效率还高,领导满意,自己轻松。实际做好的软件可以很精致漂亮的,上个图。咱们虽然没学过编程,但是做出的软件绝对不比程序员差,效率还比他们高,企业CIO都得拍手称赞!
当然,做报表管理只是云表最基础的功能,你完全可以用云表做各种管理软件,比如进销存、OA、ERP、WMS仓库管理系统、生产管理系统、会员管理系统、客户关系管理系统等各行业的各种场景下的管理系统,只要你有需要,就可以通过云表来搭建,PC端和手机APP一起生成。另外,如果需要与其他软件或者智能设备对接,也完全没有问题。
即使不是懂编程,不懂数据库,不是程序员,只要你有excel或者WPS的使用基础,只要了解自己的管理需求,相信你都能设计得出来属于自己的个性化软件。
- ?
简单几步掌握Excel数据统计分析必备功能-数据透视表
刘翰
展开
上一篇给大家分享了一下筛选功能的使用,特别要注意不能随意复制粘贴的原因和解决办法。有兴趣的朋友们可以点击或关注百家号,进去查看历史文章。
那么,今天给大家分享下EXCEL透视表功能的简单使用。通常情况下,我们需要做批量数据的统计、用excel出图表等等的时候,需要计数或者求和的结果作展示的时候都会用到。可以说是在大数据分析以及展示结果的时候,所必须会使用到的一个功能。
在此,让我们一起通过一个实例来看一下,excel数据透视表的具体使用方法。只需要简单几步,就可以完成一个简单的数据透视!
首先,我们打开一个要处理的EXCEL,比如需要统计各部门总工资。如下图的数据。通过1月到5月每个人的工资记录,来计算出部门工资的总数及每个月的走势。
第一步:选定A列到H列,即包含所有数据的列。
第二步:点击插入-数据透视表,出现一个创建数据透视表的小窗口,直接点击确定。
此时出现了一个新的sheet页,如下图。这里为了方便大家看全,我把表格横向缩小到了一起。实际上数据透视表字段是在EXCEL最右侧。
第三步:新sheet页的最右侧数据透视表字段,有一个选择要添加到报表的字段,可以看到原始表格的标题列。继续往下看,有四个区域,分别为筛选器,列,行,值。我们把月份点住,拖动到列的区域中。
再分别把部门、姓名拖动到行,部门在上。最后把工资拖动到值。
第四步:值里边默认是计数项,我们需要修改一下,工资是以求和来统计。点击计数项:工资,会出现值字段设置。打开后,选择求和,然后点击确定。
第五步:此时已经可以看到表中的数据都已经出现,每个部门每个人1月到5月工资以及总计的工资。可以点击技术部、科研部、运营部前边的-号,代表隐藏姓名;最后一列的总计,每一行代表这一行数据的总计,比如第一行代表技术部1月到5月的总计工资数目;最后一行的总计,每一列代表的是这一列数据的总计,比如1月的那一列代表1月各个部门的总计工资。这样就满足我们的需求了,可以看到每个部门在每个月以及合计的工资数目。
习惯而言,统计的数据都喜欢有高低顺序来浏览,方便一眼看出哪个部门的工资总额高低。我们可以再点击一下总计那列,然后点击排序,选择降序排列。这样就可以看到一个按高到低排序的工资图表了。
好了,本篇就给大家讲到这里,大家可以自己试着随意在四个区域里,把其他的标题也拖进去,看看会出现什么变化?其实看似枯燥的Excel工具也有非常有趣的一面,更多的技巧就留给大家自己开发吧!有什么问题欢迎留言给我们哦!
- ?
利用excel数据透视表统计大量数据,再也不用对上千行数据发愁了
雨莲
展开
如果有一张上千行的销售表,像下图(各个地区按天统计的1至12月的物品销量),要统计每个月,每个地区的数据,当看到上千行的数据,是不是发愁无从下手呢,利用数据透视表,轻松搞定。
1、选中数据表中任意单元格,点击工具栏插入——数据透视表。弹出创建透视表对话框,点击确定。
2、在右边数据透视表字段对话框添加字段,这里勾选订购日期、地区、分类、销售额和成本。字段勾选根据数据分析的要求勾选。
勾选后,左边单元格会生成下图所示数据表。
3、但是日期是按天来统计,我们需要的是按月统计,选中行标签统计的某一天的单元格,例如2015/1/24,右键创建组,在组合对话框中,选择月,确定。
4、确定后生成下图所示的统计表,但是原始数据没有统计利润,这里我们为了说明问题,我们简单统计利润。
5、增加字段,统计利润,假设利润为销售额减去成本,点击数据透视表工具的分析菜单选项。
6、点击字段、项目和集——计算字段。
7、在插入计算字段对话框中,名称填写利润,公式填写=销售额-利润,确定。
8、则上千行的数据按月份统计完成。
这里只是数据透视表的基本用法,数据透视表还可以排序、筛选,还可以转换称图表,还有很多更强大用途。
excel数据统计软件
-
1、只需3秒快速实现求和
-
2、如何快速填充序号
-
3、如何自动填充序号(公式法)
-
4、数据条的神奇应用
-
5、多文本快速合并
-
6、查找与替换的不同玩法
-
7、快速定位到指定区域
-
8、数据排序、工资条制作
-
9、快速筛选(模糊、精确筛选)
-
10、快速插入空行
-
11、快速删除空行
-
12.快速跳转到天涯海角
-
13、.同时查看两个Excel文件
-
14、用条件格式扮靓报表
-
15、一键插入Excel图表
-
16、批量处理行高、列宽
-
17、利用拆分功能查看数据
-
18、批量录入相同内容
-
19、工作表快速跳转
-
20、批量录入表格模板(精品课程)
-
21、Excel函数与公式的应用、公式循环引用的查找
-
22、IF函数单条件判断同比增长
-
23、用sum函数 格式相同,连续多表数据汇总
-
24、excel快捷键
-
25、VLOOKUP函数——根据销售员匹配销售额
-
26、统计各部门销售总额
-
27、统计指定条件个数
-
28、怎样输入当前日期和时间、星期数
-
29、销售业绩排名
-
30、Sumproduct函数-万能函数(销售额汇总求和)
-
31、根据销售员,地区,商品名称汇总
-
32、批量替换PPT字体
-
33、给销售额数据批量添加万元单位
-
34、一秒快速核对两列数据
-
35、快速定位到指定单元格或区域
-
36、快速制作双行标题工资条
-
37、给你的表格做个瘦身
-
38、快速打开常用的Excel文件
-
39、快速打开多个Excel文件
-
40、利用创建组—快速隐藏/展开多列数据
-
41、快速制作下拉菜单
-
42、复制粘贴表格,如何保留数据源列宽格式一致?
-
43、两列数据位置互换
-
44、1秒钟扮靓报表——如何实现表格隔行换色
-
45、快速删除重复记录——保留唯一值
-
46、快速向下填充、向右填充,文本或公式
-
47、给Excel文件添加密码
-
48、插入带图片的批注
-
49、输入公式后不计算?
-
50、如何设置单元格缩进
-
51、快速解决Excel表格总显示货币格式
-
52、批量添加万元单位
-
53、你会四舍五入么?
-
54、用RAND函数机选彩票
-
55、冻结首行你会么?
-
56、超链接的高级应用
-
57、IFERROR函数-屏蔽错误值
-
58、批量填充颜色
-
59、录入数据
-
60、快速输入工号
-
61、快速行列转置
-
62、自定义缩放界面
-
63、多个单元格同时输入
-
64、如何计算立方米?
-
65、快速制作双行标题工资条
-
66、输入带方框的√和×
-
67、快速将姓名对齐
-
68、快速输入性别
-
69、按单位职务排序
-
70、自动计算合同到期日期
-
71、计算时间间隔
-
72、日期和时间的拆分
-
73、快速处理不规范的日期格式
-
74、快速填充合并单元格
-
75、效率加倍的快捷键
-
76、快速复制表格和对象
-
77、快速创建工作表副本
-
78、快速复制序列号
-
79、快速显示公式
-
80、多个单元格同时输入
-
81、快速调整显示比例
-
82、快速自动填充
-
83、快速填充(Ctrl+E)
-
84、Ctrl与数字键结合
-
85、快速将多列数据整理为1列
-
86、快速将1列数据拆分为多列
-
87、快速定位公式
-
88、快速录入数据
-
89、快速累计求和
-
90、身份证号码显示为0怎么办?
-
91、快速制作斜线表头
-
92、文本竖向显示
-
93、神奇的监视窗口
-
94、不一样的格式刷
-
95、快速美化图表
-
96、快速生成当前日期
-
97、快速找出循环引用
-
98、快速提取信息
-
99、二维表快速转换为一维表
-
100、快速多表合并