- ?
超重量级的Excel多表“合并及汇总”功能,99.99%的人都没用过!
雪瑶
展开
前言:最近总有同学提问
怎么能合并多个工作簿?多个Excel表格汇总到一个表中?怎么把表分发给其他人做调查,收回后能批量合并到一个表中?
合并多个表的确是一个难题,好象除了VBA也没有什么好办法,即使是新兴的power query也很难完成固定位置合并的问题。其实兰色在06年就发现了个很神奇的工作簿合并的功能,所以今天再把这篇旧文翻出来,希望能帮到大家。
这个功能是小编昨天无意中发现的,为什么称它为超重量级Excel功能,小编先给你演示个操作。
【例】在一个文件夹中有N个公司的Excel格式报表,需要把这些报表的数据合并到“报表.xlsx”中。
只是点了一个按钮,然后选取了要合并的文件,刷刷刷,各公司的数据已全部合并过来了,是不是很神奇!(合并多个文件的多个工作表也适用)
小编在合并过程中,使用了一个在Excel中隐藏很深的功能:比较和合并工作簿
我们先把它揪出来:
文件- 选项 - 快速访问工具栏 - 不在功能区域中的命令 - 找到“比较和合并工作簿”
然后在快速访问工具栏中就可以看到它了,只是它是灰色的。
它到底怎么才可以用? 和小编一起开始操作吧!
1、先设置一个报表模板(可以有多个工作表),把格式设置好,然后设置成共享工作簿。
2、把设置好的模板发放给各公司填写。
3、收到各公司上缴的报表,放在一个文件夹里。
4、合并时,点击“比较与合并工作簿"按钮,选取要合并的文件,然后.....如开始动画演示。多个Excel文件的合并瞬间完成!
在实际工作中,这个功能可以省去非常大的工作量,毕竟把N多个报表汇总到一起是一件多么枯燥又费力的事情。
但这个功能只是合并而不能汇总。
别急,小编再教大家一个神技能,多个表格如何汇总!
多个Excel表格汇总到一个表中,有一个神秘技巧帮你实现!
如下图所示工资表中,含有多个月份的数据。要求在汇总表中把所有月份的数据汇总到一起。
操作步骤:
1、数据选项卡 - 现有连接 - 浏览更多。
2、找到当前操作的excel文件。
3、选取任一个表格名称
4、【导入数据】窗口中,显示方式选“数据透视表”,放置位置选工资表A1单元格(也可以选新工作表)
5、选取刚创建的数据透视表,然后点击 数据透视表工具 - 选项 - 更改数据源 - 连接属性。
6、把下面的代码粘贴到命令文本框里。
------------------------------------
select '3月' as 月份, * from [3月$] union all select '4月' as 月份, * from [4月$]union all select '5月' as 月份, * from [5月$]
-------------------------------------
代码说明:
1) 具体的SQL语句一言两语也说不清楚,同学们只需要按下面的模式套用即可。有多少表,连接多少个。
Select * from [表1$] union all Select * from [表2$] union all Select * from [表3$]....union all Select * from [表N$]
2) '3月' as 月份: 是为三个表创建一个共同的字段(月份),其中引号内3月为自定义字符,用来区分工作表,只是不一定要和工作表名称一致。月份是数据透视表要用的字段名,也是自定义的。中间用 as 连接,放在select 之后 *号之前。如果不需要为三个表创建共同字段名,此部分可以省略。
7、连接完成!下面就是对数据透视表的基本操作,添加行、列标标签和数据标签。
8、调整格式和修改字段标题。最终效果如下图所示。
- ?
地表最强报表工具,一张模板秒杀数百Excel !
补丁
展开
又到月末了,表格表姐、财务狗,IT人们又要赶报表了。
财务人哭诉说:
自从干了总账会计,我发现人家吃饭,我在做报表;人家睡觉,我在做报表。做报表的事真是从年头到年尾,从年尾到年头啊,现在生活中没有其他,只有EXCEL。
自从干了总账会计,我才知道一个报表不来回修改个十几二十次,那都是不正常的。我才知道周末是不能关机的,要是关机了,就嘿嘿。
所以说,做报表的,佛系才能长命。
表格表姐也憋了很多牢骚:
每到月底、季末,领导就会在群里夺命连环@
要知道,这样的报表,我要去申请业务系统的数据先核对。大包大揽导出几十万条数据,给我配备的电脑,打开需要2分钟;每写完一条函数,都要运算7、8分钟;鼠标不敢乱点,人也不敢离开,还时不时的得给主机扇风。企业级的报表,尤其数据多的时候,Excel真不是好选择。当你好不容易做完,一句“数据不对”就给打回,心中真不知是什么滋味。
IT人更是不服:
公司采购了几千万的SAP大家不用,业务系统自带的报表也不用,依旧excel邮箱满天抄送,任务系统中这里少数据,那里口径对不上。回头各种抱怨数据不对。SQL手把手教大家写了,简单的数据库功能也是花了两天培训的。结果到头来,简单的报表需求依旧交给IT,反倒是需求提得更严苛了,真是有苦无处说。
大大小小的报表,是企业里少不掉的基础事物,维系着整个经营信息的流转,但现在反而成为很多人的日常工作的束缚,不免引起一阵反思。
工欲善其事,必先利其器!
造成这些问题的很大部分原因就在于,缺乏一套高效的工具。
做报表做表格,很多人第一时间想到的是Excel。Excel作为个人办公软件绝无仅有,但作商业用,其实在效率上还有办公协同上稍有不足:用Excel收集数据容易乱,用Excel存储数据容易丢失,影响数据质量。而且普遍企业报表需求大于人员负荷,用Excel做报表改报表无疑都是在增大工作量。
懂IT的朋友可能会说,交给数据库啊my sql 、oracle,写两条SQL,借助数据库的运算性能就解决了。再不行,找程序员写代码,批量做报表,数据录入、图形化报表、甚至数据分析都可以交由程序开发,性能杠杠的。
那如果有现成的工具,可以直接和数据库交互(数据导出+填入数据),能连接各系统的数据,能高效率批量做报表,展现,交互分析,可视化大屏,并做到办公协同,那就是小编今天想来讲讲的FineReport了。
一、用FineReport做一张模板,可以替代N张手工重复劳作的Excel !
为什么这么说,先来了解FineReport的制表原理
1、FineReport的制表原理
FineReport是通过连接数据库,读取数据字段来设计报表模板的,所以在制作模板前先要知道数据库的类型、地址、访问数据库的用户名密码,两者建立一个数据连接后才可开始设计模板。然后依据所需功能(表格展示?填报?dashboard分析?)和表样来操作模板,最后在web端展示。
制作模板时处理的对象是数据字段(区别于Excel的单元格数据),模板中一个单元格放一个数据字段,web端展示时字段扩展。FineReport报表中单元格的扩展是有方向的,可纵向扩展,也可横向扩展,也可以不扩展。
单元格的扩展是针对某一个单元格,当报表主体中绑定了多个单元格时,单元格与单元格之间依靠父子格关系跟随扩展。子格的数据会根据父格的数据进行过滤分组显示,并且还会跟随父格的扩展方向而扩展。
2、三大类报表设计方式,解决日常所有报表需求,并且一表复用。
1)普通模板设计,此者最常用。依靠着单元格的扩展与父子格的关系来实现模板效果,可进行参数查询,填报报表,图表设计等。比如交叉报表、行式报表、分组报表等等。
2)聚合报表设计,针对不规则大报表。适用于一张模板中显示多个独立模块的报表,几个报表块汇总在一起的复杂报表。
3)决策报表设计,就是表单,也是dashboard,也就是大家常见的各种图表拼接在一起的可视化数据报表。
通过拖拽图表来制作,制作好的dashboard可以自己适配屏幕的大小,多以也可以做成手机端的报表,大屏可视化,下面有细讲。
以下举例一些常见的报表格式:
交叉表
行式报表
分组报表
自由报表
3、参数实现数据查询和过滤
在很多情况下,我们需要根据条件查询数据,过滤。在FineReport中,通过设置参数绑定数据字段和过滤的控件(单选框、复选框等等),参数可用JS编辑更多复杂的情况,通过界面输入查询条件来控制报表显示的内容及形式,而后导出打印。
很多公司很多员工都会要做周报月报季报等,有些全国性的公司有分公司、门店、办事处。经常性的要做这些重复性很大的报表。那用FineReport就可以集中将每一条数据明细上传到数据库中(填报功能,下面会讲)。在做报表时,做将一些常用的维度“地区”、“时间”、“城市”等等作为一个查询的参数控件,类似Excel中的筛选,导出。基本上一个周报模板,就解决了一些人一年52张手工excel报表的工作量。
4、填报
填报就是向数据库中录入数据,用于固定格式固定条件的数据收集。就好比你注册网站时提交的邮箱、收集、用户名、密码,都会按照格式存放到数据库中。
填报也需要一个模板,操作流程如下:
填报模板由控件组成,文本控件、数字控件、密码控件、单复选框、网页、文件等等。控件对应着数据字段。有了填报,就可以收集数据,并且允许用户实现对数据库的增删改。出于数据质量和数据安全的考虑,还可以对填报进入的数据做校验操作。
填报最大的用处是替代excel收集数据,做好了模板,奖模板链接发送给相关人,填完数据审核过后即可入库,省得excel传来传去,而且是在web端填写,也非常简单。
二、不只是报表,还有数据可视化
酷炫的dashboard都需要通过FineReport的表单(决策报表)来设计展现。通过拖拽报表块、图表块和各类控件初步设计界面。
不同于普通报表,普通报表是一个整体,无法实现局部刷新。表单是由各个组件组成,可以实现组件内刷新,即局部刷新。像动态大屏都是全局或者局部刷新的,所以需要用决策报表制作实现。
1、决策报表制作过程
新建表单:FineReport支持新建工作薄,即普通报表模板,还支持新建表单,两种设计模式;
拖入组件:FineReport表单支持多种不同的组件类型,包括报表块、tab块、绝对画布块、参数、图表和控件等等;
定义数据集:定义各个组件数据来源,图表组件数据即可来源于数据集,也可来源于单元格;
设置表单样式:即设置表单的显示样式。
2、数据可视化与交互
之前很多网友留言,问这样的可视化是什么图表制作的。其实大多由FineReport自带的H5图表。此前有提到FineReport良好的开放性,可让IT同事写代码开发,所以在制作时,也可接入Echarts等第三方控件来制作图表。
3、实用而强大的数据地图
finereport有很强大的地图功能:基本地图、GIS地图、热力地图、大数据流向地图等。
GIS地图基于GIS地图层进行数据展示,支持自定义GIS主题风格,能够与数据表钻取联动。比如省级钻取到市级、县级、街道。
三、总结
篇幅有限,以上只展现了FineReport的一部分功能,很多细节无法展开。
要说效率,最大的好处就是从数据库中读出数据自动产生报表,且一类报表做成一个固定样式的模板,每次只要同步一下,自动生产周期性的报表,如日报、周报、月报、季报等。 每次按照条件查询,Excel批量导出/打印,少了人力去一个一个用Excel统计汇总。
而且操作上,大多数功能FineReport都封装成模块了,包括写SQL取数,汇总筛选过滤等,基本上都有对应的功能键。像著名的资产负债表,如果按照以往写代码或者写复杂的SQL语句,就有点摧残生命了,而且那天书般的SQL语句要是出点错谁来查,如果数据来自多个源,那就彻底无法解脱了。
其次,在数据处理速度上,由于性能一部分依靠数据库,一部分依靠FineReport的行式报表引擎,相比于Excel的单机效率,几十万行的数据秒出。再者,企业数据库有各种自带或第三方的集群方案,通过堆机器就可以近似于无限的加大数据储存能力。
最后,FineReport除了解放个人,最大的贡献应该是对企业。在商业用途上,我们要考虑效率,人员的培训成本,协同性,还要考虑对企业业务的支撑、贡献,这几点Excel是比较难发挥贡献的。有知友说“Excel用得再溜,老板也不会给你涨工资,可能还革了其他同事的命”。那是因为Excel处理了数据,但没有得到有效结果去服务于业务带来效益。那如果在报表之后,基于业务基于指标去做特定主题的数据分析,站在公司角度做数据化管理,为领导的业务决策提供有效意见,这样的高度就别有不同了。
- ?
一键篇 | Excel一键实现所有工作表的内容合并到一个新的工作表
巧曼
展开
Excel作为一个具有强大的数据处理的办公软件,对于白领一族来说,使用频率应该较高。在处理数据过程中,您是否碰到过清单之类汇总的情况,就是将同一个工作簿中的所有工作表的内容合并到一个工作表中。对于不会取巧的朋友,可能就是一个表一个表的复制,然后粘贴拼凑在一块,若碰到表格数量不多的情况,这种方法还好,若是碰到工作表数量庞大,例如50个工作表,100个工作表......这种方法就很鸡肋。今天本篇以Excel2013为例,教大家如何一键实现所有工作表合并到新工作表中,同样适用于Excel其他版本,碰到细微差异,可以适当调整代码。
教程将内容分成三部分:第一部分是新建一个汇总的工作表,并重新自定义命名;第二部分是逐一将各个工作表复制粘贴到汇总工作表中;第三部分为提示,即当合并工作完成后弹出提示。具体操作如下:
打开工作簿,在工作表标签中会显示包含的工作表名称,教程以下图中三个工作表为例,分别是Sheet1,Sheet2,Sheet3.按下组合键Alt+F11即可从Excel工作界面切换到VBA界面,在VBA窗口单击菜单栏中的插入,找到模块命令,单击该命令即可创建一个新的模块窗口,在模块窗口复制粘贴以下代码:
Sub Comb()
Dim i%
On Error Resume Next
Sheets(1).Select
Worksheets.Add '新建一个工作表
Sheets(1).Name = "汇总工作表" '对新建工作表重命名
For i = 2 To Sheets.Count 'For循环,遍历所有工作表
Sheets(i).Activate '激活工作表
Range("a1").Select
Selection.CurrentRegion.Select '选择活动工作表数据区域
Selection.Copy Destination:=Sheets(1).Range("a65536").End(xlUp).Offset(1) '粘贴到汇总工作中
Next
MsgBox ("工作表已全部合并到指定工作表中!") '弹窗提示合并完成
End Sub
- ?
「Excel实用技巧」一个比 Ctrl + C 还简单的Excel表格汇总方法!
笑珊
展开
无论你从事财务、人事或销售,都会面对多个excel文件表格的汇总问题。绝大部分同学都是逐个打开excel文件,复制粘贴到一个表格中,然后再进行汇总,如果是月报或日报,每月每天都要重复这个工作。今天分享一种通用的多表汇总方法,非常简单。
【例】如下图所示文件夹中,有3个子公司的报表和汇总表。要求:更新分公司文件后,汇总表会自动更新汇总。
1、把各分公司数据引入到汇总表中。
打开分公司报表, 复制 - 打开汇总表,选择性粘贴 - 粘贴链接。然后在A列输入该公司名称。(注意在复制时,多复制些空行,这样可以在添加新车型后也可以自动更新。)
2、用数据透视表生成汇总表
选取合并后的数据,插入 - 数据透视表 - 调整格式。
二、使用
使用很简单,把新报表替换旧报表,再打开汇总表更新数据透视表即可。
测试:新的一月A公司报表(为了方便测试我们把B车型销售数量改成1000)复制,粘贴到汇总文件夹内。
A公司新报表
复制A文件粘贴到文件夹中,替换原来的A公司文件。
其他公司同A公司,直接替换各个公司旧文件即可。
注意:为了防止某个公司未替换造成上个月数据的遗留,建议用空白文件把各个公司的文件先替换一下,然后再用当月文件替换
Excel解释说明:今天分享的技巧是一劳永逸的技巧。我们在实际工作中大量运用。工作量比原来不知省去了多少倍,一分钟就搞定所有汇总。
- ?
Excel分类汇总如何使用
纪嚣
展开
Excel中如果想对某类数据进行汇总,除了使用数据透视表之外,还可以使用分类汇总功能。
1. 首先必须对要汇总的数据进行排序,选中所有数据,点击“数据”——“排序”——主要关键字设为“姓名”——排序依据设为“单元格值”——次序设为“升序”——“确定”。这里的关键字跟你要汇总的方法是相关的,你想怎么分类就选哪个关键字,这里想汇总每个人的销量,因此选择“姓名”为排序关键字。至于次序为“升序”或“降序”都可以的。
图1-12. 选中排好序的数据,点击“数据”——“分类汇总”。在这个界面上有多个设置项,分类字段表示你要为哪个字段进行汇总,这里应该选择步骤1排序的关键字;汇总方式有求和、计数、平均值、最大值、最小值和乘积这几种统计方式;汇总规则有表格中的几列标题,选择哪一个就表示要为哪一个进行统计。本例中分类字段设为“姓名”,汇总方式设为“求和”,汇总规则设为“销量”,并勾选“汇总结果显示在数据下方”。
图1-2图1-33. 这样分类汇总就制作好啦。每个姓名下都有一行汇总了这个人的销量总和,界面左侧多了一些分级标志,点击其中的数字可以收缩或展开数据,例如点击数字“2”,就会收缩所有原始数据,只显示汇总结果;点击数字“1”就只会显示“总计”结果。
图1-4图1-54. 如果想用多种规则汇总,就重复上述步骤2,在分类汇总设置窗口中不勾选“替换当前分类汇总”即可。如果不想要分类汇总了,就点击“数据”——“分类汇总”“全部删除”。
图1-6Excel数据透视表怎么做
来源:解晴新生,点击文章开头的“解晴新生”或“关注”可以查看更多相关文章哦。方便的话,请点赞支持下,谢谢!
- ?
推荐一款可以替代 Excel 的可视化报表神器!
初之
展开
很多读者看到漂亮的图表都会问“这个怎么做”,“用什么工具实现”。制作漂亮的可视化一般有这样几个方式:
利用Excel内置的图表做一些常规的统计图。高级复杂的譬如动态图表,图表的筛选展示可以通过写VBA来实现。通过R、Python一类的数据分析语言,调用图表功能包,呈现可视化的数据,数据分析常用。借助Echarts、HighCharts、D3.js等开源的可视化插件,嵌入代码,开发成插件包,可视化工程师和前端开发常用。
可视化最实用的场景就是做报表。既然这次的主题是可视化,那小编今天就细细地讲一下酷炫的可视化报表是怎么做的?有哪些基础和高级的可视化图表?代码开发是怎么一回事?大屏又是如何操作?
代表工具FineReport,此前介绍过FineReport的使用场景和功能。大家若不熟悉,可自行和Excel绑定对比。
你用过Excel,却不知还有一款神器“FineReport”这款效率远超Excel的表格工具,没用过就可惜了!
基础图表+表格
柱形图、折线图、饼图、气泡图、散点图等能满足常规的数据统计。拿到数据后,先分析要展示几个维度,选用什么样的图表,需要几个图表展示等。
如何选择图表的类型?
基础图表的制作流程
在FineReport中,图表的操作流程类似Excel,数据准备——插入图表——选择图表类型—选择分类轴、系列名称和系列值——选择图表样式。
各式各样的表格
表格主要在于文字、数字、格间的美感,以及整体的色彩搭配和谐,这些在FineReport中都可通过自定义来是实现。
高级图表
高级图表都是在基本图表的基础上展开来一些新特性。
饼图类:等弧度玫瑰图、不等弧度玫瑰图…
柱形图类:堆积柱形图、百分比堆积柱形图…
条形图类:堆积条形图、百分比堆积条形图…
折线图类:堆积折线图、面积图…
仪表盘类:多指针的仪表盘360度、多指针的仪表盘180度、百分比圆环仪表盘、百分比刻度槽型仪表盘、试管型仪表盘…
雷达图类:普通雷达图、堆积柱形雷达图…
气泡图类:普通气泡图、力学气泡图、十字象限气泡图…
地图类:区域地图、点地图、大数据流向地图…
还有各种组合图,比如“柱形图—折线图、柱形图—面积图、堆积柱形图—折线图、自定义地图”…
其他,还有漏斗图、甘特图、词云、框架图等等。
这些图在FineReport都是现成使用的。在其他工具或其他使用场景中,可由交由可视化工程师开发。
为了高度结合数据分析的过程,更好的理解数据背后的业务意义。可视化图表除了形态还有动态展示部分,就是所谓的动态可视化。
例1:地图的钻取和联动
例2:图表联动
例3:点击词云跳转链接
例4:图表切换
过去这些动态特效和交互属性都要写代码开发,这个在FineReport都已经封装成一个个功能,还有图表缩放、自动刷新、数据提示。再复杂点,就是设动态参数加超链。
利用开源插件开发
就是用市面上开源的数据可视化工具, 譬如Highcharts、D3.js、百度Echarts、蚂蚁金服AntV、GoogleCharts、Raphael.js、Sigma.js、three.js等。
像在7月,我们举办了一场可视化插件开发大赛上,很多开发者开发了令人心动的图表插件。
譬如下方的3D城市全景地图,作者Little使用Echart-GL开源库和MapBox,与地图结合,基于真实地图和基本建筑数据构造都市圈级别的宏大场景,适用于政府部门、连锁企业、LBS提供商等对真实经纬度和展现区域范围敏感的用户。插件的底层是WebGL(Web Graphic Library),它是一个 JavaScript API,用于在任何兼容的 Web 浏览器中渲染 3D 图形。WebGL 程序由用 JavaScript 编写的控制代码和用 OpenGL 着色语言(GLSL)编写的着色器代码构成,这种语言类似于 C 或 C++,可在 GPU 上执行。
比如滚动报表图。传统的决策报表块是静态的,列表不会滚动,数据必须一次性展现,在大屏中效果不够酷炫,无法自动获取最新的数据,除非编写大量的js代码,对一般人来说就只能望洋兴叹。
而插件安装后,可以用图表的形式展现报表,通过设置数据集,显示成类似报表块列表,零代码获取数据库信息并配置自动更新时间,支持通过字段名称配置表头,支持自定义颜色配置等多种丰富的配置项,这样制作的决策报表效果也更酷炫。
数据大屏
大屏展现作为数据可视化的一个典型使用场景,涵盖的知识太多。一个完整的大屏项目从开始调研到实施交付可能需要开发工程师、项目经理、视觉工程师、UI工程师、硬件工程师等等众多专业人员的参与。
于数据大屏设计美学:大屏做成这样,领导不重用你都难!数据大屏的具体制作:4步教你玩转可视化大屏设计|内附实际操作
-----------------
最后,12月28日晚上20:00,帆软将在知乎上举办 “如何成为企业需要的数据分析人才” Live 直播,教大家如何找到数据职业生涯的破局点,欢迎大家参加!
- ?
Excel多表汇总?没有比这个更简单实用的技巧了
裴笑卉
展开
关于多表汇总的问题,我在类似的问题中介绍了一种非常好的方法:Power Query(有兴趣的同学,请参考仅需3分钟,轻松帮你搞定Excel多表数据汇总)。下面我来介绍一种更为简单的汇总多表数据的技巧。如何快速汇总下图中的12个sheet中的数据到总表呢?
一、无链接简单汇总法(各个数据源发生变化,汇总表不发生变化)
1.选择sheet汇总中的任意空白单元格,依次单击“数据”--“合并计算”,如下图所示:
2.在弹出的对话框中函数设置为:“求和”。单击引用位置的折叠按钮选择在各个sheet中的数据区域并添加到所有引用位置列表中。勾选标签位置下的“首行”和“最左列”选项,单击确定。
3.我们将得到如下的汇总表,这时候我们可以删除B列和C列,或者将任意sheet中的B列和C列数据复制粘贴到汇总表中即可。
二、有链接的数据汇总(汇总结果随数据源的变化而变化)
此种方式与上面介绍的方法唯一不同的地方就在于多勾选了一个选项,操作技巧都一样,只是在上面设置合并计算对话框时勾选一下:“创建指向源数据的链接”即可。
得到的结果也会有所不同。
包含了公式,且前面变成分类汇总的样式。
- ?
Excel多工作表汇总,这个功能让你快速达成
神圣的
展开
Excel多工作表如何汇总,这是职场中经常碰到的问题之一。有多种方法可以达到这个效果,今天给大家带来一个简单的操作——合并计算。
合并计算在哪?
在【数据】选项卡,【数据工具】功能区。
1、标题一致的多表汇总
分表如下:
各工作表标题一致的情况下,首先将光标定位在汇总表格的左上角单元格,然后再进行操作。光标定位在“引用位置”的文本框中选择各工作表的表格范围,然后点击“添加”。“首行”或“首列”根据情况选择,本例中即要首行的标题,也要首列的员工编号,所以都选择。
最终完成效果如下:
2、标题不一致的多表汇总
如我们要将4个月的明细汇总到一个工作表中,各工作表除员工编号标题外,其它标题不同。
操作方法一致,最终效果如下:
- ?
全球100款大数据工具汇总
卫惜萍
展开
1、 Talend Open Studio
是第一家针对的数据集成工具市场的ETL(数据的提取Extract、传输Transform、载入Load)开源软件供应商。Talend的下载量已超过200万人次,其开源软件提供了数据整合功能。其用户包括美国国际集团(AIG)、康卡斯特、电子港湾、通用电气、三星、Ticketmaster和韦里逊等企业组织。
2、DYSON
探码科技自主研发的DYSON智能分析系统,可以完整的实现大数据的采集、分析、处理。DYSON智能分析系统专业针对互联网数据抓取、处理、分析,挖掘。可以灵活迅速地抓取网页上散乱分布的信息,并通过强大的处理功能,准确挖掘出所需数据,是目前使用人数最多的网页采集工具.
3、YARN
一种新的Hadoop资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,解决了旧MapReduce框架的性能瓶颈。它的基本思想是把资源管理和作业调度/监控的功能分割到单独的守护进程。
4、Mesos
由加州大学伯克利分校的AMPLab首先开发的一款开源群集管理软件,支持Hadoop、ElasticSearch、Spark、Storm 和Kafka等架构。对数据中心而言它就像一个单一的资源池,从物理或虚拟机器中抽离了CPU,内存,存储以及其它计算资源, 很容易建立和有效运行具备容错性和弹性的分布式系统。
5、Datale
由探码科技研发的一款基于Hadoop的大数据平台开发套件,RAI大数据应用平台架构。
6、 Ambari
作为Hadoop生态系统的一部分,提供了基于Web的直观界面,可用于配置、管理和监控Hadoop集群。目前已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeper、Sqoop和Hcatalog等。
7、ZooKeeper
一个分布式的应用程序协调服务,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的工具,让Hadoop集群里面的节点可以彼此协调。ZooKeeper现在已经成为了 Apache的顶级项目,为分布式系统提供了高效可靠且易于使用的协同服务。
8、Thrift
在2007年facebook提交Apache基金会将Thrift作为一个开源项目,对于当时的facebook来说创造thrift是为了解决facebook系统中各系统间大数据量的传输通信以及系统之间语言环境不同需要跨平台的特性。
9、Chukwa
监测大型分布式系统的一个开源数据采集系统。建立在HDFS/MapReduce框架之上并继承了Hadoop的可伸缩性和可靠性,可以收集来自大型分布式系统的数据,用于监控。它还包括灵活而强大的显示工具用于监控、分析结果。
10、Lustre
一个大规模的、安全可靠的、具备高可用性的集群文件系统,它是由SUN公司开发和维护的。该项目主要的目的就是开发下一代的集群文件系统,目前可以支持超过10000个节点,数以PB的数据存储量。
11、HDFS
Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。
12、GlusterFS
一个集群的文件系统,支持PB级的数据量。GlusterFS 通过RDMA和TCP/IP方式将分布到不同服务器上的存储空间汇集成一个大的网络化并行文件系统。
13、Alluxio
前身是Tachyon,是以内存为中心的分布式文件系统,拥有高性能和容错能力,能够为集群框架(如Spark、MapReduce)提供可靠的内存级速度的文件共享服务。
14、Ceph
新一代开源分布式文件系统,主要目标是设计成基于POSIX的没有单点故障的分布式文件系统,提高数据的容错性并实现无缝的复制。
15、PVFS
一个高性能、开源的并行文件系统,主要用于并行计算环境中的应用。PVFS特别为超大数量的客户端和服务器端所设计,它的模块化设计结构可轻松的添加新的硬件和算法支持。
16、QFS
Quantcast File System (QFS) 是一个高性能、容错好、分布式的文件系统,用于开发支持 MapReduce处理或者需要顺序读写大文件的应用。
17、 Logstash
一个应用程序日志、事件的传输、处理、管理和搜索的平台。可以用它来统一对应用程序日志进行收集管理,提供了Web接口用于查询和统计。
18、Scribe
Scribe是Facebook开源的日志收集系统,它能够从各种日志源上收集日志,存储到一个中央存储系统(可以是NFS,分布式文件系统等)上,以便于进行集中统计分析处理。
19、Flume
Cloudera提供的一个高可用的、高可靠的、分布式的海量日志采集、聚合和传输的系统。Flume支持在日志系统中定制各类数据发送方,用于收集数据。同时,Flume支持对数据进行简单处理,并写入各种数据接受方(可定制)。
20、RabbitMQ
一个受欢迎的消息代理系统,通常用于应用程序之间或者程序的不同组件之间通过消息来进行集成。RabbitMQ提供可靠的应用消息发送、易于使用、支持所有主流操作系统、支持大量开发者平台。
21、ActiveMQ
Apache出品,号称“最流行的,最强大”的开源消息集成模式服务器。ActiveMQ特点是速度快,支持多种跨语言的客户端和协议,其企业集成模式和许多先进的功能易于使用,是一个完全支持JMS1.1和J2EE 1.4规范的JMS Provider实现。
22、Kafka
一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模网站中的所有动作流数据,目前已成为大数据系统在异步和分布式消息之间的最佳选择。
23、Spark
一个高速、通用大数据计算处理引擎。拥有Hadoop MapReduce所具有的优点,但不同的是Job的中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。它可以与Hadoop和Apache Mesos一起使用,也可以独立使用。
24、Kinesis
可以构建用于处理或分析流数据的自定义应用程序,来满足特定需求。Amazon Kinesis Streams 每小时可从数十万种来源中连续捕获和存储数TB数据,如网站点击流、财务交易、社交媒体源、IT日志和定位追踪事件。
25、 Hadoop
一个开源框架,适合运行在通用硬件,支持用简单程序模型分布式处理跨集群大数据集,支持从单一服务器到上千服务器的水平scale up。Apache的Hadoop项目已几乎与大数据划上了等号,它不断壮大起来,已成为一个完整的生态系统,拥有众多开源工具面向高度扩展的分布式计算。高效、可靠、可伸缩,能够为你的数据存储项目提供所需的YARN、HDFS和基础架构,并且运行主要的大数据服务和应用程序。
26、Spark Streaming
实现微批处理,目标是很方便的建立可扩展、容错的流应用,支持Java、Scala和Python,和Spark无缝集成。Spark Streaming可以读取数据HDFS,Flume,Kafka,Twitter和ZeroMQ,也可以读取自定义数据。
27、Trident
是对Storm的更高一层的抽象,除了提供一套简单易用的流数据处理API之外,它以batch(一组tuples)为单位进行处理,这样一来,可以使得一些处理更简单和高效。
28、Flink
于今年跻身Apache顶级开源项目,与HDFS完全兼容。Flink提供了基于Java和Scala的API,是一个高效、分布式的通用大数据分析引擎。更主要的是,Flink支持增量迭代计算,使得系统可以快速地处理数据密集型、迭代的任务。
29、Samza
出自于LinkedIn,构建在Kafka之上的分布式流计算框架,是Apache顶级开源项目。可直接利用Kafka和Hadoop YARN提供容错、进程隔离以及安全、资源管理。
30、Storm
Storm是Twitter开源的一个类似于Hadoop的实时数据处理框架。编程模型简单,显著地降低了实时处理的难度,也是当下最人气的流计算框架之一。与其他计算框架相比,Storm最大的优点是毫秒级低延时。
31、Yahoo S4 (Simple Scalable Streaming System)
是一个分布式流计算平台,具备通用、分布式、可扩展的、容错、可插拔等特点。程序员可以很容易地开发处理连续无边界数据流(continuous unbounded streams of data)的应用。它的目标是填补复杂专有系统和面向批处理开源产品之间的空白,并提供高性能计算平台来解决并发处理系统的复杂度。
32、HaLoop
是一个Hadoop MapReduce框架的修改版本,其目标是为了高效支持 迭代,递归数据 分析任务,如PageRank,HITs,K-means,sssp等。
33、Presto
是一个开源的分布式SQL查询引擎,适用于交互式分析查询,可对250PB以上的数据进行快速地交互式分析。Presto的设计和编写是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。Facebook称Presto的性能比诸如Hive和MapReduce要好上10倍有多。
34、 Drill
于2012年8月份由Apache推出,让用户可以使用基于SQL的查询,查询Hadoop、NoSQL数据库和云存储服务。它能够运行在上千个节点的服务器集群上,且能在几秒内处理PB级或者万亿条的数据记录。它可用于数据挖掘和即席查询,支持一系列广泛的数据库,包括HBase、MongoDB、MapR-DB、HDFS、MapR-FS、亚马逊S3、Azure Blob Storage、谷歌云存储和Swift。
35、Phoenix
是一个Java中间层,可以让开发者在Apache HBase上执行SQL查询。Phoenix完全使用Java编写,并且提供了一个客户端可嵌入的JDBC驱动。Phoenix查询引擎会将SQL查询转换为一个或多个HBase scan,并编排执行以生成标准的JDBC结果集。
36、Pig
是一种编程语言,它简化了Hadoop常见的工作任务。Pig可加载数据、转换数据以及存储最终结果。Pig最大的作用就是为MapReduce框架实现了一套shell脚本 ,类似我们通常熟悉的SQL语句。
37、Hive
是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。
38、SparkSQL
前身是Shark,SparkSQL抛弃原有Shark的代码并汲取了一些优点,如内存列存储(In-Memory Columnar Storage)、Hive兼容性等。由于摆脱了对Hive的依赖性,SparkSQL无论在数据兼容、性能优化、组件扩展方面都得到了极大的方便。
39、Stinger
原来叫Tez,是下一代Hive,由Hortonworks主导开发,运行在YARN上的DAG计算框架。某些测试下,Stinger能提升10倍左右的性能,同时会让Hive支持更多的SQL。
40、Tajo
目的是在HDFS之上构建一个可靠的、支持关系型数据的分布式数据仓库系统,它的重点是提供低延迟、可扩展的ad-hoc查询和在线数据聚集,以及为更传统的ETL提供工具。
41、Impala
Cloudera 声称,基于SQL的Impala数据库是“面向Apache Hadoop的领先的开源分析数据库”。它可以作为一款独立产品来下载,又是Cloudera的商业大数据产品的一部分。Cloudera Impala 可以直接为存储在HDFS或HBase中的Hadoop数据提供快速、交互式的SQL查询。
42、 Elasticsearch
是一个基于Lucene的搜索服务器。它提供了一个分布式、支持多用户的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索、稳定、可靠、快速、安装使用方便。
43、Solr
基于Apache Lucene,是一种高度可靠、高度扩展的企业搜索平台。知名用户包括eHarmony、西尔斯、StubHub、Zappos、百思买、AT&T、Instagram、Netflix、彭博社和Travelocity。
44、Shark
即Hive on Spark,本质上是通过Hive的HQL解析,把HQL翻译成Spark上的RDD操作,然后通过Hive的metadata获取数据库里的表信息,实际HDFS上的数据和文件,会由Shark获取并放到Spark上运算。Shark的特点就是快,完全兼容Hive,且可以在shell模式下使用rdd2sql()这样的API,把HQL得到的结果集,继续在scala环境下运算,支持自己编写简单的机器学习或简单分析处理函数,对HQL结果进一步分析计算。
45、Lucene
基于Java的Lucene可以非常迅速地执行全文搜索。据官方网站声称,它在现代硬件上每小时能够检索超过150GB的数据,它拥有强大而高效的搜索算法。
46、Terracotta
声称其BigMemory技术是“世界上首屈一指的内存中数据管理平台”,支持简单、可扩展、实时消息,声称在190个国家拥有210万开发人员,全球1000家企业部署了其软件。
47、 Ignite
是一种高性能、整合式、分布式的内存中平台,可用于对大规模数据集执行实时计算和处理,速度比传统的基于磁盘的技术或闪存技术高出好几个数量级。该平台包括数据网格、计算网格、服务网格、流媒体、Hadoop加速、高级集群、文件系统、消息传递、事件和数据结构等功能。
48、GemFire
Pivotal宣布它将开放其大数据套件关键组件的源代码,其中包括GemFire内存中NoSQL数据库。它已向Apache软件基金会递交了一项提案,以便在“Geode”的名下管理GemFire数据库的核心引擎。
49、 GridGain
由Apache Ignite驱动的GridGrain提供内存中数据结构,用于迅速处理大数据,还提供基于同一技术的Hadoop加速器。
50、MongoDB
是一个基于分布式文件存储的数据库。由C++...
- ?
Excel超高效汇总表格,看这篇就够了
Elijah
展开
excel使用技巧大全如何汇总多个excel表格这是很多朋友都非常困扰的一个问题,今天我们来介绍一下不用公式如何来轻松的完成。
如下图所示,在一个工作簿中有4个城市的销量表,我们现在要将这4个表用数据表来汇总起来。
方法如下:1、按alt+d键,松开后按d键。这时就会打开数据透视表和数据透视图向导,第1步选取“多重合并计算数据区域”,请看下图。
2、点击“自定义页字段”
3、添加区域和设置字段数目和名称。
4、添加要合并的所有表格,并且依次的给所有表设置名称和字段数目。
5、点击完成后就会生成数据透视表,将页字段名字从“页1”改成“城市”,“行”改成“产品”。
没更改前:
更改后为:
设置ok!
下面我们就能够通过字段位置的调整来完成模式不同的汇总。
以城市+产品汇总
以产品+城市汇总
数据透视表只是可以完成一些比较简单的表格的合并,但一些行数列数比较多比较复杂,格式又不一致的表格就要用到SQL语句来合并了。在之后的课堂上我们会讲到这个的,谢谢。
电子表格汇总软件
-
1、只需3秒快速实现求和
-
2、如何快速填充序号
-
3、如何自动填充序号(公式法)
-
4、数据条的神奇应用
-
5、多文本快速合并
-
6、查找与替换的不同玩法
-
7、快速定位到指定区域
-
8、数据排序、工资条制作
-
9、快速筛选(模糊、精确筛选)
-
10、快速插入空行
-
11、快速删除空行
-
12.快速跳转到天涯海角
-
13、.同时查看两个Excel文件
-
14、用条件格式扮靓报表
-
15、一键插入Excel图表
-
16、批量处理行高、列宽
-
17、利用拆分功能查看数据
-
18、批量录入相同内容
-
19、工作表快速跳转
-
20、批量录入表格模板(精品课程)
-
21、Excel函数与公式的应用、公式循环引用的查找
-
22、IF函数单条件判断同比增长
-
23、用sum函数 格式相同,连续多表数据汇总
-
24、excel快捷键
-
25、VLOOKUP函数——根据销售员匹配销售额
-
26、统计各部门销售总额
-
27、统计指定条件个数
-
28、怎样输入当前日期和时间、星期数
-
29、销售业绩排名
-
30、Sumproduct函数-万能函数(销售额汇总求和)
-
31、根据销售员,地区,商品名称汇总
-
32、批量替换PPT字体
-
33、给销售额数据批量添加万元单位
-
34、一秒快速核对两列数据
-
35、快速定位到指定单元格或区域
-
36、快速制作双行标题工资条
-
37、给你的表格做个瘦身
-
38、快速打开常用的Excel文件
-
39、快速打开多个Excel文件
-
40、利用创建组—快速隐藏/展开多列数据
-
41、快速制作下拉菜单
-
42、复制粘贴表格,如何保留数据源列宽格式一致?
-
43、两列数据位置互换
-
44、1秒钟扮靓报表——如何实现表格隔行换色
-
45、快速删除重复记录——保留唯一值
-
46、快速向下填充、向右填充,文本或公式
-
47、给Excel文件添加密码
-
48、插入带图片的批注
-
49、输入公式后不计算?
-
50、如何设置单元格缩进
-
51、快速解决Excel表格总显示货币格式
-
52、批量添加万元单位
-
53、你会四舍五入么?
-
54、用RAND函数机选彩票
-
55、冻结首行你会么?
-
56、超链接的高级应用
-
57、IFERROR函数-屏蔽错误值
-
58、批量填充颜色
-
59、录入数据
-
60、快速输入工号
-
61、快速行列转置
-
62、自定义缩放界面
-
63、多个单元格同时输入
-
64、如何计算立方米?
-
65、快速制作双行标题工资条
-
66、输入带方框的√和×
-
67、快速将姓名对齐
-
68、快速输入性别
-
69、按单位职务排序
-
70、自动计算合同到期日期
-
71、计算时间间隔
-
72、日期和时间的拆分
-
73、快速处理不规范的日期格式
-
74、快速填充合并单元格
-
75、效率加倍的快捷键
-
76、快速复制表格和对象
-
77、快速创建工作表副本
-
78、快速复制序列号
-
79、快速显示公式
-
80、多个单元格同时输入
-
81、快速调整显示比例
-
82、快速自动填充
-
83、快速填充(Ctrl+E)
-
84、Ctrl与数字键结合
-
85、快速将多列数据整理为1列
-
86、快速将1列数据拆分为多列
-
87、快速定位公式
-
88、快速录入数据
-
89、快速累计求和
-
90、身份证号码显示为0怎么办?
-
91、快速制作斜线表头
-
92、文本竖向显示
-
93、神奇的监视窗口
-
94、不一样的格式刷
-
95、快速美化图表
-
96、快速生成当前日期
-
97、快速找出循环引用
-
98、快速提取信息
-
99、二维表快速转换为一维表
-
100、快速多表合并