中企动力 > 头条 > 数据分析师

网站性能检测评分

注:本网站页面html检测工具扫描网站中存在的基本问题,仅供参考。

数据分析师

一起聊聊数据分析师的那些技能(硬功夫) 公司视频课程

img

Fan

关注

在前面写了《聊聊我的R语言学习路径和感受》一文,很多朋友在公众号后台给我留言,问如何学习数据分析、如何转行数据分析、如何快速的掌握数据分析技能等等类似的问题。为了回答这些问题,就在这里跟大家聊聊我个人从事数据分析行业后的一些感受和建议。也欢迎各位看官提出你自己的想法和经验,帮助到其他同行的朋友。

感受1:SQL很重要

SQL很重要!SQL很重要!SQL很重要!重要的事说三遍,数据库查询对于一个数据分析师来说真的是必备技能。没有它,你的工作真的非常难找,往往在面试的时候,对方都会出一些数据库相关的问题。数据库之所以重要,那是因为你工作中所需要分析的数据基本都是来自于数据库,如果你不会从数据库查询,就等同于“巧妇难为无米之炊”。

学习建议

数据库目前在市面是有很多种,如Oracal、SQL Server、MySQL、Hive等,并不是都要一一学个遍,因为它是结构化的查询语言,各种数据库的语法都非常相似,可以说是一通百通。如果你想从事数据分析岗,但又没有接触过数据库(学生或准备换行的朋友),建议你下载一个MySQL的社区版本(https://dev.mysql/downloads/mysql/),然后买一本相对实战且基础的书籍(《SQL必知必会》)进行学习。这本书一共介绍了30个章节的内容,你只需重点吸收数据库的查询、修改、删除、插入、存储过程等知识点,我认为通过这些知识点的吸收和应用,基本上可以满足数据分析岗的面试要求了。当然对于老手来说,这本书里面也有很多其他值得学习和实战的例子(如存储过程、游标、事件、性能等)。

感受2:可视化显水平

数据可视化的技能,也是数据分析师的必备要求,因为枯燥的数据表肯定不如一张张图更吸引眼球,更何况这些报表更多的是给那些业务繁忙的Boss看。那报表的展现方式总不能每次发一个PPT给对方吧,如何让对方随时随地的查看到你的报表呢?Tableau!

它有两个强大的版本,一个是DeskTop版,即分析人员的可视化设计版本;另一个是Server版,即通过DeskTop将设计好的可视化报表上传至服务器,实现随时查阅报表的功能,而这两个版本的结合就能恰到好处的满足随时随地查报表。最大的好处是你无需编程即可完成高质量的可视化任务,只需通过简单的托拉拽,就让数据可视化想怎么玩就怎么玩。目前越来越多的企业,在招聘时,都会要求或注明有Tableau的使用经验。

学习建议

这里推荐《Tableau数据可视化从入门到精通》一书,这也是我看的众多Tableau书籍中比较好的一本,而且该书籍在售书平台上的评价也非常棒。该书一共16个章节,从基础的工具简介、数据读取、字段操作、函数使用到可视化实操,讲到了很多细节方面的内容,最后还以两个案例作为压轴戏,分别是“网上超市运营分析”和“网站流量统计分析”。这两个主题抓的非常贴切,一个从电商运营角度来思考常见的可视化问题;另一个则从网站运营角度来分析有哪些核心指标可供选择和及对应的展现方式。这两个角度都顺应了互联网时代下的需求,我相信当你读完并操作完数里面的案例,会对你的可视化能力有一个质的提升,也是进入数据分析行业的加分项。

感受3:Excel很普及

作为一个数据分析师或BI,其实很多工作内容都可以通过SQL提数和Excel的加工就可以任务完成,困难的是如何梳理好SQL的提数逻辑和灵活的应用Excel减轻你的工作量。之所以说它应用很普及,是因为它不仅仅是个装数据的容器,更多的是会借助于强大函数、可视化等帮你完成工作。

各式各样的字符串函数(LEFT、RIGHT、MID、LEN、REPLACE、TRIM、FIND、SEARCH、CONCATENATE、REPT等)、数值函数(ABS、EXP、LOG、POWER、SQRT、CEILING、FLOOR、MOD、ROUND、SIGN等)、日期函数(DATE、YEAR、MONTH、DAY、WEEKDAY、WORKDAY、TODAY等)、统计函数(MIN、MAX、AVERAGE、MEDIAN、VAR.S、SUM、SUMIFS、COUNT、SKEW、NORM.DIST等)、匹配函数(ROWS、COLUMNS、MATCH INDEX、VLOOKUP)等可以让你在数据处理过程中变的非常简单而轻松;强大的可视化功能(如饼图、条形图、柱状图、折线图、面积图、散点图、气泡图、雷达图等)也会为你的数据分析助一臂之力,但面对大数据量时就显得非常捉急,这也是无法跟Tableau媲美的;灵活的宏功能,可以避免我们不断的做重复性工作,从而节约时间,提高我们的工作效率,宏语句是由一系列的命令和函数组织起来的,尽管它在工作中用的并不是那么的频繁,但一有机会,你去用它来开发报表或表计算的话,会大大提高你的成就感,当然,我希望你能够会一些宏语句,这样你身边的朋友或同事都会觉得你很了不起呢!

学习建议

这里向大家推荐《Excel函数与公式速查手册》和《Excel2016宝典》两本书。第一本书涵盖了近600个函数的讲解,而且这些函数都是借助于一个个实例来完成的,有助于读者的操作和理解,可以说,读完这本关于函数的书就可以在工作中使用函数时显得游刃有余;第二本光从书名就知道是一本知识点比较全面的书籍,该书涉及Excel的公式和函数、图表可视化以及Excel的各种设置。个人建议可以把这两本书当作工具来使用,没必要系统的过一遍,当你需要某个知识点时,从目录去查找相关关键词,然后操作几遍就记得如何使用了。

数据挖掘秀肌肉

我相信,当你找数据分析相关的工作岗位时,基本上都会看见对方要求你会数据挖掘或数据建模方面的能力,同时也会附上一条熟练使用Python、R等工具。此时你会掂量掂量自己,这方面的技能我会吗?工具使用的熟悉程度能够达到对方的预期吗?我有哪些相关的建模经验?

在面试或工作中比较常见的数据挖掘算法有四类,分别是预测、分类、聚类和关联,个人觉得前两类的使用频率会更高一些。这里提几个重要的挖掘算法:线性回归、Logistic回归、决策树、贝叶斯、SVM、随机森林、K均值和关联规则。希望不熟或不会数据挖掘的朋友可以先从这几个着手学习,而且学习的时候先通过代码完成落地,然后再去慢慢研究其理论知识。

学习建议

如果你是统计学或经济学等类似专业的朋友,建议你去学习R语言,而如果你是计算机专业或理工科的朋友,则建议你去学习Python。因为这两个工具的思维有一点点差异,毕竟R语言是由统计学家创建的(偏向于函数概念),而Python是由计算机学家创建的(偏向于类概念)。而且又有一些相似性,同时学习的话会比较容易混淆。如果你选择R语言的话,这里推荐《R语言实战》和《机器学习与R语言》这两本书,前一本书偏向于语法编程,同时也会含有案例来说明统计学方面的知识点,后一本则通过实战的方式来介绍常用的数据挖掘技术,能够助你快速的进入R语言的挖掘状态;如果你选择Pythond的话,同样介绍两本书,即《利用Python进行数据分析》和《Python数据分析与挖掘实战》,第一本更多的是介绍数据分析方面的Python库,如numpy、pandas和matplotlib,这也是一本基础书,第二本则是教你如何按部就班地完成每一个实战案例,具有代入感,让读者学习起来很顺畅;如果你还想补一补数据挖掘的理论知识,则推荐《数据挖掘概念与技术》,个人看了好几遍,不是很难,有比较好的操作性。

OK,如上就是我从事数据分析岗位的一些学习经验和感悟,希望对各位读者有一点点的帮助。学习是一种投资,需要耐得下性子,坐得住板凳,敲得住键盘,同时,还要不断的坚持。只有这样,我相信一定会成为数据分析或挖掘的强者。

End.

作者:刘顺祥(中国统计网特邀认证作者)

点击下面链接 查看历史文章

一文综述数据科学家必备的10大统计技术:线性回归、分类、无监督学习...

【漫画版】12星座程序员写代码

怎样成为知乎大V?爬取张佳玮138w+知乎关注者:数据可视化

一步一步教你分析消费者大数据

身为数据分析师,却被业务当做取数机? 流量视频课程

img

出国人

关注

作者:接地气的陈老师链接:https://zhihu/question/264164580/answer/357527397来源:知乎

被业务呼来喝去的跑数据,是做数据分析的同学一个极大的痛点。出力不讨好不说,自己还没啥成长。如果扒皮抽筋看真相,你会发现这压根就不是个技术问题,而是政治地位的问题。是数据分析到底在公司里算老几的问题。

我就见过相当多大企业,做了BI系统,还有拖拉拽的数据集市,还有日、周、月报,到头来数据分析部还是天天在接一堆零时取数需求。我们还尝试过收集各个公司的报表打开率数据,非常有意思,大概10%左右。有兴趣的同学可以尝试下,最简单的方法,就是你群发日、周、月报的时候,加一个邮件阅读回执。看看有几个人真的每天会看。你会发现不但看的人很少,而且一般等级都很低O(╯□╰)o所以自动化的报表救不了数据分析师。你会发现业务部门照样会把你当哆啦A梦的口袋,需要数据的时候直接丢一纸需求单了事。你要是不肯做,他们就搬出:“这是XX总监面授的需求,要抓紧完成,老板需要精细数据”来镇压你。是滴,这帮哥们常常宁可把时间浪费在打嘴仗上,也不肯抽10分钟研究下现有的报表,这都是常有的事。

虽然做数据分析的同学喜欢讲“数据驱动决策,分析提升效率”,然而这句话是有主语的,应该叫:“老板用数据驱动决策,业务部门用分析提升效率”。因为本质上看,想驱动决策需要的不是数据而是权威;想提升效率,需要的是把数据优化的结果融入业务过程。如果老板数据化管理意识淡薄,喜欢讲经验、拍脑袋,那驱动决策就无从做起。如果业务部门只喜欢按自己的路子来,对分析结果不管不顾,或是喜欢在分析里夹自己的私货,那提升效率也无从谈起了。所以真的想改变这个情况,需要的不是更复杂的方法或者自动化报表,而是:想办法争取老板的认可、业务部门的参与。不要让我们的分析结果躺在PPT里。

具体的做法写本书都够了。这些年做项目,和不少甲方企业的数据部门一起为了提高地位而努力过,可以分享一些心得给大家。

第一,目标清晰。数据驱动决策不是数据替代决策哈。很多会争取地位的数据部门领导们,把目标设定在:让业务方认可数据的用途上。正如医生不能包治百病,但有病了还是得去看医生一样。只要能证明看数据比拍脑袋、土办法、憋思路多那么一点点的用就行了。与此对应的是,凡是大吹大擂大数据人工智能怎么怎么就把业绩拉动基本都死无葬身之地。因为拉业绩是业务部门的活。跨过业务部门想直接促成业绩,不但很难做到,而且抢了业务部门的生意。人家随便做做手脚,数据都得吃瘪。

第二,选好对象。做数据的同学切记:我们人微言轻,我们做报告给老板看和我们就是老板是两个概念。因此所有人都有兴趣听我们说话,也不是所有人都适合服务的。我总结了经常碰到的业务部门类型,归纳为下图。大家体验一下。如果想挤出更多时间来做真正的分析,肯定要拒绝掉一些需求的,搞清部门的风格,可以帮你减少摩擦。

第三,切中痛点。既然业务部门会有零散的需求,至少说明他们还有需求。业务部门的工作,可以粗略的分为平常思考-事前策划-事中执行-事后评估四个阶段,其实每个阶段都有很多很多和数据有关的抱怨(详见下图),因为分析原因,测算效果,监控进度,总结经验始终是业务所需要的。只要我们能和业务部门说上话,一定能从他们的痛点切入,找到体现数据分析价值的地方。围绕痛点,把零散的需求转化为有具体目标的数据分析项目。

与其空谈”人工智能时代““大数据价值”不如结结实实的帮业务部门解决一些痛点。有痛点的才是真实需求。

第四,循序渐进。当我们能争取到一个项目,就比单纯写取数需求表大大前进了一步。下边就看如何把这个项目变成常规性的数据产品。其实数据产品的形态也不限于一个APP或软件。定期月例会汇报,定期的信息公报,数据资源库都是产品。关键,只要让业务部门能用起来,能在老板面前刷足存在感。这样以后的路才能越走越宽,而不是自己憋在格子间里跑数了。

至于如何具体操作,涉及的内容太多,有机会慢慢和大家分享。这里只提一点:只要是打包成一个整体能满足特定需求的都是产品(没打包要一步步做的叫服务)。很多同学觉得报表不算产品,其实是因为只知道跑报表,没见过报表如何应用。如果能结合具体场景,就会发现,其实好用的报表自有好用的理由,为什么选这些字段,为什么定这个周期更新,都是很有讲究的。

当然,并不是所有企业都有努力的空间,如果企业的老板、高层、业务部门真的很冥顽不化,还是趁早离开的好。但庆幸的是,现在“大数据”“数据挖掘”“人工智能”的春风吹遍大江南北,为我们营造了很好的外部环境。下一步,就是看怎么把朋友圈里《时代淘汰你的时候连问都不问一声》《震惊!又一个行业即将被颠覆!马云刚刚宣布》带来的对人工智能的恐慌,转化为切切实实的数据分析部门的地位提升。与大家共勉。

作者介绍:陈老师,在咨询行业打拼了9年,在如何诊断经营问题、建立分析体系、解决专项问题上有超过30个大型项目积累与实战,天善智能特邀专家。数据分析职场路上有困扰吗?不妨到《数据分析师八大能力培养课程》https://edu.hellobi/course/272 里聊聊!视频课程特色:从真实数据分析工作场景出发,训练实战能力启发式教学+大量实际操练,培养属于自己的能力不依赖于某个具体技术,也适合对数据分析感兴趣的学生、业务部门人士学习=

img

在线咨询

建站在线咨询

img

微信咨询

扫一扫添加
动力姐姐微信

img
img

TOP