中企动力 > 头条 > 统计学大数据分析

网站性能检测评分

注:本网站页面html检测工具扫描网站中存在的基本问题,仅供参考。

统计学大数据分析

年薪50万的大数据分析师养成记 行业视频课程

img

向伟祺

关注

以下是一位在数据分析领域打滚了N年后,写下的一些体会,一定能给新人一些借鉴的地方。(总结的不错,大家可以借鉴学习哦)

一、数据分析师有哪些要求?

  1、理论要求及对数字的敏感性,包括统计知识、市场研究、模型原理等。

  2、工具使用,包括挖掘工具、数据库、常用办公软件(excel、PPT、word、脑图)等。

  3、业务理解能力和对商业的敏感性。对商业及产品要有深刻的理解,因为数据分析的出发点就是要解决商业的问题,只有理解了商业问题,才能转换成数据分析的问题,从而满足部门的要求。

  4、汇报和图表展现能力。这是临门一脚,做得再好的分析模型,如果不能很好地展示给领导和客户,成效就大打折扣,也会影响到数据分析师的职业晋升。

二、请把数据分析作为一种能力来培养

  从广义来说,现在大多数的工作都需要用到分析能力,特别是数据化运营理念深入的今天,像BAT这样的公司强调全员参与数据化运营,所以,把它作为一种能力培训,将会让你终生受益。

三、从数据分析的四个步骤来看清数据分析师需具备的能力和知识:

  数据分析的四个步骤(这有别于数据挖掘流程:商业理解、数据理解、数据准备、模型搭建、模型评估、模型部署),是从更宏观地展示数据分析的过程:获取数据、处理数据、分析数据、呈现数据。

  (一) 获取数据

  获取数据的前提是对商业问题的理解,把商业问题转化成数据问题,要通过现象发现本质,确定从哪些纬度来分析问题,界定问题后,进行数据的采集。此环节,需要数据分析师具备结构化的思维和对商业问题的理解能力。

  推荐书籍:《金字塔原理》、麦肯锡三部曲:《麦肯锡意识》、《麦肯锡工具》、《麦肯锡方法》

  工具:思维导图、mindmanager软件

  (二) 处理数据

  一个数据分析项目,通常数据处理时间占70%以上,使用先进的工具有利于提升效率,所以尽量学习最新最有效的处理工具,以下介绍的是最传统的,但却很有效率的工具:

  Excel:日常在做通报、报告和抽样分析中经常用到,其图表功能很强大,处理10万级别的数据很轻松。

  UltraEdit:文本工具,比TXT工具好用,打开和运行速度都比较快。

  ACCESS:桌面数据库,主要是用于日常的抽样分析(做全量统计分析,消耗资源和时间较多,通常分析师会随机抽取部分数据进行分析),使用SQL语言,处理100万级别的数据还是很快捷。

  Orcle、SQL sever:处理千万级别的数据需要用到这两类数据库。

  当然,在自己能力和时间允许的情况下,学习新流行的分布式数据库及提升自身的编程能力,对未来的职业发展也有很大帮助。

  分析软件主要推荐:

  SPSS系列:老牌的统计分析软件,SPSS Statistics(偏统计功能、市场研究)、SPSS Modeler(偏数据挖掘),不用编程,易学。

  SAS:老牌经典挖掘软件,需要编程。

  R:开源软件,新流行,对非结构化数据处理效率上更高,需编程。

  随着文本挖掘技术进一步发展,对非结构化数据的分析需求也越来越大,需要进一步关注文本挖掘工具的使用。

  (三) 分析数据

  分析数据,需要用到各类的模型,包括关联规则、聚类、分类、预测模型等,其中一个最重要的思想是对比,任何的数据需要在参照系下进行对比,结论才有意义。

  推荐的书籍:

  1、《数据挖掘与数据化运营实战,思路、方法、技巧与应用》,卢辉着,机械出版社。这本书是近年国内写得最好的,务必把它当作圣经一样来读。

  2、《谁说菜鸟不会数据分析(入门篇)》和《谁说菜鸟不会数据分析(工具篇)》,张文霖等编着。属于入门级的书,适合初学者。

  3、《统计学》第五版,贾俊平等编着,中国人民大学出版社。比较好的一本统计学的书。

  4、《数据挖掘导论》完整版,[美]Pang-Ning Tan等着,范明等翻译,人民邮电出版社。

  5、《数据挖掘概念与技术》,Jiawei Han等着,范明等翻译,机械工业出版社。这本书相对难一些。

  6、《市场研究定量分析方法与应用》,简明等编着,中国人民大学出版社。

  7、《问卷统计分析实务—SPSS操作与应用》,吴明隆着,重庆大学出版社。在市场调查领域比较出名的一本书,对问卷调查数据分析讲解比较详细。

(四) 呈现数据

  该部分需要把数据结果进行有效的呈现和演讲汇报,需要用到金字塔原理、图表及PPT、word的呈现,培养良好的演讲能力。

  推荐书籍:

  1、《说服力让你的PPT会说话》,张志等编着,人民邮电出版社。

  2、《别告诉我你懂ppt》加强版,李治着,北京大学出版社。

  3、《用图表说话》,基恩。泽拉兹尼着,马晓路等翻译,清华大学出版社。

  (五) 其他的知识结构

  数据分析师除了具备数学知识外,还要具备市场研究、营销管理、心理学、行为学、产品运营、互联网、大数据等方面的知识,需要构建完整广泛的知识体系,才能支撑解决日常遇到的不同类型的商业问题。

  推荐书籍:

  1、《消费者行为学》第10版,希夫曼等人着,江林等翻译,中国人民大学出版社,现在应该更新到更高的版本。

  2、《怪诞行为学》升级版,艾瑞里着,赵德亮等翻译,中信出版社

  3、《营销管理》,科特勒等着,梅清豪翻译,格致出版社和上海人民出版社联合出版

  4、《互联网思维—独孤九剑》,赵大伟主编,机械出版社

  5、《大数据时代—生活、工作与思维的大变革》,舍恩伯格等着,周涛等翻译,浙江人民出版社

四、关于数据分析师的职业发展:

  1、数据分析师通常分两类,分工不同,但各有优势。

  一类是在专门的挖掘团队里面从事数据挖掘和分析工作的。如果你能在这类专业团队学习成长,那是幸运的,但进入这类团队的门槛较高,需要扎实的数据挖掘知识、挖掘工具应用经验和编程能力。该类分析师更偏向技术线条,未来的职业通道可能走专家的技术路线。

  另一类是下沉到各业务团队或者运营部门的数据分析师,成为业务团队的一员。他们工作是支撑业务运营,包括日常业务的异常监控、客户和市场研究、参与产品开发、建立数据模型提升运营效率等。该类型分析师偏向产品和运营,可以转向做运营和产品。

  2、数据分析师的理想行业在互联网,但条条大道通罗马,走合适你的路线。

  从行业的角度来看:

  1)互联网行业是数据分析应用最广的行业,其中的电商企业,更是目前最火的,而且企业也更重视数据分析的价值,是数据分析师理想的成长平台。

  2)其次是咨询公司(比如专门的数据挖掘公司Teradata、尼尔森等市场研究公司),他们需要数据分析人才,而且相对来说,数据分析师在咨询公司成长的速度更快,专业也会更全面。

  3)再次是金融行业,比如银行和证券等行业,该行业对数据分析的依赖需求,越来越大。

  4)最后是电信行业(中国移动、联通和电信),它们拥有海量的数据,在严峻的竞争下,也越来越重视数据分析,但进入这些公司的门槛比较高。

五、什么人适合学习数据分析?

  这个问题的答案跟“什么人适合学功夫”一样,毫无疑问,功夫是适合任何人学习的(排除心术不正的人),因为能够强身健体。而功夫的成效,要看习武者的修炼深浅。常常有人争论,是咏春拳厉害,还是散打厉害,其实是颠倒了因果,应该看哪个人练习得比较好,流派之间没有高低,只有人修炼的厚薄。

  实际上,问题的潜台词是“什么人学习数据分析,会更容易取得成功(比如职业成功)”,这个要视乎你的兴趣、付出和机遇。但要做到出类拔萃,除了上面三点,还需要一点天赋,这里的机遇是指你遇到的职业发展平台、商业环境、导师和同事。

  借用管理大师德鲁克的话“管理是可以习得的”,管理并非是天生的,而数据分析能力,也可以后天提升。或许做到优秀,只需要你更加的努力+兴趣,而这个努力的过程,也包括你寻找机遇的部分。

六、关于如何学习:

  学习方法千万种,关键是找到适合自己的,最好能够结合你的工作遇到的问题来学习。

  1、搜集书籍、案例库和视频,先弄懂理论,然后学会软件操作,自己制作属于自己的教程。

  比如,你学习聚类分析模型。1)搜集相关的聚类分析模型的书籍、案例和教学视频,了解聚类分析的原理,主要有哪几种算法(划分、层次、密度、网格)、模型适用的范围和前提、如何评估模型的精确度等。

  2)自己学会用软件来实现。

  3)总结整理成一份PPT和制作操作视频,成为自己的学习教程,不断完善。

  4)学习到一定程度后,可以在博客、微信等渠道分享,授人与渔,而自己也会有所收获。

  2、关注名人、名博、网站,多渠道学习。

  1)关注专业的数据分析、咨询公司网站和论坛,特别强调,统计软件公司的网站如SPSS的官网有很多案例库,值得关注。

  SPSS的案例库,可在官网上搜索各类案例:http://ibm/developerwork … 8zhangzy/index.html

  另外,你最好建一个自己的网址导航目录,提升你的学习效率

  2)关注名人名博,最好能加他们的微博、微信和微信公众号,看牛人的博客和微信等内容,还是能得到很多引导,这个你懂的。

  3)加入一些有共同爱好的QQ群,互相学习交流。通常群里有人会提出一些真实的运营问题,然后大家用不同的方法去解决,对思路很有启发。

  4)碎片化学习,最大化你的时间价值。为了把零散的时间利用起来,通常我会把一些资料上载到网盘,在零碎的时间里通过手机进行视频、文档学习等。目前使用百度云盘和360网盘。百度云盘应用比较广,通常在网络上搜索“关键词+百度云”后,搜到结果可以直接保存在云盘上,搜索保存速度极大提升。360网盘则空间比较大,可以到达40T,同时有保险箱加密功能,安全性高一些。

  手机上安装一些APP,随时随地学习。

七、最后的建议

  请再次问问自己,是否真的喜欢数据分析,能否忍受处理数据时的寂寞?如果是,那就开始学习,给你几条建议。

  1、把数据分析作为一种能力培养,让自己在现在的团队中展现出良好的数据分析能力,为你以后内部转岗做好准备。如果内部转岗不成,你可以考虑跳槽到我之前分析的行业中,但我强烈建议你还是需要把系统开发的编程能力学习好,并且对商业智能系统(BI和CRM)有一定了解,这也许是应聘数据分析的优势。如果没有数据分析经验去应聘,相对会难一些,用人单位会考你统计和数据挖掘模型方面的知识,以及工具使用情况。

  2、在公司里找一些有共同爱好的同事一起学习数据分析,平时多请教数据分析做得好的同事,它山之石,可以攻玉。

  3、扎实学好一、两门数据挖掘软件,基于你有编程的基础,建议你可以学SAS或者R,同时辅助学习SPSS Modeler。如果没编程基础或者希望短期能够取得成效,那也可以先学习SPSS。SAS+SPSS,基本能够满足很大部分企业的需求,三者都会,那更好。

  4、要了解公司是如何运营,产品是如何开发的,如何做客户研究锁定客户需求,如何做产品营销,这些需要不断工作积累和广泛的阅读。

  5、开始学习时,先读几本有趣的数据分析类的书,然后系统学习一下统计知识(建议教材用《统计学》第五版,贾俊平等编着),接着网上快速搜集软件操作视频和案例,然后逐个分析模型进行学习和总结归纳,学习最好能够结合实际工作中的问题进行。

  6、学习到一定程度时,参加一些数据分析师的职业认证,进一步梳理知识结构,同时认识一些志同道合的朋友和老师,也是对你有很大帮助。

  希望你能够成为你想成为的人!

End.

来源:36大数据

2018年大数据专业就业前景怎么样? 互联网视频课程

img

窦难敌

关注

2018年大数据专业就业前景

大数据人才稀缺

据数联寻英发布《大数据人才报告》显示,目前全国的大数据人才仅46万,未来3-5年内大数据人才的缺口将高达150万。

据职业社交平台LinkedIn发布的《2016年中国互联网最热职位人才报告》显示,研发工程师、产品经理、人力资源、市场营销、运营和数据分析是当下中国互联网行业需求最旺盛的六类人才职位。其中研发工程师需求量最大,而数据分析人才最为稀缺。领英报告表明,数据分析人才的供给指数最低,仅为0.05,属于高度稀缺。数据分析人才跳槽速度也最快,平均跳槽速度为19.8个月。

根据中国商业联合会数据分析专业委员会统计,未来中国基础性数据分析人才缺口将达到1400万,而在BAT企业招聘的职位里,60%以上都在招大数据人才。

大数据专业就业三大方向

大数据主要的三大就业方向:大数据系统研发类人才、大数据应用开发类人才和大数据分析类人才。

在此三大方向中,各自的基础岗位一般为大数据系统研发工程师、大数据应用开发工程师和数据分析师。

大数据专业人才就业薪资

1基础人才:数据分析师

北京数据分析平均工资: 10630/月,取自 15526 份样本,较 2016 年,增长 9.4%。

数据分析师岗位职责

业务类别:技术

业务方向:数据分析

工作职责:

1. 根据公司产品和业务需求,利用数据挖掘等工具对多种数据源进行诊断分析,建设征信分析模型并优化,为公司征信运营决策、产品设计等方面提供数据支持;

2. 负责项目的需求调研、数据分析、商业分析和数据挖掘模型等,通过对运行数据进行分析挖掘背后隐含的规律及对未来的预测;

3. 参与数据挖掘模型的构建、维护、部署和评估;

4. 整理编写商业数据分析报告,及时发现和分析其中变化和问题,为业务发展提供决策支持;

5. 独立完成项目需求管理、方案设计、实施管理和项目成果质量的把控;

6. 参与编写项目相关文档。

教育背景:

学历:本科其它:

经验要求:工作经验:3-5年

任职要求:

1. 统计学、数学或计算机、数理统计或数据挖掘专业方向相关专业本科或以上学历;有扎实的数据统计和数据挖掘专业知识;

2. 熟练使用数理统计、数据分析、数据挖掘工具软件(SAS、R、Python等的一种或多种),能熟练使用SQL读取数据;

3. 使用过 逻辑回归、神经网络、决策树、聚类 等的一种或多种建模方法;

4. 3年以上数据分析工作经验,征信从业背景人员优先;

5. 具有金融行业项目经验的相关经验者优先考虑;

6. 主动性强,有较强的责任心,积极向上的工作态度,有团队协作精神。

能力素养:

良好的分析、归纳和总结能力,善于分析、解决实际问题; 主动性强,有较强的责任心,积极向上的工作态度,有团队协作精神。

2大数据开发工程师

北京大数据开发平均工资: 30230/月。

大数据开发工程师/专家 岗位指责(引自 滴滴出行):

职位描述:

1、构建分布式大数据服务平台,参与和构建公司包括海量数据存储、离线/实时计算、实时查询,大数据系统运维等系统;

2、服务各种业务需求,服务日益增长的业务和数据量;

3、深入源码内核改进优化开源项目,解决各种hadoop、spark、hbase疑难问题,参与到开源社区建设和代码贡献;

岗位要求:

1、计算机或相关专业本科以上学历(3年以上工作经验);

2、精通C++/Java/Scala程序开发(至少一种),熟悉Linux/Unix开发环境;

3、熟悉常用开源分布式系统,精通Hadoop/Hive/Spark/Storm/Flink/HBase之一源代码;

4、有大规模分布式系统开发、维护经验,有故障处理能力,源码级开发能力;

5、具有良好的沟通协作能力,具有较强的分享精神;

6、对Kudu、Kylin、Impala、ElasticSearch,github等系统有深入使用和底层研究者加分;

3Hadoop开发工程师

北京hadoop平均工资: 20130/月,取自 1734 份样本。

Hadoop开发工程师岗位职责(引自新浪网):

职位描述:

1.参与优化改进新浪集团数据平台基础服务,参与日传输量超过百TB的数据传输体系优化,日处理量超过PB级别的数据处理平台改进,多维实时查询分析系统的构建优化;

2.分布式机器学习算法在数据平台的构建与优化(包括常见的LR、GBDT、FM、LDA、Word2Vec及DNN等);

3.深入源码改进各种开源大数据项目(包括Hadoop、Spark、Kafka、HBase等)。

任职要求:

1.计算机或相关专业本科以上学历;

2.熟悉Linux环境下开发,熟练掌握C++/Java/Scala等一种以上编程语言;

3.熟悉Hadoop生态系统相关项目,精通以下项目之一的源码(Hadoop/Spark/Kafka/HBase/Flume/ElasticSearch/Druid/Kylin);

4.具备良好的学习能力、分析能力和解决问题的能力。

4数据挖掘工程师

北京数据挖掘平均工资: 21740/月,取自 3449 份样本,较 2016 年,增长 20.3%;

数据挖掘工程师招聘要求(引自蚂蚁金服集团技术部):

工作职责:

1、在分布式系统上进行数据计算、挖掘、和实现算法;

2、数据仓库模型设计和建立;

3、数据梳理流程的实现和维护;

4、物流场景下的地址文本、空间属性研究和分析。

任职资格:

1、本科以上学历,有扎实的统计学,数据挖掘,机器学习,自然语言识别理论基础,一种或几种以上的实际使用经验。

2、熟悉聚类、分类、回归等机器学习算法和实现,对常见的核心算法和数据挖掘方法有透彻的理解和实际经验。

3、深入理解Map-Reduce模型,对Hadoop、Hive、Spark、Storm等大规模数据存储于运算平台有实践经验。

4、有扎实的计算机理论基础,至少熟悉一种编程语言,Java优先。

5、有三年以上互联网公司或者海量数据处理工作经验,大数据挖掘、分析、建模经验

5算法工程师

北京算法工程师平均工资: 22640/月,取自 10176 份样本。

算法工程师 招聘要求(引自美团点评数据平台部):

职位描述:

互联网公司背景优先

A、广告算法

岗位职责:

1.负责点击率预估等主要广告算法的技术选型;

2.负责核心算法的开发;

3.负责广告大数据处理流程的建设及相关工具的研发;

4.负责广告技术研究项目的推进与管理;

职位需求:

1.计算机或相关专业本科以上学历,3年以上相关工作经验;

2.熟练掌握一门开发语言;

3.有机器学习、数据挖掘相关知识;

4.在广告、搜索、推荐等相关领域之一有技术研究工作经验;

5.有较强的沟通协调能力;

B、推荐算法

职位描述:

1. 参与各个产品线的个性化推荐系统的研发;

2. 分析用户行为数据,并设计合理的推荐算法模型及策略,并优化推荐排序;

3. 通过对用户行为数据的挖掘,对用户进行建模,精准刻画用户各种属性;

职位要求:

1. 全日制本科及以上学历,计算机相关专业;

2. 熟练掌握各类个性化推荐算法,并有开发个性化推荐系统的实际项目经验;熟练掌握各类回归及排序算法,能够利用相关算法进行推荐排序的优化;

3. 熟练掌握分类、聚类、回归、降维等经典机器学习算法和技术,能够根据实际问题选择合适的模型和算法并进行相应的开发;

4. 有较强的工程架构和开发能力,能够实现支撑千万级用户和TB级用户行为数据的推荐系统或算法;

5. 掌握python、matlab等脚本语言,熟悉各类数据挖掘工具(如weka、Mahout),能够快速建立模型并进行验证;

C、算法工程师

岗位职责:

1、开发和优化用户行为数据挖掘,文本分类和语义理解,社交网络分析,网页搜索,推荐系统等领域的特定算法

2、能够很快学习和利用state-of-the-art的算法解决实际产品问题,提升产品用户体验

任职资格:

1、有一定的研究、实验的能力,优秀的分析问题和解决问题的能力

2、理解自然语言处理、机器学习、网页搜索,推荐系统,用户数据分析和建模的基本概念和常用方法,有相关领域的实际项目研发或者实习经历者优先。

3、熟悉C++, Java或Python,熟悉Linux或类Unix系统开发,有较强的编程能力。 能独立实现线上算法模块者优先。

4、对大数据处理平台和工具有一定经验者优先, 包括: Hadoop, Hive, Pig, Spark 等

最后一个问题,哪些公司需求大数据人才?

答:所有的公司。大到世界500强,BAT这样的公司,小到创业公司,他们都需求数据人才。

马云爸爸说“我们已从IT时代进入了DT时代,未来我们的汽车、电灯泡、电视机、电冰箱等将全部装上操作系统,并进行数据集成,数据将会让机器更“聪明”。DT时代,数据将成为主要的能源,离开了数据,任何组织的创新都基本上是空壳。”

数据,未来的一切。

大数据和统计学之间的关系,你怎么看? 流量视频课程

img

女孩

关注

普遍的定义认为,统计学是关于数据的科学,研究如何收集数据,并科学地推断总体特征。大数据和统计学还是存在一定区别的,其一是数据分析时不再进行抽样,而是采用population(n=all);其二是分析方法,侧重所有变量之间的相关性,而不再根据背景学科理论筛选变量,进行假设检验。

现在社会上有一种流行的说法,认为在大数据时代,“样本=全体”,人们得到的不是抽样数据而是全数据,因而只需要简单地数一数就可以下结论了,复杂的统计学方法可以不再需要了。

普查和抽样调查是传统的两大数据收集方法。普查不需要统计学方法进行推断估计,因为通过普查,已经取得了所有个体数据和总体的实际分布,这也是为什么人类开始懂得计数就开始进行普查。抽样调查是利用抽样理论解决如何科学设计样本,取得样本个体数据,并科学地推断总体分布及特征。无论是普查还是抽样调查,其核心问题之一是要取得准确的“个体数据”。但在大数据时代,一切皆可量化,一切皆可记录,如何利用更全面、更及时、更经济的网络电子化数据,以及通过对这些数据使用新的分析及挖掘技术,产生新的见解和认识,是我们面临的重大机遇。

大数据的应用可以说是在减少人类处理数据时带入的主观假设的影响,而完全依靠数据间的相关性来阐述。而由于消除人为因素带入的误差,已经分析人员作出假设的限制(如果教育背景和保险购买额是相关的,而分析人员没想到,那这个结论就不会被分析出来,这在实际案例中是很容易发生的,大数据的核心也就在于它能更充分的发掘数据的全部真实含义。

在大数据时代,数据分析的很多根本性问题和小数据时代并没有本质区别。当然,大数据的特点,确实对数据分析提出了全新挑战。例如,许多传统统计方法应用到大数据上,巨大计算量和存储量往往使其难以承受;对结构复杂、来源多样的数据,如何建立有效的统计学模型也需要新的探索和尝试。对于新时代的数据科学而言,这些挑战也同时意味着巨大的机遇,有可能会产生新的思想、方法和技术。

西线学院培训机构提供良好的教学环境,良好的师资以及行业资源,使得西线学院教学永远都是跟随行业进步的步伐。说了这么多,其实就是想让你更加了解大数据。如此优秀的资源和别人望眼欲穿的实习机会,再不行动就要被后来居上的技术人员拍死在沙滩上了。

img

在线咨询

建站在线咨询

img

微信咨询

扫一扫添加
动力姐姐微信

img
img

TOP