两年前在艾瑞期间写成并发表于知乎“拉勾”话题精华的文章,当时拉勾是我认识数据分析世界的一个窗口,脑中一直萦绕两个问题:
企业愿意为数据分析人付多少钱?
数据分析人要学到什么才会拿到这个钱?
为了解决问题而上拉勾来看jd(job description)熟悉工作职能和技能要求,经常是看几小时后而脑袋晕胀(因为不懂的实在太多了)。突然某天我问自己”为什么不把lagou的信息爬下来并做个统计?一个做数据分析的人竟然这样原始地(手动)统计数据?”一周内搞定从爬取、解析分词、分析出图,从自己关心的细分维度回答问题:
就自身发展上看:
数据分析师一般几年会遇到瓶颈?(看工资在哪些年限上会有明显阶跃)
在不同的阶段应该学哪些工具?
从公司平台上看:
融资到什么阶段的公司会愿意付相对高的价格来聘请数据分析师?
公司规模/人数会不会产生影响?
北上广深的数据分析师相同资质下会不会有收入差异?
文章是以201510数据为基础搭建,数据会过时,思考问题的方法不会。
如何学习思考问题方法:聪明人是“别人生病,自己吃药” (不需要跟我一样去经历这个阶段,而获得这份经验)。把自己代入到场景,你会如何做?把做法整理并复盘得失;现实遇到困难,把自己想象成master去解决。就像我在看《穷查理宝典》的时候会代入书中的场景,假如我是查理芒格,我做的演讲是出于什么心情、背后代表什么心态?(尽可能理解透彻)在现实投资过程中,我遇到问题时会想象成查理芒格来做思考。
这篇文章对我的反思:为了消除对未知的恐惧,通过拉勾平台以公司付费的角度来评价数据分析师的价值,e.g. 当知道1-3年互联网金融公司の会python数据分析师每月2w的薪资,我就像从乱麻中牵扯出线头那样开心。整个过程中最重要的是求知若渴的心,而智慧与否只是会加速或减缓这个学习的过程。
为什么我一直在谈钱,因为公司拿出真金白银来雇用你,大概率情况下,说明公司愿意付费来购买你的价值,间接证明你的价值所在。
附上爬虫python源码(https://github.com/lichald),感兴趣的童鞋可以自己尝试。
/ 01 /
数据分析在哪个城市需求更加旺盛?
北京领先全国:从总值上看,北京在数据挖掘岗位open的职位数量和公司数量上占据绝对优势,甚至超过后面4个城市的数值加和;仅就北京和上海相比,公司数量是3倍,职位数量是4倍。从公司平均招聘人数上看,北京也领先于其他城市。即使排除拉勾网base在北京中关村地利优势和3w咖啡的线下优势,北京的数值依然是遥遥领先。
/ 02 /
公司如何定价员工的工作资历?
主流1-5年在21-25k:工作经历在1-5年的现在需求最旺盛,且大多数公司均会给到11-25k的价位。且对于11-15k、16-20k、21-25k三个细分档次的价位,用人单位对于1-3年工作经验的人11-15k是主流价码,优秀的人可以提升至16-20k,更优秀的再提升至21-25k;用人单位对于3-5年工作经验的人21-25k是主流价码,有经验但能力欠缺的降至16-20k,再弱一些的就降至11-15k。
“经验不限”注重能力导向:有相当一部分企业对于“经验不限”的情况大多数也愿意给出11-15k和21-25k的价位,说明在互联网领域仍有企业是看重能力而不是资历,对于经验有相当的自由度。
乱世出英雄:另外对于5-10年的人员数量非常低,排除专业猎头分的蛋糕之外,也可能说明这个行业的专家非常少,或者是企业的数据挖掘需求还远没有达到需要专家的级别。这两点结合来看,专家权威效应不明显,企业看重能力而非资历,对于这个行业的新人是利好的消息。
新人打好基本功:企业对于1年以下经验的人招聘数量和薪资认可方面都是非常低的,说明新人前1-2年先不着急跳槽,好好打好基本功,迎接之后的量质转换!
/ 03 /
高薪资都存在哪些高大上的行业?
数据声明:在拉勾网上发布职位的公司一般都会贴上两个以上的标签,本文将对这些标签重复计算。例如宜信公司标签是,则在这两个领域分别会计数。图中移动互联网的绝对值非常高,说明移动互联网是一种主流的趋势。
移动互联网11-25k主流:移动互联网的主流薪资认可是11-25k范围,且能够容纳的人员数量非常多,说明该行业不差钱。数据服务是这行里面的默默无闻的耕耘者,有很多新兴企业,提供数据服务,也是通过高新来吸引人才。电商、o2o、文化(主要是视频)、广告、金融几个行业对数据挖掘人才需求的数量和质量相差无几。如果希望从事一份体面的数据挖掘工作,可以考虑从这些行业中来找。
/ 04 /
何种融资阶段公司会需要数据分析?
ab轮找11-15k,20k到处缺:融到钱的公司(途径包括各种轮和上市)对于数据挖掘的需求明显高于其他,早在天使轮就有体现。就成功融资的这些企业来讲,11-15k的人在ab轮时达到顶峰,说明这阶段应该是数据挖掘部门急剧膨胀的阶段,需要比较多的初级数据挖掘人员;21-25k的人员在abcd和上市之后的需求保持持平,说明对于有能力的资深人士,需求是一直存在的,而且可能满足要求的人员较少,公司之间的流动性比较高,招聘需求一直稳定存在。
融资程度与工资正相关:平均收入是根据人数加权得出,从中可以看出,“成功融资”、“未融资”、“不需要融资”呈依次递减的水平,在融资领域内,平均收入水平依据成熟度而显示逐步上升。
期权还是现金:如果你是希望通过跳槽来获取更高的收入11-20k,不考虑期权的因素下,成熟度高的已成功融资、如cd轮或者上市的公司是最理想的选择,这些公司总体平均收入比较高,未来有进一步上升的潜力;如果觉得竞争太激烈,可以退而求其次,将目标放在ab轮,这些公司对此档人员的需求最高,但平均收入不一定高。(但事情一体两面,如果你选择时机得当,ab轮获得股权期权,将来成功套现,也将是一笔不小的收入)
/ 05 /
何种规模企业需要数据分析?
500人规模对应15k分析师:对于11-15k的等级,在企业发展阶段呈现先上升后下降的趋势,其中150-500人是需求的顶峰;对于16-25k的人员,企业发展阶段是持续上升的需求,其中在50-500人阶段呈现出一个小高峰。可以理解企业在发展到150-500人之前,15k以下的数据挖掘即可满足需要,但在之后数据量的膨胀导致数据的价值陡增,对于21k以上的中高级人才产生巨大的渴求。
大公司易发挥分析价值:从人员加权平均收入来看,随着规模的增长是在不断上升的,企业的发展越大,数据挖掘越容易产生价值。如果你热衷于数据分析领域创造价值,大公司将是不错的历练平台;但如果可以接受11-15k水平的初级人员,150-500人的公司将会是一个不错的跳板。
/ 06 /
数据分析工具与收入之间的关系?
从每个网页中抓取jd说明,根据python中jieba库进行文本分词,并计算出现频次,并建立自己的分词标签字典。
词频占比=该词词频/所有词词频。平均每个jd中出现次数=词频/jd数。
在jd中,非关系型数据库、脚本语言和关系型数据库是三种主要被提及的工具,平均每个job中均会提及一次以上。说明这些是必备技能。具体取了排名前30的原始词做成云图如下。
以hadoop为代表的关系型数据库,以python和java为代表的语言,以sql为代表的关系型数据库构成工具的主流。
数据说明:面积图为对应词出现的频次总数,折线图为词频/job数量的比例、代表平均每个职位描述中出现某词的频次。
25k是工具和软技能分割点:从折线图上看,在6-15k、16-25k、26-100k三个阶段内,绝大多数工具需求都呈现正三角形的结构,即“小大小”的情况,可以理解为在25k以前,薪资随着工具的提升而不断提升,26k以后需要有其他非软件工具技能来获得职业生涯的突破。
从工作数量上看,hadoop、python、java的数值很高,说明获得绝大多数公司的认可,所以这三门工具是在数据挖掘领域走向人生巅峰的必备良药。
RT-Thread7月份及8月份社区活动简报及预告
受补贴金额影响 预计2019年1月份新能源汽车销量也会很高
智慧公安:信息时代下的电子眼
用于化学战剂检测的SAW气体传感器系统开发
FPGA零基础学习之TLC5620驱动教程
如何学习思考问题方法,数据分析在哪个城市需求更加旺盛?
示波器电流探头可以测量多大电压?
飞利浦携手Razer为中国家庭娱乐带来沉浸式体验
STM32串口通信过程详解
EV和HEV充电器中的三相PFC
AT&T在美国部分地区提供5G移动网络服务
锁存器Lacth & 触发器Flip-flop就是实现储存功能的两种逻辑单元电路
世界首款可充电固态电池芯片现已在中国供货
HU16磁敏传感器构成的水位控制电路
浅谈电瓶修复技术,对电动自行车选用36V是否合适的探讨
清华天机嵌入式芯片将颠覆传统架构
中英联合研发的ROV,能下潜到6000米深的海底 提4吨重物
网桥和路由器的区别
三星在中国市场的份额仅剩1%天津工厂将关闭
智能镜子显示器的应用,一秒便可打造高科技家居生活