大数据的世界不只是一个单一的、巨大的计算机网络,而是一个由大量活动构件与多元参与者元素所构成的生态系统,终端设备提供商、基础设施提供商、网络服务提供商、网络接入服务提供商、数据服务使能者、数据服务提供商、触点服务、数据服务零售商等等一系列的参与者共同构建的生态系统。而今,这样一套数据生态系统的基本雏形已然形成,接下来的发展将趋向于系统内部角色的细分,也就是市场的细分;系统机制的调整,也就是商业模式的创新;系统结构的调整,也就是竞争环境的调整等等,从而使得数据生态系统复合化程度逐渐增强。
大数据课程优势
1. 来自清华、北大、北航的实战讲师和上市企业的骨灰级大咖授课……
2. 根据企业需求设计课程,并且定期更新,引入最新技术……
3. 配备了价值上百万的开发服务器,可实时感受分布式开发和云计算等……
4. 16小时老师全程陪伴,不怕学不会……
5. 线上线下结合,可以无缝衔接……
6. 学员管理以人为本,不忘初心,致力培养眼界高、技术牛、做人好的职场员工。
大数据在各行各业中应用广泛 没有什么能逃出你的掌心
大数据特点 数据量大 数据种类多 要求实时性强 主导气质无法掩盖
真实就业数据 震撼你的小心脏
无论按照工作经验还是市场本身的薪资变化趋势
大数据工程师都是一路高歌猛进,当之无愧的互联网贵族!
-
100
国内人才缺口
-
31.7%
行业需求增长
-
10000+
猎聘网大数据招聘
-
17210
北京大数据工程师
大数据就业前景分析
据职业社交平台LinkedIn发布的《2016年中国互联网最热职位人才报告》显示,研发工程师、产品经理、人力资源、市场营销、运营和数据分析是当下中国互联网行业需求最旺盛的六类人才职位。其中研发工程师需求量最大,而数据分析人才最为稀缺。领英报告表明,数据分析人才的供给指数最低,仅为0.05,属于高度稀缺。数据分析人才跳槽速度也最快,平均跳槽速度为19.8个月。
潮流技能 颠覆性课程
拒绝用老掉牙的淘汰项目练手 要做就做前沿
覆盖大数据行业主流技术岗位,课程半年升级一次,紧跟市场与企业步伐
01 大数据入门基础课程 |
1.JavaSE;2.MySQL;3.JDBC;4.Linux;5.shell;6.HTML;7.CSS;8.JavaScript;9.JSP;10.Servlet |
02 大数据Hadoop基础 |
1.大数据概论;2.Hadoop框架;3.HDFS分布式文件系统;4.MapReduce计算模型;5.全真实训项目 |
03 大数据离线分析 |
1.Hive数据仓库;2.Sqoop ETL工具;3.Azkaban工作流引擎;4.Ooize;5.Impala;6.全真实训项目 |
04 大数据实时计算 |
1.Zookeeper分布式协调系统;2.HBase分布式数据库;3.Redis数据库;4.mogDB数据库;5.Kudu列式存储系统;6.Storm实时数据处理平台;7.Kafka分布式发布订阅消息系统;8.Flume海量日志采集系统;9.全真实训综合项目 |
05 Spark数据计算 |
1.Scala;2.Spark;3RDD;4.Spark SQL;5. Streaming;6. Mahout;7.MLlib;8.GraphX;9.Spark R;10.Python;11.Alluxio;12.Python爬虫;13.ElasticSearch;14.Lucene |
Hadoop基础实战 |
项目名称:搜狗搜索日志分析系统
数据体量:5000W+/日
硬件环境:Hadoop集群 12台
软件环境:Hadoop2.5.2+Hive1.2.1+MR+Oracle10g
项目描述:搜狗每天产生大量的日志数据,从日志数据里面能提取到有用的数据包括每个用户的ID、浏览次数、月/日浏览频率、访问源、浏览内容等等,提取这些内容、统计数据分析每个用户行为,从而做出有利的决定。 |
大数据离线实战 |
项目名称:新浪微博数据分析系统
日均数据体量:3GB+
硬件环境:Hadoop集群 50台
软件环境:MapReduce+HBase0.98.9+Storm0.9.6+Hadoop2.5.2+Kafka2.10+Zooke
eper3.4.5+CentOS-6.5-X86
项目描述:此次项目我们需要处理微博产生的数据,通过对数据的处理得到所需的数据,微博拥有大量的用户,大量的用户潜在的价值是巨大,怎么挖掘这些潜在的宝藏就是我们项目最直接的目的,为了能够实时的进行数据处理使用Storm流式计算系统,和HBase、Zookeeper、Kafka组成框架,对数据进行处理,当然这些都是建立在hadoop集群上实现的,底层的存储还是HDFS。 |
大数据实时计算 |
项目名称:网络流量流向异常账号统计项目
数据体量:每天1000亿,每秒峰值100 000
硬件环境:Hadoop集群 600台
软件环境:Hadoop2.5.2+Hive1.2.1+MR+Oracle10g
项目描述:运营商骨干网上采集现网流量流向信息,根据这些原始信息检测账号是否存在异常,如果多个终端使用同一个宽带账号,超过一定阈值则触发报警机制,例如阈值为5时,同一个账号同时连接的终端数量不能超过该值,如果超过则报警。 |
Spark阶段项目 |
项目名称:京东网上商城数据统计分析平台
数据体量:5000W+/日
硬件环境:centos-6.5-x86 集群:spark standalone(Master-1,Worker-3)
软件环境:hadoop,spark,hive,mysql,idea,navicat,kafka,flume
每日处理的数据量:3GB
项目描述:基于京东网上商城数据统计分析平台--该项目采用了目前大数据领域非常流行的技术——Spark。本项目使用了Spark技术生态栈中最常用的三个技术框架,Spark Core、Spark SQL和Spark Streaming,进行离线计算和实时计算业务模块的开发。实现了包括:统计和分析UV、PV、登录、留存、热门商品离线统计、广告流量实时统计3个业务模块。 |
★课程价格根据所报读的班级不同,价格从几百到数万不等,详情请咨询客服。
来自主流高校和企业的骨灰级大咖授课
他们将十余年实战经验倾囊相授,他们在郑州兄弟连为你的职业发展保驾护航
360°全方位辅导 缔造行业培优模式
学不会不是理由,相信我你可以。不抛弃不放弃,6大保障让每一位学员成人成才!
-
学习中途落课了怎么办 icon
中途耽误几天的话可以通过看视频同步完成老师的作业弥补进度,不会的可以随时问老师。
-
是否可以重修呢? icon
学生因学习中途落课或者学习效果不扎实等原因可以向教务老师申请重修或降级,本期学不会下期免费再学,直到学会为止!
-
考核方式 icon
学习的流程分为预习、听课、整理笔记、作业(每周定期检查作业,并针对反馈情况进行讲解)、复习、默写、项目阶段跟踪检查。
-
严格规范的预习笔记 icon
预习笔记是郑州兄弟连一再强调的学习法宝,每个同学在郑州兄弟连都必须养成课前预习的习惯,对老师第二天要讲授的内容重点、难点做到心里有数,听课事半功倍。
-
定期召开关怀学员会议 icon
开课后根据学生的作业及测验情况形成关怀名单,进入关怀名单的学生会被所有老师所关注,相应的对其作业、预习笔记、默写等要求会更高,要求会更严格。
-
人性化的班组机制 icon
学习中遇到问题,小组成员共同讨论解决,小组内有学习懈怠完不成学习任务的同学,小组内全体成员会集体被罚(罚手抄代码n遍哟)。
学习氛围浓厚 人性化服务助你一站成才
集衣食住学为一体,舒适生活区域,先进教学设备
郑州兄弟连注重细节,倾力为学员打造贴心学习环境
业内独有四大班型 为你而生 为你所需
-
零基础周末班
课程设置与脱产班相同 学习工作两不误 适合需要周末上课的人群
-
全日制脱产就业班
面向零基础小白 5个月完成Python 开发课程
-
精英提高班
面向掌握一定Python技术 但需提升职场竞争力的 在职人群
-
在线精品课程
同步线下面授课程 纯干货技术课堂 随到随学
相关资讯:
大数据不仅改变企业的运营方式,也将成为供应链协同创新提供新的发展方向。
伴随着信息技术全面的融入社会生活,人类世界充斥着比以往更多的信息,而且信息数据的增长速度还在不断地加快。在科技的高速发展以及数据信息不断增加的背景下,“大数据”这一全新的信息科学概念给我们的社会发展带来两个方面的巨变:一方面,在没有数据积累的时代下无法实现的解决方案终于可以实现;另一方面,从数据匮乏时代到数据泛滥时代的转变带来新的挑战与困扰,使传统的数据分析解决方案已经不能从海量数据中高效地获取最重要的机会洞察点。
作为中国最具规模的零售连锁企业华润万家集团(以下简称华润万家)和国际知名的快速消费品公司宝洁(中国)公司(以下简称宝洁)在如何运用“大数据”进行了积极的尝试。双方选取供应链作为突破口,利用“大数据”工具在实现零售生意增长的同时降低运作成本并提升现金流。
双方合作创建的基于门店的实时销售以及库存信息的智能运营系统解决方案,将大数据解决方案成功地运用于生意趋势分析,货架缺货降低,档期需求预测等关键零供供应链协作领域。该成功案例也为“大数据”在商业智能,特别是针对供应链这一特定领域的运用提出了全新的解决思路和方向。
华润万家是最具规模的零售连锁企业品牌之一,旗下拥有华润万家、苏果、欢乐颂、中艺、华润堂、Ole’、blt、VanGO、Voi_la"VIVO采活、太平洋咖啡Pacific Coffee等多个著名品牌。目前已进入28 个盛自治区、直辖市和特别行政区的100 多个主要城市,门店数量超过4000多家。
宝洁拥有众多深受信赖的优质、领先品牌,包括帮宝适、汰渍、碧浪、护舒宝、潘婷、飘柔、海飞丝、威娜、佳洁士、舒肤佳、玉兰油、SK-II、欧乐B、金霸王、吉列、博朗等等。宝洁目前在广州、北京、上海、成都、天津、东莞及南平等地设有多家分公司及工厂,员工总数超过七千人,在华投资总额超过十七亿美元。
大型零售商和快速消费品企业必将在大数据的运用实施上处于领先地位。
2011年5 月,在“云计算相遇大数据”为主题的EMC World 2011 会议中,EMC 抛出了“大数据”(Big Data)概念。最早提出大数据时代到来的麦肯锡:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”业界(IBM 最早定义)将大数据的特征归纳为4个“V”:大量化(Volume)、多样化(Variety)、价值密度低(Value)、快速化(Velocity)。简而言之,大数据有四个层面的特征:第一,数据体量巨大;第二,数据类型繁多;第三,价值密度低,但是商业价值高;第四,处理速度快。这几点也使“大数据”和传统的数据挖掘技术有着本质的不同(如图1)。
总而言之,“大数据”是信息技术发展到现在的一种特征,在给人类带来巨变的同时也使得各个企业能在以云计算为代表的信息技术革命的背景下,逐步开始收集和使用一些尚未被发掘的数据。
通过各行各业的不断创新,大数据逐步地为人类创造出了更多的价值。特别是商业智能、公共服务和市场营销这三大领域。目前,越来越多的企业供应链负责人已经将目光投向这一全新的信息技术解决方案中。依据国外知名咨询公司EFT的一项调查,84%的大型企业供应链负责人已开始重视大数据,他们一致认为大数据项目能够在提升供应链运营的有效性的同时降低成本,并能够推动供应链管理从一般的基于历史数据的决策进化为即时的智能决策。而且有将近2/3的供应链负责人目前正在尝试或者在考虑实施“大数据”项目。
更重要的是,业界一致认为大型零售商和快速消费品企业将在大数据的运用实施上处于领先地位。这也是多年来业界所倡导的零供协同供应链这一大的基础上激发的新成果,也必将为零供双方构建新型联合商务框架添加新的动力能量。
作为长期的战略合作伙伴,华润万家和宝洁在生意发展的过程中遇到了共同的挑战: 即需要在不断满足消费者的需求的同时降低运营成本, 实现门店运营效率的最大化(如图2)。
图2 零供双方共同的挑战和机遇
供应链的高效协同是实现双方生意发展共同目标的重要基石,也是双方高层领导确定的重要合作方向。在联合商务合作框架的理念下,过去几年宝洁和华润万家在供应链领域取得了一系列的成绩:从精益供应链愿景的提出,到JBP(联合生意发展计划)计划的落地,再到EDI/GDSN(电子数据交换/全球商品数据同步网络)等项目的成功实施,充分展示出双方供应链管理团队通过精细化的管理手段、信息化的管理工具深入挖掘供应链的潜力,提升供应链的整体效能。
正是有了这样相互信任的合作理念以及技术基础能力,双方团队开创性的提出了“以店为先”这一全新的门店智能运营模式,这一模式的关键点是从门店实际出发,以大数据为基础,使用实时数据进行预测性分析和决策,从而优化门店的每一个运营环节,通过实时数据分析把门店业务流程和决策过程中存在的每一份潜在价值都“挤”出来,从而提升门店单产,实现“低成本、高效率”的运营模式。
项目实施
借助以往的供应链项目成功经验,由华润万家和宝洁供应链相关负责人牵头,双方组建了跨部门联合工作小组,其中包括华润万家信息部、物流部、商品部、营运部和宝洁公司销售部、物流部、信息部的主要负责人。确定了将现有系统和“大数据”方案整合的工作思路,并关注在门店执行可视化,消费者需求计划以及风险管理作为主攻方向以提升项目的收益。
首先,项目组系统地梳理了门店运营工作中的系列流程,重点探讨了通过可比门店增长数据以及品类组发展的生意数据对比,挖掘出在新品,分销以及陈列上的机会点;利用门店宝洁单品实时的销售和库存数据进行预防性的补货以便降低货架缺货率和分析档期销售的各项参数以提升商品去化率优化商品库存这三个最重要的生意增长机会点。
然后,项目组确定了最终的技术方案以及运营方案。在技术解决方案中,主要关注在如何解决每日门店销售及库存数据的传输,存贮及加工的全套信息化解决方案。这也是对应“大数据”大量化(Volume)、多样化(Variety)、价值密度低(Value)、快速化(Velocity)这四大特征所必须要解决的问题。华润万家(包含苏果)4000多家门店所产生的巨大的销售库存数据信息,不同业态的数据清算方式的差异,以及最重要的三个生意需求的数据信息要求都给项目的实施带来了各种障碍。
项目组最终确认了一个囊括了门店实时数据和主数据的标准提取格式,以华润万家不同区域为单位对数据进行打包并最终采用T+1的频率通过EDI(电子数据交换)平台将原始数据传输给宝洁全球数据仓库。在获取数据之后,宝洁相关团队会按照设定的逻辑对数据进行校验,清洗和结构化处理,使其成为能被宝洁全球智能分析平台能所接受的标准数据格式。并最终产生可视化的智能报表,以最高效的方式给门店一线运作人员运营建议。需要强调的是,项目组依托移动供应链的理念,设计了总部和门店两个逻辑层级的报表展示方式。总部层级的报表主要关注在宏观层面,门店层级的报表主要关注在微观门店的执行层面,而且门店的层级报表可以直接在iPad等多平台上呈现,以最大程度地方便门店一线人员的交流和执行(如图3)。
图3 门店智能运作系统解决方案
在技术解决方案明确后,双方团队还研究了门店一线人员对相关工具的使用方式和流程,因为信息系统解决方案只是这个项目的一部分,更重要的是双方一线运营团队需要用好这些通过“大数据”所挖掘商业洞察。结合目前门店的操作实践,项目组共同设计并量身定做了能最高效地服务于一线业务运营人员、宝洁门店运营经理、华润万家门店管理人员系列可视化报表。通过这些报表的有效运用,各种生意机会一目了然地呈现在一线运作人员面前,清晰可执行的改进建议让运作人员关注在最大的生意机会点上,从而将他们从繁杂的数据分析工作中解放出来。在这个过程中,华润万家和宝洁的一线运作人员也总结了很多更贴合门店实践的修改意见,实现了信息系统解决方案的持续进化(如图4)。
图4 智能运作系统解决方案在门店的执行测试
项目成就和收益
据麦肯锡的估计,如果零供双方能够充分发挥大数据的优势,将各种商业洞察运用到供应链效率提升上,其生产效益将会实现年均0.5% ~1%的增长幅度。在这个项目中,宝洁可以更好地建议商品在店内的陈设,可以通过店内工作人员更多地接触,提高产品经营的知识;华润万家可以降低库存成本,提升销售,减少店内商品陈设的投入。综合起来,整个供应链可以在成本降低的情况下,更好地满足消费者的需求。
在对于测试门店的试运行中,项目组已经取得了一些显著的效果,对比于基础门店,测试门店的零售生意增长了7%。(其中0.9%来源于货架缺货率的降低;3%来自于档期销量的提升;1.1%来自于分销系统的提升;2.1%来自于门店库存效率的提升)测试结果再一次证明了大数据解决方案的有效性,也有助于该项目在华润万家全国门店的推广计划,并实现实时智能运作系统运用到华润万家的每一家门店中的项目目标。
在推广目前已有的解决方案的同时,项目组也在思考如何利用现有的大数据信息,从门店追溯回宝洁的上端供应链,例如宝洁的生产计划环节通过在整条供应链上分享大数据技术,引爆零售业的生产效率革命。最终更快,更好,更高效地亲近和美化更多消费者的生活!