随着信息技术和人类生存生活交汇融合,全球数据呈现爆发增长、海量集聚的特点,对经济发展、社会治理、国家管理、人民生活都产生巨大的影响。大数据时代,国家竞争力将部分体现为一国拥有数据的规模、活性以及该国解释、运用数据的能力,而国家数据主权体现了对数据的占用和控制。因此,大数据时代,数据主权成为另一个大国博弈的空间。
洛阳达内超高含金量的课程内容
-
JavaWeb
-
EasyMall
-
大数据框架
-
挖掘分析
-
第一阶段:JavaWeb阶段(EasyMall项目贯穿) |
学习版块 |
学习内容 |
XML |
XML的概念与基本作用、XML语法、XML解析介绍、DOM4J解析XML |
HTML/CSS |
HTML介绍、HTML文档结构、HTML语法、HTML标签技术(超链接、列表、表格、图像、表单等),CSS介绍、CSS导入方式、CSS选择器、CSS布局、CSS样式属性 |
JavaScript |
JavaScript语法、数据类型、运算符、流程控制、数组、函数、JavaScript内部对象、自定义对象,DHTML编程、BOM介绍,DOM编程(使用DOM操作HTML文档) |
MySql |
数据库介绍、MySQL安装与配置、数据库增删改操作DDL语句使用、表增删改操作DML语句使用、表查询操作DQL语句使用。数据备份及恢复、多表设计、多表查询 |
JDBC |
JDBC介绍、JDBC快速入门,JDBC核心API介绍,JDBC的CURD操作防止SQL注入及PrepareStatement使用,使用批处理。连接池的介绍、自定义连接池,常用的开源连接池C3P0的介绍及使用 |
Tomcat/HTTP |
WEB服务器介绍、Tomcat的安装与启动、Tomcat的体系结构、组织WEB应用目录与在Tomcat中发布WEB应用程序的方式、配置WEB的主页、使用Tomcat配置虚拟主机、HTTP协议详解 |
Servlet |
Servlet介绍、开发Servlet程序、Servlet生命周期、Servlet调用分析、Request及Response的使用、ServletConfig使用,ServletContext使用(作为域对象使用、配置系统初始化参数、获取web资源)。AJAX介绍、XMLHttpRequest对象详解 |
Cookie/Session |
会话技术介绍、Cookie介绍及Cookie的使用、案例之Cookie实现记住用户名,Session的使用及Session的原理,案例之利用Session实现登陆功能及验证码校验 |
JSP/EL表达式/JSTL标签库 |
JSP介绍、JSP表达式、JSP脚本片段、JSP声明、JSP注释、JSP中的9个内部对象和作用,EL表达式简介,EL获得数据、EL执行运算、EL内置对象,page指令及其重要的属性,JSP中的include指令、pageContext对象的详细讲解。JSP动作标签介绍。JSTL标准标签库的介绍及使用 |
MVC设计模式/三层架构 |
JavaEE开发模式介绍、MVC软件设计模式介绍、JavaEE经典开发模式重构EasyMall项目、工厂设计模式介绍、工厂设计模式的应用。层与层之间的耦合与解耦 |
过滤器/监听器 |
ServletListenert监听器介绍及使用、ServletFilter过滤器介绍、过滤器生命周期。30天内自动登录功能的实现,全站乱码处理 |
JavaWeb高级开发技术 |
泛型介绍、泛型应用、文件下载原理及实现,事务概述、事物的隔离级别、事务控制、更新丢失 |
EasyMall商城功能实现 |
实现商品添加、商品删除、修改商品数量、查询商品列表 |
-
第二阶段:框架及EasyMall |
学习版块 |
学习内容 |
Spring |
SpringIOC基础、Spring的工厂模式(静态工厂、实例工厂、Spring工厂)、Spring依赖注入(构造器注入,set注入)、Spring的注解形式、SpringAOP原理及实现、Spring整合JDBC、JDBCTemplate、Spring声明式事务处理、事务的回滚策略 |
jQuery |
jQuery对象、jQuery选择器(ID、元素、class、层级等)的使用、jQuery案例(用户列表增、删、改、查)、Json的对象转换、jQueryAJAX的实现 |
SpringMVC |
SpringMVC原理、SpringMVC简单参数封装、复杂参数封装、值传递的原理、SpringMVC的注解形式、日期格式类型转换、文件上传、页面访问控制(转发和重定向)、RESTFUL结构 |
MyBatis |
MyBatis原理、DQL映射、DML映射、复杂结果集映射、参数传递(注解形式和MAP形式)、结果集封装原理、动态SQL的拼接、字符转义、MyBatis的接口实现、代码自动生成工具、关联关系的讲解、Spring+SpringMVC+MyBatis整合(SSM整合) |
HTCargo项目实战EasyMall(初级) |
购物车模块实现、订单列表及删除功能实现、在线支付、销售榜单下载 |
EasyMall互联网电商项目 |
EasyMall是一个典型的互联网电子商务系统,类似京东淘宝,是一个互联网分布式高并发的系统,系统包括:
后台系统:提供了对商品的管理,其中应用EasyUI的插件来显示商品分类树,用富文本编辑器KindEditor提供上传商品图片,包括商品描述等实现。
前台系统:提供了产品展示功能,并为用户提供商品浏览、购物等功能。包括商品的三级分类并利用Jsonp和HttpClient技术实现异构系统间的访问。
新单点登录SSO:利用该系统完成用户的注册、登录功能,实现Session共享问题,解决了在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。
购物车系统:实现了我的购物车功能。
商品搜索系统:实现了商品搜索功能,提供了一种通过关键字快速查找对应内容的方式。
|
-
第三阶段:大数据框架 |
学习版块 |
学习内容 |
大数据高并发基础 |
大数据java加强 |
通过java编码实现zebra项目,熟悉分布式处理思想,了解zebra业务需求学习java中关于高并发、NIO、序列化反序列化(AVRO)、RPC相关知识掌握zookeeper、sqoop等大数据领域常用工具原理及使用 |
大数据离线数据分析 |
Hadoop |
Hadoop是知名的大数据处理工具包括分布式数据存储系统HDFS、分布式数据计算框架MapReduce和资源协调框架Yarn通过学习掌握hadoop安装配置、实现原理、及企业级应用方式 |
Flume |
Flume是大数据生态环境中流行的日志收集框架基于其灵活的可广泛配置的使用方式及优良的效率被广泛的应用在大数据生态环境中课程中详细讲解了Flume的Source、Channel、Sink、Selector、Interceptor、Processor等组件的使用并通过美团应用案例,展示了Flume企业级应用场景的实现方式 |
Hive |
EasyMall是一个典型的互联网电子商务系统,类似京东淘宝,是一个互联网分布式高并发的系统,系统包括:
后台系统:提供了对商品的管理,其中应用EasyUI的插件来显示商品分类树,用富文本编辑器KindEditor提供上传商品图片,包括商品描述等实现。
前台系统:提供了产品展示功能,并为用户提供商品浏览、购物等功能。包括商品的三级分类并利用Jsonp和HttpClient技术实现异构系统间的访问。
新单点登录SSO:利用该系统完成用户的注册、登录功能,实现Session共享问题,解决了在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。
购物车系统:实现了我的购物车功能。
商品搜索系统:实现了商品搜索功能,提供了一种通过关键字快速查找对应内容的方式。
|
Hbase |
HBase是一种分布式的、面向列的基于hadoop的非关系型数据库适合存储半结构化、非结构化的数据基于其优良的设计,可以提供良好的实时数据存取能力,并提供优秀的横向扩展能力 |
Zebra项目 |
项目名称:zebra电信日志数据分析应用的技术:flume收集日志,采用三层结构实现日志收集聚集最终持久化到hadoophdfs中并实现日志收集过程中的失败恢复负载均衡hadoophdfs分布式存储收集到的日志数据,hadoopmapreduce进行日志清洗、格式转换hive进行日志处理、业务规则计算,按照不同维度分时段统计应用受欢迎程度、网站受欢迎程度、小区上网能力小区上网喜好等信息sqoop技术将处理完成的结果导出到关系型数据库EChars通过传统web技术将关系型数据库中的数据展示到web页面中Zookeeper作为集群协调、集群状态监控工具EChars通过传统web技术将关系型数据库中的数据展示到web页面中Zookeeper作为集群协调、集群状态监控工具 |
大数据实时数据分析 |
Storm |
Storm是流行的大数据实时分析框架,是一个分布式的、容错的实时计算系统包括Storm基础、原理、Topology、StormSpout、StormBolt、StormStream、Strom并发控制、Storm可靠性保证、Storm高级原语Trident等内容 |
Kafka |
Kafka是一种高吞吐量的分布式发布订阅消息系统它可以处理消费者规模的网站中的所有动作流数据SPARK的SQL、SPARK的DataFrame对象、SPARK的Stream |
网站流量分析项目 |
通过在网站的前台页面中进行js埋点收集用户访问网站的行为信息,再由大数据技术进行分析进而得到网站的PV、UV、VV、BounceRate、独立ip、平均在线时长、新独立访客、访问深度等信息,来引导网站针对性的做出升级改进,提高整个网站的访问效率,提升用户粘度。整个系统分为数据收集、数据传递、数据分析三部分,数据分析又分为离线数据分析和实时数据分析,应对数据分析的不同的实时性需求。 |
大数据内存计算框架 |
SCALA |
Scala是一门多范式的编程语言,集成面向对象编程和函数式编程的各种特性。Scala视一切数据类型皆对象,且支持闭包、lambda等特性,语法简洁。使用Actor作为并发模型,与Akka框架自然契合,是一种基于数据共享、以锁为主要机制的并发模型。Scala可以和Java很好的衔接。Scala可以使用所有的Java库,同时对于一些Java类做了无缝的扩展Scala的traits对于java的面向对象来说做了很好的扩充,使得面向对象更加灵活Scala的for推导式提供了更好用更灵活的for循环Scala的语法内容包括:方法定义、变量、字符串、泛型、Option、集合、程序控制结构、匿名函数、Class类、ClassCase样例类模式匹配、traits、extends、函数式编程、高阶函数、AKKA编程 |
SPARK |
知名的内存计算框架,可用来构建大型的、低延迟的数据分析应用程序,在迭代处理计算方面比Hadoop快100倍以上。SPARK构建了自己的整个大数据处理生态系统,如流处理、图技术、机器学习、NoSQL查询等方面都有自己的技术,并且是Apache顶级项目。SPARK的内容有:SPARK的RDD、SPARK的SHUFFLE、SPARK的Stage、Work、Task、Partition、action、transformation等特性,SPARK的SQL、SPARK的DataFrame对象、SPARK的Stream |
Python爬虫、数据可视化 |
Python爬虫 |
Python是一种脚本化语言,具有简单易用、天然开源、生态丰富、应用范围广泛的特点。在大数据技术中,数据获取是第一步骤,其中利用爬虫获取互联网中公开的数据是一种非常常见的场景。Python爬虫技术在爬虫领域具有很广泛的应用,课程中将介绍Python的基本语法、Scrapy、PySpider爬虫框架,使学员具有基于Python的爬虫开发能力 |
数据可视化 |
数据可视化技术是大数据处理过程中的结果展示相关技术,通过相关工具将分析结果展示为直观的、美观的图形页面,为用户提供展示效果 |
-
第四阶段:算法、R语言、数据挖掘分析 |
学习版块 |
学习内容 |
算法、R语言数据挖掘分析 |
算法是解决问题的策略机制,是解决问题的核心方法。R是用于统计分析、绘图的语言和操作环境。数据挖掘是基于数据进行数据建模得到数据规律从而进行事实预测的技术。本节以R语言为环境学习包括但不限于聚类、回归、正则化、决策树、集成算法、降维算法、神经网络等算法,来实现数据挖掘相关能力并为后续学习机器学习、人工智能等相关技术提供基础。使学员从工具使用者变为真正问题的解决者 |
用户画像推荐系统项目 |
基于电商网站的业务数据、访问日志构建用户的画像描述用户特征为后续精准营销提供数据基础。通过收集业务系统数据库中结构化数据、日志系统中访问日志信息构建基于hive的数据仓库,使用spark作为计算引擎实现用户画像。基于协同过滤算法实现基于商品的推荐系统,为电商网站商品推荐提供支持。通过收集日志系统信息到kafka、获取用户画像数据作为数据来源,通过sparkstraming作为计算引擎实现商品推荐 |
大数据工程师需要具备哪些能力
1.大数据架构的工具与组件。数据工程师更关注分析基础架构,因此所需的大部分技能都是以架构为中心的。
2.深入了解SQL和其它数据库解决方案。数据工程师需要熟悉数据库管理系统,深入了解SQL至关重要。
3.数据仓库和ETL工具。数据仓库和ETL经验对于数据工程师至关重要。像Redshift或Panoply这样的数据仓库解决方案,以及ETL工具,比如StitchData或Segment都非常有用。
三大优势,助你快速掌握大数据核心
-
注重实践
注重项目、注重技能,让所学知识能够合理运用,助学员快速获得工作经验。
-
云主机实验环境
达内教育配备ucloud云服务器,提供完全真实的互联网大数据开发部署环境。
-
项目多易掌握
每个项目对应一个阶段知识点,从基础到进阶层层深入,对接企业工作流程。
达内项目峰会,更贴近企业需求
01
实战项目操作流程
以企业内部开发项目流程为样例进行分步骤拆解,全程参与项目所有环节。
02
一线工程师联手打造
和一线讲师一起协作。老师提供指导,学员独立自主开发,完成实战课题。
03
热门行业项目案例
选取热门的行业作为项目来源。比如:北京二手房项目,电商平台项目。
04
多方位技术辅导教学
个性化辅导,并获得项目代码审阅与详细反馈,高效提升大数据开发技能。
大数据开发工程师应掌握的技术
1. Redis。Redis是一个key-value存储系统,其出现很大程度补偿了memcached这类key/value存储的不足,在部分场合可以对关系数据库起到很好的补充作用,它提供了Java,C/C++,C#,PHP,JavaScript,Perl,Object-C,Python,Ruby,Erlang等客户端,使用很方便,大数据开发需掌握Redis的安装、配置及相关使用方法。
2. Flume。Flume是一款高可用、高可靠、分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。大数据开发需掌握其安装、配置以及相关使用方法。
实力讲师汇聚,实战经验倾囊相授
来自于亚信Java培优大数据教研总监。6+年软件开发经验。8+年IT培训经验。在开发过程中,担任过项目经理、系统架构师等职位。在JavaEE领域和大数据领域有深入的研究。
工作20年,15+年软件开发、管理经验。曾任职于山脉科技、神州数码、国家电网等机构,担任系统架构师、CTO等工作。曾在传智播客任A级讲师、达内科技任研发总监及授课讲师。
学员评论
来自第三方
来自第三方
来自第三方