下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

什么是大数据工程师?

世界正从IT时代走向DT时代,未来是大数据的时代,企业最有价值的资产就是数据,你所拥有的数据越多你就越有说话权,因此未来企业里最牛逼的员工应该是和数据有关的职位,比如CDO(首席数据官)、大数据工程师等,这些职位将成为程序员又一个高薪出路。

大数据工程师就是一群“玩数据”的人,玩出数据的商业价值,让数据变成生产力。大数据和传统数据的最大区别在于,它是在线的、实时的,规模海量且形式不规整,无章法可循,因此“会玩”这些数据的人就很重要!

飓风口的机遇,人生的转机

大数据工程师市场需求、薪资一览图

大数据工程师市场需求、薪资一览图
如何成大数据工程师?

从0基础进阶学习,到年薪30万

大数据进阶学习
讲师:徐培成

十八掌教育创始人,主讲师,java,大数据


  毕业于计算机工程专业,先后在软件公司人软件工程师、系统分析师、项目经理、软件架构师,主持开发了大产权交易系统,异构数据 库协同系统、电信资源管理系统、互联网综合性调查等系统,对java技术、数据库技术、互联网应用、远程通信、网络编程、分布式应用、高可用性计算机网络 集群等技术有着丰富的实战经验和深厚的技术功底。曾在传智播客任java技术讲师,主要负责Struts2、Hiberate、spring、Mybatis、webservice、android、Jee框架项目部分的讲解。期间曾受聘北航研究生软件学院特聘android讲师,CSDN华北区高校讲师暑期Android训练营的特聘讲师以及二炮部队javaee事业组持久化化技术外聘唯一技术讲师。曾任驿统金(上海)网络技术有限公司总经理,主导和光大银行总行重点合作的阳光驿站金融结算系统研发和技术。主持并指导团队在阿里公有云上规划、部署hadoop大数据集群,并对用户的金融交易日志进行存储和分析,完成从传统RDMBS数据到大数据集群的移植和升级。现在是北京十八掌网络科技有限公司创始人,主营大数据技术开发和探索,志在打造最具实战性的大数据技术培训。

大数据培训班系列课程目录立即报名
第一阶段、大数据基础体系 JavaSE,Mysql, 实时聊天软件,Linux&VMware基础

本部分是基础课程,帮大家进入大数据领域打好java,Linux基础,以便更好地学习Hadoop,hbase,NoSQL,Spark,Storm,docker,openstack等众多课程。因为企业 中的项目基本上都是使用Linux环境下搭建或部署的。

课程一、大数据立足之本JavaSE

此课程对于初级程序员来说,可以在短时间内迅速提高开发能力,掌握流行的技术,把握技术的发展脉络。对于中高级程序员来说,本课程可以在短时间内快速提升个人的开发能力及流程设计能力,此刻javaeSe深入浅出讲解。

  • 1)Java语言入门,Java基础语法、数据类型、运算符、流程控制语句、函数、数组
  • 2)OOP编程,面向对象编程(OOP)、类和对象,封装、继承、多态三大特性
  • 3)Java常用Api、集合,集成开发工具(Eclipse)安装使用
  • 4)常用IO流及编码表,异常体系Exception、Error,NIO
  • 5)五、Java实用技术,多线程、网络编程、反射、内省、设计模式

课程二、数据库MySql

本教程从基础的MySQL开始介绍,让学员能够从易到难,从Java的数据库的灵活使用。其中分库介绍了,各个数据库的基本独立使用,以及各自的安装和配置。课程中主要是以SQL脚本为基础,带领学员更加牢固的掌握知识点。

  • 1)MySql数据库的应用
  • 2)触发器、存储过程序列、索引、视图对象
  • 3)JDBC技术:JDBC基础Statement、PreparedStatement、ResultSet结果集对象等
  • 4)数据库连接池技术
  • 5)ORM对象关系映射基本思想。

课程三、阶段项目:实时聊天软件

本课程通过学习的知识点融会贯通,让以前的知识飞起来,让每个学生掌握java核心内容。 此项目虽然仅仅几句描述,但是知识点运用到极致。

  • 运用前面学习的知识,综合运用Java基础、Swing、集合、IO、数据库、Socket编程,编写一个实时聊天软件。

课程四、Linux&VMware基础

这章是基础课程,帮大家进入大数据领域打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,Spark,Storm,docker,kvm,openstack等众多课程。因为企业中无一例外的是使用Linux来搭建或部署项目。

  • 1)Linux的常用命令:介绍、使和练习
  • 2)nano编辑器:nano编辑器的介绍、nano扥使用和常用快捷键
  • 3)Linux用户和组账户管理:用户的管理、组管理
  • 4)Linux系统文件权限管理:文件权限介绍、文件权限的操作
  • 5)apt命令,源修改
  • 6)Linux网络管理:hosts,hostname,ifconfig等
  • 7)Linux系统进程管理常用命令ps、pkill、top、htop等的使用
  • 8)Shell编程:Shell的介绍、Shell脚本的编写
 第二阶段、大数据Hadoop
 第三阶段、大数据Hadoop 其他体系家族
 第四阶段、大数据spark世界
 第五阶段、大数据 大型企业项目实战

课程一、国内某前三甲著名电商的商品推荐系统

国内某前三甲著名电商的商品推荐系统,项目又名--“猜你喜欢”。
    项目采用MapReduce计算模型结合mahout机器学习实现用户相似度、商品关联度和降维分析等 协同过滤算法。
    数据直接来自企业在线系统的生产数据,具有权威性和真实性,数据量在tb级以上。
    利用该系统,直接促成商业交易额提升25%。

课程二、国内某电视台卫视节目HDFS的云盘存储系统

国内某电视台卫视节目云盘存储系统,基于Hadoop HDFS分布式存储,实现对文件的浏览、上传、下载、删除功能, 系统支持多种文件格式,文件大小支持几十K到几十M,甚至上百M。
    视频存储容量为每天10小时有效视频文件,每小时的视频大小为1g(高清视频),每周七天,存储近10年的数据。
    总容量评估为 : 10 x 365 x 10 x 1g = 35tb字节数。
    基于HDFS的云盘系统可以把独立的服务器磁盘或磁盘阵列统一为有机整体,由Hadoop HDFS全局维护数据的存储与备份, 以存储海量数据,对外部系统提供一致的文件下载服务。
    基于HDFS的云盘系统可以将数据冗余存储,保证了数据的安全存储与备份,并使整个存储的水平扩展非常容易。 namenode节点使用QJM实现高可用集群,支持自动+手动两种容灾方式。
    为避免工作人员因专业性强导致集群资源分布不均,根据需求设定空间配额和目录配额进行约束管理。 为防止管理员对资源目录进行快速备份和后期恢复工作,支持快照功能,且可以设定快照数量。     为防止管理员操作不当,误删除重要数据,集群支持回收站机制,并设有告警和提示功能。
云盘存储系统支持存储节点的热伸缩,保证数据高可用性。