玖富彩票开户

400-700-1307

大数据能自学吗?

2019-01-23 11:47
        学习大数据一定要清楚自己做数据科学还是数据工程,大数据怎么自学?大数据如何自学?都需要哪些方面的技术能力,自身处于哪一个阶段等,不能为了技术而技术,这样很难学好大数据。
 
        对于零基础想要学习的大数据的同学,最好的方案是:先关注一些大数据领域的动态,让自己融入大数据这样一个大的环境中。然后找一些编程语言的资料(大数据的基础必备技能)和大数据入门的视频和书籍,基本的技术知识还是要了解的。在学习了一段时间之后,如果觉得自己还能应付的来,就继续寻找大数据基础视频和书籍。大数据怎么自学?大数据如何自学?
 
  (1)大数据学习 业务驱动规避技术驱动:数据科学的核心能力是解决问题。
 
  大数据的核心目标是数据驱动的智能化,要解决具体的问题,不管是科学研究问题,还是商业决策问题,抑或是政府管理问题。
 
  学习之前要明确问题,理解问题,所谓问题导向、目标导向,这个明确之后再研究和选择合适的技术加以应用,这样才有针对性,言必hadoop,spark的大数据分析是不严谨的。
 
  不同的业务领域需要不同方向理论、技术和工具的支持。如文本、网页要自然语言建模,随时间变化数据流需要序列建模,图像音频和视频多是时空混合建模;大数据处理如采集需要爬虫、倒入导出和预处理等支持,存储需要分布式云存储、云计算资源管理等支持,计算需要分类、预测、描述等模型支持,应用需要可视化、知识库、决策评价等支持。所以是业务决定技术,而不是根据技术来考虑业务,这是大数据学习要避免的第一个误区。
 
  (2)大数据学习要善用开源,不要重复造轮子:数据科学的技术基因在于开源。IT前沿领域的开源化已成不可逆转的趋势,Android开源让智能手机平民化,让我们跨入了移动互联网时代,智能硬件开源将带领跨入物联网时代,以Hadoop和Spark为代表的大数据开源生态加速了去IOE(IBM、ORACLE、EMC)进程,倒逼传统IT巨头拥抱开源,谷歌和OpenAI联盟的深度学习开源(以Tensorflow,Torch,Caffe等为代表)正在加速人工智能技术的发展。
 
  (3)大数据学习要以点带面,不贪大求全:数据科学要把握好碎片化与系统性。根据前文的大数据技术体系分析,我们可以看到大数据技术的深度和广度都是传统信息技术难以比拟的。
 
  我们的精力很有限,短时间内很难学习好多个领域的大数据理论和技术,数据科学要把握好碎片化和系统性的关系。
 
  那怎么把握系统性呢,不同领域的大数据应用有其共性关键技术,其系统技术架构也有相通的地方,如系统的高度可扩展性,能进行横向数据大规模扩张,纵向业务大规模扩展,高容错性和多源异构环境的支持,对原有系统的兼容和集成等等,每个大数据系统都应该考虑上述问题。
 
  如何把握大数据的碎片化学习和系统性设计,离不开前面提出的两点误区,建议从应用切入、以点带面,先从一个实际的应用领域需求出发,搞定一个一个技术点,有一定功底之后,再举一反三横向扩展逐步理解其系统性技术。
 
  (4)大数据学习要勇于实践,不要纸上谈兵:数据科学还是数据工程?
 
  大数据只有和特定领域的应用结合起来才能产生价值,数据科学还是数据工程是大数据学习要明确的关键问题,搞学术发paper数据科学OK,但要大数据应用落地,如果把数据科学成果转化为数据工程进行落地应用,难度很大,这也是很多企业质疑数据科学价值的原因。且不说这种转化需要一个过程,从业人员自身也是需要审视思考的。
 
  工业界包括政府管理机构如何引入研究智力,数据分析如何转化和价值变现?数据科学研究人员和企业大数据系统开发工程人员都得想想这些关键问题。
 
  大数据如何走出实验室和工程化落地,一是不能闭门造车,模型收敛了就想当然万事大吉了;二是要走出实验室充分与业界实际决策问题对接;三是关联关系和因果关系都不能少,不能描述因果关系的模型无助于解决现实问题;四是注重模型的迭代和产品化,持续升级和优化,解决新数据增量学习和模型动态调整的问题。
 
  大数据怎么自学?大数据如何自学?学习大数据一定要清楚我是在做数据科学还是数据工程,需要哪个比较方面的技术能力,自身所处的阶段等,不能为了技术而技术,这样难以学好和用好大数据的。

免费资源

开班信息

当前校区

北京校区
  • 北京校区
  • 上海校区
  • 广州校区
  • 沈阳校区
  • 杭州校区
  • 南京校区
  • 郑州校区
  • 成都校区
  • 深圳校区
  • 西安校区
  • 苏州校区
  • 深圳沙井
  • 深圳观澜
  • 深圳龙岗
  • 武汉校区
  • 西宁校区
  • 石家庄校区
  • 湖北咸宁
  • 广东惠州
  • 广东佛山
  • 济南校区
  • 北京 Java就业班 2019-06-11
  • 北京 Python就业班 2019-06-11
  • 北京 Python就业班 2019-06-18
  • 北京 Python训练营 2019-06-18
  • 北京 PHP就业班 2019-06-19
  • 北京 PHP就业班 2019-06-19
  • 北京 UI/UE就业班 2019-06-20
  • 上海 PHP就业班 2019-06-20
  • 上海 Java就业班 2019-07-17
  • 上海 Python就业班 2019-07-17
  • 上海 PHP就业班 2019-07-25
  • 上海 PHP就业班 2019-08-22
  • 上海 Java就业班 2019-10-29
  • 上海 Python就业班 2019-11-21
  • 广州 PHP就业班 2019-06-19
  • 广州 PHP就业班 2019-07-17
  • 广州 Python就业班 2019-07-17
  • 广州 Java就业班 2019-07-17
  • 广州 Python就业班 2019-08-13
  • 广州 PHP就业班 2019-09-18
  • 广州 Python就业班 2019-10-29
  • 沈阳 PHP就业班 2019-06-19
  • 沈阳 UI/UE就业班 2019-06-20
  • 沈阳 PHP就业班 2019-07-17
  • 沈阳 Java就业班 2019-07-17
  • 沈阳 Python就业班 2019-07-17
  • 沈阳 UI/UE就业班 2019-07-18
  • 沈阳 Java就业班 2019-08-13
  • 杭州 PHP就业班 2019-06-19
  • 杭州 Python就业班 2019-07-17
  • 南京 Java就业班 2019-06-11
  • 南京 PHP就业班 2019-07-17
  • 南京 Java就业班 2019-08-13
  • 郑州 Python就业班 2019-06-11
  • 郑州 PHP就业班 2019-06-19
  • 郑州 PHP就业班 2019-07-17
  • 郑州 UI/UE就业班 2019-07-18
  • 郑州 Java就业班 2019-08-13
  • 郑州 Python就业班 2019-08-13
  • 郑州 PHP就业班 2019-08-21
  • 成都 Python就业班 2019-06-11
  • 成都 Python就业班 2019-08-13
  • 成都 Python预科班 2019-09-24
  • 成都 Python就业班 2019-10-29
  • 成都 Python预科班 2019-12-18
  • 深圳 Java就业班 2019-06-11
  • 深圳 UI/UE就业班 2019-06-20
  • 深圳 Java就业班 2019-07-17
  • 深圳 PHP就业班 2019-07-17
  • 深圳 UI/UE就业班 2019-08-22
  • 深圳 Java就业班 2019-09-10
  • 深圳 PHP就业班 2019-09-18
  • 西安 Java就业班 2019-06-11
  • 西安 Python就业班 2019-06-11
  • 西安 Python预科班 2019-06-20
  • 西安 PHP预科班 2019-06-20
  • 西安 Java就业班 2019-07-17
  • 西安 PHP就业班 2019-07-17
  • 西安 Python预科班 2019-07-25
  • 苏州 PHP就业班 2019-06-19
  • 苏州 UI/UE就业班 2019-07-18
  • 苏州 PHP就业班 2019-08-21
                    • 济南 PHP就业班 2019-06-15
                    • 济南 Java就业班 2019-06-15

                    Copyright © 2007-2019 易第优(北京)科技股份有限公司 版权所有 京ICP备11018177号  京公网安备 11010802026987号