大数据技术学习路线指南:[7]为什么是Hadoop
前文已经介绍过Hadoop是什么,但是关于为什么是Hadoop,Hadoop凭借怎样的本事而成为大数据分析技术的标准基础。我们一起从多个角度来了解下Hadoop的威力,以及和这威力密切相关的一切因素。
![大数据技术学习路线指南:[7]为什么是Hadoop](https://exp-picture.cdn.bcebos.com/2e66f9ef28066b01d055d2f43df39187021cf3dc.jpg)
2、Hadoop命名:其实是一个孩子给棕黄色大象的命名。Hadoop图标在本系列中也随处可见。Google也是一个这样的例子。这样有一个很好的点就是想到Hadoop,就会想到大数据,而不会是其他。
![大数据技术学习路线指南:[7]为什么是Hadoop](https://exp-picture.cdn.bcebos.com/983aa5f4da5872da81c180bb0056ad042f68d4dc.jpg)
Hadoop大比较
1、为什么选择Hadoop,而不是其他数据处理架构,比如传统关系型数据库或者其他。Hadoop在我的眼里,更像是在“暴力解锁”,它可以处理每一条数据,乃至每一种可能的设想。Hadoop的巨大贡献在于快速分析大数据所隐藏的事实,这在过去也许需要几天甚至几个月的时间才能完成,而Hadoop很可能只需要几分钟甚至几秒钟的时间就可以很完整地做好!
![大数据技术学习路线指南:[7]为什么是Hadoop](https://exp-picture.cdn.bcebos.com/18aebc5f0c14c27bae0a673d2a46b7b1eff939dd.jpg)
3、网格计算尝试通过多台机器(不同的任务)处理和管理共享文件系统,最终达到大数据计算的目的。这样的尝试以网络带宽的约束而失败告终。因为数据量达到GB级别以上时,网格计算的方法显得力不从心。不过网格计算用在中小型科研实验确实是说一不二的选择!
![大数据技术学习路线指南:[7]为什么是Hadoop](https://exp-picture.cdn.bcebos.com/3aae2b4f50b8b43e3453b6fe7132939c2df719dd.jpg)
2、目前谷歌已经不再使用Hadoop架构(可以解决PB级别的数据),而是使用DataFlow结构在完成EB级别数据的分析,并且是基于对Hadoop架构的升级。这是一个可喜的消息,这不意味着Hadoop已经成为历史,而更说明Hadoop架构和其中思想的巨大潜力!
![大数据技术学习路线指南:[7]为什么是Hadoop](https://exp-picture.cdn.bcebos.com/3852f6e5eceeadbc04a7a6c4cd18dfdae53b7bdd.jpg)
4、大数据给我们带来许多好处,但同时也产生了不少新问题。比如数据隐私,大数据安全,数据滥用等等。这些都将是需要大家达成共识的下一个议题。
![大数据技术学习路线指南:[7]为什么是Hadoop](https://exp-picture.cdn.bcebos.com/e2aefe781431dfb6e0e4b6d212cf02532e6363dd.jpg)
声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。