(1)Hadoop概述 Hadoop是一个开源的分布式计算和存储框架,用于处理大规模数据集(大数据)的并行处理。它由Apache基金会开发,核心设计灵感来自Google的MapReduce和Google文件系统(GFS)论文。Hadoop的核心优势在于其高容错性、横向扩展能力(可通过增加普通服务器扩展集群)以及低成本 (2)Hadoop核心部件 (3)一些其他的和Hadoop配合的东西