0

基于HADOOP集群的数据采集和清洗

作者:刘晨; 焦合军海量数据hadoophive数据采集数据清洗

摘要:互联网的到来,使计算机行业蓬勃发展,各公司的业务数据也都到达P级别的数据量。本文结合Hadoop框架的中Hive和Hbase,对各个模块进行了详细的描述,重点分析了集群搭建步骤,及如何对集群的数据进行采集和清洗,并通过建立表来存储分析结果。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

软件工程师

《软件工程师》是一本有较高学术价值的月刊,自创刊以来,选题新奇而不失报道广度,服务大众而不失理论高度,颇受业界和广大读者的关注和好评。 《软件工程师》现已更名为《软件工程》。

杂志详情
在线客服 发表咨询 加急见刊 文秘咨询 期刊咨询