Hadoop硬实战


背景和基本原理

跳跃中的Hadoop

数据逻辑

将数据导入导出Hadoop

数据序列化-处理文本文件及其他格式的文件

大数据模式

处理大数据的MapReduce模式

优化HDFS处理大数据的技术

诊断和优化性能问题

数据科学

数据结构和算法的运用

结合R和Hadoop进行数据统计

使用Mahout进行预测分析

驯服大象

深入解析Hive

Pig流管道

Crunch及相关技术

测试与调试