• 用户头像

    崔维力77

    //@fleeting001: 回复@大数据皮东: !呵呵,这个hive中join的优化以及有些paper optimzing joins in a mr environment,但是两个大表的join的性能都比较难。表比较小,可以直接放到distributedCache中,。。。
    【大数据技术每日分享】【MapReduce应用实例】MapReduce适合在大量非结构数据上进行简单操作(如求和、提取属性值和简单统计操作),因此大数据分析中常用于挖掘的预处理(如数据装载,ETL和只读一次的处理),不适合于复杂统计和挖掘任务(如迭代和递归),具体实现实例推荐好文 🔗 网页链接
    展开全文
    转发 1评论 0
    原微博