友荐云推荐

Scala快速入门-基本数据结构

2014年apache开源软件最火的应该是spark,没有之一。为了更好的掌握spark,scala应该是必须学习的。为了一周左右快速入门scala,对scala有个基本认识,不可能像学校那样拿着书系统学习,只能通过官网tutorial以及高手的总结(后面的参考资料)。现把scala的基本知识总结了一下,分享给大家。

more ...

Scala快速入门-基础

2014年apache开源软件最火的应该是spark,没有之一。为了更好的掌握spark,scala应该是必须学习的。为了一周左右快速入门scala,对scala有个基本认识,不可能像学校那样拿着书系统学习,只能通过官网tutorial以及高手的总结(后面的参考资料)。现把scala的基本知识总结了一下,分享给大家。

more ...

Hive整体优化策略

hive可以从几个方面进行优化,从系统角度看:整体架构、MR阶段、JOB以及平台都可以进行优化。从用户角度看:了解SQL执行过程以及业务数据特点,调整SQL语句进行优化。

more ...

C++并行编程4

基于C++11,并行线程编程的最大好处,就是可以数据共享,但最大的坏处也是数据共享,如果使用不当,最容易产生bug。本节介绍如何安全的共享数据,避免潜在的问题。

more ...

C++并行编程3

基于C++11,介绍std::thread是如何传递参数的,是如何转换所有权的,以及如何确定线程数和获得线程标识符。

more ...

C++并行编程2

基于C++11线程的基本管理,包括如何启动一个线程,如何等待一个线程结束,如何处理一个异常以及如何让一个线程后台运行。

more ...

C++并行编程1

在C++11中的标准库中引入了线程库,这样就可以方便我们并行编程。什么时候需要并行编程呢?什么时候又不需要呢?并用线程库实现hello world。

more ...

分布式系统-terms

好玩实在的分布式系统理论系列,本节主要介绍分布式系统中涉及到的一些术语,大家应该经常听到这些术语的,但是具体含义应该没有多少人可以确切回答的,如scalability、latency、performance等。

more ...