Hadoop é um framework open-source que permite armazenar e processar dados grandes em um ambiente distribuído entre clusters de computadores que utilizam modelos de programação simples. Ele é projetado para ampliar a partir de um único servidor para milhares de máquinas, cada um oferecendo computação e de armazenamento local.