Hadoop è un framework open-source che permette di memorizzare ed elaborare dati di grandi dimensioni in un ambiente distribuito su cluster di computer che utilizzano modelli di programmazione semplici. È stato progettato per scalare da singoli server a migliaia di macchine, ognuno con il calcolo e memoria locale.