Hadoop is een open-source framework die het mogelijk maakt om grote hoeveelheden gegevens op te slaan en te verwerken in een gedistribueerde omgeving aan de overkant van clusters van computers met behulp van eenvoudige programmering modellen. Het is ontworpen om op te schalen van enkele servers tot duizenden machines, elk met lokale berekening en opslag.