창립자: Hadoop의 아버지로 알려진 Doug Cutting은 Apache Software Foundation의 회장이자 Lucene, Nutch, Hadoop 및 기타 프로젝트의 창시자입니다.
처음에 Hadoop은 Apache Lucene의 하위 프로젝트인 Nutch의 일부였습니다.
Lucene은 세계 최초의 오픈 소스 전체 텍스트 검색 엔진 툴킷입니다. Javaweb의 검색 기능을 사용해 본 학생들은 이 툴킷을 접했을 것입니다.
완전한 쿼리 엔진과 부분 텍스트 분석 엔진을 갖추고 있습니다.
Nutch는 Lucene을 기반으로 하며 웹 크롤링 및 파싱 기능을 가지고 있으며 검색 엔진 개발을 구현할 수 있지만 실제로 사용하려면 매우 짧은 시간에 응답해야 합니다. 수억 개의 웹 페이지를 분석하고 처리하려면 분산 작업 처리, 장애 복구, 로드 밸런싱 등의 문제를 고려해야 합니다.
나중에 Doug Cutting은 Google의 Google File System 및 MapReduce: Simplified Data Process On Large Clusters 두 편의 논문을 빌려 해당 기술을 이식하고 이름을 Hadoop으로 명명했습니다.