하둡#hadoop#분산처리#DBMS#IT#정보보호#정보보안1 하둡이란? 하둡이란, 기존 DBMS로는 대용량 데이터를 처리할 수 없게되자 생겨나게 되었고, 하둡은 여러개의 컴퓨터로 분산하여 대용량데이터를 처리하는 기술입니다. 하둡의 주요 장점은 대용량 데이터를 분산하여 처리한다는 점입니다. 기존 데이터들은 처리를 위해서는 중앙으로 모두 모아져 중앙에서 처리가 되었다면, 하둡환경에서는 각 데이터들이 여러개의 컴퓨터에서 처리가 된 후 중앙으로 모이게 되어서, 데이터 처리 속도가 매우 빨라지게 되는 장점이 있습니다. 하둡의 주요 구성요소는 HDFS(Hadoop Distributed File System, 하둡 분산형 파일시스템) : 수천대의 분산된 장비에 대용량 파일을 저장할 수 있는 기능을 제공하는 분산파일 시스템 맵리듀스(MapReduce) : 저장된 파일을 분산된 서버의 CP.. 2022. 11. 20. 이전 1 다음