Hadoop1 하둡 프로그래밍 기초 ( Part.1 ) 하둡은 빅데이터 관련 기술을 이용하는 사람이라면, 필수로 알아야 할 자바 기반의 오픈소스 프레임워크 이다.하둡의 주요 기능은, 데이터를 저장하고 분산 처리 시스템인 맵리듀스를 이용하여 데이터 처리를 한다. 1. 왜 쓸까?소프트웨어 라이선스 비용 부담 없음 (오픈소스)한 번에 여러 대의 서버를 이용하여 데이터 저장, 동시 처리가 가능 (=분산처리)그렇기 때문에 졸라 빠름. (당연한 얘기겠죠?)RDBMS 도 아니지만 NoSQL도 아님. (Nosql은 다른 페이지에서 설명)2. 하둡 향후 과제고가용성 지원근데 2.0 부터 많이 개선됨. 3.0은 더 개선됐겠지?파일 네임스페이스 제한메모리로 관리되니까 메모리 용량에 따라 제한이 있음 데이터 수정 불가저장된 파일은 수정이 안됨 ㅠ전문업체 부족흠..ㅠㅠ 아마 빅데이.. 2024. 11. 24. 이전 1 다음