[오픈테크넷 서밋 2014] 하둡개발 환경의 편의성 위한 플라밍고 플랫폼
[디지털데일리 이상일기자] 하둡(Hadoop)은 빅데이터 분석에 있어 각광받는 기술이지만 사용하기가 쉽지는 않다. 하지만 하둡의 성능 및 활용을 최대로 이끌어내기 위한 다양한 프로젝트가 이어지고 있어 하둡 생태계는 활성화되고 있다.
13일 서울 양재동 엘타워에서 개최된 ‘오픈테크넷 서밋 2014’에서 ‘쓰기 쉬운 하둡(Hadoop) 기반 빅데이터 플랫폼 아키텍처 및 활용방안’을 발표한 오픈프론티어랩 박치완 개발자는 “빅데이터를 활용하기 위해서는 데이터 사용자가 자주, 빨리 분석을 수행해볼 수 있어야 한다. 하지만 아직은 하둡이 기존 시스템보다 다루기 어려운 것은 사실”이라고 설명했다.
오픈프런티어랩은 국내외 오픈소스 프로젝트를 수행하는 공개SW 커미터(Committer)를 지원하는 정부지원(정보통신산업진흥원) 프로그램이다.
박 개발자는 “아파치 하둡이 소개된 이후 사용하기 어렵다는 지적을 보완하기 위해 다양한 기술이 나왔다”며 “하지만 터미널 위주의 데이터가 주를 이루다 보니 기존 환경에 익숙한 개발자들에겐 생소할 수 있다”고 설명했다.
이렇다보니 하둡 기술을 쉽게 사용할 수 있는 다양한 기술도 꾸준히 소개되고 있다.
박 개발자는 “하둡 클러스터를 쉽게 배포하고 관리해 줄 수 있는 ‘암바리(Ambari)’, 하둡관련 프로젝트를 하나로 묶어 사용할 수 있게 해주는 솔루션인 ‘클라우데라 휴(Cloudera Hue)’ 등 다양한 솔루션이 나오고 있어 하둡 생태계를 확장시키는데 도움을 주고 있다”고 설명했다.
한편 이 자리에서 오픈프론티어랩에서는 정부 지원을 받아 진행하고 있는 ‘플라밍고(Flamingo)’ 프로젝트를 소개했다. 플라밍고는 웹 기반 유저환경(UI)에서 하둡 컴포넌트를 다루는 것으로 하둡 개발환경에 생소한 개발자들고 편하게 다가갈 수 있게 해준다.
기능적으로 기존에 사용하던 맵리듀스(Mapreduce)에 통합해 워크플로우(Workflow)에 적용할 수 있고 하이브 테이블(Hive Table)은 쿼리(Query)문 없이 UI로만 가능하는 등 편의성이 강조된 기능이 채택됐다.
박 개발자는 “플라밍고에선 향후 기본적으로 제공되는 컴포넌트를 보강하는 한편 하둡 2.0 지원, 아마존 EMR 등 하둡 기반 엔터프라이즈 플랫폼을 지원할 계획”이라고 밝혔다.
<이상일 기자>2401@ddaily.co.kr
심각한 노인빈곤율…"면세자에 대한 환급형 세액공제 도입해야"
2024-12-22 12:38:24올해 정보보호 투자액 2조원 돌파…공시 의무화 효과 '톡톡'
2024-12-22 12:00:00예상 빗나가지 않은 강호동 농협중앙회장의 '물갈이'… 탄핵 정국속 '쾌도난마'
2024-12-22 11:21:15[OTT레이더] '무한도전'부터 '해리포터'까지…연말 정주행 찬스
2024-12-22 11:14:57산업부, 2025년 R&D 역대 최대규모 5.7조원 신속 집행
2024-12-22 11:00:00