[오픈테크넷 서밋 2014] 하둡개발 환경의 편의성 위한 플라밍고 플랫폼
[디지털데일리 이상일기자] 하둡(Hadoop)은 빅데이터 분석에 있어 각광받는 기술이지만 사용하기가 쉽지는 않다. 하지만 하둡의 성능 및 활용을 최대로 이끌어내기 위한 다양한 프로젝트가 이어지고 있어 하둡 생태계는 활성화되고 있다.
13일 서울 양재동 엘타워에서 개최된 ‘오픈테크넷 서밋 2014’에서 ‘쓰기 쉬운 하둡(Hadoop) 기반 빅데이터 플랫폼 아키텍처 및 활용방안’을 발표한 오픈프론티어랩 박치완 개발자는 “빅데이터를 활용하기 위해서는 데이터 사용자가 자주, 빨리 분석을 수행해볼 수 있어야 한다. 하지만 아직은 하둡이 기존 시스템보다 다루기 어려운 것은 사실”이라고 설명했다.
오픈프런티어랩은 국내외 오픈소스 프로젝트를 수행하는 공개SW 커미터(Committer)를 지원하는 정부지원(정보통신산업진흥원) 프로그램이다.
박 개발자는 “아파치 하둡이 소개된 이후 사용하기 어렵다는 지적을 보완하기 위해 다양한 기술이 나왔다”며 “하지만 터미널 위주의 데이터가 주를 이루다 보니 기존 환경에 익숙한 개발자들에겐 생소할 수 있다”고 설명했다.
이렇다보니 하둡 기술을 쉽게 사용할 수 있는 다양한 기술도 꾸준히 소개되고 있다.
박 개발자는 “하둡 클러스터를 쉽게 배포하고 관리해 줄 수 있는 ‘암바리(Ambari)’, 하둡관련 프로젝트를 하나로 묶어 사용할 수 있게 해주는 솔루션인 ‘클라우데라 휴(Cloudera Hue)’ 등 다양한 솔루션이 나오고 있어 하둡 생태계를 확장시키는데 도움을 주고 있다”고 설명했다.
한편 이 자리에서 오픈프론티어랩에서는 정부 지원을 받아 진행하고 있는 ‘플라밍고(Flamingo)’ 프로젝트를 소개했다. 플라밍고는 웹 기반 유저환경(UI)에서 하둡 컴포넌트를 다루는 것으로 하둡 개발환경에 생소한 개발자들고 편하게 다가갈 수 있게 해준다.
기능적으로 기존에 사용하던 맵리듀스(Mapreduce)에 통합해 워크플로우(Workflow)에 적용할 수 있고 하이브 테이블(Hive Table)은 쿼리(Query)문 없이 UI로만 가능하는 등 편의성이 강조된 기능이 채택됐다.
박 개발자는 “플라밍고에선 향후 기본적으로 제공되는 컴포넌트를 보강하는 한편 하둡 2.0 지원, 아마존 EMR 등 하둡 기반 엔터프라이즈 플랫폼을 지원할 계획”이라고 밝혔다.
<이상일 기자>2401@ddaily.co.kr
[尹정부 ICT점검] ‘디지털정부 1위’ 성과 이면에 장애대응·격차해소 과제로
2024-11-16 10:39:44임종훈 대표, 한미사이언스 주식 105만주 매각… 상속세 납부 목적, 이면에 불가피한 속사정?
2024-11-15 18:04:20최윤범 고려아연 회장 “이사회 의장직 내려놓겠다”… 삼성∙보잉 사례 참고했나
2024-11-15 17:19:23[DD퇴근길] 네이버 밴드, 美 MAU 600만 돌파…IT서비스업계, 연말인사 포인트는
2024-11-15 16:53:04비트코인이 불지른 가상화폐 ‘불장’… 금융당국, '이상거래' 모니터링 강화
2024-11-15 16:20:20