[DD 프리즘] 오라클이 던진 승부수…‘빅 데이터 어플라이언스’
[IT전문 미디어블로그 = 딜라이트닷넷]
올해 국내외 IT업계를 달굴 가장 뜨거운 키워드는 ‘빅 데이터’입니다. 가트너를 비롯한 여러 IT조사기관, IT업체 등의 2012년 전망 보고서는 모두 빅 데이터가 올해의 최대 화두로 빅 데이터를 꼽고 있습니다.
지금까지 빅 데이터를 제대로 이용해 온 기업들은 대부분 인터넷 서비스 업체들입니다. 구글, 페이스북 등은 빅 데이터라는 용어가 없던 시절부터 빅 데이터를 저장, 관리, 처리, 분석하는 기술을 자체적으로 개발하거나 이용해 왔습니다.
문제는 일반 기업들입니다.
은행, 통신사, 제조업체 유통업체 등의 기업들은 지금까지 빅 데이터가 쌓이면 버릴 수 밖에 없었습니다. 이를 활용할 방법이 없었기 때문입니다. 일반기업의 IT부서 개발자 및 관리자들은 하둡이나 맵리듀스, NoSQL과 같은 최신 기술을 자체적으로 습득해 활용하기를 기대하는 것은 무리입니다.
때문에 이런 일반 기업이 빅 데이터를 잘 활용하기 위해서는 이들의 오랜 파트너였던 오라클, IBM, HP, 마이크로소프트, EMC 등의 솔루션 및 컨설팅 업체들의 도움이 필요합니다.
일반적으로 IT업계에 새로운 기술이 각광을 받더라도 이들이 뛰어들지 않으면 일반 기업에서는 이 기술을 활용하지 않게 됩니다. 이런 IT전문기업들이 활용하기 용이한 솔루션 및 서비스를 제공할 때 비로소 일반 기업들이 최신 기술을 받아들이기 때문입니다.
이런 면에서 이번 주 국내에 출시된 ‘오라클 빅 데이터 어플라이언스’ 솔루션을 주목할 필요가 있습니다.
오라클이 빅 데이터 시장을 겨냥해 출시한 첫 제품이기 때문입니다. 오라클 빅 데이터 어플라이언스는 빅 데이터 관리를 위한 서버와 스토리지, 소프트웨어 등이 결합된 어플라이언스 솔루션입니다.
국내 데이터 관리 산업에서 오라클이 차지하는 비중을 감안하면, 이 솔루션이 국내에 끼칠 영향은 적지 않아 보입니다. 그런 의미에서 오라클 빅 데이터 어플라이언스에 대한 세부 스펙을 살펴보도록 하겠습니다.
이 어플라이언스에는 썬 X4270 M2 서버가 18개 들어있습니다. 각 노드 당 48GB(기가바이트)의 메모리가 포함돼, 총 864GB의 메모리입니다. 하드디스크드라이브는 노드 당 36TB(테라바이트), 총648TB를 포함하고 있습니다.
이 외에 3개의 인피니밴드 스위치가 들어 있습니다. 총 100개의 포트는 초당 40GB의 속도이며 내부 노드 및 외부의 오라클 엑사데이터와 연결됩니다. 초당 10GB의 이더넷도 16개 포트로 구성됩니다.
소프트웨어로는 ▲오라클 리눅스5.6 ▲오라클 자바 VM ▲하둡(클라우데라 배포판) ▲오라클 R 오픈소스 ▲오라클 NoSQL 데이터베이스 커뮤니티 에디션 ▲마이SQL 스탠다드 에디션 ▲오라클 빅 데이터 커넥터 등이 포함돼 있습니다.
여기서 흥미로운 점은 오라클이 클라우데라의 하둡 배포판을 어플라이언스 안에 포함시켰다는 점입니다. 하둡은 오픈소스이기 때문에 오라클이 굳이 클라우데라 배포판을 넣을 필요는 없었기 때문입니다. 오픈소스로 제공되는 리눅스나 R(통계툴)의 경우 ‘오라클’이라는 브랜드를 붙인 반면, 똑같은 오픈소스임에도 하둡에는 ‘클라우데라’ 배포판을 이용한다는 것입니다.
이는 클라우데라가 하둡 기술을 선도하는 업체라는 것을 오라클이 인정한다는 의미이기도 하고, 아직 오라클이 하둡 기술을 완벽하게 숙지하지 못했다는 뜻으로 이해할 수도 있습니다.
빅 데이터 커넥터의 구성요소로는 ▲하둡을 위한 오라클 로더(Oracle Loader for Hadoop) ▲하둡을 위한 오라클 데이터 통합 애플리케이션 어댑터(Oracle Data Integrator Application Adapters for Hadoop), 오라클 알-투-하둡 커넥터(Oracle R-to-Hadoop Connector), 오라클 다이렉트HDFS(Oracle DirectHDFS) 등이 있습니다.
‘하둡을 위한 오라클 로더’는 데이터를 하둡 시스템에서 오라클 DB로 로딩하는 역할을 합니다. ‘하둡을 위한 오라클 데이터 통합 애플리케이션 어댑터’는 오라클 데이터통합 솔루션에서 사용할 수 있는 어댑터로, 하둡과 통합돼 있으며 하둡 코드 생성을 지원합니다. ‘오라클 알-투-커넥터’는 R프로그램이 하둡 분산 파일 시스템(HDFS) 데이터 위에서 직접 수행되도록 하는 소프트웨어입니다. 오라클 다이렉트HDFS는 SQL 질의와 HDFS 사이의 데이터를 통합해 SQL을 통해 HDFS의 데이터를 컨트롤 할 수 있도록 합니다.
오라클은 이 중에서 DB 안에서 R을 통해 직접 통계치를 내고 분석을 수행한다는 점을 강조합니다. 이는 데이터 이동을 최소화 해 비즈니스 속도를 높인다고 회사 측은 설명합니다.
빅데이터 솔루션 컨설팅 업체 윈터 코퍼레이션은 오라클의 빅 데이터 어플라이언스에 대해 세 가지 장점이 있다고 이야기 합니다.
첫째는 기업들이 빅 데이터 아키텍처를 만들기 위해 하드웨어와 소프트웨어를 통합하는 등의 수고를 덜어준다 점이고, 둘째는 상용 기술지원 서비스를 받을 수 있다는 점입니다. 셋째는 대부분의 기업들이 이미 오라클 DB를 이용하기 때문에 이것과 연결하기 쉽다는 점입니다.
하지만 이런 장점에도 불구하고 ‘오라클’이니까, 비싸다는 점은 각오를 해야 할 것입니다. 이 솔루션의 정가는 45만 달러에 프리미엄 기술지원 비용 5만4000달러입니다. 물론 실제로는 이보다 훨씬 저렴하게 공급될 것입니다.
반면 일부 해외 언론에서는 이마저 오라클 답지 않게 싸게 나왔다는 평가를 내놓기도 했습니다.
[심재석기자 블로그=소프트웨어&이노베이션]
[IT백과] 생성형AI의 진화 ‘AI 에이전트’, 기존 AI 비서와 뭐가 다를까?
2024-12-21 13:27:59[종합] AI 초격차 확보 공고히 한 오픈AI…12일간 여정 끝엔 ‘쩐의전쟁’ 남았다
2024-12-21 11:15:25오픈AI, o1보다 더 강력한 o3 예고…개발자·연구자 대상 사전 테스트 실시
2024-12-21 08:02:48