빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어...

20
백서 빅 데이터(Big Data)의 폭발적 증가 빅 데이터를 큰 비즈니스 기회로 연결시키는 Informatica 9.1 플랫폼

Transcript of 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어...

Page 1: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

W H I T E P A P E R백서

빅 데이터(Big Data)의 폭발적 증가빅 데이터를 큰 비즈니스 기회로 연결시키는 Informatica 9.1 플랫폼

Page 2: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

이 문서는 인포매티카의 기업 대외비, 독점 및 상거래상의 기밀 정보를 포함하며 인포매티카의 사전 서면 동의 없이 복사, 배포, 중복 또는 어떤 방식으로도 복제될 수 없습니다.

본 문서 정보의 정확성과 완전성을 기하기 위한 노력을 다했음에도 불구하고 일부 오식 또는 기술적 부정확성이 있을 수 있습니다. 인포매티카는 본 문서에 포함된 정보의 사용으로 발생하는 어떤 종류의 손해에 대해서도 책임을 지지 않습니다. 본 문서에 포함된 정보는 예고 없이 변경될 수 있습니다.

인포매티카 소프트웨어 제품의 릴리즈 또는 업그레이드에 해당 자료에서 나오는 제품 특성 통합 및 해당 릴리즈 또는 업그레이드 시기는 인포매티카의 재량으로 결정됩니다.

다음 미국 특허권 중 하나 이상에 의해 보호됩니다: 6,032,158; 5,794,246; 6,014,670; 6,339,775; 6,044,374; 6,208,990; 6,208,990; 6,850,947; 6,895,471; 또는 출원 중인 다음 미국 특허권: 09/644,280; 10/966,046; 10/727,700.

이 버전은 2011년 5월에 제작되었습니다.

Page 3: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

1

백서

빅 데이터(Big Data)의 폭발적 증가: 빅 데이터를 큰 비즈니스 기회로 연결시키는 Informatica 9.1 플랫폼

목차총괄 요약. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2

빅 데이터 메가트렌드. . . . . . . . . . . . . . . . . . . . . . . . . .2

빅 데이터의 "파괴적 힘". . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

빅 데이터 정의. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

빅(Big)을 구분 짓는 범위는? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

기업의 빅 데이터 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

빅 데이터의 비즈니스 기회 확보 . . . . . . . . . . . . . . . . . .5

기존 데이터 인프라의 장애 극복 . . . . . . . . . . . . . . . . . .6

Informatica 9.1: 빅 데이터를 위한 구축 . . . . . . . . . . . . . . .7

빅 데이터 통합 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

빅 데이터 통합 활용 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

신뢰할 수 있는 검증된 데이터. . . . . . . . . . . . . . . . . . . . . . . . . . . 9

신뢰할 수 있는 검증된 데이터 활용 . . . . . . . . . . . . . . . . . . . . . . 10

셀프서비스 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

프로젝트 관리자를 위한 애플리케이션 인지 Accelerator . . . . . . . . . . 11

셀프서비스를 통한 현업 사용자 권한 강화 . . . . . . . . . . . . . . . . . 13

적응형 데이터 서비스로 데이터 액세스 가상화. . . . . . . . . . . . . . . 15

사용자 사용 사례: 빅 데이터 활용. . . . . . . . . . . . . . . . . 15

대형 백화점의 고객 중심 전략. . . . . . . . . . . . . . . . . . . . . . . . . . 15

운송 모바일 인텔리전스 개척자의 프로세스 개선 . . . . . . . . . . . . . 16

결론 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

Page 4: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

2

총괄 요약멀티 페타바이트 데이터 웨어하우스에서 소셜 미디어 데이터, 클라우드 기반

애플리케이션에서 센서 및 모바일 장치, 전자상거래 처리에서 지리공간 정보에

이르기까지 빅 데이터 시대가 도래했습니다. 빅 데이터가 기업의 최고 자산이 될지

가장 무거운 짐이 될지는 데이터 양, 복잡성, 다양성 및 처리 속도에 있어 방대한

증가를 다루기 위해 가까운 미래에 사용할 전략과 솔루션에 따라 결정될 것입니다.

Informatica® 9.1은 조직이 빅 데이터를 큰 기회로 전환할 수 있도록 도와주기 위해

특별히 설계되었습니다. 최근 릴리즈된 인포매티카 플랫폼을 사용하면 기업에서는

빠르게 늘어나는 트랜잭션 데이터를 거대한 양의 새 상호 작용 데이터와 통합하여

다른 솔루션을 통해 얻을 수 없었던 통찰력과 전략적 이점을 얻을 수 있습니다.

이 백서는 빅 데이터가 제시하는 과제 및 기회에 대해 알아보고, 인포매티카를

사용해 빅 데이터를 비즈니스 이익으로 연결한 조직의 활용 사례를 개략적으로

소개하며, 데이터 중심 기업에게 큰 힘이 되어 줄 Informatica 9.1의 놀라운 빅 데이터

처리 능력에 대해 자세히 설명합니다. 여기서 다룰 네 가지 핵심 주제는 다음과

같습니다.

•빅 데이터 통합

•신뢰할 수 있는 검증된 데이터

•셀프서비스

•적응형 데이터 서비스

빅 데이터 메가트렌드불과 얼마 전까지만 해도 1TB(테라바이트) 데이터 웨어하우스가 엄청나게

느껴졌을 것입니다. 이제 1테라바이트 스토리지 장치는 가까운 매장에서 100달러

미만에 구입할 수 있으며 많은 데이터 웨어하우스가 페타바이트 용량을 넘어선 지

오래입니다.

페타바이트에 대해 잠시 언급하자면, 1제타바이트가 몇 페타바이트인지

알고 계십니까? 최근까지만 해도 제타바이트라는 용어는 이론적으로만

사용되었습니다. 이제 전문가들은 세상의 데이터가 ZB, 즉 100만 페타바이트

경계를 넘을 것이라고 예상합니다.

이제 우리는 빅 데이터 시대에 살고 있음이 분명합니다. 앞으로 몇 년 동안

기업에서 생성하고 소비하고 저장하고 액세스할 수 있는 데이터 양이

기하급수적으로 늘어날 것입니다. 일부에서는 산업, 정부 및 소비자 부문에서

정보가 수행하는 역할의 변화를 역사적 사건으로 빗대어 빅 데이터를

"데이터의 산업 혁명"으로 부릅니다.

그러나 데이터 양의 증가는 빅 데이터 위상의 반 정도에 지나지 않습니다. 빅

데이터는 데이터의 다양성, 복잡성 및 처리 속도의 대규모 증가도 초래했습니다.

이미 많은 조직에서는 수십 개의 형식, 수백 개의 소스 및 글로벌 규모의 실시간

스트리밍 데이터 등 빅 데이터의 집요한 공격에 시달리고 있습니다. 일부에서는

빅 데이터가 이전에 있었던 모든 것을 작아 보이게 만들 것이라 믿고 있습니다.

리서치 기업인 IDC는 빅 데이터 현상을 "그 끝을 상상하기에는 아직 이르다"1라고

한 마디로 정리합니다.

1 IDC, “The Digital Universe Decade—Are You Ready?” 2010년 5월.

Page 5: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

3빅 데이터(Big Data)의 폭발적 증가: 빅 데이터를 큰 비즈니스 기회로 연결시키는 Informatica 9.1 플랫폼

백서

빅 데이터의 "파괴적 힘"

귀사에서는 빅 데이터 증가를 처리하고 빅 데이터를 큰 기회로 전환하기 위한

전략과 솔루션을 개발 중입니까? 의사 결정 과정을 개선하고 공격적으로

성장을 추구하기 위해 빅 데이터 통합 및 분석을 준비 중이십니까? 정보를 운영

흐름에 주입하여 비즈니스 프로세스를 간소화하고 계십니까? 적합한 플랫폼과

프로세스로 빅 데이터의 비즈니스 잠재력을 깨워 데이터 중심 기업에 힘을 실어

줄 수 있습니다. 빅 데이터의 우세한 이점을 잘 활용하는 기업일수록 고객 관리,

영업 성과, 운영 효율성 및 비즈니스 민첩성 같은 부문에서 경쟁력을 확보할 수

있습니다.

오늘날 빅 데이터 전체를 유연하게 액세스하고 처리할 수 있는 능력을 가진 조직은

아직 없습니다. IT 부서에서는 경영진, 관리직, 현장 직원, 고객 또는 파트너까지

정보 전달에 대한 기대가 늘어나는 것이 부담스러울 수 있습니다. 빅 데이터를

활용하여 주요 통찰력을 얻고 경쟁 우위로 전환하기 위해 요구되는 유연하고 확장

가능한 데이터와 정보 인프라가 부족한 것이 현실입니다.

빅 데이터의 맹습을 헤쳐 나가지 못한다는 것은 단순히 기회의 손실이라고 하기에는

너무나 큰 문제입니다. 이는 실질적 위험을 초래합니다. 데이터 양의 증가는 기회와

위협을 판단할 수 있는 능력을 흐리게 합니다. 데이터가 복잡하면 규정 준수 시

타협이 필요한 경우도 있습니다. 다양한 채널에서 실시간으로 발생하는 데이터의

끊임없는 흐름은 고객 영업과 서비스의 질을 떨어뜨릴 수 있습니다.

빅 데이터 정의

빅 데이터란? 빅 데이터란 트랜잭션과 상호 작용 데이터를 모두 포함해서

적절한 비용과 시간 그리고 일반적으로 사용되는 기술을 사용해 파악, 관리 및

처리하기에는 너무 크고 복잡한 데이터를 의미합니다. 사실상 빅 데이터는 그림 1에서 보듯이 세 가지 주요 기술 경향이 융합된 것입니다.

"빅 데이터는 파괴적인 힘을

가지고 있는 시급한 과제로

기존의 합의된 비즈니스

모델에 이미 영향을 주고

있습니다. 이는 현재 추세의

붕괴를 나타내며, 공공부문,

현업 부서 및 IT 리더가

무시할 수 없는 커다란

기회를 의미합니다."

Gartner2

그림 1. 빅 데이터는 빅 트랜잭션 데이터, 빅 상호 작용 데이터 및 빅 데이터

처리로 구성된 세 가지 경향이 융합된 것입니다.

2 Gartner, “CEO Advisory: ‘Big Data’ Equals Big Opportunity,” 2011년 3월 31일.

빅 트랜잭션 데이터 빅 상호 작용 데이터

빅 데이터 통합

OLTP(온라인 트랜잭션

처리)

OLAP (온라인 분석 처리) 및 DW

어플라이언스

소셜 미디어 데이터 기타 상호 작용

데이터

과학

장비/장치

빅 데이터 처리

Page 6: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

4

•빅 트랜잭션 데이터: 기존의 관계형 데이터는 비정형 및 반정형 정보를 비롯해 ERP 애플리케이션에서 데이터 웨어하우스 어플라이언스까지 OLTP(온라인 트랜잭션 처리) 및 분석 시스템에서 지속적으로 증가하고 있습니다. 기업이 더 많은 데이터와 비즈니스 프로세스를 비공개 및 공개 클라우드로 이동함에 따라 관련 동향은 복잡해 지고 있습니다.

•빅 상호 작용 데이터: 새롭게 떠오르는 이 데이터는 Facebook, Twitter, LinkedIn 및 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 CDR(통화 세부 내역), 장치 및 센서 정보, GPS 및 지리/지역 매핑 데이터, 대용량 이미지 파일, 웹 텍스트 및 클릭스트림 데이터, 과학 정보, 이메일 등이 포함됩니다.

•빅 데이터 처리: 빅 데이터의 증가는 하드웨어 클러스터에서 실행되는 오픈 소스인 아파치 하둡(Apache Hadoop) 같은 데이터 집중 처리를 위해 구축된 프레임워크의 등장에 기여했습니다. 기업이 해결해야 하는 과제는 신속하고 신뢰할 수 있으며 비용 효율적으로 데이터를 하둡(Hadoop) 내부와 외부로 가져오는 것입니다.

빅(Big)을 구분 짓는 범위는?

빅 데이터는 크기가 큰 데이터라는 것은 분명하지만 얼마나 큰 데이터를 가리키는

지에 대해서는 논의의 여지가 있습니다. IDC에서는 "디지털 유니버스"가 약 50%의

연간 증가율을 보일 것으로 예측하고 있으며, IDC 추정치의 70% 이상이 소비자에

의해, 20% 이상이 기업에 의해 발생한다고 보고 있습니다. 2009년에서 2020년 사이에

디지털 유니버스는 35 ~ 44제타바이트 또는 3,500만 페타바이트까지 증가할 것이라고

IDC는 예상합니다.3

캘리포니아 샌디에고 대학의 컴퓨터 과학자들이 측정한 바에 의하면 빅 데이터는

점점 그 크기가 증가할 것이라고 합니다. 2011년 4월 보고서에 따르면 캘리포니아

샌디에고 대학은 세계의 기업 서버가 2008년 한 해 9.57ZB의 데이터를 처리했다고

추정했습니다. 미국 가정에서 생성된 3.6ZB의 데이터는 계산에 넣지 않은

추정치입니다.4 기업용 정보에 대한 캘리포니아 샌디에고 대학의 수치는 IDC의

기업과 소비자 데이터를 모두 포함시킨 근사치의 10배가 넘습니다만, 두 추정치

모두 엄청난 수치임에는 분명합니다. 캘리포티아 샌디에고 대학에 따르면

추정치를 놓고 볼 때, 9.75ZB의 문고판 책은 지구에서 해왕성을 20번 왕복할 수

있는 수치라고 합니다.

기업의 빅 데이터

개별 기업에서는 빅 데이터의 크기를 구체적으로 정의하지 않지만 일반적으로

수십 테라바이트에서 수 페타바이트 사이입니다. 오라클 사용자 그룹의 531명의

멤버로 구성된 Unisphere Research의 한 조사에 따르면 기업 데이터 양은 10개 중 9개 기업에서 급속히 증가하고 있으며, 16% 기업이 매년 50% 이상의 증가율을

경험하고 있다고 합니다.5

기업은 이미 성능 면에서 제어할 수 없는 데이터 증가의 영향을 감지하고

있습니다. 예를 들어, 인포매티카의 지원을 받아 Unisphere Research가 실시한 한

조사에서는 응답자의 87%가 데이터 양 증가의 원인을 기업 애플리케이션 성능

문제로 보고 있다고 합니다.6

3 IDC, “The Digital Universe Decade—Are You Ready?” EMC 후원, 2010년 5월.

4 University of California at San Diego, “How Much Information? 2010 Report on Enterprise Server Information,” 2011년 4월.

5 Unisphere Research, “Keeping Up with Ever-Expanding Enterprise Data,” 2010년 10월.

6 Unisphere Research, “Information, Unplugged: 2009 OAUG ResearchLine Survey on Enterprise Application Information Lifecycle Management,” 2010년 4월.

Page 7: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

5빅 데이터(Big Data)의 폭발적 증가: 빅 데이터를 큰 비즈니스 기회로 연결시키는 Informatica 9.1 플랫폼

백서

빅 데이터의 비즈니스 기회 확보 귀사에서 빅 데이터로 할 수 있는 일은 무엇입니까? 빅 데이터로 인한 새로운

기회를 어떻게 활용하시겠습니까? 그에 따르는 위기는 어떻게 대처하시겠습니까?

빅 데이터 관련 문제에 어떻게 대처할지 고군분투하고 있는 조직들이 늘어가고

있으며, 이들은 더욱 진보된 MPP(Massively Parallel Processing) 데이터베이스, 하둡

분산 파일 시스템, MapReduce 알고리즘, 클라우드 컴퓨팅 및 아카이브 스토리지를

구축하고 있습니다. 이러한 상황에서 중요한 것은 데이터 통합입니다. 현업 부서

사용자가 모든 데이터에 액세스 가능하게 하며, 이를 빅 데이터 인프라 전반에

걸쳐 적용하는 것이 중요합니다.

데이터 통합을 통해 조직은 빅 데이터의 "스윗 스팟"을 맞추게 되었을 때 기존

트랜잭션 데이터와 새로운 상호 작용 데이터를 통합하여 달성하기 어려운

통찰력과 가치를 이끌어낼 수 있습니다. 이를 가장 잘 보여 주는 예는, 소셜

미디어에서 수집한 고객의 선호도/비선호도 프로파일 데이터를 보강해 타겟

마케팅을 개선하는 전략입니다. 데이터 통합 없이는 빅 데이터는 수많은 빅 데이터

사일로에 지나지 않습니다.

빅 데이터가 화두가 되고 있는 요즘, 사업 성과에서 데이터가 맡은 핵심적 역할을

인지하고 있는 CIO, IM(정보 관리) VP, 엔터프라이즈 설계자, 일선 경영진 및 현업

부서 임원들이 빅 데이터를 주목하고 있습니다. 2011년 Gartner가 CEO 및 고위

경영진을 대상으로 한 조사에 따르면 사실상 CEO들은 "데이터 중심 의사 결정"을 "

비즈니스에 최고의 전략적 가치를 제공하는" 기술 기여도라고 정의하고 있습니다.7

빅 데이터는 사실상 모든 산업과 관련이 있습니다.

•소비자 산업: 소매업부터 여행업 및 서비스업에 이르기까지 조직은 페이스북 게시물, 트위터 트윗, 유튜브 동영상, 블로그 댓글 그리고 기타 소셜 미디어 콘텐츠를 파악하면 소비자 이해, 상품 판매, 서비스 제공, 브랜드 이미지 관리 및 입소문 마케팅을 좀 더 효과적으로 할 수 있습니다.

•금융 서비스: 은행, 보험사, 증권사 및 파생 금융 서비스 회사들은 고객 확보 및 유지, 타겟 교차 판매 유도뿐만 아니라 빅 데이터에 분석 데이터를 적용하여 사기 감지, 위험 관리 및 규정 준수를 강화하기 위해 빅 데이터 통합 및 분석에 시선을 집중하고 있습니다.

•공공부문: 미연방 NITRD(Networking and Information Technology Research and Development) 실무 그룹은 디지털 미래 설계 보고서를 발표했습니다. 이 보고서는 "모든 연방 정부 기관은 빅 데이터 전략이 필요"하고, 이는 과학, 의학, 상업, 국가 보안 및 기타 분야를 지원할 수 있는 것이어야 하며, 주정부 및 지방 정부 기관의 경우 환경 검토, 테러 방지 및 유권자 관계 등 다양한 분야에서 유사한 수준의 데이터 양 증가를 겪고 있다고 밝혔습니다.

•제조 및 공급망: 대용량 RFID(Radio Frequency Identification) 데이터의 실시간 흐름을 관리하면 회사가 물류, 재고 및 생산을 최적화하고 제조 결함을 신속하게 파악할 수 있습니다. GPS 및 매핑 데이터는 공급망을 효율적으로 간소화할 수 있습니다.

•전자상거래: 엄청난 양의 B2B 및 B2C 클릭스트림, 텍스트, 이미지 데이터를 이용하여 이를 트랜잭션 데이터(예: 고객 프로파일)와 통합하면 전자상거래의 효율성과 정확성을 높이고 다양한 채널에서 원활한 고객 경험을 이끌어 낼 수 있습니다.

•의료: 의료 업계가 의료 기록의 전자화 및 병원 간 의료 연구 데이터 공유를 채택함에 따라 많은 양의 데이터를 생성하고 정확한 데이터 관리의 어려움에 직면하고 있습니다. 생명공학 및 제약 업체는 게놈 연구 및 신약 개발 같은 분야에서 빅 데이터에 관심을 보이고 있습니다.

•통신: 끊임없는 CDR 스트림, 텍스트 메시지, 모바일 웹 액세스는 통신사 수익성에 위험을 초래하는 동시에 네트워크 최적화 기회를 제공합니다. 통신사들이 빅 데이터에 관심을 집중하는 이유는 소셜 네트워크 분석과 영향력 분포도를 사용하여 제품과 서비스 공급을 급변하는 고객의 수요에 맞추기 위해서입니다.

7 Gartner, “CEO Advisory: ‘Big Data’ Equals Big Opportunity,” 2011년 3월 31일.

Page 8: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

6

기존 데이터 인프라의 장애 극복 데이터 관리를 위한 기존 접근법은 빅 데이터에서 얻은 비즈니스 통찰력의 가치를

현실화하기에는 역부족입니다. 빅 데이터의 증가는 많은 기업들이 정보 관리

업무에서 겪고 있는 고통의 악화를 의미합니다.

•현업 부서/IT 민첩성 결여. IM(정보 관리) 조직은 현업 부서가 데이터 중심 이니셔티브와 의사 결정을 위해 필요로 하는 솔루션을 제공하기에는 비용은 높고 속도는 느리다는 평가를 받고 있습니다.

•비즈니스 성과 저하. IM은 데이터의 적시성, 신뢰성 및 정확성에 대한 현업 부서 사용자의 불만을 처리해야 하나 전사 데이터 품질을 확보하기 위한 표준이 결여되어 있습니다.

• IM에 대한 지나친 의존. 현업 부서 사용자는 필요한 정보에 직접 액세스하는 데 있어 제한이 있으므로, IM의 개입으로 시간이 소모되고 주요 비즈니스 프로세스에 지연을 초래합니다.

•고비용 및 복잡성. 기업은 데이터 증가 및 무계획적 애플리케이션 확장뿐만 아니라 시스템 성능 저하로 인해 치솟는 비용으로 어려움을 겪고 있으며, 빅 데이터의 공습에 제대로 대처하지 못하고 있습니다.

•지연 및 IT 리엔지니어링. 프로젝트와 그룹 전반에서 데이터 통합 로직을 거의 재사용할 수 없기 때문에 요구 사항이 조금만 바뀌어도 높은 비용의 아키텍처 재작업이 필요합니다.

•고객 기회 상실. 영업 및 서비스는 고객에 대한 포괄적인 시각이 부족한 경우, 수익 창출을 고객 행동 데이터 및 소셜 미디어 데이터를 활용할 수 있는 기회를

잃어버립니다.

이러한 문제 중, 기존 CRM 시스템의 제한을 해결하고 소셜 미디어 소스에서 나온

빅 데이터를 활용하여 고객을 확보 및 유지하고 교차 판매의 효과를 개선하는 것이

경영진의 커다란 관심사입니다. 조직은 CRM 2.0으로 전환하고 있으며, 이 전환의

결과는 다양하고 많은 데이터 소스에서 얻은 완벽하고 정확한 고객뷰에 의해

근본적으로 좌우됩니다. Gartner의 한 보고서에서는 다음과 같이 말합니다.

“Gartner 2011 CEO 및 고위 경영진 설문조사에서 '더 나은 데이터'와 '더 나은 고객

이해'가 비즈니스 리더의 최고 우선 순위라고 밝혀졌습니다. 비즈니스 프로세스에

필요한 리소스를 투자하는 조직에 한해, 빅 데이터는 이러한 추세를 파악하는 데

필요한 관리 조치와 기술 모두를 제공할 수 있는 잠재력을 가지고 있습니다.”8

8 Gartner, “CEO Advisory: ‘Big Data’ Equals Big Opportunity,” 2011년 3월 31일.

Page 9: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

7빅 데이터(Big Data)의 폭발적 증가: 빅 데이터를 큰 비즈니스 기회로 연결시키는 Informatica 9.1 플랫폼

백서

Informatica 9.1: 빅 데이터를 위한 구축인포매티카 플랫폼의 최신 릴리즈인 Informatica 9.1은 빅 데이터가 주는 문제를

큰 기회로 전환하기 위해 특별히 개발되었습니다. 18년간 데이터 통합 리더십을

구축해 온 Informatica 9.1은 데이터 중심의 기업이 다음 네 가지 부문에서 빅

데이터의 비즈니스 잠재력을 깨울 수 있도록 설계되었습니다.

•빅 데이터 통합으로 빅 데이터의 비즈니스 가치 확보

•신뢰할 수 있는 검증된 데이터로 비즈니스 통찰력 및 일관성을 높여 모든 용도에 맞는 신뢰할 수 있는 데이터 제공

• IT에서 통제를 하지만 셀프서비스로 모든 사용자가 적절한 정보를 얻을 수 있도록 권한 강화

•적응형 데이터 서비스로 모든 프로젝트의 비즈니스 요구 사항에 맞는 적절한 데이터 제공

다음 섹션에서는 Informatica 9.1의 기능 및 조직이 이를 사용하여 빅 데이터가 주는

기회를 활용할 수 있는 방법에 대해 간략히 설명합니다.

빅 데이터 통합

Informatica 9.1 은 빅 데이터 통합의 세 영역에서 혁신과 새로운 기능을 제공합니다.

빅 트랜잭션 데이터와의 연결. Informatica 9.1은 OLTP에 대한 네이티브 연결과 OLAP(온라인 분석 처리) 데이터 저장소를 통한 최대 페타바이트 규모의 빅 트랜잭션

데이터에 대한 액세스를 제공합니다. Informatica 9.1에서 제공하는 새로운 관계형/

데이터 웨어하우스 어플라이언스 패키지는 이러한 연결을 빅 데이터를 위해

구축된 솔루션으로 확장할 수 있습니다.

•소스에 관계없이 대규모 트랜잭션 데이터의 가용성과 성능 최대화

•모든 데이터베이스 및 처리 유형을 지원하는 단일 플랫폼을 통해 비용 및 연결 관리 위험 절감

•확장 가능하고 비용 효율적인 방식으로 트랜잭션 데이터를 활용하여 성장과 효율성을 위한 새로운 영역 발굴

빅 상호 작용 데이터와의 연결. Informatica 9.1에서 사용 가능한 새로운 소셜 미디어

커넥터를 사용해 Facebook, Twitter, LinkedIn 및 기타 미디어의 소셜 미디어 데이터

같은 새로운 소스에 액세스할 수 있습니다. 장치/센서, CDR, 대용량 이미지 파일

또는 생명공학, 제약, 의료 업체를 위한 의료 관련 정보 등 해당 산업에서 부각되고

있는 여러 종류의 데이터 값으로 확장할 수 있습니다.

•소셜 미디어 데이터에서 얻은 고객 관계 및 영향에 대한 새로운 통찰력 확보

•여러 유형의 빅 상호 작용 데이터에 액세스하고 통합한 후, 이를 트랜잭션 데이터와 결합하여 통찰력을 다듬고 새로운 기회 식별

•새로운 데이터 집합을 통합하고 이를 기업 사용자가 활용할 수 있도록 하여 시간, 비용 및 위험 감소

"Pfizer의 변화에서 가장 눈에

띄고 이해할 수 있는 부분은

빅 데이터, 즉 혁신을 꾀하기

위해 필요한 데이터 양의

폭발적 증가입니다. 우리는

여러 영역에서 나온 데이터를

보게 됩니다. Pfizer는 10년이

넘게 인포매티카를 사용해

오고 있으며 Informatica 9.1

기능을 구현하여 중요한

작업을 실행할 수 있을

것이라 기대하고 있습니다."

Krishan Kumar

디렉터

비즈니스 인텔리전스/데이터 웨어하우징

Pfizer

Page 10: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

8

빅 데이터 처리. Informatica 9.1의 새로운 연결 기능은 IT 리소스가 소스에 관계없이

데이터를 하둡에 로드하고 하둡에서 데이터를 추출하여 모든 대상으로 보낼 수

있도록 합니다. 또한 이러한 연결 기능 덕분에 인포매티카의 데이터 품질, 데이터

프로파일링 및 기타 기술들을 하둡 내의 데이터에 적용할 수 있습니다. 이러한

기능은 기업에게 하둡 내부와 외부에 있는 트랜잭션 데이터와 상호 작용 데이터를

결합시킬 수 있는 새로운 가능성을 열어 줍니다.

•완벽한 소스/타겟 데이터 통합을 통한 빅 데이터 처리를 위한 하둡 플랫폼 구축

•하둡 빅 데이터 분석에서 얻은 통찰력을 기존 기업 시스템에 통합하여 비즈니스 프로세스와 의사 결정 개선

•페타바이트 규모 성능을 활용하여 사실상 유형과 소스에 관계없이 빅 데이터 처리

빅 데이터 통합 활용

모든 새로운 데이터 소스는 새로운 비즈니스 기회이기도 합니다. 페이스북

친구가 올린 소셜 미디어 데이터, 제품 공급망의 센서 기반 RFID 정보 또는 새롭게

회사에서 구축한 기업 애플리케이션 등 이 정보를 활용할 수 있는 능력은 수익

증대와 직접적인 관련이 있습니다.

빅 데이터 잠재력을 깨우는 데에는 규모와 소스에 관계없이 정보를 액세스하고

통합하는 능력이 필요합니다. 여러 경우에 이는 상호 작용 데이터와 트랜잭션

데이터를 통합하여 다른 방법으로는 불가능한 통찰력을 깨우는 것입니다. 한 예로,

소셜 미디어 데이터를 사용해 고객을 확보하고 유지하여 수익을 올리는 것을 들 수

있습니다.

매일 트위터의 5,000만 개의 트윗과 페이스북의 6,000만 개의 업데이트를 통해

소비자들은 자신들이 좋아하고 좋아하지 않는 것에 대해 공유합니다. 귀사가

페이스북 친구를 통해 정보를 얻을 수 있는 경우를 가정해 보겠습니다. 이

페이스북 친구는 아들의 대학을 찾고 있고, 새 차를 구입할 예정이며, 카리브해

크루즈를 좋아합니다. 이는 타겟 마케팅과 고객 충성도 프로젝트를 위한 귀중한

정보입니다.

그림 2. 빅 데이터 통합은 빅 트랜잭션 데이터, 빅 상호 작용 데이터 및 빅 데이터 처리를 활용할 수 있는 능력과 관련됩니다.

빅 트랜잭션 데이터와의 준범용 연결

소셜 데이터를 포함한 빅 상호 작용 데이터와의 연결

하둡과의 연결

솔루션 활성화빅 데이터 처리

하둡을 통한 기업 환경 확대

하둡 - 웹 처리, 텍스트 마이닝,

사기/위험 분석, 이미지 처리

하둡 - 샌드박스(sandbox), 스테이징,

아카이브

대용량 처리 - OLTP, OLAP

새로운 유형의 DW 어플라이언스

빅 트랜잭션 데이터

빅 상호 작용 데이터

소셜 미디어 - twitter, facebook

및 Linkedin

기타 상호 작용 데이터 클릭스트림,

과학, 게놈, 센서 - 장비/장치, 모바일, CDR(통화 상세 기록), 대형

이미지, 텍스트

정보 관리 환경

Page 11: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

9빅 데이터(Big Data)의 폭발적 증가: 빅 데이터를 큰 비즈니스 기회로 연결시키는 Informatica 9.1 플랫폼

백서

더구나 넓은 범위에서 고객의 가치 형성에 미치는 영향을 볼 때, 기업은 이제

소셜 미디어 친구를 영업 직원으로 이용할 수 있고, 친구와 친구의 친구 사이에서

입소문 구매를 유도할 수 있다는 점을 잘 알고 있습니다. 반대로 까다로운 고객이

회사 제품이나 서비스에 대해 소셜 미디어를 통해 불평을 하는 경우 사업 평판에

흠이 갈 수 있습니다. 아직은 소셜 미디어 데이터의 20%만이 마케팅과 연관된다고

추정되는 가운데, 기업은 동적 데이터 스트림에서 선택적 콘텐츠를 분석할 수 있는

고성능 플랫폼이 필요합니다.

Informatica 9.1로 기업은 소셜 미디어 데이터를 활용하여 CRM 애플리케이션에서

고객의 선호 대상, 비선호 대상, 관심사, 직장과 가족 정보 및 기타 세부 사항 등

고객 프로파일을 강화할 수 있습니다. 하둡을 지원하므로 분산 처리 프레임워크와

트랜잭션 시스템 간 데이터 연동성을 제공하고, 양방향 데이터 움직임을 위한

유연성으로 비즈니스 목표를 달성할 수 있습니다.

신뢰할 수 있는 검증된 데이터

Informatica 9.1은 MDM(마스터 데이터 관리) 및 데이터 품질 기술이 탑재되어 있어

조직은 빅 데이터의 다양성과 범위에 관계없이 신뢰할 수 있는 검증된 데이터를

비즈니스 프로세스, 애플리케이션 및 분석에 제공하여 더 나은 비즈니스 결과를

얻을 수 있습니다.

모든 MDM 아키텍처 스타일 및 데이터 영역을 위한 단일 플랫폼. Informatica 9.1의

범용 MDM 기능 덕분에 조직은 데이터의 유형이나 위치에 관계없이 모든 마스터

데이터를 하나의 통합 솔루션으로 관리, 통합 및 조정할 수 있습니다. 범용 MDM

기능의 특징은 네 가지로 정의할 수 있습니다.

•멀티 도메인: 고객, 공급업체, 제품, 자산, 위치에 대한 마스터 데이터를 관리, 통합 및 액세스할 수 있습니다.

•다중 스타일: 유연한 솔루션으로 레지스트리형, 분석형, 트랜잭션형 또는 공존형 등 다양한 스타일로 사용할 수 있습니다.

•다중 구현: 솔루션은 단일 인스턴스 허브로 사용되거나 페더레이션, 클라우드 또는 서비스 아키텍처에서 사용될 수 있습니다.

•다중 사용: MDM 솔루션은 단일 플랫폼의 일부로 데이터 통합 및 데이터 품질

기술과 유연하게 연동합니다.

범용 MDM은 독립형 단일 MDM 인스턴스의 위험을 제거하며, 사실상 다른 데이터

사일로를 통해 문제를 해결하는 데이터 사일로 집합입니다.

•여러 데이터 아키텍처와 변화하는 비즈니스 요구 사항에 유연하게 대응

•단일 도메인에서 소규모로 시작해 스타일에 관계없이 다른 도메인으로 솔루션 확장

•MDM 솔루션의 목적을 재정의해 기술 집합과 데이터 로직을 비용 효과적으로

재사용

"폐기되는 데이터가 더 이상

없습니다! U.S. xPress는 대규모

트랜잭션 데이터와 다양한

상호 작용 데이터를 활용하여

Informatica 9.1의 하둡같은

빅 데이터 처리 플랫폼으로

확장했습니다. 우리는 이미지

파일로 운전자를 평가하고

고객 서비스 담당자가

작성한 텍스트에서 고객

행동을 파악합니다. U.S. xPress

는 센서, 미터, RFID 태그

및 지리적 위치 데이터를

활용하여 연료를 줄이고

경로를 최적화함으로써

연간 수백만 달러를

절감했습니다."

Tim Leonard

CTO(Chief Technology Officer)

U.S. xPress

Page 12: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

10

9 CIO Insight, “The Big Data Conundrum,” 2010년 11월 9일

모든 프로젝트 유형에서 재사용 가능한 데이터 품질 정책. Informatica 9.1의 MDM,

데이터 품질, 데이터 통합 기능 간 연동성 덕분에 데이터 품질 규칙은 MDM 및

데이터 통합 프로젝트의 구현 주기에 걸쳐 모든 데이터에 재사용 및 적용이

가능합니다(그림 3 참고).

•프로젝트 유형에 관계없이 데이터 품질 규칙을 유연하고 효율적으로 적용하여 데이터 정확성 향상

•기술과 리소스의 재사용을 최대화하여 기존 투자의 ROI 증대

•데이터 품질 규칙을 소스 애플리케이션 내에서 중앙 집중적으로 작성, 구현 및 유지하여 다운스트림 애플리케이션에 전달

예방적인 데이터 품질 보증. Informatica 9.1은 현업 부서와 IT 사용자 모두가

예방적으로 데이터를 모니터링하고 프로파일링할 수 있는 기술을 제공합니다.

이는 내부 애플리케이션 또는 외부 빅 데이터 소스에서 사용 가능합니다.

지속적으로 일치성, 일관성 및 이상 징후를 검사하여 데이터 품질 문제가 발견되면

다양한 채널에서 경고를 받을 수 있습니다.

• "조기 경고"를 수신하여 경고가 발생하기 전에 예방적으로 데이터 품질 문제를 식별하고 수정

•데이터 품질 문제가 다운스트림 애플리케이션과 비즈니스 프로세스에 영향을 주는 것을 방지

•최대 80%까지 테스트 주기 단축

신뢰할 수 있는 검증된 데이터 활용

빅 데이터의 다양성과 복잡성은 많은 조직에 존재하는 데이터 품질 문제를

악화시킬 수 있습니다. 독립형 임시 데이터 품질 도구들은 여러 소스에서 발생한

대규모 스트림을 처리하기에는 부족하며 기업에서 필요한 신뢰할 수 있는 정확한

데이터를 생성할 수 없습니다. 불량 데이터는 궁극적으로 불량 비즈니스로

이어집니다. 한 CIO Insight 보고서에 따르면 설문조사 응답자의 46%가 불량 또는

오래된 데이터를 바탕으로 부정확한 비즈니스 의사 결정을 한 적이 있다고

답했습니다.9

그림 3. Informatica 9.1은 데이터 통합, 데이터 품질 및 MDM을 통합하여 신뢰할 수 있는 검증된 데이터를 제공합니다.

현업 부서/IT 협업/데이터 거버넌스역할 기반, 통합, 프로세스 중심

하나의 MDM

하나의 데이터 품질

하나의 데이터 통합

현업 사용자 데이터 관리자 설계자 개발자

재사용 가능/일관된 데이터 품질

규칙

Page 13: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

11빅 데이터(Big Data)의 폭발적 증가: 빅 데이터를 큰 비즈니스 기회로 연결시키는 Informatica 9.1 플랫폼

백서

MDM 및 데이터 품질은 빅 데이터로 얻을 수 있는 기회를 가장 잘 활용하기 위해

필요한 필수 조건입니다. 두 가지 예를 들어 설명드리겠습니다.

•소셜 미디어 데이터를 사용해 고객 확보 및 유지. 일부 조직의 경우, 고객 프로파일을 강화하기 위해 소셜 미디어 데이터를 활용하는 것은 주객이 전도된 것일 수 있습니다. 그러나 많은 기업들은 신뢰할 수 있는 일관된 이름과 연락처 정보에서부터 제품과 서비스까지 완벽한 고객 싱글뷰를 가지고 있지 못합니다. 고객 데이터는 종종 CRM, ERP, 마케팅 자동화, 서비스 및 기타 애플리케이션에 분산되어 있습니다. Informatica 9.1 MDM 및 데이터 품질은 다양한 소스에서 하나의 완벽한 고객 프로파일을 구축할 수 있도록 해 줍니다. 이를 통해, 소셜 미디어에서 수집한 정보를 활용하여 고객 프로파일을 보강할 수 있습니다.

•비즈니스 문제에 데이터 중심 대응. 귀사는 포츈 500 제조업체 중 하나인데, 공급업체에서 제공한 한 부품에 문제가 있어 교체가 필요하다는 보고를 받았다고 가정하겠습니다. 예를 들어, 어떤 제품에 문제가 있는 부품이 사용되었는가? 해당 제품을 구입한 고객은 누구이며 어디에 있는가? 재고에 대체 부품이 확보되어 있는가? 대체 공급업체가 있는가? 같은 중요한 질문들에 대해 신속하게 답해야 합니다.

그러나 회사의 여러 영역, 즉 구매 시스템, CRM, 재고, ERP 그리고 여러 나라의

다양한 영역에서 답변이 나올 수 있습니다. 비즈니스 위기로 바뀔 수 있는

문제에 신속하고 정확하게 대응할 수 있는 방법은 무엇이겠습니까? 비즈니스

문제는 종종 여러 영역에서 초래되어 기업 전체에 도미노 효과를 일으켜 간단한

해결책으로는 해결할 수 없게 만듭니다. 이러한 문제의 해결은 상호 의존적

프로세스와 여기서 파생된 데이터를 유연하게 조정하는 것에 달려 있습니다.

Informatica 9.1의 범용 MDM 기능을 사용하여, 제조업체는 데이터가 어디에 있든,

어떤 MDM 스타일과 구현 방법이 사용되었는지에 관계없이 신뢰할 수 있는 검증된

마스터 데이터를 신속하게 찾아 긴급한 비즈니스 질문에 답할 수 있습니다.

셀프서비스

현업 부서가 빅 데이터 활용을 IT에만 의존한다면 빅 데이터의 가치는 제한됩니다.

Informatica 9.1은 조직이 현업 부서와 IT 부서와의 협업을 뛰어 넘어 현업 분석가,

데이터 관리자 그리고 프로젝트 관리자가 IT 리소스의 투입 없이도 더 많은 것을 할

수 있도록 합니다. 이러한 기능들은 그림 4에 정리되어 있습니다.

분석가 및 데이터 관리자를 위한 셀프서비스 데이터 통합. IT 부서와의 협업

프레임워크에서 현업 부서 사용자는 Informatica 9.1을 통해 역할 기반의 비기술적인

인터페이스에서 데이터 통합 및 품질에 대한 규칙을 구현할 수 있습니다. 분석가와

데이터 관리자는 스펙을 정의하고 데이터의 효율적인 이해를 도모하며, 현업

부서와 IT 부서의 생산성을 향상하는 데 더 큰 역할을 맡을 수 있습니다.

•현업 부서 사용자가 비즈니스 조건과 의미론적 메타데이터를 기반으로 데이터에 액세스할 수 있도록 함

•재사용, 자동화 및 협업을 통해 데이터 통합 프로젝트 가속화

•비즈니스 요구 사항을 데이터 통합 매핑과 품질 규칙에 정확하게 옮겨 오류를 최소화하고 일관성 확보

프로젝트 관리자를 위한 애플리케이션 인지 AcceleratorInformatica 9.1을 통해 프로젝트 관리자는 데이터 웨어하우징, 데이터 마이그레이션,

테스트 데이터 관리 및 기타 프로젝트에 필요한 데이터를 신속하게 이해하고

액세스할 수 있습니다. 프로젝트 관리자는 데이터 모델 및 관계형 스키마에 대한

심도 있는 지식을 요구하는 개별 테이블을 지정하는 대신 애플리케이션 내에서

비즈니스 엔터티를 소싱할 수 있습니다.

•데이터 통합 프로젝트 이행 시간 단축

•데이터의 완전성 보장 및 참조 무결성 유지

•비즈니스별 및 규정 준수 요구 사항을 충족하도록 대응

"LinkShare는 대량의 캠페인

및 광고 데이터를 고객과

파트너를 위한 비즈니스

가치로 탈바꿈시키는

데 선도적인 역할을 해

왔습니다. 이제 빅 데이터가

LinkShare의 온라인 PPA(Pay-

Per-Action) 마케팅 네트워크의

모든 부분에 포괄적인

영향을 미치고 있습니다.

빅 데이터, 적응형 데이터

서비스 및 셀프서비스를 위해

Informatica 9.1을 활용하여,

LinkShare는 새로운 제품을

더욱 빠르게 출시하고, 좀 더

정확한 보고 및 분석에 대한

고객 요구를 충족하며, 통합

로직의 재사용을 늘리고,

결과적으로 성장을 가속화할

수 있을 것입니다.”

David Ramos

비즈니스 인텔리전스 및 분석 이사

LinkShare

Page 14: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

12

현업 부서 사용자를 위한 사용 지점 데이터 및 컨텍스트. Informatica 9.1은 현업

부서 사용자에게 매일 사용하는 비즈니스 애플리케이션에 신뢰할 수 있고

검증된 데이터를 제공하여 여러 시스템에서 데이터에 액세스해야 하는 수고를

덜어 줍니다. 또한 사용자는 계층적 및 관계 정보, 비즈니스 글로서리 및 다양한

프로세스에서 중요한 데이터 계보(Lineage) 같은 전반적인 정보를 보고, 활용할 수

있습니다.

•현업 부서 의사 결정의 정확성 및 적시성 증가

•현업 부서 생산성 및 운영 효율성 개선

•제한된 IT 리소스에 대한 의존성을 최소화하여 부가 가치가 있는 프로젝트에

투입될 수 있도록 조정

예방적인 데이터 품질 보증. 빅 데이터 처리의속도 및 복잡성 문제를 해결하고자

Informatica 9.1은 CEP(복합 이벤트 처리) 기술을 데이터 품질 및 통합 모니터링에

도입하여 현업 부서 사용자 및 IT 부서에 실시간으로 문제를 경고해 줍니다.

예를 들어 데이터 품질의 주요 성과 지표가 임계값을 초과하는 경우, 또는 통합

프로세스가 사전 지정된 비율만큼 일반 프로세스와 다른 경우, 이를 분석가에게

알립니다.

•현업 부서 사용자가 사전 정의된 템플릿을 사용해 모니터링 기준을 정의할 수 있도록 함

•현업 부서 사용자에게 데이터 품질 및 통합 문제가 발생하는 경우 이를 알림

•문제가 성능 및 운영 시스템에 영향을 주기 전에 식별하고 수정

그림 4. IT에서 통제를 하지만 셀프서비스로 모든 사용자가 중요 정보에 액세스하고 데이터 통합 및 품질에 기여할 수 있도록 권한 강화.

셀프서비스 통합 사용 지점 데이터

생산성 협업

자동화 정확성

적시성 응답성

셀프서비스 예방적 모니터링

애플리케이션 인지 Accelerator

솔루션 활성화

Page 15: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

13빅 데이터(Big Data)의 폭발적 증가: 빅 데이터를 큰 비즈니스 기회로 연결시키는 Informatica 9.1 플랫폼

백서

셀프서비스를 통한 현업 사용자 권한 강화

현업 부서와 IT는 현업 사용자를 위한 협업과 데이터 셀프서비스 결여에 의해

오랫동안 불이익을 받아 왔습니다. 현업 부서는 필요한 신뢰할 수 있는 정보가

부족하고, 사용자가 정보 수집에 시간을 낭비함에 따라 생산성도 악화되고

있습니다. 빅 데이터의 출현과 데이터 전망의 추가적인 복잡성은 이러한 문제를

더욱 악화시킵니다. Informatica 9.1은 현업 부서 사용자에게 셀프서비스를 제공하여

현업 부서와 IT 부서가 더욱 효과적으로 협업할 수 있도록 합니다.

•비즈니스 효율성 가속화 및 강화. Informatica 9.1은 세일즈포스닷컴, 오라클, 시벨, SAP 같은 매일 사용하는 비즈니스 애플리케이션 내에서 조정된 마스터 데이터를 직접 제공함으로써 이 애플리케이션들이 “MDM을 인지”하게 만듭니다. 예를 들어, 한 영업 사원이 "John Jones"라는 새 고객의 계정을 만들려고 하는데, 동일한 주소를 가진 Jonathan Jones라는 고객 계정이 이미 있는 경우, 인포매티카의 MDM 솔루션을 사용해 이를 해결할 수 있습니다. 세일즈포스 인터페이스를 통해 사용자는 Informatica MDM이 여러 애플리케이션에서 수집하여 통합한 완전하고

신뢰할 수 있는 고객 정보에 액세스할 수 있습니다.

영업 사원은 John이 사용 중인 제품과 서비스를 확인할 수 있고, John이 영업 사원

회사의 트위터 팔로워이며, 페이스북 친구라는 것을 확인할 수 있습니다. John의 가정과 직장 관계를 파악할 수 있어 적절한 교차 판매를 유도할 수 있습니다.

B2B와 B2C 시나리오 모두에서 MDM 인지 애플리케이션을 사용해 영업 인력이

데이터 수집이나 IT와 연계되는 것을 줄이며, 생산성도 상당히 높일 수 있습니다.

•데이터 통합 및 품질에서 현업 부서 사용자에게 실제 역할 제공. 현업 부서가 IT 부서와 데이터 스펙에 대해 스프레드시트로 커뮤니케이션을 시도할 때 흔히 오랜 지연과 높은 비용이 발생합니다. 문제점 중 하나는 현업 부서와 IT 부서의 협업을 유도하고 현업 부서 사용자가 데이터 통합과 품질에 액세스할 수 있게

하는 툴의 부족입니다.

빅 데이터가 등장함에 따라 Informatica 9.1은 분석가 및 데이터 관리자에게 실제

역할을 할당합니다. 회사에 경쟁업체가 생겨 새로운 빅 데이터를 회사 운영

시스템으로 마이그레이션 및 병합해야 한다고 가정하겠습니다. 데이터 관리자는

데이터 품질 점수표를 검토해 보니, 특정 고객을 식별하는 방법에 이상 징후를

발견했고 IT 부서와 샘플 스펙을 공유했습니다. 문제가 확인된 후, 관리자는 관련

애플리케이션에 스펙을 전달할 수 있었습니다. 또한 역할 기반 인터페이스를

통해 관리자는 데이터 통합 로직을 의미적인 관점에서 보고 데이터 통합 매핑을

작성하여 다른 현업 부서 사용자 또는 IT에서 쉽게 이해하고 재사용 가능하게 할

수 있습니다.

Page 16: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

14

적응형 데이터 서비스. Informatica 9.1은 적응형 데이터 서비스를 통해 서비스 중심

플랫폼을 확장하여 기업이 모든 프로젝트에 대한 현업 부서의 요구에 맞는 적절한

데이터를 전달할 수 있도록 합니다.

다중 프로토콜 데이터 프로비저닝. Informatica 9.1을 사용해 데이터 서비스를

ODBC 또는 JDBC를 통해 SQL 쿼리나 웹 서비스로, 혹은 배치 프로세스로 Informatica PowerCenter®에 프로비저닝할 수 있습니다. SOA 구현을 위한 데이터 가상화 계층

역할을 합니다. 이 접근법은 실시간 데이터를 데이터 웨어하우징과 다른 분석

시스템에 저장된 기록 데이터와 통합하는 데 도움을 줍니다.

•재작업 없이 유연한 데이터 서비스 재사용을 통한 개발자 생산성 개선

•데이터 가상화를 통해 프로젝트 이행 시간 단축

•여러 프로젝트에 걸쳐 일관성 보장

통합 데이터 품질. Informatica 9.1을 사용해 데이터 서비스를 통해 프로비저닝된

모든 데이터에 대해 높은 품질을 보장할 수 있습니다. 이는 읽기와 쓰기 모두

액세스 지점에서 데이터 품질 규칙이 적용되도록 합니다. 통합 데이터 품질 기능을

구현할 때 템플릿 및 데이터 품질 규칙 라이브러리를 재사용할 수 있습니다.

•기업 전체에서 현업 부서가 신뢰할 수 있는 정보를 확보하도록 보장

•현업 부서에서 불량 데이터를 발견하면 데이터 품질을 높여 불량 데이터의 영향을 최소화

•사전/사후 처리나 임시 저장 없이 실시간으로 데이터 품질 구축

정책 중심 시행. Informatica 9.1로 데이터 액세스, 데이터 신선도, 데이터 품질,

데이터 보존 및 데이터 기밀에 대해 재사용 가능한 데이터 서비스를 구축할 수

있습니다. 이러한 정책은 표준을 따르고 현업 부서 요구와 관련 데이터 요구

사항에 맞게 수정된 규정을 준수합니다. 캐싱 규칙을 활용하여 데이터를 새로

고쳐야 하는 빈도를 지정하고 데이터가 실시간, 준실시간 혹은 배치로 전달되어야

하는지 지정합니다. 또한 데이터 보존 정책(예: 휴면 데이터 아카이브 시기 및

아카이브된 데이터 보존 기간 지정)을 구축합니다.

•정책, 규정 및 SLA를 준수하지 않음으로써 발생하는 위험 감소

•데이터 거버넌스를 위해 모든 애플리케이션에서 정책을 일관적으로 정의하고 적용

•하나의 플랫폼에서 여러 규정을 준수함으로써 발생하는 비용 절감

그림 5. 적응형 데이터 서비스는 모든 프로젝트에 대한 현업 부서의 요구 사항에 맞는 적절한 관련 데이터를 제공합니다.

•데이터 서비스를 ODBC 또는 JDBC를 통해 SQL 쿼리, 웹서비스 혹은 배치 프로세스로 프로비저닝

•SOA 구현을 위한 데이터 가상화 계층 구축

•과거 데이터와 실시간 데이터 결합

다중 프로토콜 데이터 프로비저닝

통합 데이터 품질 정책 중심 시행

적응형 데이터 서비스

보다 빠른 프로젝트 완료

재사용 및 표준화

신뢰할 수 있는 정보

규정 준수 위반 위험 감소

애플리케이션에서의 데이터 거버넌스

솔루션 활성화

•프로비저닝된 모든 데이터에 대해 높은 품질 보장

•읽기와 쓰기 모두 액세스 지점에서 데이터 품질 규칙 적용

•데이터 액세스 구축, 데이터 신선도, 데이터 품질, 데이터 보존 및 정책으로서의 데이터 기밀 유지

•캐싱 규칙을 활용하여 데이터를 새로 고쳐야 하는 빈도 지정

Page 17: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

15빅 데이터(Big Data)의 폭발적 증가: 빅 데이터를 큰 비즈니스 기회로 연결시키는 Informatica 9.1 플랫폼

백서

적응형 데이터 서비스로 데이터 액세스 가상화

Informatica 9.1의 데이터 가상화 및 페더레이션 기능은 빅 데이터의 늘어나는

복잡성을 해결하기 위한 강력하고 세련된 솔루션을 제공합니다. 아키텍트 및

개발자는 기존 접근법보다 상당히 짧은 시간과 적은 비용으로 다양한 데이터

서비스를 신속하게 설계, 구현 및 재사용할 수 있습니다.

이 혁신적인 기술 덕분에 이기종 소스에서 발생한 데이터를 하나의 데이터

소스처럼 움직이는 단일 가상 보기로서 그 데이터를 필요로 하는 애플리케이션에

결합할 수 있습니다. 모든 핵심 표준을 지원하므로 데이터 서비스는 재사용 가능한

서비스로 데이터 통합 로직을 공개하고, 소스에 관계없이 요청 시 또는 정해진

간격으로 복잡한 데이터 변환 일정을 세울 수 있는 유연함을 제공합니다.

통합 데이터 프로파일링 서비스를 통해 데이터 생명 주기의 모든 단계에서

데이터의 구조 및 품질을 평가할 수 있으며, 통합된 데이터 서비스는 신뢰할 수

있는 검증된 데이터가 현업 부서에 전달될 수 있게 보장합니다. 뿐만 아니라

데이터 서비스를 소스 시스템에서 데이터에 바로 액세스하는 리포팅 및 비즈니스

인텔리전스 솔루션을 위한 페더레이션 뷰, 데이터 웨어하우징을 위한 변환

프로세스의 일부, 또는 실시간 데이터 통합 서비스 등 여러 방식으로 재사용할 수

있습니다.

사용자 사용 사례: 빅 데이터 활용인포매티카 고객은 빅 데이터의 영향력을 활용하는 이니셔티브를 실현하고

있습니다.

온라인 마케팅 리더의 비용 절감 전략

이 온라인 제휴 마케팅 회사는 세계에서 가장 큰 인터넷 서비스 업체 중 하나로

전자상거래, 포털 및 미디어, 여행, 금융 서비스 및 프로 스포츠에서 우수한

서비스를 제공하고 있습니다. 고품질 직접 응답 디지털 미디어, 서비스 및 기술을

통합하는 온라인 마케팅 플랫폼도 제공합니다. 이를 통해 클라이언트는 비용

효율적으로 PPA(Pay-Per-Action) 제휴, 검색 및 리드 창출 캠페인을 개발하여 새

고객을 확보하고 수익을 늘리고 결과를 얻을 수 있습니다.

이 인포매티카 고객은 높은 인센티브를 가지고 적절한 광고가 적절한 시간에

적절한 사람에게 노출되도록 하여 수익성을 극대화합니다. 이 자체가 큰 최적화

문제를 가지고 있습니다. 또한 마지막 5분간 활동에 대해 정확한 최신 청구서가

고객에게 전달되도록 하는 SLA가 있습니다. 해결해야 하는 과제에는 500개 데이터

소스에서 발생하고 하루 3억 개의 트랜잭션과 관련되며 실시간으로 300,000명의

사용자에게 정보를 제공하는 엄청난 양의 트랜잭션 데이터 볼륨이 포함되어

있습니다. 이 회사는 인포매티카를 활용해서 이 모든 것이 가능하게 하였으며,

비용 면에서 3배의 절감 효과를 거두고 인포매티카를 사용해 최대 5배 빠르게

프로젝트를 이행했습니다.

대형 백화점의 고객 중심 전략

유명한 패션 전문 소매업체 중 하나로 지역 백화점, 온라인 또는 카탈로그

비즈니스를 통해 고객에게 제품을 제공하는 곳입니다. 이 회사는 단골 고객에게

차별화된 서비스를 제공하는 것으로 잘 알려져 있습니다. 몇 가지 분석을 통해

이 소매업체는 무료 메이크업 서비스와 화장품 샘플을 주는 것을 중단하기로

결정했습니다. 관리자들은 이러한 증정품을 받은 고객이 화장품을 구매하지 않는

다는 사실을 발견했기 때문입니다. 소매업체는 증정품 프로그램이 끝나도 화장품

판매율은 동일하게 유지될 것이라 기대했지만 판매율 하락을 경험했습니다.

Page 18: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

16

트위터와 페이스북 같은 소셜 미디어 정보 수집 등 연구를 통해 이 회사는

화장품의 영향 모델을 더 자세히 파악하기 위한 노력을 시작했습니다. 그 결과

소비가 많고 영향력이 높은 가치 있는 두 종류의 고객을 유지해야 한다는 사실을

파악했습니다. 무료 메이크업을 받는 고객이 반드시 화장품을 사는 것은 아니지만

입소문을 통해 친구나 친구의 친구가 구매하도록 유도할 수 있습니다. 이것은

트랜잭션 데이터와 상호 작용 데이터의 완벽한 결합으로 비즈니스 해결 과제에

명확하지 않은 해답을 이끌어 내게 합니다. 인포매티카를 사용해 이 소매업체는

소셜 미디어 데이터로 고객 마스터 데이터를 강화하고 서비스를 더욱 타겟

지향적으로 만들었습니다. 영향력이 높은 고객에게 적절한 증정품을 제공하는

전략을 사용해 수익을 높일 수 있었습니다.

운송 모바일 인텔리전스 개척자의 프로세스 개선

이 트럭 회사의 비전은 차세대 온보드 커뮤니케이션 시스템과 수천 명의 운전수,

수만 대의 트럭과 차량으로 운송 모바일 인텔리전스 분야에서 리더가 되는

것입니다. 이 업체는 모바일 인텔리전스를 사용해 회사의 자산, 트럭, 운전수,

운영 관리자, 파트너 및 고객의 모든 움직임을 추적하고 통찰력을 확보해 운영을

최적화하는 데 중점을 두고 있습니다. 여기에는 몇 가지 문제가 있었습니다.

회사는 트럭이 정지한 지점과 정지 시간을 파악하는 수단이 전혀 없었습니다.

엔진 유휴 시간에 돈이 낭비되었고 트럭은 효율적으로 사용되지 않았으며 고객

서비스는 제대로 이루어지지 않았습니다.

"No Data Left Behind" 프로그램의 일환으로 이 회사는 트럭 시스템에서 1초에 여러 번

900개 데이터 요소를 수집하기 시작했고, 타이어와 연료 사용에 대한 센서 데이터,

엔진 운영, 전 차량을 추적하는 지리적 위치 데이터 등 상상할 수 있는 데이터의

모든 부분을 효과적으로 추적했습니다. 시스템에 대해 불평하는 트럭 운전자의

블로그에서도 데이터를 스크랩하여 개선을 꾀했습니다. 하둡 기반 빅 데이터 처리

환경과 인포매티카가 기업 정보 관리 시스템의 핵심 요소였습니다. 이 시스템

덕분에 회사는 전 차량 사용을 최적화하고 배기량을 줄이고 환경 규정을 준수할 수

있었습니다. 그 결과 연간 수백 만 달러를 절감하고 "친환경" 노력에 동참했습니다.

"Informatica 9.1 덕분에

상호 작용 데이터를

비롯해 모든 데이터에

액세스하고, 어디에서나

데이터를 처리하며, 어떤

대기 시간에도 필요로 하는

애플리케이션에 데이터를

제공하고, 셀프서비스와

현업/IT 협업을 통해

생산성을 극대화할 수

있습니다. 모든 프로젝트에서

데이터 서비스를 재사용하고

데이터 사용이 일관적이고

정확한지 예방적으로

확인하여 위험을 줄일 수

있습니다. 우리의 필요에

따라 확장 가능한 유연한

구축 옵션을 활용하여

비즈니스를 미래 지향적으로

변모시킬 수 있습니다.

Informatica Data Services v9.1

은 우리처럼 더욱 민첩하게

움직이고 싶어하는 기업에게

최고의 ROI를 선사해

줍니다."

Robert Meyers

BI 아키텍처 매니저 겸

EDW 솔루션 아키텍트

HealthNow

Page 19: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

17빅 데이터(Big Data)의 폭발적 증가: 빅 데이터를 큰 비즈니스 기회로 연결시키는 Informatica 9.1 플랫폼

백서

결론빅 데이터에 관해 한 가지 분명한 사실은 앞으로 그 크기가 더 늘어날 것이라는

것입니다. 데이터의 미래 전망은 여러 영역에서 성과를 개선할 수 있는 기회로

가득 찰 것입니다. 그러나 증가하는 데이터 양, 복잡성, 다양성 및 처리 속도로

야기되는 함정을 해쳐 나가야 합니다.

빅 데이터는 현실이며, 조직이 이 메가트렌드의 정면 대결에 맞서는 데 사용할 수

있는 데이터 통합 기술 역시 여기에 있습니다. 대규모 트랜잭션 데이터를 새로운

상호 작용 데이터와 결합하고 데이터 집중적 프레임워크의 이점을 활용할 때,

조직은 빅 데이터가 창출하는 큰 기회를 현실화할 수 있고 데이터 중심 기업으로

거듭날 수 있을 것입니다.

자세한 정보인포매티카 플랫폼에 대해 자세히 알아보십시오. www.informatica.com/kr을

방문하시거나 (02) 6293-5000으로 전화하십시오.

인포매티카 정보Informatica Corporation(NASDAQ: INFA)은 데이터 통합 소프트웨어 분야에서 세계 최고의

독립 기업입니다. 전 세계 기업들은 오늘날의 세계적인 정보 경제에서 최상의

비즈니스 과제를 달성하기 위해 적절하고 신뢰할 수 있는 적시 데이터를 통해 경쟁

우위를 확보합니다. 전 세계적으로 4,350개 이상의 기업들이 인포매티카 솔루션을

사용하여 기업 내외부 및 클라우드 환경에 보유하고 있는 정보 자산을 액세스하고

통합하며 신뢰도를 향상시키고 있습니다.

Page 20: 빅 데이터(Big Data)의 폭발적 증가 - Informatica · 기타 소스 같은 소셜 미디어 데이터를 가리킵니다. 여기에는 cdr(통화 세부 내역), 장치 및

W H I T E P A P E R

한국인포매티카, 서울시 영등포구 여의도동 23-10 삼성생명 여의도 빌딩(구. SK 증권빌딩) 20층전화: 650.385.5000 팩스: 02-6293-5001 www.informatica.com/kr

© 2011 Informatica Corporation. All rights reserved. 미국에서 인쇄. Informatica, Informatica 로고 및 The Data Integration Company는 미국 및 전 세계 관할 국가 내에서 Informatica Corporation의 상표 또는 등록

상표입니다. 다른 모든 회사 및 제품 이름은 해당 소유주의 상품명 또는 등록 상표일 수 있습니다. 초판 발행: 2011년 5월 1601 (05/13/2011)