Data-driven marketing, Data-driven decision making, 데이터 중심적 사고 등 데이터를 중심으로 사고하는 것에 대한 중요성이  Business World를 중심으로 급격히 성장하고 있다. 따라서 다양한 분야에서 스스로가 데이터 중심의 사고를 하고 있는지 점검하고, 이를 강화하는 방법이 있는지에 대해 궁금해 하는 사람들이 많을 것이다. 이번 포스팅에서 소개하는 글은 Data-driven의 특성을 정의하고, 사례와 인용을 통해 각각의 특성들이 실제 비즈니스에서 어떻게 응용 되는지 소개하고 있다. (원문)

당신은 데이터 중심적(data driven)인가? 

데이터 중심적 (data driven) 이라는 용어는 오늘날 가장 부각되는 어휘이다. Data Driven은 필자의 최근 저서의 이름이기도 하며, 최근의 학술 연구들은 스스로를 “data driven” 이라고 언급하는 회사들이 그렇지 않은 회사들에 비해 수익성이 좋다는 것을 보여주고 있다. 따라서 데이터 중심적으로 변화하는 것은 노력할 만한 가치가 있는 일이다.

지금까지의 노력에도 불구하고, 필자도 아직 리더가 자신의 조직이 더 잘하기 위해 필요한 것을 발견할 수 있는 벤치마크나 기준을 찾지 못했다.

개인적으로 “data-driven”의 핵심은 조직의 차트를 오르고 내리게 만드는 의사결정을 더욱 잘하게 만드는 데 있다고 본다. 몇 년전, 운 좋게도 많은 의사 결정자 및 의사 결정 그룹과 일할 기회가 있었다. 그들 중 몇몇은 훌륭한반면, 몇몇은 끔찍했지만, 그 일을 하면서, “data-driven의 12가지 특성”을 도출할 수 있었다.


 

데이터 중심적 (Data-Driven) 사고를 하는 사람들의 특성

  • 가능한 가장 낮은 단계에서 의사 결정을 수행
  • 가능한한 여러 상황의 다양한 데이터를 수집
  • 깊이 이해할 수 있도록 데이터를 발전
  • 변화에 대한 인지의 발전
  • 불확실성에 대한 합리적 처리
  • 데이터와 그 영향을 이해하는 능력과 직관의 통합
  • High-quality 데이터와 이를 개선하기 위한 투자의 중요성에 대한 인식
  • 훌륭한 실험자 및 연구자의 자질
  • 의사 결정의 기준이 상황에 따라 변할 수 있다는 점에 대한 인식
  • 의사 결정은 단지 첫 단추에 불과하다는 점의 인식
  • 새로운 스킬, 새로운 데이터, 새로운 기술 (빅데이터, 예측 모델, 메타데이터 관리 등)을 조직 내 주입하기 위한 노력
  • 실수로 부터의 배움

 

이 모든 특성들은 중요하다. 대부분은 그 이유가 자명하지만, 몇몇은 추가적인 설명이 필요하다. 첫번째는 데이터 중심의 회사가 가장 낮은 단계에서 의사 결정을 해야한다는 것이다. 필자와 대화를 나눈 한 임원은 이에 대해 다음과 같이 설명했다. “내 목표는 일년에 6개의 결정만 하는 것 입니다. 이는 내가 가장 중요한 6개를 골라내야 한다는 것이고, 나에게 보고하는 사람은 반드시 데이터와 이에 대한 확신을 갖고 있어야 하며, 그들은 나머지에 대한 의사 결정을 해야 합니다.” 조직 하부에서 의사 결정하는 것을 유도하면 고위직은 가장 중요한 의사 결정을 하는데 필요한 시간을 확보할 수 있다. 또 중요한 것은 하급 직원들에게 의사 결정 권한이 떨어지면, 그들이 이를 위해 더 많은 시간과 관심을 쏟는다는 점이다. 이는 조직적 역량을 올바르게 강화시키고, 업무 환경을 보다 즐겁게 만든다.

두번째, 데이터 중심적 사고를 하는 사람들은 변화에 대한 타고난 감각을 갖고 있다. 가장 단순한 프로세스, 사람들의 응답, 또는 가장 통제 되는 상황조차도 달라진다. 그들은 관리도를 이용하지 않지만, 무슨 일이 일어나고 있는지 이해하려면 변화를 이해해야 한다는 점을 알고 있다. 한 중간급 관리자는 이를 다음과 같이 설명했다. “제가 첫 관리 업무를 맡았을때, 저는 결과물을 놓고 매주 고뇌했습니다. 몇주는 약간 올랐지만, 나머지는 다 하락 했습니다. 저는 상승에 대한 공을 차지하고자 노력했고, 침체가 되면 또 괴로워했습니다. 제 상사는 저에게 이를 그만두라고 했습니다. 확실히 상황은 악화 되었습니다. 모든 것들은 요동친다는 것을 배우는 데는 오랜 시간이 걸렸습니다.”

세번째, 데이터 중심적 사람들은 데이터와 데이터 소스에 대한 높은 수요가 있을 때에 존재한다. 그들은 그들이 내린 결정이 기반이 된 데이터보다 낫지 않다는 것을 안다. 따라서 데이터의 품질과 믿을 만한 데이터 소스를 만드는데 투자한다. (참고) 그 결과, 시간에 민감한 이슈가 발생했을 때를 대비한 준비가 되어 있다. 고품질의 데이터는 다양성을 이해하는 것과 불확실성을 감소시키는 것을 쉽게 해준다. 성공은 실행에 의해 측정 되고 고품질 데이터를 통해 직원들이 의사 결정자의 논리를 이해하고 쉽게 따르게 만든다.

더 나아가, 한 번의 실행은 더 많은 데이터를 얻게 한다. 따라서 데이터 중심적 사람들은 지속적으로 그들의 결정을 재평가하고, 정제한다. 특히 이들은 의사 결정이 틀렸다는 증거가 제시 될 때, 다른 사람들보다 빠르게 대응한다. 이는 데이터 중심적 사람들이 급회전을 한다는 것을 의미하진 않는다. 그들은 결정이 지속 가능하지 않다는 것을 안다.

 

 

이제 거울을 들여다보자. 상단의 리스트를 들여다보고 각각의 특성에 대해 점수를 매겨보자. 정기적으로 잘 따르는 항목은 1점, 전부는 아니지만 대부분 따르는 항목은 0.5점. 한 두번 한 것이라면 점수를 주면 안된다.

만약 당신이 7점 미만이라면, 더 올려야 할 필요가 있다. 각각의 사람이나 조직은 서로 다르기 떄문에 의사 결정을 조직의 하부로 보내는 것부터 시작하기를 추천한다. 이에 따른 이익은 이미 언급하였다. 모든 것을 제어하고 싶어하는 매니저들에겐 아마 매우 힘들고 반직관적일 것이다. 하지만 충분히 시도할 가치가 있다.

둘째로 고품질의 데이터에 투자해라. (참고) 실로 당신의 데이터와 그 출처에 대한 높은 신뢰가 없다면 데이터 중심의 사고를 할 수 없다. 당신의 직관을 반으로 감소시키는 것을 목표로 해라.

마지막 한단계는 스스로를 들여다보는 것이다. 당신의 조직을 위해 똑같은 일을 하는 팀을 참여 시켜라.

<Harvard Business Review>

출처 : http://eunwoopark.com/wp/category/bigdata/ : 사라짐.

'데이터 사이언트' 카테고리의 다른 글

R - 데이터 고급 분석과 통계 프로그래밍  (0) 2016.05.10

R - 데이터 고급 분석과 통계 프로그래밍을 위한

1. 'R' ?

오픈소스 '통계분석' 언어. 정확한 프로젝트 명칭은 'GNU S' 

산더미 같은 데이터 중에서 추정계수(?), 표준오차(?), 잔차(?) 등과 같은 통계적 분석을 거쳐서 좀 더 의미있는 데이터에 접근하기 위해 사용한대..

AT&T 에서 개발한 통계언어 S 에서 영향을 받았음. 

'S' 는 아마 Statistics 에서 따왔을 것이고 R 은 알파벳 순으로 S 보다 앞에 있어서..(?)

'S-plus' 라고 있는데, 이건 'S' 에 GUI가 추가된 상용판 언어로 전문 통계학자들 사이에서는 사실상 표준

많은 '통계적 지식'을 필요로 함 (허들이 제법 높다.)

프로젝트 홈페이지

빅데이터 시대에 데이터 접근에 대한 표준역할은 나(R)에게 맡기고, 이후의 데이터 처리는 당신들이 지금껏 써왔던 언어를 쓰시라....는게 컨셉인 언어

 

2. 'R' 특징

상용 분석 도구인 SAS 나 SPSS 보다 패키지 업데이트가 빠르고, 다양한 데이터 소스와의 연결이 장점.

각 세션사이마다 시스템에 데이터 세트를 저장하므로 데이터를 매번 다시 로딩할 필요가 없다.

'병렬 컴퓨팅'과 궁합이 잘 맞는듯.

 

3. 'R' 맛만 한번 보기

설치

CRAN(the Comprehensive R Archive Network) 에 접속. OS에 맞는 링크 클릭해서 안내를 따를것.  

나는 'Download R for Window' -> base (기본 배포 바이너리) -> R-3.2.2 for Windows (32/64 bit) -> R-3.2.2-win.exe 를 다운로드

 R-3.2.2-win.exe 실행. x64 모드로 설치

실행

바탕화면 숏컷 "R x64 3.2.2" 실행

R Console 이 표시되면 프롬프트에서 명령어를 입력

demo()

+ Recent posts