본문 바로가기
프로그래밍

빅데이터 분석기사 1-1. 빅데이터의 이해 (2)

by choihyuunmin 2021. 1. 17.

3) 빅데이터 산업의 이해

(1) 데이터 산업의 발전

1. 데이터 용량
   KB < MB < GB < TB < PB < EB < ZB < YB

 

(2) 전략적 인사이트 도출을 위한 역량

1. 데이터 사이언스의 이해와 역량
   - 데이터 사이언스는 데이터로부터 의미 있는 정보를 추출해내는 학문
   - 데이터 사이언스는 전략적 통찰을 추구하고 비즈니스 핵심 이슈에 답하고, 사업의 성과를 견인해 나갈 수 있음.

2. 데이터 사이언스의 구성 요소
   - Analytics
   - IT(Data Management)
   - 비즈니스 분석

3. 데이터 사이언티스트에게 요구되는 역량
   - 하드 스킬(Hard Skill) : 빅데이터에 대한 이론적 지식, 분석 기술에 대한 숙련  ex) 코딩 능력, 통계 지식, 기술 등
   - 소프트 스킬(Soft Skill) : 창의적 사고, 호기심, 논리적 비판, 커뮤니케이션 등

 

(3) 데이터 사이언스의 미래

1. 가치 패러다임의 변화
   
   - 디지털화 : 아날로그의 디지털화  ex) 운영프로그램, 워드/파워포인트/엑셀 과 같은 오피스 프로그램
   - 연결 : 디지털화된 정보와 대상들이 서로 연결  ex) 구글, 네이버와 같은 기업들의 알고리즘, 검색 등
   - 에이전시 : 사물인터넷의 성숙과 함께 연결이 증가하고 복잡해짐 

    -> 디지털화 > 연결 > 에이전시 로 이어지는 순서 중요

 

4) 빅데이터 조직 및 인력

(1) 데이터 분석 거버넌스 체계 수립

1. 분석 거버넌스 체계
   - 분석 거버넌스 : 분석에 있어 바람직한 행동을 지원하기 위해 의사결정 및 책임 소재를 기술한 일종의 프레임워크
                          분석을 통해 조직의 전략과 목표에 부합되게 운영하는 관리 체계

2. 분석 준비도(Readiness) 평가

  기업의 데이터 분석 도입 수준을 파악하기 위한 진단 방법. 진단 결과를 충족하지 못하면 분석 환경을 먼저 조성한다.

분석 업무 파악 분석 인력 및 조직 분석 기법
- 발생한 사실 분석 업무
- 예측 분석 업무
- 시뮬레이션 분석 업무
- 최적화 분석 업무
- 분석 업무 정기적 개선
- 분석전문가 직무 존재
- 분석전문가 교육 훈련프로그램
- 관리자 기본 분석 능력
- 전사총괄조직
- 경영진 분석 업무 이해
- 업무별 적합한 분석 기법 사용
- 분석 업무 도입 방법론
- 분석 기법 라이브러리
- 분석 기법 효과성 평가
- 분석 기법 정기적 개선
분석 데이터 분석 문화 IT 인프라
- 분석 업무를 위한 데이터
- 충분성/신뢰성/적시성
- 비구조적 데이터 관리
- 외부데이터 활용 체계
- 기준 데이터 관리
- 사실에 근거한 의사결정
- 관리자의 데이터 중시
- 회의 등에서 데이터 활용
- 경영진 직관보다 데이터 활용
- 데이터 공유 및 협업 문화
- 운영시스템 데이터 통합
- EAI, ETL 등 데이터 유통체계
- 분석 전용 서버 및 스토리지
- 빅데이터/통계/비주얼 분석환경

3. 분석 성숙도(Maturity) 평가

  분석 성숙도는 시스템 개발 업무 능력과 조직의 성숙도를 파악하기 위해 사용한다. 비즈니스, 조직·역량, IT 부문
  3부문을 대상으로 도입, 활용, 확산, 최적화 4단계로 구분해 진단한다.

출처 : [ADsP] 3과목_제 2장 분석 마스터 플랜/ Private room 네이버 블로그

4. 결과 진단

 

 

(2) 데이터 거버넌스 체계 수립

1. 데이터 거버넌스 구성요소
   데이터 거버넌스란 전사 차원의 모든 데이터에 대해 정책 및 지침, 표준화, 운영 조직 및 책임 등의 표준화된 관리
   체계를 수립하는 것을 말한다.

   데이터 거버넌스의 3대 구성요소
   - 원칙(Principle) : 데이터 유지와 관리를 위한 지침 및 가이드
   - 조직(Organization) : 데이터를 관리할 조직의 역할, 책임
   - 프로세스(Process) : 데이터 관리를 위한 활동과 체계

2. 거버넌스 체계 

   - 데이터 표준화 : 
     데이터 표준화는 데이터 표준 용어 설정, 명명 규칙(Name Rule) 수립, 메타데이터 구축, 데이터 사전 등의 업무로
     구성된다. 예를 들어 날짜 데이터를 저장할 때 데이터 형식이 2021-01-16, 16-01-2021, 2021-Jan-16 이런 식으로
     다양하게 표현하게 되면 혼란을 초래할 수 있으므로 하나의 형식으로 지정하여 축적하는 규칙을 의미한다.

 

(3) 빅데이터 조직 및 인력 관리 방안

1. 분석 조직의 유형

출처 : [ADsP] 3과목_제 2장 분석 마스터 플랜/ Private room 네이버 블로그

각 구조의 특징을 기억하자!