빅데이터 분석기사 1-1. 빅데이터의 이해 (3)
02_ 빅데이터 기술 및 제도
1) 데이터 기초
(1) 빅데이터 플랫폼의 이해
1. 빅데이터 플랫폼의 개요
빅데이터 플랫폼 = 빅데이터 관리 플랫폼 + 빅데이터 분석 플랫폼
2. 빅데이터 플랫폼 개발 기업 현황|
: 많은 기업이 분산형 병렬처리 및 리얼타임 데이터 처리를 위한 하둡 기반의 솔루션을 사용하고 있음
(2) 빅데이터 에코시스템(Ecosystem)
1. 에코시스템
: 빅데이터를 수집, 정제, 처리, 적재 등 많은 단계를 거치는 동안 사용하는 기술 및 프레임워크, 솔루션 등을 통틀어 에코시스템이라고 함.
2. 하둡 에코시스템
: 거대한 프로젝트의 집합체. 많은 기업이 채용하고 있음.
2) 빅데이터와 인공지능
(1) 인공지능의 이해
1. 빅데이터와 인공지능의 관계
: 인공지능(Artificial Intelligence)은 4차 산업 혁명 시대의 핵심.
빅데이터 분석 기술은 대용량의 데이터 분석을 단시간에 처리할 수 있게 하였으며 덕분에 머신러닝과 딥러닝 분야의
발전이 두드러지게 나타났다.
2. 머신러닝과 딥러닝의 차이
: 머신러닝과 딥러닝은 넓게 보면 하나의 뿌리를 가짐.
머신러닝은 데이터를 바탕으로 결정을 내리기 위해 학습한 내용을 적용하는 알고리즘
딥러닝은 머신러닝에 포함된 개념이지만 예측의 정확성 여부를 기계가 스스로 판단하고 결정을 내림
(2) 4차 산업 시대를 선도하는 빅데이터와 인공지능
1. 빅데이터 & 인공지능 산업
: 2022년까지 5년간 연평균 11.1%의 성장세를 유지하며 확대될 전망
2. 인공지능의 활용
: 자율주행, 스마트 홈, 인프라, 스마트 농업, 커머스 등..
3) 개인정보 활용 '마이데이터'
(1) 마이데이터(MyData)의 이해
1. '마이데이터' 운동의 확산
>> 4차 산업혁명 시대 이후로 가장 큰 화두는 데이터의 자산 가치
2015년 벨기에 브뤼셀에서 시작된 이 운동은 유럽을 거쳐 전 세계로 확산됨.
2. EU의 GDPR에 도입된 마이데이터
(2) 우리나라의 마이데이터
1. 첫걸음을 뗸 마이데이터
: 우리나라 정부에서도 적극적으로 마이데이터를 도입하려는 움직임이 보이기 시작했다.
개인정보보호 권리는 강화하면서도 빅데이터 관련 산업에 유연하게 대응할 수 있게 다양한 방안과 법령 등 준비.
2020년 1월 이른바 '데이터 3법'이라 불리는 개인정보보호법, 정보통신망법, 신용정보법이 개정되었다.
데이터3법 개정안 쉽게 알아보기 | 로톡
데이터 3 법이 국회 본회의를 통과했다는 소식으로 떠들썩합니다.이에 대해 많은 분들이 '데이터 3 법이 뭐야?', '이게 나랑 무슨 상관이 있어?'라고 생각하실 거예요.하지만, 이는 개인정보자
www.lawtalk.co.kr
2. 현재진행형인 '본인신용정보관리법'
본인신용정보관리법의 효과 -> 개인은흩어져 있는 자신의 개인정보를 통합해 맞춤형 금융 서비스를 받을 수 있음.
기업은 신규 비즈니스 모델을 창출할 수 있는 절호의 찬스.
업권 | 정보활용 | 주요서비스 |
은행 | 계좌 거래 내역, 대출 잔액, 금리와 이자 등의 다양한 금융자산 현황 등 분석 | 저축, 재테크 방안 안내 등을 통한 자산 형성 지원 |
카드 | 카드 사용 일시, 결제 내역, 카드 대출 이용 등의 소비 패턴 분석 | 다양한 카드 사용 혜택 제공 및 합리적인 소비 습관 개선 지원 |
금융투자 | 투자종목, 투자금액, 자산규모 등의 투자 정보를 통해 투자패턴 분석 | 세제 혜택, 투자 습관 개선 등 포트폴리오 제공 |
보험 | 여러 금융업권의 금융 상품 및 정보를 종합적으로 비교, 분석 | 맞춤형 금융상품 추천 및 정보 주체의 정보 권리 행사 대행 |
IT | 금융과 통신, 유통 등의 데이터와 융합,복합 | 통신정보 기반 금융상품, 유통 정보 기반 금융상품 |
3. 한국데이터산업진흥원의 '본인정보활용지원 사업'
4. 마이데이터 핵심 정리
- 마이데이터 개념 : 자기정보결정권 확보와 데이터 경제 활성화
자기정보결정권 : 개인을 중심으로 개인데이터를 구성, 자신의 데이터 활용에 적극적으로 참여
데이터 경제 활성화 : 새로운 서비스 모델이 등장할 수 있는 시장 조성 - 마이데이터 원칙 : 개인데이터 통제, 제공, 활용을 개인을 중심으로 진행
- 개인의 동의
종전 '동의' 제도 | 마이데이터 '동의' 제도 | |
특징 | 동의서별 일괄 획득 | 동의 대상 세분화 |
동의 수준 | 필수/선택 구분 | 선택 동의서의 세부사항에 대한 의사표현 O |
동의 대상 | 동의서 단위로 의사 표현 | 동의서 내에서도 목적, 기관, 항목 따라 선택 가능 |
동의서 유형 | 개인데이터 수집 및 활용 방식에 따라 | 필요 시 목적별, 제공기관별 동의서로 분리 가능 |
- 열람권 : 기관이 보유하고 있는 개인데이터와 처리 정보에 대한 열람 및 사본을 요청할 수 있는 권리
- 마이데이터 서비스의 특징 : 투명성, 신뢰성, 통제권, 가치 관점의 특징
- 마이데이터 기본 서비스 모델
데이터3법, 마이데이터 그리고 DID
마이데이터를 구현하기 위한 도구로 DID 바라보기
yusulism.medium.com
4) 개인정보보호 법·제도
(1) 2020년 개정 개인정보보호법
1. 개인정보의 이해
> 프라이버시 개념의 변화 :
산업사회의 '프라이버시' : 남에게 방해받지 않을 소극적 권리 "free from physical infringement"
정보사회의 '프라이버시' : 내 정보가 침해로부터 자유로울 권리 "free from imformation infringement"
4차 산업사회의 '프라이버시' : 내 정보의 가치를 보호받을 권리 "protection of the value of information"
2. 개인정보보호법
(2) 개인정보 비식별화
1. 개인정보 비식별화
데이터 내에 개인을 식별할 수 있는 정보가 있느 경우, 이의 일부 또는 전부를 삭제, 또는 일부를 속성 정보로 대체 처리함으로써 다른 정보와 결합하여도 특정 개인을 식별하기 어렵게 하는 조치.
2. 개인정보 비식별화 기술 및 절차
처리 기법 | 예시 |
가명처리(Pseudonymizaion) | 김민수, 27세, 서울 영등포 거주, 서울대 재학 > 홍길동, 20대, 서울 거주, A대 재학 |
총계처리(Aggregation) | 수학점수 김민수 100점, 박지현 78점, 이수영 59점 > 수학점수 합계:237점 평균:79점 |
데이터 삭제(Data Reduction) | 주민등록번호 951223-1242512 > 90년대생, 남자 |
데이터 범주화(Data Suppression) | 김민수, 27세 > 김씨 20대 |
데이터 마스킹(Data Masking) | 김민수, 27세, 서울 영등포 거주, 서울대 재학 > 김○○, 27세, 서울 거주, ○○대 재학 |