본문 바로가기
프로그래밍

빅데이터 분석기사 합격후기

by choihyuunmin 2022. 9. 20.
728x90

미루고 미루다 쓰는 빅데이터 분석기사 합격후기.

올 상반기에 있었던 4회 시험을 응시했고, 운이 좋게도 필기와 실기를 모두 한번에 합격할 수 있었다.

통계, 빅데이터 관련 지식이 전무한 상태였기 때문에 올 상반기는 빅데이터분석기사 공부에만 전념했다.

필기
실기

 

빅데이터 분석기사 취득한 이유?

사실 올해 갑자기 취득해야겠다고 느낀건 아니고 작년부터 취득할  생각이 있었다.

지금 일하는 직장이 빅데이터 관련 기업이고, 업무를  수행하고 있는 곳도 빅데이터는 아니지만 데이터 관련 부서에서 일하고 있다. 주변 사람들이 데이터 기반 행정, 마이데이터, 데이터플랫폼 등 데이터와 관련된 설명을 하는데 정작 내 귀에 들어오는건 열 마디 중 두세마디 정도였다.. 그렇게 자연스럽게 빅데이터 관련 자격증으로 관심이 생겼고, 빅데이터분석기사라는 자격증을 알게 되었다. 게다가, 정부기관이나 회사에서도 자격증 취득을 하면 조금 평가를 후하게(?) 해주는 것 같은 눈치였다.

작년에 응시원서 접수를 하긴 했지만 사정이 생겨 응시하지 못했고, 올해 다시 절치부심하여 응시하게 되었다.

 

공부방법

필기시험이 4월에 있었기 때문에 넉넉하게 2월부터 제대로 준비했다. 본래 외우고 들어가서 시험치는 건 자신 있었기 때문에 두 달정도 기간을 잡았는데, 처음에는 후회했다. 관련 지식이 없는 상태에서 준비했기 때문에 기본적인 단어나, 용어 정도는 숙지하는 시간을 가졌더라면 하는 생각이 들었다.

1) 필기

필기 공부는 예문사에서 출간된 빅데이터분석기사 한권완성이라는 교재를 사용했다.

많고 많은 교재들 중에서 원하는 조건이 딱 하나 있었는데, 바로 문제수였다. 자격증 공부를 많이 해봤지만 가장 효과적인 공부 방법은 문제를 푸는거라고 생각하고 있었다. 교재들을 비교해 봤을 때, 예문사에서 출간한 해당 교재가 가장 문제가 많아보여 구매하게 되었다.

공부는 문제 풀이를 무한 반복했다. 문제를 계속 반복해서 풀다보면, 반복해서 나오는 유형이 있는데 그 유형을 파악하는데 주력했다.

예를 들어, 시공간 데이터는 어떤 게 해당되는지, 귀무가설과 대립가설에 대한 설명이 보기에 자주 출몰한다던지 이런 패턴을 알게 되면 문제 푸는 데 도움이 많이 된다.

정답을 반복해서 문제를 풀어보고, 한번 틀렸던 문제는 다시 틀리지 않는게 팁이다.

 

2) 실기 - 파이썬

실기는 정말 추천해주고 싶은 사이트가 있다.

https://www.datamanim.com/intro.html

 

DataManim — DataManim

Toggle in-page Table of Contents

www.datamanim.com

바로 데이터마님이라는 사이트인데, 정말 많은 도움을 받았다. 여기 서비스 운영하시는 분이 혹시나 이글을 보시게 된다면 정말 큰 감사를 드리고 싶다.

실기는 총 세과목으로 나누어지는데,

단답형 / 제1유형 / 제2유형으로 나누어진다.

단답형은 말 그대로 주관식 형태로 10문제가 출제된다. 단답형 공부도 마찬가지로 예문사에서 출간된 교재를 이용했다.

필기 교재와는 다르게 문제가 많다고 느낄 순 없었지만, 필기를 해당 교재로 합격했기 때문에 실기도 그대로 구매했다. 단답형도 역시 반복적으로 문제를 푸는 방식으로 공부했다. 다행인 점이 있다면, 필기 문제처럼 딥한 문제는 나오지 않는다. 간단한 개념을 묻는 정도이고, 중간중간 계산 문제가 섞여 있는데, 많은 계산을 요하는 문제가 아닌 간단한 계산문제이니 걱정할 필요 없다.

제1유형은 파이썬 기준으로 데이터 전처리 작업이 주어진다. 데이터를 집계하고, 축소하고, 계산하여 원하는 결과를 표현해야하는데, 위에 언급했던 데이터마님이라는 사이트에서 많은 도움을 받았다.

https://www.datamanim.com/dataset/03_dataq/typeone.html

 

작업 1유형 — DataManim

Toggle in-page Table of Contents

www.datamanim.com

작업1유형의 문제를 주피터노트북 환경에서 하나씩 실행시켜보며 숨김 처리되어있는 답과 비교하며 풀었다. 여기 사이트가 참 좋은 게 groupby, isin 등 판다스의 다양한 함수를 이용해서 해답을 적어놓아 한 상황에 대해 여려가지 함수를 적용해보며 문제를 풀 수 있었다.

제2유형은 전처리뿐만 아니라 데이터분석의 예측, 분류 알고리즘을 이용하여 결과를 내는 유형이다.

전처리부터 분석까지 모두 진행해야 하기 때문에 하나만 잘해서는 높은 점수를 받을 수 없다. 특히 제2유형이 40점이라는 높은 점수를 차지하기 때문에 여기서 삐끗해버리면 탈락하게 된다.

제2유형 공부도 역시 위의 데이터마님에서 공부했다. 데이터마님에서 제공하는 데이터를 통해 1유형에서 학습한 전처리 함수를 이용했고, 분류, 예측 알고리즘을 한두개 정도 외워서 분석했다.

https://www.kaggle.com/datasets/agileteam/bigdatacertificationkr

데이터마님과 위 캐글 사이틀의 다른 분들의 코드를 참고하면서 공부했다.

사용한 알고리즘은 사이킷런의 LabelEncoder, OneHotEncoder를 이용하여 전처리(데이터 라벨링)를 수행했고,

분류나 예측 역시 사이킷런의 GradientBoostingClassifier, RandomForestRegressor을 사용했다.

예측은 잘 출제되지 않을 것으로 예상되어 분류 위주의 공부를 했다.

 

결론

필기, 실기 각각 약 두달 정도 잡고 공부했다.

결론은 필기는 문제를 반복해서 푸는 방법, 실기 역시 다른 홈페이지를 도움 받아 올라와 있는 문제를 반복적으로 풀었다. 자격증 공부는 어떤 자격증이든 간에 반복이 답인 것 같다 .. 

필기는 각자의 역량에 따라 달라진다고 느끼는데 실기는 정말 위에 언급한 홈페이지에서 며칠만 집중해서 반복적으로 풀다 보면 누구든 합격할 수 있을 것이라고 생각한다.

시험 응시료가 절대 저렴한 편이 아니기 때문에.. 응시하는 모두들 한번에 합격했으면 좋겠다.