데이터 분석 사례로 알아보는 시계열 분석
1. 시계열 분석이란?
시계열이란 시간의 흐름에 따라 기록된 자료(data)를 분석하고, 여러 변수들간의 인과과계를 분석하는 방법론입니다.
따라서 '시계열 분석'이란 시간변수의 흐름에 따라 종속변수의 움직임을 이해하고 예측하는것을 목표로 하는 분석입니다.
2. 데이터 분석 프로세스
데이터를 분석하는 목적은 다양하지만, 대부분 과거로부터 현재까지의 수집된 데이터를 통해 미래를 예측하기 위함이 많습니다.
즉, 데이터 분석은 어떠한 현상이나 트렌드가 어떤 데이터와 관련있는지 파악하고, 이를통해 미래를 예측해 볼 수 있는 시작점입니다.
빅데이터 분석 프로세스는 크게
"빅데이터 분석기획 - 빅데이터 탐색 - 빅데이터 모델링 - 빅데이터 결과 해석"으로 이어집니다.
조금 더 세분화 해 설명 드리면,
"문제정의 - 데이터 획득 - 데이터 정리 - 데이터 정규화 - 데이터 변형 - 통계를 위한 탐구 - 데이터 시각화 - 예측 모델 생성 - 예측 모델 검증 - 결과 시각화 및 해석 - 솔루션 보고 및 배포"
순서로 진행됩니다.
이중 '데이터 시각화(Big Data Visualization)'는 데이터 분석 결과를 쉽게 이해할 수 있도록 시각화하여 사용자에게 전달하는것을 의미합니다.
이러한 시각화 방법에는 시간 시각화, 분포 시각화, 관계 시각화, 비교 시각화, 공간 시각화가 있습니다.
데이터 분석 프로세스 중 가장 익숙하고 직관적으로 확인할 수 있는 과정인 데이터 시각화에 대해 분석 사례를 바탕으로 조금 더 자세히 알아보도록 하겠습니다.
3. 데이터 시각화 분석 사례
1) 나플레옹의 진군 맵
1812년 나플레옹의 군대는 모스크바를 점령하기위해 47만명의 병사를 이끌고 진군 하였으나 겨우 1만명만이 돌아왔습니다.
이러한 나플레옹의 진군을 한장의 시각화(시계열) 그래프로 보여주는 그림이 있습니다.
선의 넓이가 나플레옹의 군대인원을 나타내며, 황색은 모스크바로의 출정, 검은색은 복귀를 나타냅니다.
아래의 온도 그래프는 급속히 떨어지는 그 당시의 맹추위를 직관적으로 보여줍니다.
이러한 시계열 데이터 분석을 통해 작성된 시각화 그래프 한장으로 시간이 지남에 따라 나플레옹의 모스크바 진군에 대한 설명할 수 있습니다.
2) 요일 별 콜택시 이용자 수
요일 별로 각 지역의 콜택시 이용자 수를 직관적인 시계열 그래프로 나타낸 재미있는 연구결과도 있습니다.
이러한 시계열 데이터 그래프를 통해 가장 콜택시를 적게 부르는 날은 일요일, 주말으로 갈 수록 콜택시 이용인원이 증가하는 경향을 보이는 것을 확인할 수 있습니다.
이처럼 각 개별적으로 존재하는 데이터들은 의미가 없지만, 이를 특정한 목적을 위해 수집·가공하고, 이를 사람들이 보기 편한 그래프로 나타낸다면, 유용한 정보가 될 수 있습니다.
이러한 시각화 그래프 중, 시간이 지남에 따라 유의미한 변화를 보이는 시각화 그래프는 보는 사람으로 하여금 직관적인 이해를 심어줄 수 있는 유용한 도구입니다.
이러한 모든 기술들이 현재 빅데이터의 발전을 통해 분야에 상관없이 다양하게 쓰이고있습니다.
과거에서 현재까지 수집된 데이터들을 바탕으로, 현재까지의 추세를 확인할 수 있으며, 이러한 데이터들을 머신러닝에 적용한 시계열 데이터 머신러닝을 기반으로 미래의 상황까지 예측가능한 부분입니다.
개별적으로는 의미없는 단순한 데이터들이 모여 과거부터 현재까지 일어난 일들을 한 장의 그래프로 표현하고, 더 나아가 미래를 예측할 수 있는 유의미한 결과를 가져오는 데이터 분석분야는, 앞으로 사회 전반에 걸친 많은 변화를 가져올 것으로 예상됩니다.
이번 포스팅을 통해 데이터분석(시계열 데이터)에 관한 흥미있는 예제로 여러분이 쉽게 이해할 수 있었스면 좋겠습니다.
'IT > 이슈 및 정보' 카테고리의 다른 글
삼성QLED vs 엘지OLED 차이점 및 장단점 완벽 분석! (5) | 2021.01.31 |
---|---|
빅테크(big tech) 기업의 폭발적 성장과 향후전망 (0) | 2020.11.29 |
MVC 패턴, 직무면접 전 반드시 알고가자! (0) | 2020.09.23 |
혁신의 실험장 규제 샌드박스, 대표 사례로 이해하기 (0) | 2020.09.22 |
빅데이터 관점의 비식별 조치에 대하여 (2) | 2020.09.15 |
댓글