본문 바로가기
IT/이슈 및 정보

빅데이터의 3V, 5V를 넘어 7V까지??

by ghostzoominn 2020. 8. 27.

「 빅데이터를 설명할 때 나오는 특징 3가지(3V), 이젠 7가지(7V)라고? 」

빅데이터에 대한 정확한 의미에 대해서는 이전글에서 알아 보았습니다. (아래 링크 참조)

2020/08/21 - [IT이슈 및 정보] - [한국정보화진흥원 면접기출] 빅데이터(Bigdata), 이렇게 대답하면 오답!(실제기출포함)

 

[한국정보화진흥원 면접기출] 빅데이터(Bigdata), 이렇게 대답하면 오답!(실제기출포함)

「 빅데이터(Bigdata), 데이터가 많은게 빅데이터 아닌가요? 」  '4차산업혁명'이라는 단어가 본격적으로 등장하기 시작하면서, 빅데이터(Bigdata)라는 단어도 이미 일상용어가 되었습니다. 이미 우�

universitytomorrow.com

빅데이터의 특징을 이야기 할 때 나오는 3가지는 혹시 알고 계신가요?

 

3V라고 불리는 크기(Volume), 속도(Velocity), 다양성(Variety)입니다.

 

빅데이터를 공부하시면서 한번쯤은 들어보셨을 겁니다.

 

하지만 빅데이터의 개념이 확장되면서 이제는 5가지 특성, 더 나아가 7가지 특성을 가지고 있다는 의견도 힘을 얻고 있습니다.

 

그렇다면 3가지 특징을 넘어 새로운 특징으로 정의되는 나머지 부분에 대해서 알아보도록 합시다.

빅데이터의 특징

 

기본적인 빅데이터의 특징 3V에 대해 알아보자

기본적인 빅데이터의 특징이라 부르는 3V에는 크기(Volume), 속도(Velocity), 다양성(Variety)이 있습니다.

 

1) 크기(Volume)

빅데이터라는 이름에서도 알 수 있듯, 큰 데이터를 의미합니다.

 

과거에 관리되던 고객의 회원정보(이름, id, 전화번호 등), 창고의 물품 재고 정보(이름, 물품식별번호, 수량, 가격 등) 등의 데이터의 개념을 넘어선 비정형 데이터(SNS에 올라오는 사진, 영상 등)들이 다양한 플랫폼에서 저장되어 활용되고있습니다.

 

이처럼 빅데이터 분야에서는 사람이 입력한 텍스트 정도만 관리하던 과거와는 달라진 개념의 데이터를 처리합니다.

 

2) 속도(Velocity)

빅데이터는 데이터가 수집되는 속도에서도 이전과는 다르게 빠릅니다.

 

데이터가 수집되는 플랫폼 또한, 기계, 네트워크, SNS 등 다양화되고있으며, 이러한 데이터의 양도 크기때문에, 수집되는 속도도 빨라져야 합니다.

 

특히, 아무리 많은 양의 좋은 데이터가 있다 하더라도 수집되는 속도가 느리다면, 그 데이터는 이미 과거의 데이터가 될 것이고 쓸모가 없어지게 됩니다.

 

빠른속도로 수집되어 가공될 수 있는 RealTime 데이터가 중요합니다.

 

3) 다양성(Variety)

데이터의 종류 또한 이전과는 비교가 안 될 정도로 다양해졌습니다. 

 

과거의 정형데이터들 뿐 만 아니라 비정형데이터 또한 활용할 수 있는 데이터로 인정받으면서, 종류는 무궁무진해졌습니다.

 

정형데이터(고객의 이름, ID, 주소 등)의 한정된 데이터 종류에서, 비정형데이터(고객의 손글씨, SNS에 올라온 사진 등)의 영역까지 다루게되면서, 다양성 또한 빅데이터의 3가지 특징에 속하게 되었습니다. 

 

3V에서 추가 된 2가지 특성, 5V가 되다

빅데이터라는 단어가 처음 등장하기 시작하고, 개념이 정립되어 사용되면서 특징을 설명하는데 크기, 속도, 다양성 세가지 특성이면 충분했습니다.

 

하지만 데이터의 영역이 더욱 커지고, 다양한 기술이 빅데이터와 결합되면서, 이 세가지 특성으로는 설명하기 부족하다는 의견이 있었습니다.

 

이때 두가지 주장이 제기되었는데 한가지는 정확성(Veracity), 다른 한가지는 가치(Value)였습니다.

 

4) 진실성(Veracity)

'진실성'이라는 특성은 빅데이터를 구성하는 데이터들이 얼마나 신뢰할 수 있는지를 의미합니다.

 

많은 데이터를 수집하다보면, 원치않는 데이터를 함께 수집할 수 도 있습니다.

 

이러한 데이터들을 확인하고, 삭제하는 작업을 통해, 빅데이터를 구성하는 데이터들의 신뢰성을 확보해야만이 빅데이터가 의미를 가집니다.

 

예를들어, 개와 고양이 사진을 수집했는데, 각 사진이 기술적 결함으로 훼손되어서 개인지 고양이인지 판단하기 힘들다면, 진실성이 떨어지는 데이터가됩니다.

 

이러한 의견을 통해 '진실성' 또한 빅데이터를 설명하는 중요한 특징이라는 주장입니다.

 

5) 가치(Value)

가치를 빅데이터의 중요한 특징이라고 주장하는 의견은, 결국 이 데이터가 가치있는 정보가 되어야 그 의미가 있다는 것 입니다.

 

빅데이터를 수집하기전에 수집 한 데이터로 어떤 가치있는 정보를 만들것인지 설계하는것이 가장 먼저라는 의견입니다.

 

많은 양의 데이터를 빠르고 정확하게 수집했다하더라도, 이 데이터로 무엇을 할 것인지 설계하지 않고 수집한 데이터는 아무 가치가 없다는 것 입니다.

 

이러한 의견을 통해 빅데이터의 중요한 특성을 '가치'라고 판단했습니다.

 

두 의견 다 설명을 듣고 생각 해 보시면 빅데이터를 구성하는 중요한 특성이라는 생각이 드실겁니다.

무궁무진한 빅데이터의 활용성

5V도 많은데 7V까지....?

5개도 많은데 7개라니... 최근에는 빅데이터의 활용범위가 넓어지면서 5v를 넘어 7v로 빅데이터 특성을 정의하는 의견까지 나오게 되었습니다.

 

6) 정확성(Validity)

다양하고 큰 데이터를 빠른 속도로 수집하더라도, 그 데이터가 타당한지 정확한지 여부를 무시한다면 이는 올바르게 활용될 수 없습니다.

 

아무리 많은 데이터를 빠른 시간내에 수집했다 하더라도, 이를 가공하여 어떠한 정보를 얻어내기 위해서는 수집 된 데이터가 정확한지부터 검증하는게 필요합니다.

 

예를들어 가지와 당근의 사진 데이터를 수집하였는데, 당근사진을 보고 가지로 인식하고, 가지사진을 보고 당근으로 인식하여 데이터를 수집하고있다면, 이는 정확성이 떨어지는 데이터입니다.

 

이처럼 빅데이터의 중요한 또 한가지 특성은 '정확성'이라는 주장이 있습니다.

 

7) 휘발성(Volatility) 

'휘발성'이라는 특징은, 데이터가 얼마나 오래 저장될 수 있고 타당하며, 오랜시간 활용 할 수 있는지에 대한 특징입니다.

 

다양한 양질의 데이터를 많이 수집했다 하더라도, 그 데이터를 오래 보관 할 수 없어 삭제가 된다면 의미가 없다는 뜻입니다.

 

따라서, 데이터를 수집하고 가공하여 유용한 정보로 만드는 과정에 앞서, 설계단계에서부터 이러한 휘발성의 특징을 고려하여 판단해야한다는 의견입니다.

 

빅데이터의 특징... 어떻게 정리하면 좋을까?

빅데이터의 활용분야는 시간이 지날수록 광범위해지고 있으며, 그 특성 또한 단순한 몇가지로 정의하기 힘든 수준까지 왔습니다.

 

빅데이터를 정의하고, 특정짓는 다양한 의견이 있지만, 그 중 가장 많은 의견으로 일치되는 7가지 특성에 대해 알아보았습니다.

 

가장 중요한 3가지 특성(크기, 속도, 다양성)을 먼저 기억하시고, 다음으로 이어지는 추가의견(진실성, 가치, 정확성, 휘발성)은 어떠한 것이 있고 무엇을 의미하는지, 이러한 특징이 왜 빅데이터를 설명하는데 필요한지를 다시 한 번 생각 해 보시면 좋을 것 같습니다.

 

면접기출(2017년 하반기 기술보증기금 면접 기출)

Q1. 빅데이터를 정의하는 3가지 특성인 3V가 뭔지 설명할 수 있는지?

Q1-1. 3V를넘어 4V, 5V까지 개념이 확장되고있는데, 이에 대해 설명 할 수 있는지?

댓글