본문 바로가기
IT/이슈 및 정보

빅데이터(Bigdata), 이렇게 대답하면 오답!(실제기출포함)

by ghostzoominn 2020. 8. 21.

「 빅데이터(Bigdata), 데이터가 많은게 빅데이터 아닌가요? 」

 '4차산업혁명'이라는 단어가 본격적으로 등장하기 시작하면서, 빅데이터(Bigdata)라는 단어도 이미 일상용어가 되었습니다.

 

이미 우리에게 익숙해진 빅데이터(Bigdata)라는 단어, 혹시 정확히 어떤 의미인지 알고 계신가요?

 

혹여나 면접에서 빅데이터(Bigdata)에 대해서 설명해보라는 질문을 받았을때, 기존의 데이터보다 많은 양의 데이터로 어쩌고 저쩌고... 틀린말은 아니지만 정답은 결코 아닙니다.

 

지금부터 빅데이터에 대해 쉽고 간단하게, 하지만 정확하게 알아보도록 하겠습니다.

 

(한국정보화진흥원 면접 기출 문제도 포함되어있습니다)

빅데이터? 많은데이터 아닌가요?

1.「 빅데이터(Bigdata)란?

빅데이터란 기존 데이터베이스의 관리 능력을 넘어서는 '대량의 데이터'를 뜻합니다. 

 

여기서 '대량의 데이터'라는 단어에 주목해야 합니다.

 

이 대량의 데이터에는 정형데이터와 비정형데이터가 함께 포함 된 단어입니다.

 

보통은 이를 구분하지  않고, 정형데이터만을 생각하고 빅데이터라는 개념을 이해하기 쉽지만, 4차산업혁명에서 중심이 되는 데이터는 오히려 비정형데이터입니다.

 

빅데이터를 이루는 데이터 중 90%는 비정형데이터입니다.

 

따라서 정형데이터와 비정형데이터에 대한 이해가 필요합니다.

 

2. 정형데이터 vs 비정형데이터

정형데이터는 흔히 생각하는 데이터의 개념입니다.

 

정해진 규칙에 맞게 데이터를 입력하고 의미 파악이 쉬운 데이터들입니다.

 

예를 들면, 티스토리 회원가입시 필요한 아이디, 비밀번호, 메일주소 등이 모두 정형데이터 입니다. 

 

그렇다면 비정형데이터는 무엇일까요?

 

비정형데이터는 정형데이터와 반대로 정해진 규칙이 없고, 형태도 없으며, 값을 봤을 때 의미를 쉽게 파악하기 힘든 데이터들입니다. 

 

예를들면 페이스북에 올라온 영상, 이미지, 음성 등입니다.

 

이러한 데이터들은 우리 눈과 귀로는 어떠한 정보인지 파악을 할 수 있지만 이를 데이터화 해서 연산을 하는것은 불가능합니다.

 

하지만 이러한 비정형데이터들을 분석하여 정보로 만들어 활용하는것이 빅데이터 분야입니다.

 

하루에도 수십만개씩 올라오는 페이스북, 트위터, 유튜브 등의 이미지, 동영상 등을 데이터의 관점에서 분석하는 것 입니다.

 

이처럼 정형데이터와 비정형데이터의 차이는 예시를 통해 이해하시는게 가장 쉽고 빠르게 이해할 수 있습니다.

 

그렇다면 혹시 이 두가지 말고 다른 데이터가 존재할까요?

 

반정형데이터... 정형도 아니고 비정형도 아닌 데이터?

 

사실 IT나 전산 관련 직무 면접이 아니라면 반정형데이터까지 질문할 경우는 거의 없을 것 같습니다.

 

데이터를 분류하다보니 필요에 의해 생긴 명칭이지만 '반정형데이터' 라는 단어를 현업에서는 거의 쓰지않습니다.

 

하지만 이또한 이해하고 알아두면 좋은 지식입니다.

 

반정형 데이터는 정형도아니고 비정형도 아닌, 중간에 위치한 데이터라는 뜻이 아닙니다.

 

완전한 정형이 아니라 약한(Semi) 정형 데이터라는 뜻입니다.

 

예를들어 HTML이나 XML과 같은 포멧을 반정형 데이터라고 부릅니다.

 

일반적으로 정형데이터를 저장하는 데이터베이스에는 스키마와 데이터값이 분리가 되어있지만 HTML과 XML같은 포멧에는 그러한 내용이 함께 포함되어 있습니다.( 한 텍스트 파일안에 Columl과 Value를 모두 출력합니다.)

 

이러한 데이터들을 반정형 데이터라고 부릅니다.

 

3. 빅데이터, 딱 이것만 기억하자!

면접을 준비하시면서 빅데이터에 대한 지식은 이것으로 정리하시면 됩니다.

 

빅데이터(bigdata)는 기존의 정형데이터 뿐 만 아니라, 비정형데이터까지 포함하는 뜻의 단어이다.

 

빅데이터라고 불리는 데이터 집합의 90%는 비정형데이터이다.

 

오히려 4차산업혁명에서 주목받고 활용되고있는 데이터는 비정형데이터이다.

빅데이터에 대한 이해

4. 면접 기출(2019년 상반기 한국정보화진흥원)

Q1. 빅데이터의 개념에 대해 설명해 보세요

Q1-1. 빅데이터를 본회사에 활용한다면, 어떠한 사업에 어떻게 활용 할 수 있을까요?

댓글