Big data

빅데이터의 개념과 특징(3V, 5V, 7V)

전산왕 2020. 11. 12. 22:12

Big Data란? 

  • 기존 DB 관리 도구의 한계를 넘어서는 대량의 용량(보통 수십 TB 이상)의 정형 또는 비정형 데이터의 집합으로부터 유용한 가치를 추출하고 그 결과를 분석하는 기술을 의미한다. 

Big Data의 특징 

 

Big Data는 3V, 5V, 7V라고 정의하기도 하며 이는 문헌에 따라 다르기도 하다.

 

통상적으로

  • 3V는 Volume(크기), Variety(다양성), Velocity(속도)
  • 5V는 Volume(크기), Variety(다양성), Velocity(속도), Veracity(정확성), Value(가치)
  • 7VVolume(크기), Variety(다양성), Velocity(속도), Veracity(정확성), Value(가치), Validity(유효성), Volatility(휘발성)

 

각 속성의 의미 

 

  • Volume(크기) : 디지털 데이터의 증가, 그 크기가 수 페타바이트 까지 증가를 의미
  • Variety(다양성) : 데이터 종류와 유형이 다양해짐을 의미(비정형데이터, log, iot data, 위치 데이터, 등등)
  • Velocity(속도) : 실시간성 정보의 증가에 따라 데이터의 속도가 중요해짐, 빠른 데이터의 처리와 분석 속도 필요.
  • Veracity(진실성) : 해당 데이터를 신뢰할 수 있는가, 정말로 유용한 정보인가에 대한 의미.
  • Value(가치) : 수많은 데이터 내에서 의미있는 정보, 즉 가치 있는 정보에 대한 의미.
  • Validity(정확성) : 어떠한 결정에 있어 해당 데이터가 타당하며 합리적이고 정확한 데이터인가에 대한 의미. 
  • Volatility(휘발성) : 데이터가 얼마나 오래 저장될 것인가, 그 가치는 얼마나 지속되는가에 대한 의미.