빅데이터는 통상적으로 사용되는 데이터 수집 및 관리, 처리와 관련된 소프트웨어의 수용 한계를 넘어서는 크기의 데이터를 뜻함.
빅데이터의 규모는 단일 데이터 집합의 크기가 수십 테라바이트에서 수 페타바이트에 이르며, 그 크기가 끊임없이 변화하는 것이 특징임.
일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터.
대용량 데이터를 활용, 분석해서 가치 있는 정보를 추출하고, 생성된 지식을 바탕으로 능동적으로 대응하거나 변화를 예측하기 위한 정보화 기술.
단순한 데이터의 크기가 아니라 데이터의 형식과 처리 속도 등을 함께 아우르는 개념으로, 기존 방법으로는 데이터의 수집, 저장, 검색, 분석 등이 어려운 데이터를 총칭해서 일걷는 용어.
빅데이터의 정의 6V:
1. 크기/Volume : 방대한 양의 데이터
2. 다양성/Varity : 정형 + 비정형
3. 진실성/Veracity : 주요 의사결정을 위해 데이터의 품질과 신뢰성 확보
4. 시각화/Visualization : 복잡한 대규모 데이터를 시각적으로 표현
5. 가치/Value : 비즈니스 효익을 실현하기 위해 궁극적인 가치를 창출
6. 속도/Velocity : 실시간으로 생산되며, 빠른 속도로 데이터를 처리/ 분석