빅데이터 (big data, mega data) 또는 방대한 양의 자료는 의사 결정력, 통찰력 및 프로세스 최적화 능력을 향상시키기 위해 새로운 처리 모델이 필요한 대량, 높은 증가율 및 다양한 정보 자산을 의미합니다.
"빅 데이터" 란 다양한 형태로 많은 출처에서 수집된 방대한 데이터 그룹을 의미하며, 종종 실시간적입니다. 기업이 기업에 판매하는 경우 이러한 데이터는 소셜 네트워크, 전자 상거래 웹 사이트, 고객 방문 기록 및 기타 여러 출처에서 얻을 수 있습니다. 이 데이터는 회사 고객 관계 관리 데이터베이스의 정규 데이터 그룹이 아닙니다.
확장 데이터
빅 데이터의 주요 특징
1, 대량
빅데이터의 특징은 우선' 대' 로 드러난다. 먼저 Map3 시대부터 작은 MB 수준의 Map3 으로 많은 사람들의 요구를 충족시킬 수 있지만 시간이 지남에 따라 스토리지 단위는 과거 GB 에서 TB 로 이동한다.
현재 페타바이트급, 이타바이트급까지 말입니다. 정보기술이 급속히 발전하면서 데이터가 폭발적으로 증가하기 시작했다. 소셜 네트워크 (웨이보, 트위터, 페이스북), 모바일 네트워크, 각종 지능형 도구, 서비스 도구 등이 모두 데이터의 원천이 되었다.
2, 다양한
광범위한 데이터 소스는 큰 데이터 형식의 다양성을 결정합니다. 어떤 형태의 데이터라도 효과가 있을 수 있으며, 현재 가장 널리 사용되고 있는 것은 타오바오, 넷이즈 클라우드 뮤직, 오늘의 헤드라인 등과 같은 추천 시스템입니다. 이러한 플랫폼은 사용자의 로그 데이터를 분석하여 사용자가 좋아하는 것을 더욱 추천합니다.
로그 데이터는 구조화되어 있는 데이터이며, 그림, 오디오, 비디오 등과 같이 구조화되지 않은 데이터도 있습니다. 이러한 데이터는 인과관계가 약하므로 수동으로 표시해야 합니다.
3, 고속
빅 데이터의 생성은 매우 빠르며 주로 인터넷을 통해 전송됩니다. 생활 속의 모든 사람은 인터넷을 빼놓을 수 없다. 즉, 매일 개인이 매일 큰 데이터에 대량의 자료를 제공하고 있다는 것이다.
그리고 이러한 데이터는 적시에 처리해야 합니다. 적은 양의 자본을 들여 작은 역사적 데이터를 저장하는 것은 매우 비용 효율적이지 않기 때문입니다. 플랫폼의 경우, 보관된 데이터는 지난 며칠 또는 한 달 이내에만 있을 수 있습니다. 더 먼 데이터는 제때에 정리해야 합니다. 그렇지 않으면 비용이 너무 많이 들 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 성공명언)
4, 가치
이것은 또한 빅데이터의 핵심 특징이다. 현실 세계에서 생성되는 데이터 중 가치 있는 데이터의 비율은 매우 작다. 기존의 작은 데이터에 비해 큰 데이터의 가장 큰 가치는 관련이 없는 다양한 유형의 데이터를 통해 얻을 수 있습니다.
미래 동향 및 패턴 예측 분석에 가치 있는 데이터를 발굴하고 기계 학습 방법, 인공 지능 방법 또는 데이터 마이닝 방법 깊이 분석을 통해 새로운 규칙과 새로운 지식을 발견하고 농업 금융 의료 등 다양한 분야에 적용함으로써 결국 사회지배구조 개선, 생산성 향상, 과학 연구 추진의 효과를 얻을 수 있습니다.
바이두 백과-빅 데이터 시대