클래스: 데이터 과학 학습: 기본 이해

무료이용으로 수강해 보세요.

업계 전문가가 강의하는 클래스 23,200개를 수강하세요.

주요 데이터 문제 대응

주요 데이터 문제 대응

빅 데이터와 데이터 과학은 서로 얽혀 있습니다. 많은 조직에서 그것들을 하나의 것으로 봅니다. 데이터 과학이 데이터에 과학적 방법을 사용한다는 점을 기억하십시오. 데이터가 많이 있어야 이러한 질문을 한다는 의미가 아닙니다. 빅 데이터는 강력하고 새로운 데이터 소스를 제공합니다. 이 새로운 소스를 사용하면 질문할 수 있습니다. 더 작은 데이터 세트로는 답할 수 없습니다. 종종 더 많은 데이터 포인트가 통계 분석 중에 더 많은 힘을 제공합니다. 빅 데이터는 1960년대 공포 영화의 제목처럼 들립니다. 당신은 고양이 눈 안경을 쓴 비명을 지르는 여자를 상상합니다. 쏟아지는 데이터 산에 삼켜지고 있습니다. 실제로 빅 데이터는 명사가 아닙니다. 원래 NASA 논문에서는 빅 데이터 문제로 설명했습니다. 두 가지 방법 중 하나로 읽을 수 있습니다. "빅 데이터" 문제 또는 큰 "데이터 문제"입니다. 논문을 다 읽으면 이것은 그들이 문제에 중점을 두는 것처럼 들립니다. 빅데이터가 아니라 저장하기에 너무 큰 데이터 문제에 관한 것입니다. 또한 몇 년 후 McKinsey 보고서를 통해 이를 확인할 수 있습니다. 보고서에서 그들은 빅 데이터를 참조 일반적으로 사용되는 하드웨어 및 소프트웨어의 기능을 초과하는 데이터로. 빅 데이터를 명사가 아닌 문제로 생각하는 것이 왜 중요한가요? 글쎄요, 빅데이터 프로젝트를 시작하는 많은 회사들이 실제로 큰 데이터가 없습니다. 양이 많기 때문에 크게 느껴질 수 있습니다. 그것도 문제인듯 저장하고 수집하는 것이 정말 어려운 일이기 때문에 하지만 빅 데이터 문제는 아닙니다. 빅 데이터 문제가 있는지 확인할 수 있는 한 가지 방법은 데이터가 네 가지 범주에 속하는지 확인하는 것입니다. 이러한 범주를 4개의 Vs로 기억할 수 있습니다. 스스로에게 이러한 질문을 해보십시오. 데이터 양이 매우 많습니까? 다양한 데이터가 있습니까? 데이터가 빠른 속도로 들어오고 있습니까? 내가 수집하는 데이터에 진실성이 있습니까?…

목차