클래스: 데이터 과학 학습: 기본 이해
무료이용으로 수강해 보세요.
업계 전문가가 강의하는 클래스 23,200개를 수강하세요.
체계적인 데이터로 간소화하기
당신은 데이터 과학 팀에 속해 있습니다. 당신은 종종 많은 양한 유형의 데이터를 처리합니다. 데이터를 어떻게 저장하고 싶을지 결정할 때 이러한 다양한 유형이 핵심 요소가 될 것입니다. NoSQL과 같은 기술은 양한 데이터 유형을 저장하려고 당신에게 많은 유연성을 줄 것입니다. 관계형 데이터베이스가 유연성 일부를 포기하지만 다루기가 더 쉬운 경우가 많습니다. 데이터를 어떻게 저장할지 생각할 때 다양한 데이터 유형을 이해할 필요가 있습니다. 이는 모든 스토리지에도 마찬가지입니다. 특정 데이터베이스가 특정 유형의 데이터를 위해 최적화되었습니다. 물 주전자에서 샌드위치를 보관하고 싶지 않은 것처럼 잘못된 유형의 데이터를 보관하려고 관계형 데이터베이스 설정을 원하지 않을 것입니다. 팀이 고려해야 할 것인 세 가지 유형의 데이터가 있습니다. 구조화된 데이터, 반구조화된 데이터 그리고 비구조화된 데이터가 있습니다. 첫 번째 유형의 데이터가 일반적으로 가장 간단합니다. 일반적으로 구조화된 데이터로 언급됩니다. 특정 순서로 특정 형식을 따르는 데이터입니다. 구조화된 데이터는 데이터베이스 세계의 모르타르 및 벽돌과 같습니다. 싸고 유연성이 있고 많은 전방 설계가 필요합니다. 구조화된 데이터의 좋은 예는 일반적인 사무용 스프레드시트입니다. 줄에 데이터를 채우고 있다고 상상해 보세요. 꽤 견고한 구조것을 고집해야 합니다. 구매 날짜라고 하는 열을 만든다고 가정해 봅시다. 해당 열의 각 필드는 엄격한 가이드라인을 준수해야 할 것이 필요합니다. 화요일을 한 줄에 넣고 다음 줄에 3월을 수 넣는 것이 안 됩니다. 올바른 형식을 따라야 합니다. 각 줄은 동일한 형식이어야 합니다. 슬래시, 그리고 년이 뒤따르는 숫자로 된 달처럼 표준 형식을 사용해야 할 것 같습니다. 이 구조를 데이터 모델이라고 합니다. 구조화된 데이터는 이 데이터 모델을 기반으로 합니다. 데이터 모델은 관계형 데이터베이스의 데이터 스키마와 유사합니다. 전체 데이터베이스 구조를 정의하기…