클래스: 데이터 과학 학습: 기본 이해

무료이용으로 수강해 보세요.

업계 전문가가 강의하는 클래스 23,200개를 수강하세요.

체계적인 데이터로 간소화하기

체계적인 데이터로 간소화하기

당신은 데이터 과학 팀에 속해 있습니다. 당신은 종종 많은 양한 유형의 데이터를 처리합니다. 데이터를 어떻게 저장하고 싶을지 결정할 때 이러한 다양한 유형이 핵심 요소가 될 것입니다. NoSQL과 같은 기술은 양한 데이터 유형을 저장하려고 당신에게 많은 유연성을 줄 것입니다. 관계형 데이터베이스가 유연성 일부를 포기하지만 다루기가 더 쉬운 경우가 많습니다. 데이터를 어떻게 저장할지 생각할 때 다양한 데이터 유형을 이해할 필요가 있습니다. 이는 모든 스토리지에도 마찬가지입니다. 특정 데이터베이스가 특정 유형의 데이터를 위해 최적화되었습니다. 물 주전자에서 샌드위치를 보관하고 싶지 않은 것처럼 잘못된 유형의 데이터를 보관하려고 관계형 데이터베이스 설정을 원하지 않을 것입니다. 팀이 고려해야 할 것인 세 가지 유형의 데이터가 있습니다. 구조화된 데이터, 반구조화된 데이터 그리고 비구조화된 데이터가 있습니다. 첫 번째 유형의 데이터가 일반적으로 가장 간단합니다. 일반적으로 구조화된 데이터로 언급됩니다. 특정 순서로 특정 형식을 따르는 데이터입니다. 구조화된 데이터는 데이터베이스 세계의 모르타르 및 벽돌과 같습니다. 싸고 유연성이 있고 많은 전방 설계가 필요합니다. 구조화된 데이터의 좋은 예는 일반적인 사무용 스프레드시트입니다. 줄에 데이터를 채우고 있다고 상상해 보세요. 꽤 견고한 구조것을 고집해야 합니다. 구매 날짜라고 하는 열을 만든다고 가정해 봅시다. 해당 열의 각 필드는 엄격한 가이드라인을 준수해야 할 것이 필요합니다. 화요일을 한 줄에 넣고 다음 줄에 3월을 수 넣는 것이 안 됩니다. 올바른 형식을 따라야 합니다. 각 줄은 동일한 형식이어야 합니다. 슬래시, 그리고 년이 뒤따르는 숫자로 된 달처럼 표준 형식을 사용해야 할 것 같습니다. 이 구조를 데이터 모델이라고 합니다. 구조화된 데이터는 이 데이터 모델을 기반으로 합니다. 데이터 모델은 관계형 데이터베이스의 데이터 스키마와 유사합니다. 전체 데이터베이스 구조를 정의하기…

목차