클래스: 데이터 과학 학습: 기본 이해

무료이용으로 수강해 보세요.

업계 전문가가 강의하는 클래스 23,200개를 수강하세요.

반 체계화된 데이터 공유

반 체계화된 데이터 공유

데이터 과학 팀은 다양한 데이터 유형과 작업합니다. 관계형 데이터베이스는 종종 최선의 선택입니다. 구조화된 데이터가 있는 경우. 엄격한 데이터 모델이 필요합니다. 미리 정의된 데이터베이스 스키마에 구조화된 데이터를 적합하기 위해서요. 그것은 당신이 고정 된 열과 줄을 가질 스프레드시트와 같습니다. 구조화된 데이터를 사용하면 일반적으로 보고서를 만드는 것이 매우 간단합니다. 구조화된 쿼리 언어를 사용할 수 있습니다. 아니면 SQL으로 데이터베이스에서 데이터를 가져오고 표준 형식으로 표시합니다. 구조화된 데이터가 관계형 데이터베이스에 자리 잡을 때 세상의 모든 것이 조직화 된 것처럼 보입니다. 그것은 당신이 향신료 항아리에 있는 모든 향신료를 가질 때와 같습니다 . 당신은 모든 것이 어디에 있는지 알고 어디에서 찾을 수 있는지 정확히 알고 있습니다. 문제는 일부의 응용 프로그램이 항상 그렇게 단순하지 않습니다. 러닝화 웹사이트로 돌아가 보겠습니다. 당신이 관계형 데이터베이스를 사용하고 있다고 상상해보십시오. 네 개의 테이블이 있습니다. 신발을 위한 테이블이 있습니다. 고객, 주소 및 배송 옵션 모든 구조화된 데이터가 데이터 모델에 적합합니다. 날짜는 표준이고 우편 번호는 표준입니다. 일이 순조롭게 진행되고 있습니다. 세상에는 모든 것이 옳은 것 같습니다. 그런 다음 배송 업체에서 전자 메일을 받습니다. 캐리어는 비용을 획기적으로 낮출 수 있다고 말합니다. 정보를 데이터베이스에 직접 추가하는 것으로 데이터베이스를 쿼리하기만 하면 됩니다. 그런 다음 지역 배송 코드의 하나를 다운로드하시고 주문에 추가하시고 새 레코드를 만듭니다. 쉬워 보인데 그들의 데이터베이스는 당신의 것과 같기 때문입니다. 그것이 모두 구조화된 데이터이고 모두 관계형 데이터베이스에 있습니다. 문제는 그들의 스키마가 당신의 스키마와 동일하지 않습니다. 당신은 우편 번호 데이터를 ZIPCode라고 불렀고 그들은 우편 번호 데이터를 PostalCode라고 불렀습니다. 사업이나…

목차