클래스: 통계의 기초 2: 확률

무료이용으로 수강해 보세요.

업계 전문가가 강의하는 클래스 23,200개를 수강하세요.

종 모양 곡선

종 모양 곡선

3명의 교사가 각각 한 학급 20명을 담당하며, 각각 시험을 봅니다. 이 세 학급의 시험 결과는 어떨까요? 1반에서는 85점이 가장 빈도가 높은 점수인 것 같군요. 그러나 대부분의 학생들은 그보다 낮은 점수를 받았습니다. 어떤 학생들은 매우 낮은 점수를 받았습니다. 낮은 점수에 대해 왼쪽으로 이어지는 긴 꼬리가 있습니다. 이 히스토그램은 왼쪽으로 치우쳐 있어요. 2반에서는 70점이 가장 인기있는 점수로 보이지만 많은 학생들이 70점 이상이고 몇몇 학생들은 정말 고득점을 이뤘군요. 더 높은 점수에 대해 오른쪽으로 이어지는 긴 꼬리가 있습니다. 이 히스토그램은 오른쪽으로 치우쳐 있습니다. 3반을 보면 분포가 중구난방이네요. 일부 높은 점수, 일부 낮은 점수 일부는 중간 점수를 받았군요. 3반에서는 패턴을 찾기 어렵습니다. 흥미롭게도 많은 것들이 패턴을 따릅니다. 키가 큰 사람이나 국가표준시험 점수, 심지어 건강 데이터도 종종 데이터가 패턴을 따르고는 합니다. 데이터는 확률분포에서 이 종 모양을 취합니다. 정규 분포 그래프를 보면 어떤 걸 알 수 있을까요? 첫째, 데이터의 평균은 곡선의 가장 높은 지점에 집중됩니다. 둘째, 데이터가 평균의 양쪽에서 대칭임을 알 수 있죠. 즉, 50%는 평균보다 높고 50%는 평균보다 낮습니다. 셋째, 그 결과의 확률이 낮을수록 평균에서 멀어집니다. 곡선이 점점 X축에 가까워지죠. 또한 곡선은 축에 닿지 않죠. 그것은 어느 방향이든 무한대로 계속 이어집니다. 또 하나 기억해야 할 것은 곡선 아래 면적은 1과 같으며 이는 곡선 아래 면적이 가능한 결과 100%란 뜻이에요. 전통적으로 정규 분포 그래프라고 부르는 것입니다. 확률을 이해하는 데 중요해요. 특히 데이터가 정규분포일 때 말이죠. 통계에서는 데이터가 정규분포를 따른다고 하면 데이터가 정규 분포 그래프의 형태를 보인다는 걸 알아요. 그러나 모든 일반 곡선이 동일하게 생성되지는 않아요. 둘 다 정규분포 곡선이지만 한쪽이 더 크고 더 좁습니다. 이는 대부분의 데이터 포인트가 평균에…

목차