클래스: 통계의 기초 2: 확률

무료이용으로 수강해 보세요.

업계 전문가가 강의하는 클래스 23,200개를 수강하세요.

정규 곡선

정규 곡선

이산형분포는 다음과 같은 경향을 보여요. 각 값이 이산적이기 때문에 막대 차트를 사용할 수 있죠. 모든 숫자는 정수입니다. 그러나 연속확률변수가 있다면 가능한 결과는 무한합니다. 다음은 공항에서 하루에 10명의 무작위 여행자가 대기하는 시간을 나타낸 것입니다. 정수 및 반복되는 값은 없어요. 50명의 여행자에 대한 데이터가 더 있다면 반복되는 값이 없을 가능성이 매우 높죠. 이런 상황에서 가능한 결과는 무한하다고 말할 수 있습니다. 막대 차트는 여기에 사용할 수 없으니 대신 곡선을 사용하여 결과 분포를 설명합니다. 이러한 곡선을 확률 밀도라고 합니다. 곡선 아래 영역은 각 결과의 확률을 나타냅니다. 이 확률 밀도에서 결과 A의 확률은 X입니다. 결과 B의 확률은 Y입니다. 또한 곡선 아래 면적은 가능한 모든 결과를 나타내며 곡선 아래 전체 면적은 1.0 또는 100%입니다. 다시 말하지만 가능한 결과는 무한하므로 단일 시나리오의 확률은 그리 흥미롭지 않죠. 정확히 12.5분 안에 보안 검색대를 통과할 정확한 확률이 얼마인지 정말로 신경쓰는 사람이 있을까요? 대개는 사람들이 결과 집단의 확률을 계산하는 이유가 이것입니다. 분포도로 돌아가보죠. 아마도 더 흥미로운 질문은 10분에서 20분 사이에 공항 보안을 통과할 확률은 얼마인지입니다. 이 구간에서 곡선 아래 영역은 곡선 아래 영역의 약 25%처럼 보여요. 이제 질문을 바꾸면 공항 보안 검색대를 통과하는 데에 10분~40분 걸릴 확률은 얼마일까요? 곡선 아래 영역의 50%를 간단히 넘는다는 것을 알 수 있어요. 50% 이상이 10~40분 내로 보안 검색대를 통과합니다. 물론 이렇게 물어볼 수 있어요. 1분~60분 사이에 공항 보안을 통과할 확률은 얼마일까요? 거의 100%에 가까울 거예요. 대답이 좀 모호하죠? 아마 궁금하실 거예요. "이 간격에서 곡선 아래 면적을 어떻게 정확히 계산하나요?" 이를 위해서는 두 가지가 필요합니다. 곡선의 공식과 적분학이죠. 네, 이건 아마 오늘 다룰 내용보다 좀 더 많은…

목차