학업

[수학 유형 정리] <확률과 통계> 확률분포 개념 완벽 정리

치료킷 2023. 10. 30. 20:39
반응형

선택과목 <확률과 통계 >에서 통계-확률분포 단원 정리

주로 문과학생들이 많이 선택하는 확률과 통계는 크게 경우의 수, 확률, 통계로 나누어져 있습니다. 그중에서도 통계 단원은 굉장히 실용적인 단원이면서도 향후 대학교를 가서도 어떤 전공을 불문하고 각종 통계분석의 기초 지식이 되는 단원으로 그 활용도가 굉장하다고 볼 수 있습니다. 지금부터 그 통계 단원을 알아보려고 하는데요. 글의 분량을 생각해 우선 이번 글에서는 확률분포에 대해 알아보도록 하겠습니다.

 

확률과 통계, 확률분포, 확률변수

1. 개요

어떤 수학적 개념을 설명할 때 중요하지만 재미가 없는 과정이 하나 있습니다.

바로 정의를 명확하게 짚고 넘어가는 것인데요. 사실 많이들 지루해하기도 하고 실제로 크게 중요하지 않은 단원도 있어서 대충 넘어가는 경우도 있지만 확률분포의 경우는 그 정의가 굉장히 중요합니다. 그래서 지금부터 용어의 정의를 알아볼 예정인데요. 확률분포의 가장 근간인 확률변수의 정의에 대해 알아보겠습니다. 

 

2. 확률변수의 정의

확률변수의 정의는 다음과 같습니다. "표본공간에서 실수로 가는 함수"

네 맞습니다. 당연히 어려워 보이라고 적은 글입니다. 조금 더 풀어서 적어보겠습니다.

"어떤 사건에 대해 부여하는 값"을 바로 확률변수라고 합니다. 조금 더 쉽게 말하자면 어떤 사건이 있을 때 그 사건에 매칭되는 숫자가 있으면 그 관계를 확률변수라고 부릅니다. 그 숫자를 무엇으로 할지는 정하기 나름입니다. 

한 가지 예시를 들어보겠습니다. 주사위를 던지는 행위로 벌어지는 사건은 총 6가지(눈금 1개부터 6개까지) 일 것입니다. 제가 만약 주사위를 던져서 나오는 점의 개수에 5를 더하는 숫자를 대응시킨다고 하면, 눈금 1이 나오는 사건에는 숫자 6이 대응될 것이고 눈금 6이 나오는 사건에는 숫자 11이 대응될 것입니다.

여기서 궁금증이 생깁니다. 확률변수를 왜 정하는 거죠? 바로 간단하게 사건을 부르고 싶기 때문입니다. 사람들이 확률변수에 대한 저 규칙을 알고 있다고 한다면 우리는 "주사위를 던져서 눈이 3 나오는 사건"이라고 쓰지 않고 그냥 편하게 "확률변수 X가 8인 사건"이라고 편하게 부를 수 있습니다. 확률변수의 정의만 알면 이렇게 훨씬 간결해지죠.

그리고  이렇게 규칙적인 룰을 정할 필요도 없습니다. 그냥 사건에 숫자만 대응시키면 그 관계를 확률변수라고 합니다.

중요한 사실은 확률변수는 결국 숫자라는 것입니다.

이 정의가 중요한 이유는 나중에 확률변수들로 이루어진 식의 기댓값,  분산에 대한 계산을 하게 되는데 그때 개념이 정립되어있지 않으면 조금만 응용해도 쉽게 헷갈리기 때문입니다. 

 

3. 확률분포

확률변수의 정의를 알았다면 이제 확률변수를 이용해서 확률분포를 알아보려고 합니다. 확률분포란 확률변수가 가질 수 있는 모든 경우를 모으고 각각에 대해 확률을 구하는 것을 말합니다. 따라서 당연히 확률변수에 대한 확률들을 모두 모으면 1이 되겠죠? 위에서 든 예시로 확률분포를 만들어보겠습니다.

확률변수 X 6 7 8 9 10 11
확률 P(X) 1/6 1/6 1/6 1/6 1/6 1/6

이런 식입니다. 이 표에서 주사위를 던지는 행동에 대한 설명은 사라져 있습니다. 그저 확률변수에 대응하는 확률만 있을 뿐입니다. 따라서 주사위를 던지는 행위가 아니어도 위 표와 아예 똑같은 확률분포는 얼마든지 만들어낼 수 있습니다.

참고로 이 예시는 확률분포 중에서도 이산확률분포입니다. 확률변수가 이산적으로 셀 수 있는 숫자로 이루어져 있지요. 이산확률변수와 연속확률변수에 대한 자세한 설명은 추후 더 자세히 알아보도록 하겠습니다.

확률변수를 정의하고 해당하는 값에 대한 확률을 나타내는 것 그것이 확률분포라고 할 수 있겠습니다.

 

4. 정리

오늘은 확률변수와 확률분포에 대해 간략하게 알아보았습니다. 쉽게 지나칠 수 있는 확률변수의 정의를 명확하게 알고 시작하는 것이 바로 확률분포 단원을 잘하는 포인트라고 봐도 무방합니다. 다음 글에서는 이산확률분포와 연속확률분포의 차이 그리고 각 확률분포의 대표적인 분포인 이항분포, 정규분포에 대해 알아보겠습니다. 이 글이 수험생들에게 도움이 되길 진심으로 기원합니다.

반응형