반응형


안녕하세요!


오늘은 머신러닝의 지도학습, 분류 및 예측에 사용되는 알고리즘인


나이브 베이즈, 결정트리, 회귀 분석을 위해 필수적으로 알아야하는


확률에 대해 알아보도록 하겠습니다!



우선 확률을 이야기 하려면 어떤 사건이 발생해야 합니다.



잠깐! 여기서 사건이란 무엇일까요?


우선 확률과 관련된 용어를 알아봅시다!



어떤일이 발생하기위해 뭔가 해보는 것, 그것을 시행이라고 합니다.


예를 들어 동전을 던지는 것, 주사위를 던지는 것이 시행입니다.


단, 시행은 동일한 조건하에 행해져야 합니다.



표본공간이란 시행을 했을 때 나타나는 모든 결과를 의미합니다.


예를 들어, 주사위를 여러번 던졌을 때 1에서 6까지의 눈이 나오는 것,

그것을 모아놓은 것이 바로 표본공간입니다.



표본공간 속에서 사건이 일어납니다.


예를 들어, 주사위를 던질 때 1이 나오거나 짝수의 눈이 나오는 것을 사건이라고 합니다.



즉, 사건이란 시행을 하는 것이 아니라

시행을 했을 때 나오는 결과를 의미합니다.


따라서 사건은 표본 공간의 부분집합이 됩니다.



사건이 하나씩만 일어날 수 있는 것을 근원 사건이라고 합니다.


예를 들어, 주사위의 경우 1,2,3,4,5,6이 각각 나오는 것을 근원사건이라고 합니다.





[확률 기본]


확률은 아래와 같이 표현하며,

여기서 P는 Probability의 약자입니다.


P(A)



따라서 P(A)는 A가 일어날 사건이라고 표현합니다.




확률에도 크게 두가지 종류가 있습니다.


수학적 확률과 통계적 확률


우선, 수학적 확률이란, 수학적으로 어떤 이상적인 확률(의 결과)을 의미하는 것입니다.


예를 들어, 동전을 던졌을 때 앞면이 나올 확률을 1/2 이 되는 것입니다.



통계적 확률이란, 실제생활에서 일어나는 확률로

어떤 일을 했을 때, 어떤 일이 일어날 확률을 의미합니다.


예를 들어, 전체 30명의 학생들이 있고 이 중에 안경을 쓴 학생들이 10명이라고 했을 때,

30명 중에 어떤 한 학생이 안경을 쓰고 있을 확률은 10/30 이 되는 것입니다.



수학적 확률을 표현하는 방법


P(A)

= A사건이 일어날 원소의 갯수 / 표본공간의 원소의 갯수

= n(A) / n(S)



확률은 기본적으로 0보다 크거나 같고,

무조건 일어날 확률은 100%, 즉 1보다 작거나 같습니다.


0 <= P(A) <= 1





[조건부 확률]



확률은 결합 확률과 조건부 확률이 있습니다.


결합확률은 서로 배반되는 두 사상 A와 B가 있을 때,

두 사상이 연속적으로 또는 동시에 일어나는 확률을 의미합니다.


<결합확률 표기>


P(A ∩ B)




조건부 확률은 어떠한 상황이 주어졌을 때,

그 상황 속에서 다른 상황이 일어날 확률을 의미합니다.


<조건부확률 표기>


P(A | B)




[사건의 종류]



사건은 독립사건과 종속사건으로 나뉩니다.


독립사건이란, 두개의 사건이 일어났는데

두 사건이 전혀 연관되지 않았다면 독립사건입니다.


<독립사건 표기>


P(A | B) = P(A)




종속사건이란, 사건B가 일어났을 경우와 일어나지 않았을 경우에 따라,

사건 A가 일어날 확률이 다를 때 (즉, B의 영향을 받는 경우를 의미)

A는 B의 종속사건이라고 합니다.


예를 들어, 비가 오면 우산이 팔릴 확률이 높아지는 것은

두 사건의 관계가 종속 관계라는 것을 의미합니다.


<종속사건 표기>


P(A | B) = P(A ∩ B) / P(B)




오늘은 여기까지!


다음 포스팅할


나이브 베이즈 이론과 결정트리, 회귀분석에서


이를 활용하는 방법에 대해 같이 포스팅하도록 하겠습니다!



내용 출처: 그림으로 설명하는 개념 쏙쏙 통계학

EBS 고교강의 친절한 하영쌤의 수학

반응형

+ Recent posts