본문 바로가기
AI 관련/ADsP, ADP

ADsP 3과목 요점 정리_3과목 2장 통계분석_01 통계의 이해_확률과 확률분포

by 팀장일기 2022. 3. 13.

ADsP 3과목 요점 정리_3과목 2장 통계분석_01 통계의 이해_확률과 확률분포 

무지개가 나타날 확률

2. 확률과 확률분포

(1) 확률

1) 확률 기초

- 확률 : 발생 가능한 모든 사건들의 집합 표본 공간에서 표본 공간의 부분집합인 특정 사건 A가 발생할 수 있는 비율 나타낸 값. 0과 1 사이의 값, 가능한 모든 사건의 확률의 합은 항상 1이다. 

- 조건부 확률 : 특정 사건 A가 발생했다는 것이 사실이라는 전제하에 또 다른 사건 B가 발생할 확률을 나타낸 값. 0과 1 사이의 값을 갖는다. 

2) 독립 사건과 배반사건 

- 독립사건 : 서로에게 영향을 주지 않는 두 개의 사건을 독립이라고 한다. 

- 배반 사건 : 두 사건 A와 B에 대하여 교집합, 즉 공통된 부분이 없는 경우를 배반 사건이라 한다. 동시에 일어날 수 없는 사건이다. 

3) 확률변수와 확률분포 그리고 확률 함수 

- 확률변수 : 무작위 실험을 했을 때 특정 확률로 발생하는 각각의 결과를 수치적 값으로 표현하는 변수를 확률 변수라 한다. 

- 확률분포 : 확률변수의 모든 값과 그에 대응하는 확률이 어떻게 분포하고 있는지가 바로 확률분포다.

 

(2) 이산 확률분포

1) 베르누이 분포 : 확률 변수 X가 취할 수 있는 값이 두 개인 경우로 일반적으로 한 번의 시행을 할 때 성공과 실패로 나눌 수 있는 성공할 확률이 p 인 분포를 의미한다. 

2) 이항 분포 : 이항 분포는 n번의 베르누이 시행(성공 또는 실패)에서 k 번 성공할 확률의 분포를 의미한다. 

3) 기하 분포 : 성공확률이 p인 베르누이 시행 이서 처음으로 성공이 나올 때까지 k번 실패할 확률의 분포를 의미한다. 

4) 다항 분포 : 이항 분포를 확장한 개념으로, n번의 시행에서 각 시행이 3개 이상의 결과를 가질 수 있는 확률의 분포를 의미한다. 

5) 포아송 분포 : 단위 시간 또는 단위공간 내에서 발생할 수 있는 사건의 발생 횟수에 대한 확률분포를 의미한다. 

6) 이산 확률변수 : 확률변수가 취할 수 있는 실수 값의 수를 셀 수 있는 변수를 이산 확률변수라 한다. 

(3) 연속 확률분포

1) 균일 분포 : 연속형 확률변수인 X가 취할 수 있는 모든 값에 대하여 같은 확률을 갖고 있는 분포를 의미한다. 

2) 정규분포 : 가장 대표적인 연속형 확률분포 중 하나로 평균이 μ이고, 표준편차가 σ인 분포를 의미한다. 

3) t-분포 : 평균이 0이고 좌우가 대칭인 종 모양의 그래프지만 정규분포보다 두꺼운 꼬리를 갖는다. 

4) 카이제곱 분포 : 표준 정규분포를 따르는 확률변수 Z1, Z2, Z3---- Zn의 제곱의 합 X는 자유도가 n인 카이제곱 분포를 따른다. 

5) F분포 : (책 참고 : 수식 있음) 

6) 연속 확률변수 : 확률변수가 취할 수 있는 실수 값이 어떤 특정 구간 전체에 해당하여 그 수를 셀 수 없는 변수를 연속 확률 변수라 한다. 

 

(4) 기댓값, 분산, 표준편차 

1) 기댓값 : 특정 사건이 시행되었을 때 확률변수 X가 추할 수 있는 값의 평균값을 의미한다. 

2) 분산 

- 분산 : 데이터들이 중심에서 얼마나 떨어져 있는지 알아보기 위한 측도이다. 

- 확률변수의 분산 : 확률변수가 취할 수 있는 값들이 그 중심(모평균에서 얼마나 떨어져 있는지를 측정하는 측도다.

3) 표준편차 : 자료의 산포도를 나타내는 수치 

 

(5) 꼭 알아두어야 하는 통계 개념 

1) 첨도와 왜도

- 첨도 : 첨도(Kurtosis)는 확률분포의 뾰족한 정도를 나타내는 측도

- 왜도 : 왜도(skewness)는 확률분포의 비대칭 정도를 나타내는 측도 

2) 공분산 : 두 확률변수 X, Y의 상관 정도를 나타내는 값

3) 상관계수 : 공분산의 문제를 해결한 값 

댓글