Head vs breakz

[통계] - 통계 용어 정리 본문

Head/통계

[통계] - 통계 용어 정리

headbreakz 2021. 8. 9. 15:51

1. 평균

값 / 값의 갯수 , 추정량 , 기댓값,

산술 평균 , 기하 평균 , 조화 평균

 

2. 분산

값들의 퍼진 정도

분산이 크면 광범위하게 값들이 분포, 작을 수록 평균에 분포

 

3. 표준 편차

분산을 제곱근,

값의 분포와 변동성을 파악

 

4. 모집단

집단 전체

 

5. 표본 집단

모집단에서 추출한 집단

 

6. 불편 추정량

임의의 추출된 값들의 평균이, 모집단의 평균과 일치할 경우.

 

7. 자유도

모집단의 평균이 100인 상태에서

임의 추출로 3개를 추출 할 경우 , 

1번째, 2번째가 98 , 104이 나올 경우 3번째는 무조건 98이 나와야한다.

1번째와 2번째는 값에 대한 자유가 있지만 마지막 값은 무조건 값이 정해진 상태이다

이를 자유도가 없다고하며, 이때의 자유도는 3-1의 값이다.

자유도는 모집단에서 임의 추출로 분산을 구할때 사용된다. 

 

8. 중심극한정리

모집단의 평균 μ, 표준편차 σ 인 경우 , 임의로 추출된 표본의 크기(n)가 충분히 크다면

표본 평균 분포는 μ, 표준편차 σ/ √n 인 정규분포를 따른다.

 

9. 큰수의 법칙

복원 추출.

시행이 많아 질수록, 통계적 확률은 수학적 확률로 수렴

 

10. 귀무가설

모집단의 특성에 대해 옳다고 제안하는 주장

ex ) 대한민국 20대의 키 평균은 170cm이다. 

서울 자치구의 성별 분포는 차이가 없다.

 

11. 대립가설

귀무가설이 틀릴 경우, 대안적으로 선택하는 가설

 

12. p value

귀무가설을 참으로 하여, 추출된 표본의 통계치가 나타날 확률 값

 

13. 1종 오류

귀무가설이 참이지만, 기각한 경우

 

14. 2종 오류

귀무가설이 거짓이지만, 채택한 경우

 

15. 동질성검정

하나의 범주형 변수를 기준으로 각 그룹이 특정요인에 대해 비슷한지 확인

변수들의 분포가 동일한지 살펴보는 검정

 

16. 상관 계수

두 변수 간의 선형 관계의 정도를 수량화

직선적 성향

 

17. 정규성 검정

정규성 가정을 통해 자료가 정규분포를 따르는지 확인하는 방법

Q-Q plot , shapiro-wilk test , kolmogorov-smirnov test

 

18. 등분산 가정

그룹 간의 분산이 같다는 가정

levene's test , bartlett's test

 

19. 분산분석

서로 다른 그룹의 평균에서 분산 값을 비교하는데 사용되는 공식

서로 다른 그룹의 평균간의 차이가 있는지 확인하는 방법

-정규성 : 데이터는 정규 분포를 따른다, 아닐 경우 로그 변환을

-독립성 : 데이터는 모집단에서 독립적 추출

-등분산성 : 동일한 분산

 

 

 

 

 

 

 

 

참조

https://drhongdatanote.tistory.com/57

https://drhongdatanote.tistory.com/59

 

 

'Head > 통계' 카테고리의 다른 글

[통계] - Imbalanced learn / python  (0) 2020.07.31
[통계] - 베이즈 정리  (0) 2020.07.21
Comments