목록Head/통계 (3)
Head vs breakz
1. 평균 값 / 값의 갯수 , 추정량 , 기댓값, 산술 평균 , 기하 평균 , 조화 평균 2. 분산 값들의 퍼진 정도 분산이 크면 광범위하게 값들이 분포, 작을 수록 평균에 분포 3. 표준 편차 분산을 제곱근, 값의 분포와 변동성을 파악 4. 모집단 집단 전체 5. 표본 집단 모집단에서 추출한 집단 6. 불편 추정량 임의의 추출된 값들의 평균이, 모집단의 평균과 일치할 경우. 7. 자유도 모집단의 평균이 100인 상태에서 임의 추출로 3개를 추출 할 경우 , 1번째, 2번째가 98 , 104이 나올 경우 3번째는 무조건 98이 나와야한다. 1번째와 2번째는 값에 대한 자유가 있지만 마지막 값은 무조건 값이 정해진 상태이다 이를 자유도가 없다고하며, 이때의 자유도는 3-1의 값이다. 자유도는 모집단에서 ..
Imbalanced learn은 클래스간 불균형이 강한 데이터 세트에 일반적으로 사용되는 sampling을 제공하는 python 패키지이다. 현재 scikit-learn과 호환이 되며, scikit-learn-contrib project에 속해있다. Imbalanced learn을 사용하기 위해서는 python 3.6 이상 필요하며, 다음과 같은 패키지가 필요하다. scipy(>=0.19.1) numpy(>=1.13.3) scikit-learn(>=0.23) joblib(>=0.11) keras 2 (optional) tensorflow (optional) matplotlib(>=2.0.0) pandas(>=0.22) Imbalanced-learn의 홈페이지나 Github를 통해 설치, 사용법에 대한 내..
베이즈의 정리란 , 조건부 확률을 직접 계산하기 어려울 때, 조건이 되는 사상을 상호 배반 사상들로 분할하여, 간접적으로 계산하기 위한 공식 (R - 확률통계 , 임태진) 하나의 장난감을 만들기 위해서는 5개의 부품이 필요하고, 각각 차지하는 비율과 불량율A이 다르다. 이때! 불량품 장난감이 생산되었을 경우 ? 부품 A B C D E 비율 30% 20% 10% 20% 20% 불량율 0.01 0.02 0.02 0.03 0.01 1. 불량품이 생길 확률 = 0.3*0.01+0.2*0.02+0.1*0.02+0.2*0.03+0.2*0.01 표본공간S는 A,B,C,D,E 의 합집합이고, A,B,C,D,E는 상호 배반이므로 0.016의 값을 얻을 수 있다. 2. 불량품이 생기고, 부품 A,B,C,D,E에서 생산되었..