통계/분산분석

분산분석 정리

주인장 아저씨 2022. 12. 15. 20:12

 

ㅇ 샤피로 월크 검정을 통해 정규성을 만족하여야 하며 (기각하면 정규성 만족x)
ㅇ 레벤검정 또는 바틀렛검정으로 분산의 동일성 여부 검정 (기각하면 등분산성 만족x)

ㅇ 가설 예시

H0 : A변수와 B변수의 차이가 없다
H1 : A변수와 B변수의 차이가 있다

ㅇ Anova는 그룹들 간의 유의미한 차이가 있는지에 대해서만 알 수 있기 때문에, 3개 이상의 집단에서  특정 집단 간의 평균 차이가 유의미한지 알기 위해서는 추가적인 분석을 진행해야함

ㅇ 이때 특정 집단 간의 평균을 비교하는 분석은 planned contrast와 Tukey HSD를 포함한 다수의 분석법이 있음. (Tukey HSD, Bonferroni 와 같은 기법은 post hoc 분석이고,  contrast, planned comparison은 priori 분석)

ㅇ Contrast나 사후분석(터키HSD) 등을 통해 실제 유의한 차이가 있는지 확인

ㅇ둘 다 특정 그룹간 차이를 비교하는 것에서 공통점이 있지만, 개념적으로 (물론, 통계적으로도) 둘은 차이가 있음. priori 분석은 가설에서부터 특정 그룹간 차이를 가정하는 경우 진행하는 분석이며, post hoc 분석은 그룹(3개 이상)간 차이가 유의한 결과가 나타났을 때, 사후 (추가적으로) pair 간 차이가 있는지 확인하는 분석

ㅇ 예를 들어, a 약이 b 약보다 더 통증완화에 효과가 있을 것으로 가설을 설정하고, 이를 검정하기 위해 control 집단, a약을 먹은 집단, b약을 먹을 집단 간의 통증차이가 있는지 확인할때, 처음부터 a약과 b약의 효과 차이를 예상했으므로, planned contrast 검정을 하면 됨

ㅇ post hoc 분석의 경우,  분석 이전에 어떤 pair 간의 차이가 있는지 미리 예측하지 않고, 유의미한 anova 결과에 기초하여, 추가로 분석을 하게 될 때 사용하게됨

ㅇ 분석결과는 꼭 유의 수준에 충족한다고 좋은 것이 아님

ㅇ 이를 위해 Cohen's d 값으로 계산된 Effect size를 고려.

ㅇ Effect size란 평균값들 간의 차이를 표준편차로 나눈 값, 효과의 강도.

ㅇ 예를 들면, 약의 효과가 있다고 나오더라도 얼마나 효과가 있는지 파악 가능

ㅇ Effect size 성능 기준으로는 0.1의 경우 Small, 0.3은 Medium, 0.5 이상은 Large로 평가됨

(ex. Effect size가 0.034 일 경우 약의 효과는 있지만 미비하다고 판단됨)