반응형
LIST
상관관계(correlation)과 상관분석(correlation analysis) 두 변수간의 선형적 관계를 '상관'이라고하며, 이러한 관계에 대한 분석을 상관분석이라고 합니다. (ex. 광고비용 지출과 매출 , 1인당 GDP와 기대수명 ) 두 사건에 대응되는 두 변수는 일반적으로 연속형 변수를 가정합니다. R 프로그래밍 plot(cats$Hwt ~ cats$Bwt, col="forestgreen", pch=19, xlab='Body Weight (kg)', ylab="Heart Weight(g)", main = "Body Weight and Heart Weight of Cats") 고양이의 몸무게가 증가할수록 심장무게 역시 증가하는 패턴을 보이고 있습니다. 산점도를 이용하면 이렇게 대략적..
독립성검정(independence test) 독립성검정은 두 범주형 변수가 서로 독립인지 검정하는 것입니다. 이 검정은 카이제곱 검정의 한 형태로, 관찰된 빈도가 기대 빈도와 얼마나 다른지를 측정합니다. 독립이라는 것은 두 변수가 서로 관련이 없다는 것을 의미합니다. 귀무가설 : 두 변수는 독립이다. 대립가설 : 두 변수는 독립이 아니다. R 프로그래밍 # 데이터 생성 data
교차표와 $\chi ^{2}$ 검정 $\chi ^{2}$ 검정(chi-square test)는 교차표상의 빈도를 바탕으로 수행합니다. 교차표를 이용하면 범주형으로 수집된 두 변수의 범주 조합에 따른 조합별 빈도를 살펴볼 수 있으며, 이를 통해 두 변수 간의 관계를 파악할 수 있습니다. 독립성검정(independence test)은 두 범주형 변수 간의 관련성이 모집단에서 존재하는지 검정합니다. 20대는 양식 , 30대는 한식, 40대는 중식을 선호한다고 했을때 연령대와 선호하는 음식은 상관관계가 있다고 판단할 수 있습니다. 적합성검정(goodness of fit test)은 범주별 빈도를 바탕으로 모집단에서 기대되는 비율 분포가 존재하는지 검정합니다. ex. 이동 통신회사 A,B,C의 이용자가 각각 50..
SimCLR v1 이미지 데이터의 정답 label이 없는 상황에서 효과적으로 visual representation을 추출하는 SimCLR이라는 이름의 unsupervised learning algorithm을 소개합니다. SimCLR은 data augmentation을 통해 얻은 postive/ negative sample들에 대해 contrastive learning을 적용시켰으며, 성능 측면에서 supervised learning으로 학습한 모델들에 준하는 모습을 보여줍니다. Contrastive Learning Framework Unsupervised Learning이란 데이터의 label 없이 네트워크 모델을 학습하는 것을 의미합니다. 이전에 Computer vision 분야에서는 이미지를 임의..
다변량 분산분석(multivariate analysis of variance, MANOVA) 다변량 분산분석(multivariate analysis of variance, MANOVA)은 두 개 이상의 종속변수가 있을 경우 집단별 차이를 동시에 검정합니다. 한 개의 종속변수를 사용할 때보다 연구의 타당성을 더 높일 수 있는 장점이 있습니다. 다변량 분산분석 (Multivariate Analysis of Variance, MANOVA)은 분산분석 (ANOVA)의 확장입니다. ANOVA는 하나의 종속 변수에 대해 두 개 이상의 그룹 간 평균 차이를 비교하는 데 사용되는 반면, MANOVA는 두 개 이상의 종속 변수에 대해 두 개 이상의 그룹 간 평균 차이를 비교하는 데 사용됩니다. MANOVA는 여러 개의 ..