반응형
LIST
카플란 마이어 분석 개요 카플란-마이어분석(Kaplan-Meier analysis)은 관측된 생존시간으로부터 생존확률을 추정합니다. $ S(t) = \prod_{i: t_i \le t} \left(1 - \frac{d_i}{n_i}\right) = P_{1} +P_{2} + ... + P_{t-1} = \widehat{S}(t-1) \times P_{t} $ $p1$은 첫 번째 구간을 지나 생존한 비율입니다. $t$개의 구간에서 구한 생존비율들을 누적생존비율(cumulative proportion survivng)이라고 합니다. $ p_{i} = 1 - \frac{d_{i}}{n_{i}},i = 1,2, ... ,t $ 여기에서, $ S(t) $는 $t$시점에서의 생존확률 추정치 $ p_{i} $는 $i..
생존분석 개요 생존분석(survival analysis)은 관심있는 어떤 사건이 발생할 때까지 경과된 시간(time-to-event)를 분석합니다. 사건이 발생할 때까지 걸리는 시간을 생존시간(survival time) 이라고 합니다. 사건을 정의하는 방식에 따라 생존분석의 응용 분야는 광범위합니다. (ex. 자동차 부품이 고장날 때까지 걸린 시간, 장애 발생 후 복구할 때까지 걸린 시간, 실직 후 새로운 직업을 구할 때까지 경과된 시간) 생존분석은 시간의 흐름에 따라 달라지는 사건발생률의 분포를 분석합니다. 사건 발생을 시간의 함수로 모델링하여 일정 시점에서의 생존확률을 추정합니다. 사건 발생까지의 시간이 집단 간에 차이가 있는지 분석합니다. 또한 어떤 변수들이 사건 발생까지의 시간에 영향을 미치는지 ..
Big Self-Supervised Models are Strong Semi-Supervised Learners paper: [https://arxiv.org/pdf/2006.10029.pdf] SimCLR v2는 세 가지 측면에서 개선되었습니다. 우선 기존에 ResNet-50을 4배 키운 모델을 이용했었는데, SimCLR v2에서는 ResNet-152를 3배 키우고 selective kernel을 더해 channel별로 attention을 가해주었습니다. 이는 기존과 비교했을 때 2배 정도 많은 parameter를 이용하지만, 1% labeled sample로 fine-tuning 했을 때 29%의 놀라운 top-1 accuracy 성능 향상을 보여주었습니다. 또한 SimCLR v2는 projectio..
상관관계(correlation)과 상관분석(correlation analysis) 두 변수간의 선형적 관계를 '상관'이라고하며, 이러한 관계에 대한 분석을 상관분석이라고 합니다. (ex. 광고비용 지출과 매출 , 1인당 GDP와 기대수명 ) 두 사건에 대응되는 두 변수는 일반적으로 연속형 변수를 가정합니다. R 프로그래밍 plot(cats$Hwt ~ cats$Bwt, col="forestgreen", pch=19, xlab='Body Weight (kg)', ylab="Heart Weight(g)", main = "Body Weight and Heart Weight of Cats") 고양이의 몸무게가 증가할수록 심장무게 역시 증가하는 패턴을 보이고 있습니다. 산점도를 이용하면 이렇게 대략적..
독립성검정(independence test) 독립성검정은 두 범주형 변수가 서로 독립인지 검정하는 것입니다. 이 검정은 카이제곱 검정의 한 형태로, 관찰된 빈도가 기대 빈도와 얼마나 다른지를 측정합니다. 독립이라는 것은 두 변수가 서로 관련이 없다는 것을 의미합니다. 귀무가설 : 두 변수는 독립이다. 대립가설 : 두 변수는 독립이 아니다. R 프로그래밍 # 데이터 생성 data