UKB에서 사용할 데이터를 탐색 도중 Olink Proteomics 데이터를 발견했다.
Genetics 분야는 잘 몰라서 공부한 내용 정리.

생물학적으로 'Olink 단백질'이라는 특수한 형태의 단백질은 존재하지 않습니다. UK Biobank(UKB)에 있는 Olink 데이터는 사람의 혈액(혈장) 속에 있는 일반적인 단백질 바이오마커들을 'Olink'라는 기업의 분석 플랫폼을 이용해 정량화한 데이터셋을 의미합니다. 즉, Olink는 단백질의 이름이 아니라 측정 기술 및 회사 이름입니다.
1. UKB의 Olink 데이터 정의
UK Biobank의 Olink 데이터(주로 UK Pharma Proteomics Project, UKB-PPP를 지칭)는 약 5만 명에서 최대 50만 명에 이르는 참가자의 혈장 샘플에서 약 3,000개 수준의 단백질 발현량을 측정한 대규모 프로테오믹스(단백질체학) 데이터입니다.
- 목적: 유전체 데이터(GWAS)와 단백질 농도 간의 상관관계를 분석(pQTL 분석)하여 질병의 원인을 찾거나 신약 타겟을 발굴하기 위함입니다.
- 출력 형태: 단백질의 절대적 농도(예: mg/L)가 아니라, NPX(Normalized Protein eXpression) 라는 임의의 상대적 로그 척도로 값을 제공합니다.
2. 어떻게 생겼는가? (PEA 기술의 분자 구조적 원리)

Olink 기술의 핵심은 PEA (Proximity Extension Assay, 근접 연장 분석법) 입니다. 단백질 자체가 다르게 생긴 것이 아니라, 이 단백질을 잡아내는 센서의 형태가 독특합니다.
측정 과정에서 형성되는 구조는 다음과 같이 생겼습니다.
- 항체-DNA 프로브 (Antibody-DNA Probe): Olink는 하나의 표적 단백질을 잡기 위해 두 개의 서로 다른 항체를 사용합니다. 각 항체의 꼬리에는 고유한 바코드 역할을 하는 단일 가닥 DNA(ssDNA) 가 결합되어 있습니다.
- 근접 및 결합 (Proximity Binding): 혈장 샘플에 이 항체 쌍을 넣으면, 두 항체가 하나의 표적 단백질의 서로 다른 부위에 동시에 달라붙습니다.
- DNA 이중 나선 형성 (Hybridization): 두 항체가 같은 단백질에 결합하면 꼬리에 달린 두 가닥의 DNA가 물리적으로 매우 가까워집니다. 이때 두 DNA 가닥의 끝부분이 상보적으로 결합하여 짧은 이중 나선 구조를 만듭니다.
- 연장 및 증폭 (Extension & Amplification): DNA 중합효소(Polymerase)가 이 결합된 부분을 연장하여 완전한 이중 가닥 DNA 바코드를 생성합니다. 이 DNA 바코드를 차세대 염기서열 분석(NGS)으로 읽어내어 "이 단백질이 샘플에 얼마나 있는가"를 정량화합니다.
반응형