반응형
반응형
LIST
UKB에서 사용할 데이터를 탐색 도중 Olink Proteomics 데이터를 발견했다. Genetics 분야는 잘 몰라서 공부한 내용 정리.생물학적으로 'Olink 단백질'이라는 특수한 형태의 단백질은 존재하지 않습니다. UK Biobank(UKB)에 있는 Olink 데이터는 사람의 혈액(혈장) 속에 있는 일반적인 단백질 바이오마커들을 'Olink'라는 기업의 분석 플랫폼을 이용해 정량화한 데이터셋을 의미합니다. 즉, Olink는 단백질의 이름이 아니라 측정 기술 및 회사 이름입니다.1. UKB의 Olink 데이터 정의UK Biobank의 Olink 데이터(주로 UK Pharma Proteomics Project, UKB-PPP를 지칭)는 약 5만 명에서 최대 50만 명에 이르는 참가자의 혈장 샘플에서 ..
데이터 찾기 DNA와 RNA의 메틸레이션 데이터가 필요해서 관련 데이터들을 수집하기 위해 여러 연구 논문들을 참고했습니다.보통 처음 다루는 데이터의 출처나 정보를 얻기 위해서는 비슷한 데이터를 사용한 논문을 보시면 됩니다.논문을 보면 어떤 데이터를 사용했는지 출처가 상세하게 나와있죠.가끔 데이터셋 링크를 첨부하거나 저자의 Github에 함께 포함된 경우도 있습니다. ( 정말 종종 ) 그래서 이번에는 DNA와 RNA 데이터가 필요해서 관련 논문을 보면 다양한 플랫폼과 기관들에 대한 정보가 많습니다. NCBI, TCGA, Xena 같은 플랫폼은 생물학이나 바이오인포를 전공하시는 분들이면 많이 들어봤을 것입니다. DNA와 RNA 데이터 수집을 위한 주요 플랫폼1. NCBI (National Center fo..
이전에 계속 언급했듯이 생물학적 시스템과 유전 정보는 DNA에 암호화돼 있습니다.생명정보학 알고리즘과 도구들은 실용적인 목적으로 DNA를 1차원적 뉴클레오티드 서열로 표기합니다.DNA 또는 RNA 분자는 네 개의 뉴클레오티드로 구성돼 있으므로 컴퓨터로 표현할 때 네 개의 독립적인 문자로 표현합니다. DNA의 경우 A,C,G,T 로 표현합니다. 이는 각각 아데닌, 시토닌, 구아닌, 티민이며 RNA의 경우 T 대신 U인 우라실로 표현합니다.DNA의 기본 알파벳에는 네 개의 뉴클레오티드만 포함돼 있지만, IUPAC은 확장된 심볼들을 정리해 뉴클레오티드의 모호성을 허용하는 확장된 심볼들을 정의했습니다. 확장된 심볼들을 통해 중합 효소 연쇄 반응(PCR) 프라이머의 디자인과 같이 불확실한 뉴클레오티드가 있는 경우..
Why Genomics?본 포스팅은 Coursera에 있는 Johns Hopkins University의 게놈 데이터 과학 특화 과정 강의를 정리한 내용입니다. INTRODUCTION: 이 강의는 유전체학의 중요성과 그것이 우리에게 가르쳐 줄 수 있는 것들에 대해 설명합니다. 유전체학의 기본 개념유전체학은 우리 몸 안의 유전체를 연구하는 분야로, 모든 인간은 99.9% 동일한 유전체를 가지고 있지만, 그 안의 작은 변화로 인해 다양한 차이가 발생합니다.유전체는 우리의 발달과 생물학적 특성을 결정하며, 예를 들어, 신경세포와 피부세포는 동일한 유전체를 가지고 있지만 서로 다른 기능을 수행합니다.암과 유전적 변이암은 유전적 질병으로, 세포가 통제 없이 분열하는 현상으로 정의됩니다. 이는 유전체 내의 변이가 ..