[Bioinformatics] - 생물학적 서열의 기본적 처리
이전에 계속 언급했듯이 생물학적 시스템과 유전 정보는 DNA에 암호화돼 있습니다.생명정보학 알고리즘과 도구들은 실용적인 목적으로 DNA를 1차원적 뉴클레오티드 서열로 표기합니다.DNA 또는 RNA 분자는 네 개의 뉴클레오티드로 구성돼 있으므로 컴퓨터로 표현할 때 네 개의 독립적인 문자로 표현합니다. DNA의 경우 A,C,G,T 로 표현합니다. 이는 각각 아데닌, 시토닌, 구아닌, 티민이며 RNA의 경우 T 대신 U인 우라실로 표현합니다.DNA의 기본 알파벳에는 네 개의 뉴클레오티드만 포함돼 있지만, IUPAC은 확장된 심볼들을 정리해 뉴클레오티드의 모호성을 허용하는 확장된 심볼들을 정의했습니다. 확장된 심볼들을 통해 중합 효소 연쇄 반응(PCR) 프라이머의 디자인과 같이 불확실한 뉴클레오티드가 있는 경우..