데이터 과학

단순 서열정렬, 갭 패널티 본문

생명정보학 & 화학정보학/NCBI와 블라스트

단순 서열정렬, 갭 패널티

티에스윤 2022. 9. 15. 16:55

서열정렬 (alignment)는 2개 이상의 상동서열(homolog) 동일한 조상을 갖는 서열에 대해 서열을 이루는 구성요소들이 서열 간의 진화적 관계를 반영하여 쌍을 지어 대응하는 방법입니다. 

 

서열의 위치에서는 돌연변이 (mutation), 삽입(insertion), 결실(deldetion) 같은 세가지 종류의 진화적 변화가 발생 가능합니다. 

 

AATGATATC                 AATGATATC              AATGATATC

ATACTTC                        ATACTTC                   ATACTTC

 

3개의 단순서열을 비교해 볼 때 일치가점(match score)과 불일치 0점으로 계산을 하면 다음과 같습니다. 

2, 1, 0 점으로 나타납니다.  최적화는 첫번째 정렬이 됩니다.

 

 

여기서 삽입과 결실을 넣어서 Gap 을 활용하면 다음과 같은 결과가 나옵니다. 

 

AATGATATC                AATGATATC                AATGATATC

AT - - ATT- C                 - AT- ACTTC              - -  ATACTTC

 

이렇게 정리를 한 다음에 일치가점은 1점, 불일치 감점은 0점, 갭 페널티는 -1 점이라고 정의하면 각각의 점수는 다음과 같습니다. 

 

2점, 3점, 3점 

 

이렇게 보면 서열정렬의 갭으로 인해 첫 번째 정렬이 진화적 관계가 최적의 정렬로 보기 어렵다는 결과가 나옵니다. 

 

 

 

 

https://tsyoon.tistory.com/37

 

PAM과 BLOSUM

서열 정렬 서열 정렬 및 데이터베이스 검색 프로그램에서는 정렬을 통해 문자값을 가지고 비교하며 이에 대해 점수표(Scoring Matirix)를 활용하는 방법을 사용합니다.  방법1. 행렬의 점수를 정수

tsyoon.tistory.com

 

 

 

http://www.incodom.kr/Pairwise_Alignments

 

Pairwise Alignments - 인코덤, 생물정보 전문위키

#[[Alignment]]

www.incodom.kr

 

 

참고: 생명정보학 (조재창 역)

'생명정보학 & 화학정보학 > NCBI와 블라스트' 카테고리의 다른 글

바이오인포매틱스 서론  (1) 2023.03.17
바이러스 분류  (1) 2022.08.29
바이오인포매틱스 개요  (0) 2022.08.29
H1N1 시리즈 분석  (0) 2022.08.01
PAM과 BLOSUM  (0) 2021.11.01