| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | |||
| 5 | 6 | 7 | 8 | 9 | 10 | 11 |
| 12 | 13 | 14 | 15 | 16 | 17 | 18 |
| 19 | 20 | 21 | 22 | 23 | 24 | 25 |
| 26 | 27 | 28 | 29 | 30 | 31 |
- 서열정렬
- 블록체인
- MERS
- bioinformatics
- 캐글
- 인공신경망
- 오류역전파
- 바이오파이썬
- 결정트리
- Java
- COVID
- CNN
- 이항분포
- 딥러닝
- Kaggle
- 자바
- 바이오인포매틱스
- 시그모이드
- AP Computer Science A
- 생명정보학
- BLaST
- 파이썬
- 인공지능
- SVM
- HMM
- AP
- RNN
- 인공지능 수학
- 생물정보학
- ncbi
- Today
- Total
목록2025/10/23 (3)
데이터 과학
1. 개요이 문서는 Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2)의 스파이크 단백질(QHR63290.2, Spike glycoprotein)에 대해 AlphaFold2/ColabFold를 활용하여 구조를 예측하는 절차와 해석 방법을 정리한 것입니다. 스파이크 단백질은 바이러스가 인간 세포의 ACE2 수용체에 결합하여 감염을 시작하는 핵심 단백질입니다. 2. 서열 정보 (입력 데이터) >QHR63290.2 spike glycoprotein [Severe acute respiratory syndrome coronavirus 2] MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDLFLPFFSNVTWFH..
알파폴드2의 작동 과정 예를 들어, 세포 내에서 산소를 운반하는 단백질인 헤모글로빈(Hemoglobin)의 구조를 예측한다고 가정합니다.연구자는 먼저 헤모글로빈의 아미노산 서열(Primary sequence)을 알파폴드2에 입력합니다.이때 모델은 입력된 서열을 바탕으로, 전 세계의 단백질 데이터베이스에서 "유사한 단백질 서열들을 찾아 다중서열정렬(MSA)"을 생성합니다.이 MSA에는 사람뿐 아니라 원숭이, 생쥐, 조류 등 다양한 생물에서 발견된 유사 단백질 서열이 함께 포함됩니다.이러한 정렬을 통해, 예를 들어 45번째 아미노산이 변할 때 98번째 아미노산도 함께 변하는 패턴이 반복적으로 나타난다면, 알파폴드는 이 두 잔기가 공간적으로 서로 가까이 있을 가능성이 높다고 판단합니다. 이제 Evoformer..
단백질 구조 예측에서 알파폴드(AlphaFold) 알고리즘은 인공지능이 생명과학의 오랜 난제를 해결한 혁신적인 사례로 평가받습니다. 단백질은 아미노산 서열이 일정한 규칙에 따라 접혀 복잡한 3차원 구조를 형성하고, 그 구조를 통해 생명 현상에서 다양한 기능을 수행합니다. 그러나 아미노산의 1차 서열만으로 단백질의 입체 구조를 정확히 예측하는 것은 매우 어려운 문제였습니다. 단백질을 구성하는 아미노산이 수백 개 이상인 경우 가능한 접힘 형태는 상상할 수 없을 정도로 많기 때문입니다. 기존에는 X선 결정학(X-ray crystallography), 핵자기 공명(NMR), 냉동전자현미경(Cryo-EM)과 같은 실험적 방법으로 구조를 규명했지만, 이 방법들은 비용과 시간이 많이 소요되며 모든 단백질에 적용하기 ..