| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
- RNN
- 시그모이드
- AP
- ncbi
- 생물정보학
- HMM
- 생명정보학
- bioinformatics
- 인공지능
- 이항분포
- 캐글
- Java
- BLaST
- AP Computer Science A
- 오류역전파
- 결정트리
- SVM
- Kaggle
- 인공지능 수학
- 서열정렬
- COVID
- 자바
- 파이썬
- 바이오파이썬
- 딥러닝
- 블록체인
- CNN
- MERS
- 바이오인포매틱스
- 인공신경망
- Today
- Total
데이터 과학
플라비 바이러스 Mega 비교 분석 본문
플라비 바이러스에 대해 Mega에서의 비교 분석을 알아보겠습니다.
플라비 바이러스를 NCBI에서 찾아 BLAST에서 비교 분석하는 방법에 대한 설명은 아래 링크에서 했습니다.
https://tsyoon.tistory.com/103
플라비 바이러스
Today Zika virus is being a very big problem. In Brazil, more than 1.5 million people have become infected since April, 2015. The Zika virus was first found in Uganda in 1947 [1, 2]. As time goes by, zika virus arose in many countries like Malaysia, Micron
tsyoon.tistory.com
이후에 mega에서 어떻게 하면 되는지에 대한 실험을 진행하고자 합니다.
mega 프로그램을 설치하였다면 fasta로 저장한 5개의 플라비 바이러스를 불러오면 됩니다.
FASTA로 저장한 5개의 파일은 아래 링크에서 다운로드할 수 있습니다.
파일 용량이 크지 않습니다.
확장자는 .FAS로 되어있는데 바이오 에디터를 설치하였다면 바이오 에디터가 기본으로 링크가 되어 있을 것입니다.
Mega 프로그램을 띄어 놓고 5개의 파일을 하나로 합친 다음에 불러와 봅시다.
파일 불러올때 align으로 불러와야 합니다.

5개의 flavi 바이러스 보입니다. 서열 정렬을 해야 하는데 Aligemnet 메뉴에서 clustal-W 혹은 Muscle로 진행하면 됩니다.
gap이 나타나는 결과가 나오는데 이를 저장해야 합니다. 서열의 길이가 다르기 때문에 비교 분석을 위해서는 gap을 맞춰주어야 합니다.

Data -> export Aligement -> FAST Format, Mega Format
으로 저장한 후에
Data -> Phylogenetic Analysis 메뉴를 선택합니다.
이후에 메인 메뉴에 가서 Phylogency를 선택하면 5가지의 계통수 메뉴가 나타납니다.

이중 하나인 Maximum Likelihood Tree를 선택해 봅시다.

간단한 계통수가 나타납니다.
아미노산으로 각각의 거리가 대략적으로 보이는 내용입니다.
이후에 서열을 전부 잘라서 비교 분석합니다.
방법은 window 형식으로 잘라서 비교하는 방법인데 아래 논문에 잘 나와 있습니다.
윈도(window) 잘라서 실험하는 이유는 그 안에서 특정적인 아미노산 서열에 대한 규칙이나 아미노산을 찾으려고 하기 때문입니다.
보통 홀수 윈도로 나눠서 실험을 진행합니다.
이에 데이터 마이닝 알고리즘으로는 신경망, 결정트리, 어프리오리, SVM등이 사용됩니다.
Deeper understanding about the genetic structure of dengue virus using SVM | MATEC Web of Conferences
Subin Choi, Hyunjin Choi and Taeseon Yoon Natural Sciences, Hankuk Academy of Foreign Studies, HAFS, Yongin-si, Republic of Korea Dengue fever, mainly found in the tropical and subtropical regions, is carried by mosquitoes. With the help of greenhouse effe
www.matec-conferences.org
Deeper understanding of Flaviviruses including Zika virus by using Apriori Algorithm and Decision Tree | MATEC Web of Conference
Youjin Yang1, Bokyung Gu2 and Taeseon Yoon3 1 Nature Science Course, HankukAcademy of Foreign Studies, Yongin, South Korea 2 Nature Science Course, Hankuk Academy of Foreign Studies, Yongin, South Korea 3 Hankuk Academy of Foreign Studies, Yongin, South Ko
www.matec-conferences.org
https://ieeexplore.ieee.org/document/7890130
Comparison of flavivirus using datamining-Apriori, K-means, and decision tree algorithm
Nowadays, zika virus infection-occurred in Brazil-is becoming serious global problem. Temporary treatments-using drug-can alleviate symptoms for a while but cannot be a basic solution for infections. We researched amino acids of Zika virus and other four k
ieeexplore.ieee.org
'생명정보학 & 화학정보학 > 플라비 바이러스' 카테고리의 다른 글
| 플라비 바이러스 (0) | 2022.09.20 |
|---|---|
| Dengue -sero type (0) | 2022.09.15 |