데이터 과학

플라비 바이러스 Mega 비교 분석 본문

생명정보학 & 화학정보학/플라비 바이러스

플라비 바이러스 Mega 비교 분석

티에스윤 2022. 11. 8. 16:36

플라비 바이러스에 대해 Mega에서의 비교 분석을 알아보겠습니다. 

 

플라비 바이러스를 NCBI에서 찾아 BLAST에서 비교 분석하는 방법에 대한 설명은 아래 링크에서 했습니다. 

https://tsyoon.tistory.com/103

 

플라비 바이러스

Today Zika virus is being a very big problem. In Brazil, more than 1.5 million people have become infected since April, 2015. The Zika virus was first found in Uganda in 1947 [1, 2]. As time goes by, zika virus arose in many countries like Malaysia, Micron

tsyoon.tistory.com

 

이후에 mega에서 어떻게 하면 되는지에 대한 실험을 진행하고자 합니다. 

 

mega 프로그램을 설치하였다면 fasta로 저장한 5개의 플라비 바이러스를 불러오면 됩니다. 

https://tsyoon.tistory.com/3

 

FASTA로 저장한 5개의 파일은 아래 링크에서 다운로드할 수 있습니다. 

 

dengue.fas
0.00MB
yellow.fas
0.00MB
jencep.fas
0.00MB
tborn.fas
0.00MB
zika.fas
0.00MB

 

파일 용량이 크지 않습니다. 

확장자는 .FAS로 되어있는데 바이오 에디터를 설치하였다면 바이오 에디터가 기본으로 링크가 되어 있을 것입니다. 

 

Mega 프로그램을 띄어 놓고 5개의 파일을 하나로 합친 다음에 불러와 봅시다. 

 

flavi.fas
0.02MB

 

파일 불러올때 align으로 불러와야 합니다. 

 

 

 

5개의 flavi 바이러스 보입니다. 서열 정렬을 해야 하는데 Aligemnet 메뉴에서 clustal-W 혹은 Muscle로 진행하면 됩니다. 

gap이 나타나는 결과가 나오는데 이를 저장해야 합니다. 서열의 길이가 다르기 때문에 비교 분석을 위해서는 gap을 맞춰주어야 합니다.

 

 

Data -> export Aligement -> FAST Format, Mega Format 

 

으로 저장한 후에 

 

flavi-1.fas
0.02MB
flavi-1.meg
0.02MB

 

Data -> Phylogenetic Analysis 메뉴를 선택합니다.

 

이후에 메인 메뉴에 가서 Phylogency를 선택하면 5가지의 계통수 메뉴가 나타납니다. 

 

 

이중 하나인 Maximum Likelihood Tree를 선택해 봅시다. 

 

 

간단한 계통수가 나타납니다. 

 

아미노산으로 각각의 거리가 대략적으로 보이는 내용입니다. 

이후에 서열을 전부 잘라서 비교 분석합니다. 

 

방법은 window 형식으로 잘라서 비교하는 방법인데 아래 논문에 잘 나와 있습니다. 

윈도(window) 잘라서 실험하는 이유는 그 안에서 특정적인 아미노산 서열에 대한 규칙이나 아미노산을 찾으려고 하기 때문입니다. 

보통 홀수 윈도로 나눠서 실험을 진행합니다.

 

이에 데이터 마이닝 알고리즘으로는 신경망, 결정트리, 어프리오리, SVM등이 사용됩니다. 

 

 

https://www.matec-conferences.org/articles/matecconf/abs/2016/32/matecconf_iccpe2016_01008/matecconf_iccpe2016_01008.html

 

Deeper understanding about the genetic structure of dengue virus using SVM | MATEC Web of Conferences

Subin Choi, Hyunjin Choi and Taeseon Yoon Natural Sciences, Hankuk Academy of Foreign Studies, HAFS, Yongin-si, Republic of Korea Dengue fever, mainly found in the tropical and subtropical regions, is carried by mosquitoes. With the help of greenhouse effe

www.matec-conferences.org

https://www.matec-conferences.org/articles/matecconf/abs/2016/32/matecconf_iccpe2016_01005/matecconf_iccpe2016_01005.html

 

Deeper understanding of Flaviviruses including Zika virus by using Apriori Algorithm and Decision Tree | MATEC Web of Conference

Youjin Yang1, Bokyung Gu2 and Taeseon Yoon3 1 Nature Science Course, HankukAcademy of Foreign Studies, Yongin, South Korea 2 Nature Science Course, Hankuk Academy of Foreign Studies, Yongin, South Korea 3 Hankuk Academy of Foreign Studies, Yongin, South Ko

www.matec-conferences.org

https://ieeexplore.ieee.org/document/7890130

 

Comparison of flavivirus using datamining-Apriori, K-means, and decision tree algorithm

Nowadays, zika virus infection-occurred in Brazil-is becoming serious global problem. Temporary treatments-using drug-can alleviate symptoms for a while but cannot be a basic solution for infections. We researched amino acids of Zika virus and other four k

ieeexplore.ieee.org

 

'생명정보학 & 화학정보학 > 플라비 바이러스' 카테고리의 다른 글

플라비 바이러스  (0) 2022.09.20
Dengue -sero type  (0) 2022.09.15