데이터 과학

WEKA 사용법 본문

생명정보학 & 화학정보학/MEGA and Chimera

WEKA 사용법

티에스윤 2021. 10. 9. 21:58

데이터 마이닝 툴인 WEKA에 대한 설치방법과 기본적인 사용방법입니다. 

 

WEKA는 뉴질랜드 waikato 대학에서 만든 프로그램으로 데이터 분석을 위한 툴입니다. 인공지능 알고리즘도 포함되어 있어 간단하게 데이터를 분석할때 유용한 프로그램으로 서열정열로 응용해서 사용할 수 있습니다. 

 

https://www.cs.waikato.ac.nz/ml/weka/

 

Weka 3 - Data Mining with Open Source Machine Learning Software in Java

Weka is a collection of machine learning algorithms for data mining tasks. It contains tools for data preparation, classification, regression, clustering, association rules mining, and visualization. Found only on the islands of New Zealand, the Weka is a

www.cs.waikato.ac.nz

 

WEKA 홈페이지에 들어가서 다운로드 받으면 됩니다. 자바를 기반으로 만들어진 프로그램입니다. 설치할 때 JVM이 설치가 되어야 사용이 가능합니다. 

 

설치 파일

 

간단하게 설치만 하면 되는 프로그램입니다. 

 

설치 이후에 실행하면 다음과 같은 화면이 나오는데 위에 있는 Explorer 를 실행하면 기본적인 프로그램이 실행 됩니다. 

 

 

 

 

 

WEKA Explorer 실행 화면인데 화일의 확장자는 arff 입니다. 

파일 포맷도 정해져 있어서 파일 형식대로 파일을 만들지 않으면 파일을 제대로 불러오지 않습니다.

 

 

@relation 5window_HIV.symbolic   // 제목입니다. 

@attribute amino1 {....}    // 속성입니다. 
@attribute amino2 {....}
@attribute amino3 {....}
@attribute amino4 {....}
@attribute amino5 {....}
@attribute result {yes,no}  // 클러스터 분류되는 결과에 해당됩니다. 

@data   // 실제 데이터가 있는 곳입니다. 

 

 

. arff는 이런 형식으로 구성되어 있습니다. 

 

HTLV_7window.arff
0.00MB

 

간단하게 불러온 파일 하나 보겠습니다. 카테고리를 2개 이상 구성해야 하는데 이 파일은 하나만 불러온 예제입니다. 

 

 

 

아미노산을 표현한 예제인데 간단하게 아미노산들의 종류에 대해 표기하고 있습니다. 

 

이를 활용하여 다양한 방법으로 알고리즘을 적용할 수 있는데, Aprori와 Decision Table, Kmeans, ANN등의 알고리즘등을 활용할 수 있습니다. 

 

associate 메뉴중에 apriori 알고리즘 화면입니다. 

Start 버튼을 누르면 결과가 나옵니다. 

 

 

이외에 experiment와 KnowlegeFlow를 통해 WEKA를 좀 더 깊이 사용할 수 있습니다. 

 

 

'생명정보학 & 화학정보학 > MEGA and Chimera' 카테고리의 다른 글

scratch, 프로테오믹스  (0) 2023.09.16
Hmmer 사용법 - 리눅스  (0) 2022.11.22
ucsf 키메라(chimera) 사용법  (0) 2022.11.15
MEGA-X 사용법  (0) 2021.05.23
BIO EDIT 사용법  (0) 2021.05.22