데이터 과학

오렌지(ORANGE, 인공지능 시각화 툴) 본문

인공지능/오렌지(ORANGE)

오렌지(ORANGE, 인공지능 시각화 툴)

티에스윤 2025. 3. 8. 11:58

인공지능을 처음 시작하는 분들에게 소개하는 시각화 하는 툴입니다. 

 

인터페이스가 SPSS 클레멘타인과 비슷하며 프로그래밍을 잘 몰라도 마우스 클릭 몇 번만 하면 사용을 할 수 있는 프로그램입니다. 

R언어나 판다스는 프로그래밍을 배워야 하며 라이브러리를 설치해서 콘솔환경에서 작업을 해야 하는데 ORANGE는 GUI (그래픽 유저 인터페이스) 환경에서 작업을 하기에 상당히 간단하고 편리한 프로그램입니다. 

 

https://orangedatamining.com/

 

Orange Data Mining

Orange Data Mining Toolbox

orangedatamining.com

 

위 사이트에 접속하여서 최신판들 다운로드 받으면 됩니다. 

플랫폼이 맥OS도 지원하기에 운영체제 문제로 고민할 필요는 없습니다. 

 

 

 

버전은 홈페이지에서 최신판으로 업그레이드 되어서 배포하니 가끔 홈페이지에 접속해서 다운로드해서 업그레이드를 해 봅시다. 

 

 

다운로드하여서 설치합시다. 

 

 

 

설치 이후에 튜토리얼을 한번 보고 연습해 봅시다. 

 

기본적인 파일은 제공하고 있습니다. Data 메뉴에서 File을 불러오면 간단한 iris 데이터를 불러올 수 있습니다. 

조금 더 많은 양의 예제를 받아서 공부하고 싶다면 아래 링크로 가서 깃허브에 있는 파일들을 다운로드하여서 예제들을 실행해 보면 됩니다. 

데이터는 기본적으로 테이블 형식으로 되어 있는데 이 테이블 형식은 CSV 파일 형식으로 편집된 것이어서 데이터를 제작해서 만들어 분석할 수 있습니다. 

 

https://github.com/mrihtar/orange/blob/master/Orange/datasets/iris.tab

 

orange/Orange/datasets/iris.tab at master · mrihtar/orange

Orange 2 data mining suite. Contribute to mrihtar/orange development by creating an account on GitHub.

github.com

 

위 사이트가 깃허브에 있는 예제파일들이 있는 사이트입니다.

*.tab이라고 되어 있는 파일들을 다운로드하여서 실행하면 예제로 실습을 할 수 있습니다.

 

기본적으로 제공하는 데이터 중에 iris(붓꽃) 데이터를 사용해 보도록 합시다. 

iris 데이터는 초창기 인공지능 학습데이터이며 3종류의 붓꽃을 어떤 방식으로 분류하느냐와 성능을 평가하는데 하나의 기준이 되었습니다.

예전 인공지능 논문들을 읽어보면 iris 데이터를 기준으로 성능을 평가하는 논문들이 많이 있었죠. 현재는 빅데이터 딥러닝 시대이기에 학습용 데이터로 많이 사용하고 있습니다. 

 

 

iris 데이터 셋을 설정한 이후에 Trnsform에서 Data Smpler로 테이블화를 설정하고, 그룹화를 선택합니다. 

이후에 산포도(Scatter Plot)을 설정해서 데이터 분류를 진행하면 iris 데이터가 분류가 됩니다. 

 

 

 

마우스로 클릭하고 도형을 연결하는 방법입니다. 

한번 실습을 해 보세요. 

 

 

 

Linear Projection을 선택해서 결과를 확인하면 iris 데이터 셋 분류 결과가 잘 나왔습니다. 

iris는 종류에 따라 sepal, petal이 크기가 명확하기에 훈련 데이터로 사용해서 분류하기가 좋습니다. 

 

 

선형 분류로 결과를 확인해 보니 명확하게 분류가 된 것을 확인할 수 있습니다. 

 

그리고, 분류기를 정확하게 설정해서 작성해야 합니다. 

 

 

분류기 설정이 정확하지 않으면 x 표기가 되어 진행되지 않습니다. 

 

 

모자이크 방법을 설정해서 분석한 결과입니다. 데이터 형식을 잘 맞추고 학습을 하면 SVM과 같은 분류기를 사용할 수 있습니다. 

 

간단하게 ORANGE 프로그램에 대해 알아봤습니다. 

프로그램은 간단해서 사용하기가 편한데 여기서 사용되는 알고리즘들의 이론을 알아야 합니다. 

 

ORNAGE를 사용하면서 인공지능이나 데이터 마이닝 알고리즘에 대해 공부를 해야 한다는 생각이 들었다면, 이제 깊이 있는 학습을 해야 합니다. 

 

 

ORANGE와 비슷하지만 다른 프로그램인 WEKA도 있습니다. 

 

https://tsyoon.tistory.com/35

 

WEKA 사용법

데이터 마이닝 툴인 WEKA에 대한 설치방법과 기본적인 사용방법입니다. WEKA는 뉴질랜드 waikato 대학에서 만든 프로그램으로 데이터 분석을 위한 툴입니다. 인공지능 알고리즘도 포함되어 있어 간

tsyoon.tistory.com