데이터 과학

PANDAS 연습 - 데이터 경시대회에서 우승하는 예제 본문

Kaggle 데이터 분석, 딥러닝

PANDAS 연습 - 데이터 경시대회에서 우승하는 예제

티에스윤 2022. 6. 7. 14:26

일일 판매 데이터를 시계열로 분석하는 예시로 이를 학습함으로 인해 PANDAS의 시각화를 학습할 수 있습니다. 

matplotlib와 seabon을 활용하는 방법은 이전 블로그에 있으며 Kaggle에 있는 이 예제를 통해 PANDAS 라이브러리 쓰임새에 대해 학습할 수 있을 것입니다. 

 

데이터 소스는 다음 링크에 있습니다. 용량이 크지 않기에 쉽게 다운 받아서 압축을 풀어서 주피터 노트북 폴더에 넣은 후 예제를 실행하면 됩니다. 

 

https://www.kaggle.com/competitions/competitive-data-science-predict-future-sales/data

 

Predict Future Sales | Kaggle

 

www.kaggle.com

 

 

실습할 예제는 Power of PANDAS 라는 주제로 작성된 소스인데 링크는 다음과 같습니다. 

 

https://www.kaggle.com/code/gehallak/the-power-of-pandas

 

The power of Pandas

Explore and run machine learning code with Kaggle Notebooks | Using data from Predict Future Sales

www.kaggle.com

 

두 군데 링크를 걸었으면 위에 데이터 압축을 푼 후에 주피터 노트북 메인이나 폴더를 하나 만들어서 업로드하면 됩니다. 

위 프로그램을 실행한 파일을 그대로 두었으니 보면서 실습을 해 보도록 해요. 

 

 

 

https://www.kaggle.com/code/faressayah/data-science-best-practices-with-pandas-part-1

 

📊Data Science BEST Practices📋with Pandas||PART 1

Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources

www.kaggle.com

 

 

https://www.kaggle.com/code/faressayah/data-science-best-practices-with-pandas-part-2

 

📊Data Science BEST Practices📋with Pandas||PART 2

Explore and run machine learning code with Kaggle Notebooks | Using data from multiple data sources

www.kaggle.com

 

'Kaggle 데이터 분석, 딥러닝' 카테고리의 다른 글

Kaggle에서 MNIST  (0) 2022.09.18
Kaggle에서 딥러닝 시작  (0) 2022.08.28
시각화 seaborn  (0) 2022.05.31
신용카드 채무 불이행 예측 모델  (0) 2022.05.30
캐글, 상태 추출 예제  (0) 2022.05.10