관리 메뉴

데이터 과학

PANDAS 시리즈와 데이터프레임 본문

Kaggle 데이터 분석, 딥러닝

PANDAS 시리즈와 데이터프레임

티에스윤 2022. 5. 3. 12:53

PANDAS(판다스)는 파이썬을 기본으로 하는 확장형 라이브러리입니다. 

1차원적인 시리즈(Series)가 있고, 2차원 배열구조인 데이터프레임(DataFrames)이 있습니다.

 

간단한 Series 명령어는 다음과 같습니다. 

 

import pandas as pd
a = [1, 2, 3]
ex = pd.Series(a)
print(ex)

 

 

조금 변형을 시키면 인덱스를 넣어서 만들어 낼 수 있습니다. 

 

import pandas as pd
a = [1, 2, 3]
ex = pd.Series(a, index=["a"], ["b"],["c"])
print(ex)

 

 

인덱스 값을 출력하고 싶다면 아래와 같은 출력 명령어를 작성하면 됩니다. 

 

print(ex["c"])

 

파이썬의 기본 명령어 list와 큰 차이는 없지만 인덱싱이 가능한 부분은 딕셔너리랑 비슷한 부분이네요. 

 

 

 

DataFrame 명령어를 보면 2차원 배열과 같습니다. 

 

 

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data)
print(df) 

print(df.shape)

print(len(df.index))

 

list 명령어를 입력해 봅니다. 

 

list(df.colums)

 

loc라는 명령어는 row (열) 값을 출력합니다. 

 

print(df.loc[0])

print(df.loc[[0, 1]])

 

 

조금 더 확장해서 레코드 위치에 인덱스 값을 넣어 봅시다. 

 

import pandas as pd
data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2", "day3"])
print(df) 

 

 

df=pd.DataFrame({"A":[1,2,3], "B":[4,5,6], "C":[7,8,9]})

display(df.iloc[0])
display(df.loc[0])
display(df.ix[0])


display(df.loc[:,'A'])   # loc[] 에서 column 선택하기
display(df['A'])

 

display(df.ix[0]['A'])  # 행과 열 선택하기
display(df.loc[0]['B'])

 

 

인덱스 값을 추가해 봅시다. 

 

df = df.set_index('A')
display(df)

 

 

이후 내용은 아래 링크를 참고하면 됩니다. 

 

 

https://3months.tistory.com/292

 

Python - Pandas 튜토리얼 (데이터프레임 생성, 접근, 삭제, 수정)

Pandas (Python Data Analysis Library) 파이썬을 통해 데이터 분석을 할 때, Pandas를 빼놓고 이야기할 수 없다. 온전히 통계 분석을 위해 고안된 R 과는 다르게 python은 일반적인 프로그래밍 언어(general purp..

3months.tistory.com

 

 

참고: https://www.datacamp.com/community/tutorials/pandas-tutorial-dataframe-python

 

       https://www.w3schools.com/python/pandas/pandas_analyzing.asp

 

'Kaggle 데이터 분석, 딥러닝' 카테고리의 다른 글

시각화 seaborn  (0) 2022.05.31
신용카드 채무 불이행 예측 모델  (0) 2022.05.30
캐글, 상태 추출 예제  (0) 2022.05.10
타이타닉 생존자 분석  (0) 2022.01.21
Kaggle에서의 데이터 분석  (0) 2022.01.02