일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 인공지능 수학
- 자바
- AP
- 블록체인
- 바이오파이썬
- ncbi
- Kaggle
- 생명정보학
- 시그모이드
- 생물정보학
- 서열정렬
- MERS
- COVID
- 행렬
- AP Computer Science A
- BLaST
- 결정트리
- 인공지능
- Java
- 딥러닝
- 파이썬
- 알파폴드
- SVM
- 캐글
- 바이오인포매틱스
- 오류역전파
- 이항분포
- 인공신경망
- CNN
- bioinformatics
- Today
- Total
데이터 과학
PANDAS 시리즈와 데이터프레임 본문
PANDAS(판다스)는 파이썬을 기본으로 하는 확장형 라이브러리입니다.
1차원적인 시리즈(Series)가 있고, 2차원 배열구조인 데이터프레임(DataFrames)이 있습니다.
간단한 Series 명령어는 다음과 같습니다.
import pandas as pd
a = [1, 2, 3]
ex = pd.Series(a)
print(ex)
조금 변형을 시키면 인덱스를 넣어서 만들어 낼 수 있습니다.
import pandas as pd
a = [1, 2, 3]
ex = pd.Series(a, index=["a"], ["b"],["c"])
print(ex)
인덱스 값을 출력하고 싶다면 아래와 같은 출력 명령어를 작성하면 됩니다.
print(ex["c"])
파이썬의 기본 명령어 list와 큰 차이는 없지만 인덱싱이 가능한 부분은 딕셔너리랑 비슷한 부분이네요.
DataFrame 명령어를 보면 2차원 배열과 같습니다.
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}
df = pd.DataFrame(data)
print(df)
print(df.shape)
print(len(df.index))
list 명령어를 입력해 봅니다.
list(df.colums)
loc라는 명령어는 row (열) 값을 출력합니다.
print(df.loc[0])
print(df.loc[[0, 1]])
조금 더 확장해서 레코드 위치에 인덱스 값을 넣어 봅시다.
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}
df = pd.DataFrame(data, index = ["day1", "day2", "day3"])
print(df)
df=pd.DataFrame({"A":[1,2,3], "B":[4,5,6], "C":[7,8,9]})
display(df.iloc[0])
display(df.loc[0])
display(df.ix[0])
display(df.loc[:,'A']) # loc[] 에서 column 선택하기
display(df['A'])
display(df.ix[0]['A']) # 행과 열 선택하기
display(df.loc[0]['B'])
인덱스 값을 추가해 봅시다.
df = df.set_index('A')
display(df)
이후 내용은 아래 링크를 참고하면 됩니다.
https://3months.tistory.com/292
Python - Pandas 튜토리얼 (데이터프레임 생성, 접근, 삭제, 수정)
Pandas (Python Data Analysis Library) 파이썬을 통해 데이터 분석을 할 때, Pandas를 빼놓고 이야기할 수 없다. 온전히 통계 분석을 위해 고안된 R 과는 다르게 python은 일반적인 프로그래밍 언어(general purp..
3months.tistory.com
참고: https://www.datacamp.com/community/tutorials/pandas-tutorial-dataframe-python
https://www.w3schools.com/python/pandas/pandas_analyzing.asp
'Kaggle 데이터 분석, 딥러닝' 카테고리의 다른 글
시각화 seaborn (0) | 2022.05.31 |
---|---|
신용카드 채무 불이행 예측 모델 (0) | 2022.05.30 |
캐글, 상태 추출 예제 (0) | 2022.05.10 |
타이타닉 생존자 분석 (0) | 2022.01.21 |
Kaggle에서의 데이터 분석 (0) | 2022.01.02 |