Til 230504
2023년 5월 4일 TIL
판다스(Pandas) 복습
1. 판다스는 왜 쓰는가
- 데이터 분석에 유용한 판다스 : 정형 분석에 가장 유용하다.
- 참고할만한 책 : 데이터 분석을 위한 파이썬
- 판다스를 위협하는 새로운 라이브러리들 : cuDF(RAPIDS), Polars
- 판다스를 기본으로 잘 알아야 새로운 라이브러리를 사용할 수 있다.
- 참고자료
2.판다스 자료 구조
- 데이터프레임(Dataframe)과 시리즈 (Series), 그리고 인덱스(Index)
- 데이터프레임(Dataframe) : 행과 열로 이루어진 2차원 테이블
- 리스트 : 파이썬의 대표적인 자료구조중 하나로 여러개 원소를 가진 하나의 목록.(튜플, 집합과 혼동 노노!
- 배열(Array) : 위치정보(index)값을 가진 목록. 인덱스로 원소에 바로 접근 가능하다.
리스트(List), 어레이(Array), 시리즈(Series)의 차이
import pandas as pd
import numpy as np
L = [1, 3, 5, 6, 8]
arr = np.array(L)
s = pd.Series(L)