반응형
dropna
-
python: pandas 라이브러리 정리Python 2021. 6. 6. 20:41
이전 포스팅에서 numpy 라이브러리를 알아보았고 데이터 처리에 있어서 강력한 기능을 제공하는 것을 확인했다. 하지만 numpy는 데이터의 속성을 표시하는 행이나 열의 레이블을 가지고 있지 않다는 한계가 있다. 그래서 pandas 라는 라이브러리를 사용하는데 이를 이용하면 행과 열로 구조화하여 엑셀과 같은 데이터를 효과적으로 처리할 수 있다. 판다스의 개요 1. 특징 - 빠르고 효율적이며 다양한 표현력을 갖춘 자료구조 - 다양한 형태의 데이터에 적합 - 데이터프레임을 이용한 2차원 데이터 표현 2. 장점 - 결측 데이터 처리 - 데이터 추가 삭제 - 데이터 정렬과 다양한 데이터 조작 3. 판다스가 하는 일 - 데이터 불러오기 및 저장하기 - 데이터 보기 및 검사 - 필터, 정렬 및 그룹화 - 데이터 정제..