Merge
-
python: Pillow 라이브러리 정리Python 2021. 6. 7. 16:06
pillow는 파이썬의 이미지 편집 라이브러리로 이미지 편집에 관한 여러가지 기능을 제공한다. 1. 이미지 잘라내기 from PIL import Image img = Image.open('gif/panda.gif') # (100, 200)에서 (600, 700)까지 xy = (100, 200, 600, 700) # xy 범위를 크롭해서 가져온다. crop_img = img.crop(xy) print(crop_img.size) crop_img.show() 2. 이미지 붙여넣기 from PIL import Image img = Image.open('gif/panda.gif') # (100, 200)에서 (600, 700)의 이미지를 잘라낸다. x = (100, 200, 600, 700) crop_img = ..
-
python: pandas 라이브러리 정리Python 2021. 6. 6. 20:41
이전 포스팅에서 numpy 라이브러리를 알아보았고 데이터 처리에 있어서 강력한 기능을 제공하는 것을 확인했다. 하지만 numpy는 데이터의 속성을 표시하는 행이나 열의 레이블을 가지고 있지 않다는 한계가 있다. 그래서 pandas 라는 라이브러리를 사용하는데 이를 이용하면 행과 열로 구조화하여 엑셀과 같은 데이터를 효과적으로 처리할 수 있다. 판다스의 개요 1. 특징 - 빠르고 효율적이며 다양한 표현력을 갖춘 자료구조 - 다양한 형태의 데이터에 적합 - 데이터프레임을 이용한 2차원 데이터 표현 2. 장점 - 결측 데이터 처리 - 데이터 추가 삭제 - 데이터 정렬과 다양한 데이터 조작 3. 판다스가 하는 일 - 데이터 불러오기 및 저장하기 - 데이터 보기 및 검사 - 필터, 정렬 및 그룹화 - 데이터 정제..
-
데이터 사이언스: Pandas 로 큰 데이터를 다루기(info, describe, unique, value_counts, sort_values), 데이터합치기(merge)데이터 사이언스 2020. 7. 26. 23:31
Pandas로 큰 데이터를 다루어 봅시다! 우선 데이터를 하나 받아옵시다. import pandas as pd df = pd.read_csv("Downloads/laptops.csv") df 데이터 크기가 너무 클 경우에는 ...으로 표현됩니다. 그래서 데이터를 보고 싶은 부분만 가져오기 위해 head를 이용합시다 df.head(N)를 이용하면 첫번째 행부터 N번 째 행까지 가져옵니다. default 값은 5라서 아무값도 입력하지 않으면 5줄의 행만 가져옵니다. df.head() tail()은 head()와 반대로 뒤에서부터 가져옵니다. head와 마찬가지로 default 값으로 5를 갖습니다. df.tail() 데이터 프레임의 정보를 가져옵니다. df.info() RangeInd..