-
데이터 사이언스: Pandas 잘못된 데이터 고치기 (rename, set_index)데이터 사이언스 2020. 7. 25. 13:15
잘못된 데이터를 고쳐가면서 pandas를 공부해 봅시다
다음과 같은 데이터가 있습니다.
import pandas as pd liverpool_df = pd.read_csv("Downloads/liverpool.csv", index_col = 0) liverpool_df
칼럼들의 이름 첫 시작을 대문자로 바꾸어 줍시다.
name_set = {'position': "Position", "born": "Born", "number":"Number","nationality":"Nationality"} liverpool_df.rename(columns = name_set, inplace = True) liverpool_df
보기 편하게 행의 이름 또한 만들어 줍시다.
liverpool_df.index.name = "Player name" liverpool_df
행이 이름으로 나누어져 있는 경우, 동명이인이 있다면 중복될 수 있습니다.
바람직한 경우가 아닙니다.
Player name 행을 Number와 바꾸어 줍시다.
열에 "Player name" 데이터를 추가해줍니다.
liverpool_df["Player name"] = liverpool_df.index liverpool_df
인덱스를 "Number" 칼럼으로 바꾸어줍니다.
liverpool_df.set_index("Number", inplace = True)
짜잔 원하는 데이터 완성!
반응형'데이터 사이언스' 카테고리의 다른 글