데이터 사이언스
-
데이터 사이언스: Pandas 잘못된 데이터 고치기 (rename, set_index)데이터 사이언스 2020. 7. 25. 13:15
잘못된 데이터를 고쳐가면서 pandas를 공부해 봅시다 다음과 같은 데이터가 있습니다. import pandas as pd liverpool_df = pd.read_csv("Downloads/liverpool.csv", index_col = 0) liverpool_df 칼럼들의 이름 첫 시작을 대문자로 바꾸어 줍시다. name_set = {'position': "Position", "born": "Born", "number":"Number","nationality":"Nationality"} liverpool_df.rename(columns = name_set, inplace = True) liverpool_df 보기 편하게 행의 이름 또한 만들어 줍시다. liverpool_df.index.name = ..
-
데이터 사이언스: numpy 기본사용법과 인덱싱(Indexing) 공부하기!데이터 사이언스 2020. 7. 18. 04:13
numpy란? numpy는 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원을 해주는 파이썬의 라이브러리이다. import numpy as np np_array = np.array([1, 2, 3, 4, 5, 6]) np_array array([1, 2, 3, 4, 5, 6]) numpy를 사용하기 위해서 import numpy as np를 해줍니다. 주로 numpy를 매번 쓰기 힘드니까 편하게 np라고 선언해줍니다. (국룰입니다) np_array.shape = (2, 3) np_array array([[1, 2, 3], [4, 5, 6]]) (2, 3)의 크기로 행렬을 재배치해서 나타냅니다. np_array.shape = (m,n)이라 할 때, np_a..