배열
-
데이터 사이언스: Pandas 시리즈(Series)와 데이터 프레임(Data Frame) 공부하기!데이터 사이언스 2020. 7. 21. 00:52
Pandas에서 제공하는 라이브러리인 시리즈(Series)와 데이터프레임(DataFrame)을 공부하겠습니다. 판다스에는 일차원 데이터를 위한 시리즈(Series)와 고차원 배열을 다루기 위한 데이터프레임(Data Frame)이 있습니다. 그리고 이 판다스를 통해서 SQL, 엑셀파일, csv파일을 가져와 데이터를 활용할 수 있죠 시리즈는 1차원 배열의 데이터를 다루는 자료구조입니다. 시리즈와 1차원 넘파이(numpy)배열은 유사하지만 판다스에서 더 많은 기능을 제공합니다. 시리즈는 파이썬의 딕셔너리와 유사해서 이와 연관지으면 이해하기 쉽습니다. 예를 들어 딕셔너리에서 key와 value가 있다면 시리즈에서는 index와 data가 있습니다. 다만 시리즈의 경우에는 행렬로 표현..
-
데이터 사이언스: numpy 기본사용법과 인덱싱(Indexing) 공부하기!데이터 사이언스 2020. 7. 18. 04:13
numpy란? numpy는 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원을 해주는 파이썬의 라이브러리이다. import numpy as np np_array = np.array([1, 2, 3, 4, 5, 6]) np_array array([1, 2, 3, 4, 5, 6]) numpy를 사용하기 위해서 import numpy as np를 해줍니다. 주로 numpy를 매번 쓰기 힘드니까 편하게 np라고 선언해줍니다. (국룰입니다) np_array.shape = (2, 3) np_array array([[1, 2, 3], [4, 5, 6]]) (2, 3)의 크기로 행렬을 재배치해서 나타냅니다. np_array.shape = (m,n)이라 할 때, np_a..