데이터 사이언스
-
데이터 사이언스: Pandas 데이터(csv파일) 받아오기, 인덱싱(Indexing), 데이터 변형 공부하기!데이터 사이언스 2020. 7. 24. 22:50
1. 판다스(Pandas)로 데이터 받아오기 판다스 내부 메소드 read_csv()로 .csv 파일을 가져온다. import pandas as pd df_iphone = pd.read_csv("Downloads/iphone.csv", index_col = 0) # index_col = 0 첫번째 칼럼을 인덱스로 한다는 의미 df_iphone 2.1 판다스(Pandas) loc 인덱싱 df.loc["a", "b"] = 행이 "a"이고, 열이 "b"인 값을 가져온다. (loc는 location을 의미) df_iphone.loc["iPhone 8"] # "iPhone8" 행을 가져온다 출시일 2017-09-22 디스플레이 4.7 메모리 2GB 출시 버전 iOS 11.0 Face ID No Name: iPhon..
-
데이터 사이언스: Pandas 시리즈(Series)와 데이터 프레임(Data Frame) 공부하기!데이터 사이언스 2020. 7. 21. 00:52
Pandas에서 제공하는 라이브러리인 시리즈(Series)와 데이터프레임(DataFrame)을 공부하겠습니다. 판다스에는 일차원 데이터를 위한 시리즈(Series)와 고차원 배열을 다루기 위한 데이터프레임(Data Frame)이 있습니다. 그리고 이 판다스를 통해서 SQL, 엑셀파일, csv파일을 가져와 데이터를 활용할 수 있죠 시리즈는 1차원 배열의 데이터를 다루는 자료구조입니다. 시리즈와 1차원 넘파이(numpy)배열은 유사하지만 판다스에서 더 많은 기능을 제공합니다. 시리즈는 파이썬의 딕셔너리와 유사해서 이와 연관지으면 이해하기 쉽습니다. 예를 들어 딕셔너리에서 key와 value가 있다면 시리즈에서는 index와 data가 있습니다. 다만 시리즈의 경우에는 행렬로 표현..
-
데이터 사이언스: numpy 연산과 통계 값들 구하기(표준편차, 분산, 평균, 중앙값...)데이터 사이언스 2020. 7. 18. 19:45
기존 파이썬 리스트의 연산과는 달리 numpy 배열의 연산은 배열 원소들간의 사칙 연산입니다. 각 위치마다 정해진 값을 따로 연산하기 때문에 numpy배열의 모양(shape)이 다른 경우에는 연산이 되지 않아 오류가 뜹니다. 따라서 numpy배열끼리의 사칙연산을 코딩하기 위해서는 우선적으로 각 배열의 shape을 확인하여야 합니다. import numpy as np x = np.arange(10) y = np.arange(10,20) print(x) print(y) [0 1 2 3 4 5 6 7 8 9] [10 11 12 13 14 15 16 17 18 19] numpy 라이브러리를 추가해주고 리스트 x와 y를 만들어줍시다. x + 2 array([ 2, 3, 4, 5, 6,..
-
데이터 사이언스: numpy 기본사용법과 인덱싱(Indexing) 공부하기!데이터 사이언스 2020. 7. 18. 04:13
numpy란? numpy는 행렬이나 일반적으로 대규모 다차원 배열을 쉽게 처리할 수 있도록 지원을 해주는 파이썬의 라이브러리이다. import numpy as np np_array = np.array([1, 2, 3, 4, 5, 6]) np_array array([1, 2, 3, 4, 5, 6]) numpy를 사용하기 위해서 import numpy as np를 해줍니다. 주로 numpy를 매번 쓰기 힘드니까 편하게 np라고 선언해줍니다. (국룰입니다) np_array.shape = (2, 3) np_array array([[1, 2, 3], [4, 5, 6]]) (2, 3)의 크기로 행렬을 재배치해서 나타냅니다. np_array.shape = (m,n)이라 할 때, np_a..
-
데이터 사이언스: Jupyter Notebook! 알아두면 유용한 기본단축키와 Markdown 활용법!데이터 사이언스 2020. 7. 14. 00:16
Ctrl-Enter : run cell (셀 실행) Alt-Enter : run cells and insert below(셀 실행) Shift-Enter : run cells and select below (셀 실행) A : insert cell above (상단에 셀 추가) B : insert cell below (하단에 셀 추가) D,D : delete selected cell (선택된 셀 삭제) X : cut selected cell (셀 잘라내기) C : copy selected cell (셀 복사) Shift-M : merge cell below (하단 셀과 합치기) Shift-V : paste cell above (상단에 붙여넣기) V : p..