슬라이싱
-
python: pandas 라이브러리 정리Python 2021. 6. 6. 20:41
이전 포스팅에서 numpy 라이브러리를 알아보았고 데이터 처리에 있어서 강력한 기능을 제공하는 것을 확인했다. 하지만 numpy는 데이터의 속성을 표시하는 행이나 열의 레이블을 가지고 있지 않다는 한계가 있다. 그래서 pandas 라는 라이브러리를 사용하는데 이를 이용하면 행과 열로 구조화하여 엑셀과 같은 데이터를 효과적으로 처리할 수 있다. 판다스의 개요 1. 특징 - 빠르고 효율적이며 다양한 표현력을 갖춘 자료구조 - 다양한 형태의 데이터에 적합 - 데이터프레임을 이용한 2차원 데이터 표현 2. 장점 - 결측 데이터 처리 - 데이터 추가 삭제 - 데이터 정렬과 다양한 데이터 조작 3. 판다스가 하는 일 - 데이터 불러오기 및 저장하기 - 데이터 보기 및 검사 - 필터, 정렬 및 그룹화 - 데이터 정제..
-
Python: numpy 라이브러리 정리(indexing, slicing, 정규분포 난수)Python 2021. 5. 30. 21:13
데이터 처리 시 리스트 간의 다양한 연산이 필요하지만 파이썬 기본 리스트는 이러한 기능이 부족하며 연산 속도도 빠르지 않다. 넘파이는 파이썬에서 수치 데이터를 다루는 가장 기본적이고 강력한 패키지로써 pandas, scikit-learn, tensorflow등이 넘파이 위에서 동작한다. 넘파이는 ndarray를 사용하는데 이는 C 언어에 기반한 배열 구조로써 메모리를 적게 차지하며 속도가 빠르다. 또한 고급 연산자와 풍부한 함수를 제공한다. 1. 다차원 배열(ndarray)의 속성 # ndarray를 이용한 연산 import numpy as np a = np.array(range(1, 11)) b = np.array(range(10, 20)) print(a) print(b) print(a+b) print..
-
Python: 리스트와 문자열을 비교해보자!Python 2020. 6. 28. 14:39
파이썬에서 리스트와 문자열은 굉장히 비슷합니다. 리스트가 어떤 자료형들의 나열이라면, 문자열은 문자들의 나열이라고 할 수 있습니다. 리스트와 문자열이 어떻게 같고 다른지 정리해보겠습니다. 우선 공통점부터! # 알파벳 리스트의 인덱싱 alphabets_list = ['P', 'A', 'N', 'D', 'A'] print(alphabets_list[0]) print(alphabets_list[1]) print(alphabets_list[4]) print(alphabets_list[-1]) # 알파벳 문자열의 인덱싱 alphabets_string = 'PANDA' print(alphabets_string[0]) print(alphabets_string[1]) print(alphabets_string[4]) p..