[pandas] pandas - Series
1. 시리즈 생성, 구조확인 Pandas의 Series는 1차원 배열로서 인덱스(index) 사용 가능 문자 인덱스 사용 가능 데이터 타입 존재 (dtype) import numpy as np import pandas as pd from pandas import Series, DataFrame #Series? # ndarray 기반의 일차원 배열이다. ser = Series([1,2,3,4,5]) ser ''' 0 1 1 2 2 3 3 4 4 5 dtype: int64 ''' ser.shape # (5,) ser = Series([1, '2', 3,0, '네 번째', 5]) # 데이터 타입 맞춰야 하지만 섞어서 입력 ser ''' 0 1 1 2 2 3 3 0 4 네 번째 5 5 dtype: object ..
2022. 4. 2.
[Numpy] Numpy 배열의 통계함수
sum 합 min 최소값 max 최대값 mean 평균 median 중간값 quantile arr의 제 1사분위수(0.25), 중앙값(0.5), 제 3사분위수(0,75) 값을 반환 std 표준편차, 분산의 제곱근 var 분산, variance, 데이타가 펴져 있는 정도를 수치화 한 것 corrcoef 상관관계 import numpy as np arr = np.arange(1, 13).reshape(3,4) arr ''' array([[ 1, 2, 3, 4], [ 5, 6, 7, 8], [ 9, 10, 11, 12]]) ''' np.sum(arr) # 78 # 행 방향으로 총합 arr.sum(axis=1) # array([10, 26, 42]) np.sum(arr, axis=1) # array([10, 26..
2022. 4. 2.
[Numpy] Numpy 배열의 정렬
정렬 함수 np.sort(ndarray) ndarray.sort() np 자체에 존재하는 정렬 함수 np.sort(ndarray), 배열을 정렬, 재대입 해주지 않으면 정렬이 유지되지 않음, 원본 유지, 반환값 있음, 원본 array에 재할당 해줘야 함 ndarray를 파이썬 기본 ndarray.sort() 함수 사용, 배열 자체를 정렬하면서 동시에 원본 변경, 반환값 없음, 자동으로 array에 정렬되어 재할당 원본 데이터의 훼손을 방지하기 위해 반환값 있고, 없고, 원본에 바로 반영하고, 안 하고 나누어 사용 📍 np.sort(arr) 를 사용하여 원본을 훼손하지 않게끔 하는 방식 추천 arr3 = np.array([1, 10, 5, 8, 2, 4, 3, 8, 9, 10]) # 1. np의 기본 정렬..
2022. 4. 2.