Python/데이터 분석

[Numpy] Numpy 배열의 통계함수

snow_white 2022. 4. 2. 21:40
  • sum 합
  • min 최소값
  • max 최대값
  • mean 평균
  • median 중간값
  • quantile arr의 제 1사분위수(0.25), 중앙값(0.5), 제 3사분위수(0,75) 값을 반환
  • std 표준편차, 분산의 제곱근
  • var 분산, variance, 데이타가 펴져 있는 정도를 수치화 한 것
  • corrcoef 상관관계
import numpy as np
arr = np.arange(1, 13).reshape(3,4)
arr
'''
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])
'''

np.sum(arr) # 78

# 행 방향으로 총합
arr.sum(axis=1) # array([10, 26, 42])
np.sum(arr, axis=1) # array([10, 26, 42])

# 열 방향으로 총합
arr.sum(axis=0) # array([15, 18, 21, 24])

arr.mean() # 6.5
# 열 방향으로 평균
arr.mean(axis=1) # array([ 2.5,  6.5, 10.5])

arr.max() # 12
# 행 방향으로 최대값
arr.max(axis=0) # array([ 9, 10, 11, 12])

arr.min() # 1

arr.var() # 11.916666666666666
np.sqrt(arr.var()) # 분산값을 인자로 넣어 표준편차 구하기, 3.452052529534663
arr.std() # std() 함수로 표준편차 구하기