본문 바로가기
Python/데이터 분석

[Numpy] Numpy 배열의 통계함수

by snow_white 2022. 4. 2.
  • sum 합
  • min 최소값
  • max 최대값
  • mean 평균
  • median 중간값
  • quantile arr의 제 1사분위수(0.25), 중앙값(0.5), 제 3사분위수(0,75) 값을 반환
  • std 표준편차, 분산의 제곱근
  • var 분산, variance, 데이타가 펴져 있는 정도를 수치화 한 것
  • corrcoef 상관관계
import numpy as np
arr = np.arange(1, 13).reshape(3,4)
arr
'''
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])
'''

np.sum(arr) # 78

# 행 방향으로 총합
arr.sum(axis=1) # array([10, 26, 42])
np.sum(arr, axis=1) # array([10, 26, 42])

# 열 방향으로 총합
arr.sum(axis=0) # array([15, 18, 21, 24])

arr.mean() # 6.5
# 열 방향으로 평균
arr.mean(axis=1) # array([ 2.5,  6.5, 10.5])

arr.max() # 12
# 행 방향으로 최대값
arr.max(axis=0) # array([ 9, 10, 11, 12])

arr.min() # 1

arr.var() # 11.916666666666666
np.sqrt(arr.var()) # 분산값을 인자로 넣어 표준편차 구하기, 3.452052529534663
arr.std() # std() 함수로 표준편차 구하기

'Python > 데이터 분석' 카테고리의 다른 글

[pandas] pandas - Series  (0) 2022.04.02
[pandas] pandas - Series, DataFrame  (0) 2022.04.02
[Numpy] Numpy 배열의 정렬  (0) 2022.04.02
[Numpy] Numpy 배열의 Indexing & Slicing  (0) 2022.04.02
[Numpy] Numpy 배열의 연산  (0) 2022.04.02

댓글