본문 바로가기
2학년 2학기/데이터 사이언스 입문

Numpy - random

by kkkkk1023 2024. 9. 26.

표준편차

: 표준편차는 데이터의 흩어짐 정도를 나타내는 통계적 지표이다. 평균을 기준으로 데이터가 얼마나 퍼져 있는지를 측정한다. 값들이 평균에 가까울수록 표준편차는 작고, 값들이 평균에서 멀리 떨어져 있을수록 표준편차는 크다.

 

쉽게 말해, 표준편차가 크면 데이터가 넓게 퍼져 있고, 표준편차가 작으면 데이터가 평균에 가까이 모여 있다는 것을 의미한다.


정규분포

: 데이터가 평균을 중심으로 좌우 대칭을 이루며 종 모양을 띠는 분포


1. np.random.random(shape)

: 0과 1 사이의 균일 분포에서 난수를 생성하는 함수로, 지정된 모양(shape)의 배열을 반환함.

 

# (2, 2) 크기의 0과 1 사이의 난수 배열 생성
arr = np.random.random((2, 2))
print(arr)


# - 결과 - 
# array([[0.65879202, 0.99945692],
#       [0.32465524, 0.67843267]])

 


2. np.random.normal(loc=0.0, scale=1.0, size=None)

: 정규 분포(가우시안 분포)를 따르는 난수를 생성하는 함수. 정규 분포는 평균과 표준 편차를 기준으로 난수를 생성함.

 

# 평균 0, 표준 편차 1인 정규 분포를 따르는 (2, 3) 크기의 난수 배열 생성
arr = np.random.normal(0, 1, (2, 3))
print(arr)


# - 결과 - 
#array([[ 0.50842924, -0.99774645,  1.15752283],
#       [-1.23203801,  0.83413653,  0.24523477]])

 


3. np.random.randint(low, high=None, size=None)

: 지정된 범위 내에서 정수 난수를 생성하는 함수. low부터 high까지의 범위에서 정수를 무작위로 반환함.

 

# 0부터 10까지(10 미포함) 무작위로 정수 생성, 크기는 (2, 3) 배열
arr = np.random.randint(0, 10, (2, 3))
print(arr)


# - 결과 - 
# array([[3, 1, 7],
#       [8, 5, 0]])