본문 바로가기
2학년 2학기/데이터 사이언스 입문

[pandas] Series, DataFrame에서의 산술 연산

by print_soo 2024. 10. 8.

1. 기본적인 산술 연산 규칙 (Ufunc Rule)

시리즈나 데이터프레임에서 산술 연산을 할 때, 기본적으로 **Ufunc (Universal Functions)**의 규칙이 적용됩니다. 즉, 같은 크기와 모양을 가진 두 데이터 구조가 있다면 각각 대응되는 값들끼리 연산이 수행됩니다.

 

 

 

2. 인덱스 정렬 (Index Alignment)

 

시리즈 간 또는 데이터프레임의 열 간 연산을 할 때, 인덱스 정렬이 먼저 수행됩니다. 두 데이터 구조의 인덱스 합집합을 구한 뒤, 각 인덱스에 대해 연산이 수행되며, 만약 한 쪽에만 존재하는 인덱스가 있다면 그 결과는 NaN (Not a Number)으로 표시됩니다.

 

 

 

 

 

3. 데이터프레임 간 연산: 브로드캐스팅 (Broadcasting)

데이터프레임 간 연산에서도 기본적으로 브로드캐스팅(Broadcasting) 규칙이 적용됩니다. 브로드캐스팅은 차원이 작은 배열이 큰 배열에 맞춰 확장되는 규칙을 의미합니다. 데이터프레임 간 연산에서는 열 단위로 계산이 이루어지며, 만약 두 데이터프레임의 차원이 맞지 않으면, 차원이 작은 쪽이 자동으로 확장됩니다.