본문 바로가기
2학년 2학기/데이터 사이언스 입문

[pandas] GroupBy: Split

by kkkkk1023 2024. 10. 29.
❓ Split이란?

: 데이터 중 내가 원하는 기준에 있는 일부 데이터를 선택하는 것이다. 

 

 

 

 

 

기존 값을 기준으로 split

이런 식의 데이터가 있을 때, key를 기준으로 split을 한다면 아래와 같이 같은 키를 가진 행끼리 나누어 진다.

key data
A 0
A 3

 

key data
B 1
B 4

 

key data
C 2
C 5

 

 

 

 

사용자가 정의한 값을 기준으로 split

기존에는 열중 하나의 값으로 겹치는 행끼리 split을 했다. 하지만 사용자가 직접 정의한 값을 기준으로 split을 할 수 있다.

 

위의 데이터가 있을 때 직접 정의한 L을 기준으로 값을 나눌 수 있다.  0은 0끼리, 1은 1끼리, 2는 2끼리 나눌 수 있다.

 

[0인 것들]

key data1 data2
A 0 5
C 2 3
C 5 9


[1인 것들]

key data1 data2
B 1 0
A 3 3


[2인 것들]

key data1 data2
B 4 7