❓ Split이란?
: 데이터 중 내가 원하는 기준에 있는 일부 데이터를 선택하는 것이다.
기존 값을 기준으로 split
이런 식의 데이터가 있을 때, key를 기준으로 split을 한다면 아래와 같이 같은 키를 가진 행끼리 나누어 진다.
key | data |
A | 0 |
A | 3 |
key | data |
B | 1 |
B | 4 |
key | data |
C | 2 |
C | 5 |
사용자가 정의한 값을 기준으로 split
기존에는 열중 하나의 값으로 겹치는 행끼리 split을 했다. 하지만 사용자가 직접 정의한 값을 기준으로 split을 할 수 있다.
위의 데이터가 있을 때 직접 정의한 L을 기준으로 값을 나눌 수 있다. 0은 0끼리, 1은 1끼리, 2는 2끼리 나눌 수 있다.
[0인 것들]
key | data1 | data2 |
A | 0 | 5 |
C | 2 | 3 |
C | 5 | 9 |
[1인 것들]
key | data1 | data2 |
B | 1 | 0 |
A | 3 | 3 |
[2인 것들]
key | data1 | data2 |
B | 4 | 7 |
'2학년 2학기 > 데이터 사이언스 입문' 카테고리의 다른 글
[pandas] Pivot Tables (0) | 2024.10.29 |
---|---|
[pandas] GroupBy: Apply (0) | 2024.10.29 |
데이터 프레임 필터링 방식 (0) | 2024.10.17 |
[pandas] Combining Datasets (0) | 2024.10.16 |
[pandas] Hierarchical Indexing(계층적 인덱싱) (0) | 2024.10.15 |