❓ Split이란?
: 데이터 중 내가 원하는 기준에 있는 일부 데이터를 선택하는 것이다.

기존 값을 기준으로 split

이런 식의 데이터가 있을 때, key를 기준으로 split을 한다면 아래와 같이 같은 키를 가진 행끼리 나누어 진다.
| key | data |
| A | 0 |
| A | 3 |
| key | data |
| B | 1 |
| B | 4 |
| key | data |
| C | 2 |
| C | 5 |
사용자가 정의한 값을 기준으로 split
기존에는 열중 하나의 값으로 겹치는 행끼리 split을 했다. 하지만 사용자가 직접 정의한 값을 기준으로 split을 할 수 있다.

위의 데이터가 있을 때 직접 정의한 L을 기준으로 값을 나눌 수 있다. 0은 0끼리, 1은 1끼리, 2는 2끼리 나눌 수 있다.
[0인 것들]
| key | data1 | data2 |
| A | 0 | 5 |
| C | 2 | 3 |
| C | 5 | 9 |
[1인 것들]
| key | data1 | data2 |
| B | 1 | 0 |
| A | 3 | 3 |
[2인 것들]
| key | data1 | data2 |
| B | 4 | 7 |
'2학년 2학기 > 데이터 사이언스 입문' 카테고리의 다른 글
| [pandas] Pivot Tables (0) | 2024.10.29 |
|---|---|
| [pandas] GroupBy: Apply (0) | 2024.10.29 |
| 데이터 프레임 필터링 방식 (0) | 2024.10.17 |
| [pandas] Combining Datasets (0) | 2024.10.16 |
| [pandas] Hierarchical Indexing(계층적 인덱싱) (0) | 2024.10.15 |