본문 바로가기
2학년 2학기/데이터 사이언스 입문

데이터 프레임 필터링 방식

by kkkkk1023 2024. 10. 17.

1. 기본적인 열 선택

df[]는 기본적으로 을 선택할 때 사용됩니다.

# 하나의 열 선택
df['column_name']

# 여러 열 선택
df[['column1', 'column2']]

 

 

2. loc[]: 명시적 인덱스 및 열 이름 사용

 

행 선택

# 특정 인덱스(행) 선택
df.loc[2012]  # 2012년 데이터 선택

 

열 선택

# 특정 열 선택
df.loc[:, 'column_name']  # 모든 행에서 'column_name' 열만 선택

 

행과 열 동시 선택

# 특정 인덱스와 열 동시 선택
df.loc[2012, 'column_name']  # 2012년의 'column_name' 데이터를 선택

 

조건을 활용한 필터링

# 조건을 활용하여 필터링
df.loc[df['state/region'] == 'GA']  # 'state/region'이 'GA'인 행을 선택

 

 

3. 조건문 사용

 

# 조건을 활용하여 데이터 필터링
filtered_data = df.loc[(df['state/region'] == 'GA') & (df.index == 2012)]

 

 

 

4. 특정 조건을 만족하는 행(열)의 열(행)에 값 할당

 

[조건, '열']: 특정 조건을 만족하는 행의 특정 열 값을 할당

: 행을 조건으로 필터링하고 열의 값을 변경하거나 할당하는 경우

 

 

['행', 조건]: 특정 조건을 만족하는 열의 각 행 값을 할당

: 열을 조건으로 필터링하고, 해당하는 행의 값을 변경하거나 할당하는 경우

'2학년 2학기 > 데이터 사이언스 입문' 카테고리의 다른 글

[pandas] GroupBy: Apply  (0) 2024.10.29
[pandas] GroupBy: Split  (0) 2024.10.29
[pandas] Combining Datasets  (0) 2024.10.16
[pandas] Hierarchical Indexing(계층적 인덱싱)  (0) 2024.10.15
개인_실습(DataFrame)  (0) 2024.10.10