본문 바로가기
2학년 2학기/데이터 사이언스 입문

[pandas] 데이터 인덱싱과 접근

by kkkkk1023 2024. 10. 8.

1. Series에서의 데이터 접근 및 값 변경

 

아래와 같은 Series가 있을 때를 가정하고 여러 데이터 접근 방식에 대해서 살펴보자.

 

[index]를 통한 접근 및 변경

 


 

슬라이싱을 통한 값 접근

 

1) 명시적 인덱스

: 사용자가 배열을 생성할 때 같이 작성해주는 인덱스. 예를 들면 'a', 'b', 'c'와 같은 인덱스

 

명시적 인덱스로 슬라이싱을 진행하면 끝 인덱스의 요소를 포함한다.

 

 

 

2) 암시적 인덱스

: 배열을 생성하면 자동으로 작성되는 0, 1, 2, 3과 같은 인덱스

 

암시적 인덱스로 슬라이싱을 진행하면 끝 인덱스의 요소를 포함하지 않는다.

 

 

 


 

마스킹(조건)을 통한 값 접근

 

 

데이터의 특정한 조건을 통해 해당 조건에 true인 값을 추출한다.

 


 

팬시 인덱싱(특정 인덱스 추출)을 통한 값 접근

 

특정 인덱스를 작성해서 그 인덱스에 있는 요소를 추출한다.


 

🚨혼란을 줄 수 있는 예시 - []🚨

data[1] ➡️ 명시적 인덱스를 사용
data[1:3] ➡️ 암시적 인덱스를 사용

 

 

2. Indexer 기반의 "명확한" 데이터 접근

: 명시적 인덱스(explict index)를 통해서 접근을 할지, 암시적 인덱스(implict index)를 통해서 접근할지 사용자가 명시적으로 프로그래밍 할 수 있는 속성

 

 

 

loc

: 명시적 인덱스(explict index)를 사용하려고 확실하게 표현하는 경우

즉, 사용자가 정한 인덱스를 통해서 접근하려고 하는 경우

 

 


iloc

: 암시적 인덱스(implict index)를 사용하려고 확실하게 표현하는 경우

즉, 시스템이 자동으로 부여한 인덱스를 통해서 접근하려고 하는 경우

 

 

 

 

 

3. DataFrame에서의 데이터 선택

 

 

이런 데이터가 있을 때를 가정해보자.

 

행을 선택하는 데이터 선택

1. 슬라이싱

2. 마스킹

3. 팬시 인덱싱


열을 선택하는 데이터 선택

1. .index

2. [index]