str 속성을 이용해서 address에서 도시와 구를 추출했다. 도시는 앞에서 2글자만 추출해서 뒤에 시를 붙였다. 구는 split()을 통해서 각 행의 첫번째 요소를 구로 설정했다.
1. 우선 date열의 타입을 to_datetime를 활용해서 datetime 타입으로 변경한다.
2. 명시적 인덱싱을 이용하기 위해서 타입을 변경한 date 열을 인덱스로 설정한다.
3. 1번은 슬라이싱, 2번은 인덱싱을 했다.
4. 중요한건 3번과 4번인데 timestamp(시점)를 만들고 timedelta(특정 기간)을 만들어서 더해준다. 특정 기간은 Hour기준, Day 기준, Week 기준, Year 기준 등을 토대로 만들수 있다.
이 부분은 .dt.strftime(지시자) 형식으로 컬럼을 생성했다.
'2학년 2학기 > 데이터 사이언스 입문' 카테고리의 다른 글
[Visualization] LinePlot (0) | 2024.11.26 |
---|---|
.dt를 사용하는 이유 (0) | 2024.11.07 |
[pandas] 고성능 Pandas: Eval & Query (0) | 2024.11.05 |
[pandas] 날짜 / 시간 데이터 다루기(Time stamp, Time interval, Time duration) (0) | 2024.11.05 |
[pandas] 문자열 Vectorized 연산 (0) | 2024.11.05 |