
📚 오늘 배운 내용
1. 데이터 불러오기 및 기본 처리
- pandas를 사용하여 엑셀 파일에서 서울시 범죄 데이터를 불러왔습니다.
pd.read_excel()을 사용하여 데이터프레임으로 변환했습니다.
2. 데이터 전처리 과정
- 경찰서를 구별로 매핑
- 딕셔너리를 사용해서 경찰서 이름을 해당하는 구 이름으로 변환했습니다.
map()함수로 새로운 '구별' 컬럼을 만들었습니다.
- 데이터 구조 변경
pivot_table을 사용해서 경찰서별 데이터를 구별 데이터로 변경했습니다.- 같은 구에 있는 경찰서의 데이터는 합쳐졌습니다.
- 검거율 계산
- 각 범죄 유형(강간, 강도, 살인, 절도, 폭력)별 검거율을 계산했습니다.
- 검거율 = (검거 건수 / 발생 건수) * 100
- 불필요한 데이터 정리
- 필요없는 컬럼들을 삭제했습니다.
- 컬럼명을 더 간단하게 변경했습니다.
3. 인구 데이터 결합
- 구글 드라이브에서 서울시 인구 데이터를 불러왔습니다.
join을 사용해서 범죄 데이터와 인구 데이터를 결합했습니다.
🌟 새롭게 알게된 점
map()을 사용하면 딕셔너리로 데이터를 쉽게 변환할 수 있다는 것pivot_table을 사용하면 데이터 구조를 효과적으로 변경할 수 있다는 것join을 사용해서 서로 다른 데이터프레임을 결합할 수 있다는 것
💡 느낀 점
- pandas를 사용하면 복잡한 데이터도 효율적으로 처리할 수 있다는 것을 배웠습니다.
- 실제 데이터를 다루면서 데이터 전처리의 중요성을 깨달았습니다.
- 각 단계별로 데이터를 확인하면서 진행하니 실수를 줄일 수 있었습니다.
🔍 다음에 도전해보고 싶은 것
- 이 데이터를 시각화해보기
- 다른 종류의 공공데이터도 분석해보기
- 더 복잡한 데이터 전처리 작업 도전하기

'Python' 카테고리의 다른 글
| 클래스와 메서드 복습 (3) | 2024.12.21 |
|---|---|
| [TIL] 241212 함수와 클래스 보충 (4) | 2024.12.12 |
| [TIL] 241205 스택(Stack) 자료구조 (2) | 2024.12.05 |
| [TIL] 241202 return의 활용 (2) | 2024.12.02 |
| [TIL] 241113 (3) | 2024.11.13 |