본문 바로가기

그있잖아왜 바로가기

Python

[TIL] 241203 파이썬 데이터 분석

by 좌우지간에 2024. 12. 3.

\

📚 오늘 배운 내용

1. 데이터 불러오기 및 기본 처리

pandas를 사용하여 엑셀 파일에서 서울시 범죄 데이터를 불러왔습니다.
pd.read_excel()을 사용하여 데이터프레임으로 변환했습니다.

2. 데이터 전처리 과정

경찰서를 구별로 매핑
- 딕셔너리를 사용해서 경찰서 이름을 해당하는 구 이름으로 변환했습니다.
- map() 함수로 새로운 '구별' 컬럼을 만들었습니다.
데이터 구조 변경
- pivot_table을 사용해서 경찰서별 데이터를 구별 데이터로 변경했습니다.
- 같은 구에 있는 경찰서의 데이터는 합쳐졌습니다.
검거율 계산
- 각 범죄 유형(강간, 강도, 살인, 절도, 폭력)별 검거율을 계산했습니다.
- 검거율 = (검거 건수 / 발생 건수) * 100
불필요한 데이터 정리
- 필요없는 컬럼들을 삭제했습니다.
- 컬럼명을 더 간단하게 변경했습니다.

3. 인구 데이터 결합

구글 드라이브에서 서울시 인구 데이터를 불러왔습니다.
join을 사용해서 범죄 데이터와 인구 데이터를 결합했습니다.

🌟 새롭게 알게된 점

map()을 사용하면 딕셔너리로 데이터를 쉽게 변환할 수 있다는 것
pivot_table을 사용하면 데이터 구조를 효과적으로 변경할 수 있다는 것
join을 사용해서 서로 다른 데이터프레임을 결합할 수 있다는 것

💡 느낀 점

pandas를 사용하면 복잡한 데이터도 효율적으로 처리할 수 있다는 것을 배웠습니다.
실제 데이터를 다루면서 데이터 전처리의 중요성을 깨달았습니다.
각 단계별로 데이터를 확인하면서 진행하니 실수를 줄일 수 있었습니다.

🔍 다음에 도전해보고 싶은 것

이 데이터를 시각화해보기
다른 종류의 공공데이터도 분석해보기
더 복잡한 데이터 전처리 작업 도전하기

'Python' 카테고리의 다른 글

클래스와 메서드 복습 (3)	2024.12.21
[TIL] 241212 함수와 클래스 보충 (4)	2024.12.12
[TIL] 241205 스택(Stack) 자료구조 (2)	2024.12.05
[TIL] 241202 return의 활용 (2)	2024.12.02
[TIL] 241113 (3)	2024.11.13

공지사항

최근글

인기글

최근댓글

태그

티스토리챌린지 오블완

전체 방문자

Today :

Yesterday :

티스토리툴바