본문 바로가기
Python

[TIL] 241203 파이썬 데이터 분석

by 좌우지간에 2024. 12. 3.

 

 

\

📚 오늘 배운 내용

1. 데이터 불러오기 및 기본 처리

  •  pandas를 사용하여 엑셀 파일에서 서울시 범죄 데이터를 불러왔습니다.
  •  pd.read_excel()을 사용하여 데이터프레임으로 변환했습니다.

2. 데이터 전처리 과정

  1. 경찰서를 구별로 매핑
    • 딕셔너리를 사용해서 경찰서 이름을 해당하는 구 이름으로 변환했습니다.
    • map() 함수로 새로운 '구별' 컬럼을 만들었습니다.
  2. 데이터 구조 변경
    • pivot_table을 사용해서 경찰서별 데이터를 구별 데이터로 변경했습니다.
    • 같은 구에 있는 경찰서의 데이터는 합쳐졌습니다.
  3. 검거율 계산
    • 각 범죄 유형(강간, 강도, 살인, 절도, 폭력)별 검거율을 계산했습니다.
    • 검거율 = (검거 건수 / 발생 건수) * 100
  4. 불필요한 데이터 정리
    • 필요없는 컬럼들을 삭제했습니다.
    • 컬럼명을 더 간단하게 변경했습니다.

3. 인구 데이터 결합

  • 구글 드라이브에서 서울시 인구 데이터를 불러왔습니다.
  • join을 사용해서 범죄 데이터와 인구 데이터를 결합했습니다.

🌟 새롭게 알게된 점

  1. map()을 사용하면 딕셔너리로 데이터를 쉽게 변환할 수 있다는 것
  2. pivot_table을 사용하면 데이터 구조를 효과적으로 변경할 수 있다는 것
  3. join을 사용해서 서로 다른 데이터프레임을 결합할 수 있다는 것

💡 느낀 점

  • pandas를 사용하면 복잡한 데이터도 효율적으로 처리할 수 있다는 것을 배웠습니다.
  • 실제 데이터를 다루면서 데이터 전처리의 중요성을 깨달았습니다.
  • 각 단계별로 데이터를 확인하면서 진행하니 실수를 줄일 수 있었습니다.

🔍 다음에 도전해보고 싶은 것

  • 이 데이터를 시각화해보기
  • 다른 종류의 공공데이터도 분석해보기
  • 더 복잡한 데이터 전처리 작업 도전하기

'Python' 카테고리의 다른 글

클래스와 메서드 복습  (3) 2024.12.21
[TIL] 241212 함수와 클래스 보충  (4) 2024.12.12
[TIL] 241205 스택(Stack) 자료구조  (2) 2024.12.05
[TIL] 241202 return의 활용  (2) 2024.12.02
[TIL] 241113  (3) 2024.11.13