폴더: 전처리 교통사고건수.csv => 원본교통사고건수_clear.csv => 전처리된 데이터교통사고건수_dirty.csv => 전처리된 데이터에 결측치, 이상치 추가 data.py => (결측치, 이상치 생성 + 전처리 + 저장) 전체 tkinter 코드 ㄴ파일 불러오기에 clear.csv로 결측치 5 => 0 (1%미만)이상치 76 => 0 (10% 수준) 이상치는 의도적으로 남겨두는 것과 제거하는 것을 구분 df_raw : 파일에서 불러온 원본 데이터 (절대 수정하지 않음)df_clean : 전처리 대상 데이터 (모든 전처리는 여기서만 수행)df_view : 현재 화면(Treeview)에 보여주는 데이터 Dirty 데이터 생성결측치 주입각 컬럼의 10% 행을 무작위 선택NaN으로..