본문 바로가기

Report

7/3(월) IT K-DT / 과제 - 자유주제 데이터 분석

 
 
  • < 챗봇 제작 프로젝트 관련 단계별 수행내용>
  • 0. 주제선정 // 사회현상을 주제로 하는 것이 유리. 2~3개정도 추려 강사님과 협의.
    1. 데이터 수집 // 강사님과 협의할 때 이 부분까지 고려해오기. (데이터 존재여부의 확인까지만)
    (제출 데드라인: 영업일 10일 예정)
    2. 배경 // 뉴스기사 나열로 흥미를 도출
    3. 현재, 개선
    4. 분석 계획 및 방법 // '머신러닝 모델'을 고려해보았다는 내용 추가
    5. 분석 결과
    6. 개선안(트러블슈팅), 아쉬운점 등과제의 일종으로 진행하여 발표(7/3)까지 가질 예정.

 


과제 공부 과정

 

주제1: '범죄율' 관련 데이터 분석 후 저감 방안 제시.
선정배경: 최근 발생한 '정유정 사건' 및 강력범죄 발생에 따른 국민들의 지속적인 불안감 대두.
진행과정: 지역별/장소별 5대범죄 발생 현황 및 연도별 발생 내역을 학습하여 범죄 패턴을 분석하고 예측하는 회귀 모델 구축.
사용 가능 데이터:
  1) https://www.data.go.kr/data/15054737/fileData.do (경찰청 5대범죄 발생 장소별 현황 데이터)
  2) https://www.data.go.kr/data/3074463/fileData.do (경찰청 범죄 발생 장소별 통계)
   3) https://www.data.go.kr/data/15085725/fileData.do (대검찰청 장소별 범죄건수 통계)
  4) https://www.data.go.kr/data/3074459/fileData.do (경찰청 범죄발생 시간대 및 요일 통계)
기대효과: 특정 지역이나 시간대에서의 범죄 발생 가능성을 예측하고 이에 대한 행정력의 효율적 할당 가능.
주의점: 범죄와 관련된 데이터는 민감한 정보를 포함할 수 있으므로 개인정보 보호 및 데이터 이용에 관련된 법률과 윤리적인 측면의 고려 필요.

 

주제2: '분리수거' 관련 데이터 분석 후 환경오염 최소화 방안 제시
선정배경: 환경오염에 대한 지속적인 중요성 언급 및 이에 대한 기본적인 대책으로 분리수거가 빈번하게 제시됨.
진행과정: 쓰레기 분리수거와 관련된 데이터를 분석하여 어떤 종류의 쓰레기가 가장 많이 발생하는지,
 어떤 지역이 분리수거를 가장 잘 실천하고 있는지 등을 확인하고 예측하는 회귀 모델 구축.
사용 가능 데이터:
  1) https://stat.me.go.kr/portal/stat/easyStatPage.do (환경통계포털)
기대효과: 분리수거 교육 및 캠페인을 해당 지역이나 특정 쓰레기 종류에 맞게 집중적으로 실시하여 효율적인 분리수거 유도 가능.
 개인별 또는 지역별로 맞춤형 분리수거 가이드라인 제시 가능.

 

주제3: '저출산' 관련 데이터 분석 후 대책 제시
선정배경: 최근 대한민국에서 저출산이 심각한 사회문제로 부각
진행과정: 인구통계, 교육수준, 경제지표, 지역별 차이 등의 요인과 저출산율 사이의 상관관계를 분석하여
  저출산의 주요 원인을 식별하고 예측하는 회귀 모델 구축.
사용 가능 데이터:
  1) https://www.betterfuture.go.kr/front/policySpace/statistics.do (저출산고령사회위원회 통계지표)
  2) https://www.index.go.kr/unity/potal/main/EachDtlPageDetail.do?idx_cd=1428 (e-나라지표 합계출산율)
  3) https://kosis.kr/search/search.do?query=%ED%95%A9%EA%B3%84%EC%B6%9C%EC%82%B0%EC%9C%A8 (통계청 인구동향조사)
기대효과:  인구 및 출산율 감소에 영향을 미치는 요인을 파악하고, 이를 대상으로 정책 개발과 교육/지원 프로그램을 제시.
 지역 간 출산율 차이의 이유를 이해하고, 해당 지역에서 저출산 문제에 대응하는 정책을 개발하여 지역 사회의 출산 의지를 증진.