개요
역삼동의 1월 한달간 지역별 Acquistion 산출해주실래요?
특정 행정구역을 기준으로 이런 요청이 종종 발생하는데. 이는 기본적으로 지역별로 시장점유율이 다르기 때문입니다. 그 때문에 지역별로 다르게 전략을 설계할 수도 있죠 그런데 문제는 이 때 발생합니다.
어.. 그럼 역삼동의 1월 (주민등록)인구랑 보고 싶은데 같이 뽑아주실래요?
언뜻 보았을때는 이상한점이 없습니다. 역삼동의 주민등록인구를 보는게 뭐가 문제지? 결론부터 말하자면 행정안전부에서 제공하는 주민등록인구는 "행정동" 기준으로 제공되며 요청받은 역삼동은 "법정동" 체계이기 때문입니다.
두 체계는 어떤 차이가 있는지 알아보겠습니다.
그럼 예시로 제시한 역삼동을 네이버 지도에 검색해보겠습니다. 역삼동이라고 표시된 영역에 역삼1동과 역삼2동이 존재하는 것을 알 수 있습니다.
행정동
- 법정동의 면적이 일률적이지 않고 도시의 성장과 쇠퇴를 반영하지 못하여 행정 수요에 따라 지방 자치 단체에서 설정하는 행정 구역을 의미
- 흔히 말하는 동은 행정동을 가리키지만 법률에서 언급하는 동은 법정동을 의미
- 행정동 단위로 행정복지센터라고 불리는 기관이 있어 행정업무를 볼 수 있음
- 선거구 획정의 기준이 됨
- 아파트 등 부동산 거래 이후 전입신고 시에 사용
법정동
- 법령, 조례, 관습법으로 지정되어 있다고 하여 법정동으로 칭하며 예전부터 쓰여왔던 지명이 한자로 변해 등록된 형태가 많음
( 큰 골격은 1914년 조선총독부에 의해 실시된 전국 행정구역 개편으로 설정 ) - 행정 수요에 맞게 법정동을 분할/ 통합/ 조정하여 행정동을 구성
- 부동산등기 등 부동산 관련 문서의 토지 표기
- 도로명 주소에서 괄호 안에 병기하는 동 명칭
그런데 이게 왜 문제야?
문제가 발생하는 경우는 어떤 경우일까요?
- 기존 데이터와 신규 데이터(혹은 외부 데이터)의 행정구역 체계가 다른 경우
- 행정동과 법정동 체계를 명확히 인지하지 못함
(특히) 행정동명과 법정동명이 동일한 경우 문제가 매우 커질 수 있다.
행정 수요에 맞게 설계된 것이 행정동이므로 주민등록인구와 같은 데이터는 행정동 기준으로 발표가 됩니다. 그러나 요청했던 역삼동은 법정동이므로 매칭이 불가능하죠
물론 역삼동처럼 역삼1동 + 역삼2동인 경우는 단순히 합을 계산할 수 있지 않나 라고 생각할 수 있지만 일반적으로 법정동과 행정동은 1:N이 아닌 M:N의 관계입니다. 조금 지저분(?) 한 행정동과 법정동 지역을 살펴보겠습니다.
하나의 행정동의 3개의 법정동이 " 일부 " 포함
아래 이미지는 경남 창원시 진해구 태백동의 행정동과 법정동 형상정보입니다. 이는 행정안전부에서 제공하는 shp파일을 참고하였습니다. 아래의 이미지처럼 행정동의 태백동은 법정동의 태백동, 여좌동, 경화동을 일부만 포함하고 있습니다. 행정동과 법정동의 데이터를 합치는 것이 불가능합니다.
물론 기준을 정해서 배분하는 것은 가능합니다. 보통 공간정보를 다룰때는 면적을 기준으로 배분을 하는 것이 일반적인데 이것이 합리적인가는 다른 문제입니다. 아래는 예시입니다.
ex) 행정동 태백동의 주민등록 인구수 5만명을 법정동 태백동의 포함 면적을 기준으로 배분
- 포함된 면적이 약 50%이며 인구수가 5만명일때 2만 5천명을 배분
- 그러나 포함된 면적 50%는 거주구역이 아닌 산간지역 혹은 비거주지역
> 이때 면적으로 배분하는것이 맞을까? - 즉, 데이터의 왜곡이 발생
행정동과 법정동의 이름이 동일하나 실제 구역에 차이가 있을때
이번에는 법정동 이름과 행정동 이름이 동일한 경우를 살펴보겠습니다. 이를 명확히 하지 않을 경우 데이터 누락과 오용으로 인해 결과가 왜곡될 수 있습니다.
경상남도 창원시 진해구 충무동의 데이터입니다. 우측의 행정동을 살펴보았을때 충무동은 넓은 지역을 커버하는 것을 볼 수 있습니다. 그러나 좌측의 법정동에서는 충무동에 꽤 많은 법정동이 보이며 충무동은 아주 일부만 커버하는 것을 확인 할 수 있습니다. 즉, 행정동과 법정동을 오적용했을때 넓은 지역의 실적이 좁은 지역에 집중되거나 좁은 지역의 실적이 넓은 지역으로 확대될 수 있음을 의미합니다.
결론
그렇다면 이런 이슈를 발생시키지 않으려면 어떤 해결책이 있을까?
- 현업과 분석가 사이의 행정구역 sync up이 필요
- 행정동과 법정동보다 더 큰 행정구역을 활용
: 결국 행정동과 법정동은 시군구 단위의 지방자치단체에서 지정하는 것이므로 시군구 단위로 활용시에는 큰 문제가 발생하지 않음 - 수집하는 데이터에 좌표를 활용
: 행정동과 법정동 형상정보를 보유 후 수요에 맞게 행정구역 정보를 반영 (Spatial Join)
참고
- 행정동과 법정동을 나타내는 고유한 번호가 있는데 이 번호 체계는 최대 10자리로 구성되어 있으나 8자리를 사용하는게 일반적이다.
- 각 8자리는 시도, 시군구, 행정동( 혹은 법정동)을 나타내며 필요에 의해 슬라이싱하여 상위 행정구역으로 집계할 수 있음 (아래 이미지 참고)
- 행정구역 개편은 비교적 자주 일어나는 편이니 주민등록인구와 같은 외부 데이터를 활용한다면 자주 확인하는 것이 좋다.
: 상위 자치구나 시도의 개편은 거의 일어나지 않으나 최근 강원특별자치도와 전북특별자치도와 같이 "도"의 지방치권을 강화하기 위한 개편이 일어나고 있는 추세
'분석 기술 블로그 > 비즈니스 분석' 카테고리의 다른 글
만화책에서 일반서적으로: 시간 확보와 독서 습관의 전환 (0) | 2024.07.13 |
---|---|
당신이 자주 사용하는 앱은 무엇인가요? - 네이버 시리즈 (1) | 2024.06.30 |
당신이 자주 사용하는 앱은 무엇인가요? - 개요 (1) | 2024.06.09 |
데이터 분석가를 위한 위치 정보 - ① 좌표 체계 (0) | 2024.03.03 |