김현우
(Hyunwoo Kim)
1†iD
김경호
(Kyungho Kim)
2iD
김명수
(Myeongsu Kim)
3
홍석찬
(Sukchan Hong)
4iD
-
정회원·교신저자·(주)에스지앤아이 융합디지털사업부 차장
(Corresponding Author·SG&I Co., Ltd·hwkim@esgi.co.kr)
-
정회원·(주)에스지앤아이 융합디지털사업부 이사
(SG&I Co., Ltd·khkim000@naver.com)
-
(주) 에스지앤아이 융합디지털사업부 사원
(SG&I Co., Ltd·audtn1296@esgi.co.kr)
-
(주) 에스지앤아이 융합디지털사업부 사원
(SG&I Co., Ltd·sc1hong@esgi.co.kr)
Copyright © 2021 by the Korean Society of Civil Engineers
키워드
지오코딩, 의미론, LOD, 위치추정, 비공간정보
Key words
Geocoding, Semantics, Level of Detail, Location estimation, Non-spatial information
1. 서 론
온오프라인에는 공간정보는 아니지만 실내외 다양한 공간 객체를 설명할 수 있는 자료들이 대량 존재한다. 그러한 자료들이 자동으로 해당 공간정보와 연결된다면
공간정보의 활용성이 대폭 향상될 수 있으며, 현재 지오코딩 기법을 사용하면 2차원 공간정보의 건물객체 또는 필지정보에 매핑된 비공간정보를 활용할 수
있다. 지오코딩은 건강, 범죄 분석, 정치학, 컴퓨터과학 등 여러 연구 및 응용 분야에서 공간분석을 위해 이용되어 왔다(Goldberg et al., 2007). 국내에서는 주소를 기준으로 지적도나 건물의 GIS(Geographic Information System) 폴리곤 정보를 취득하고 취득한 폴리곤의
무게중심점으로 해당 주소나 건물의 좌표를 얻는 방식으로 지오코딩이 이용된다. 하지만 위 방법은 데이터의 품질에 영향을 많이 받고 실외의 상세한 시설물이나
실내 구역 객체의 위치를 나타내는 문구와 같은 3차원 주소에 대한 위치추정이 불가능하다(Lee, 2009). 이를 위해서는 CityGML이나 CityJSON과 같이 실내까지 상세한 3D 데이터를 참고할 필요가 있다. 현재 구축되고 있는 건물에 대한 3D
데이터에는 대표적으로 BIM(Building Information Modeling)이 있다. 최근에 많은 국가들에서 BIM 구축을 의무화하고 있고
국내에서도 2022년에 국토교통부에서 모든 공공 공사에 대해 BIM 도입을 의무화하였다. 하지만 이전에 BIM 분류체계 개발이 미흡하고 기관별 표준의
통일성 문제가 발생하여 국내에서는 실무적용에 어려움을 겪고 있었다(Kim and Choi, 2013). 이후 BIM을 실무에서 활용하기 위한 노력이 활발하게 진행되었으며 BIM to GIS 기술과 실내공간정보 측량 및 구축 기술이 점차 발전하고 있다.
또한 공간정보를 활용하는 분야에서 실내외 상세한 부분까지 GML로 구축하는 분위기가 활발하여 앞으로 도시 관리 및 건설 업무에서 파생되는 요구사항을
처리할 것으로 기대된다(Fosu et al., 2015).
새로운 기준의 위치를 추정하기 위해서는 그 위치에 대한 식별자를 고려해야 한다. 건물이나 필지의 위치를 추정할 때 위치를 식별하기 위해 주소를 사용한다.
하지만 개별 실내 외 시설물에는 주소와 같이 대표하는 고유한 식별자가 없으므로 기계가 디지털 공간상에서 그 시설물의 위치를 추정할 수 없다. 행정안전부에서는
시설물에 대한 사물주소를 구축하기 위해 노력하고 있지만 사실상 모든 시설물의 사물주소를 구축하는 것을 물리적인 제약사항이 존재하고 다른 기관의 데이터와의
연계를 고려할 필요가 있다(Kim, 2020). 이에 공간을 나타내는 의미론적인 문구를 활용한 위치 추정하는 데에 새로운 시도가 필요하다.
따라서 본 연구에서는 기존의 필지나 건물 기준의 지오코딩 개념이 의미론적 객체의 의미를 포함하는 시멘틱 지오코딩 개념으로 발전되기 위한 과정으로 시멘틱
지오코딩 LOD 개념을 제안한다. 그 연구방법으로 계층적 공간정보 객체의 LOD와 시멘틱 LOD 연구 동향 분석을 실시하고 기존연구의 시멘틱 LOD
이론을 검토한다. 또한 검토에 따라서 시멘틱 지오코딩 LOD를 정의하고 가능성을 검증한다.
2. 연구 동향 분석
본 연구에서의 공간정보는 지도를 그리기 위한 각 지형지물의 모양을 2차원 유클리드 공간에서 점, 선, 면의 기하데이터로 별도의 처리없이 변환이 가능한
정보를 의미한다. 반면 비공간정보는 위치를 나타내지만 별도의 처리 과정이 있어야 기하데이터로 변환되는 모든 정보를 의미한다(Oh, 2022). 공간정보는 타분야의 정형/비정형 비공간정보와 융합하여 다양한 서비스가 이루어질 수 있는데 이와 같이 비공간정보를 공간정보와 연결하기 위해 비공간정보의
위치를 추정하는 방법으로 지오코딩 기법이 많이 쓰인다. 지오코딩은 초기 미국 센서스 국(Cencus Buresau)에서 인구 및 경제와 관련된 기본
정보를 수집·처리하기 위하여 거처에 지리적 위치를 할당하고, 이를 집계구로 정확하게 분류하기 위하여 개발된 기술이다(Kim and Choi, 2011).
시멘틱 LOD 관련해서는 공간정보 분야 내에 소수의 연구가 진행되었다. 연구된 시간 순서대로 시멘틱 LOD 이론을 분석한다.
Hu(2008)는 수평적 층과 수직 벽으로 구분되는 개념을 계층적으로 활용하여 속성정보를 객체에 연결하는 구분으로써 시멘틱 LOD 개념을 제안하였다. 부동산 3D
재산권 객체 속성정보를 공간적 실체와 함께 융합하여 다양하게 종합적인 분석을 하였고, 건물 및 실내 재난상황의 통합관리 및 등록 문제를 해결하는 새로운
개념 모델로 4단계의 의미론 기반 LOD을 정의하였다. 벽이 없는 수평공간에서 정의된 공간은 LOD1로 정의하였고 수직벽으로 구분된 공간은 LOD2로
정의하였다. 그리고 수직 건물에서 층으로 구분된 공간은 LOD3로 지정하고 부동산 3D 재산권범위의 최소 단위는 LOD4로 하였다.
Open Geospatial Consortium(2012)의 CityGML 2.0 인코딩 표준이 따르는 Multi-scale modelling 개념의 5단계 LOD는 아래 Fig. 1과 같다. LOD0 단계는 2차원의 건물 또는 2.5차원 디지털 지형 모델을 묘사하고, LOD1은 평평한 지붕의 블록형태로 묘사된 단순한 건물 모델을
묘사할 수 있다. LOD2에서는 더욱 상세한 지붕구조를 표현할 수 있고, 표면을 묘사할 수 있고, 식물객체를 표현할 수 있다. LOD3에서는 건물의
돌출부나 발코니를 포함하여 세부적인 벽과 상세한 지붕구조를 묘사할 수 있으며 고해상도의 텍스처를 매핑할 수 있다. LOD4에서는 LOD3수준의 모델에
더불어 실내객체 구현이 가능하다.
Benner et al.(2013)은 Table 1과 같이 3D 도시모델에 대한 CityGML 2.0 LOD의 0부터 4까지 5개 레벨을 기하학적 세부 수준 GLoD(Geometric Level of
Detail)와 의미적 세부 수준 SLoD(Semantic Level of Detail)으로 구분하였다. GLoD는 실제객체와 모델객체 사이에서 기하학적
표현과 데이터 품질의 일치되는 정도를 구분하였고, SLoD는 복잡한 객체가 의미적으로 분해되고 구조화되는 정도를 구분하였다. 그리고 GLoD와 SLoD를
실내와 실외로 구분하여 GLoD-E, SLoD-E, GLoD-I, SLoD-I 4가지 개념 별도로 지정했다.
Chen(2018)은 Fig. 2와 같이 실내지도 서비스를 위한 시멘틱 LOD를 제안했다. 실외는 제외하고 실내만을 서비스하는데 LOD4 수준까지 기하학적인 기준으로 LOD 분류된
CityGML 2.0 데이터를 구축하는 것은 비효율적인 행위이므로 기하학적인 LOD 특성에서 시맨틱 LOD를 분류하고자 한 Benner et al.(2013)의 접근방식에 이어서 아래 그림의 Occupied space, Bilding structure, Equipment & furnishings 세가지
분류로 구분하여 시멘틱 LOD를 제안하였다.
이러한 CityGML 2.0의 한계를 논한 연구들을 수렴하여 Open Geospatial Consortium(2020)에서는 Fig. 3(a)와 같이 CityGML 3.0 LOD를 제시하였다. 기존 CityGML 2.0에서 LOD4까지 기하적으로 전부 구축을 완료해야 실내정보를 활용할 수
있던 CityGML 2.0과 달리 CityGML 3.0에서는 LOD4를 삭제하고, LOD0부터 LOD3까지 4단계로만 구성을 하며, LOD0~LOD3
어떤 LOD에서든 실내정보를 구축할 수 있도록 하였다. Fig. 3(b)는 좌측그림이 CityGML 3.0 LOD0에서 실내를 표현한 그림이고, 우측그림이 LOD2에서 실내를 표현한 그림이다.
Fig. 3. CityGML 3.0 Based LOD and Indoor LOD Structure by Open Geospatial Consortium (2020). (a) Representation of LOD0-3, (b) Indoor Representation Combined Outdoor of LOD0
and LOD2
Table 1. SLoD and GLoD of Benner et al. (2013)
|
SLoD-E
|
GLoD-E
|
SLoD-I
|
GLoD-I
|
|
Levels of Detail for the semantic structuring of
Building and BuildingPart
|
Levels of Detail for the geometric representation of a building's exterior shell
|
Levels of Detail for the semantic structuring of Room
|
Levels of Detail for the geometric representation of
interior building components
|
LOD0
|
|
2D or 2.5 D representation
|
No semantic structuring
|
2D or 2.5 D representation
|
LOD1
|
No semantic structuring
|
Vertical extrusion solid
|
AbsractBoundarySurfaces
|
Vertical extrusion solid
|
LOD2
|
AbstractBoundarySurfaces
|
Generalised real geometry
|
AbstractBoundarySurfaces,
IntBuildingInstallations and BuildingFurniture
|
Generalised real geometry
|
LOD3
|
AbstractBoundarySurfaces and BuildingInstallation
|
Exact real geometry
|
AbstractBoundarySurfaces with AbstractOpenings, IntBuildingInstallation and
BuildingFurniture
|
Exact real geometry
|
LOD4
|
AbstractBoundarySurfaces with AbstractOpenings and BuildingInstallations
|
|
|
|
3. 연구방법
3.1 시멘틱 LOD 개념 검토
3D 재산권 속성을 공간객체에 대입하여 서비스하기 위한 목적으로 정의된 Hu(2008)의 시멘틱 LOD는 현재 발전된 모델인 CityGML 기반의 LOD가 고려되지 않았으므로, 현재 3D 공간정보 데이터 체계를 고려하지 못한다는 점에
이 개념을 그대로 채택하여 활용하기에는 한계가 있지만, 비공간정보를 공간정보에 연결하여 서비스하는 용도의 시멘틱 LOD 지정을 위해 본 연구와 유사도도
높고 참고하기 좋은 연구로 판단된다.
CityGML 2.0 LOD는 건물의 형상에 초점을 맞추어 작성된 LOD이다. 따라서 LOD4까지 전부 구축되어야 건물 실내객체에 내부 상세한 시멘틱개념을
활용할 수 있다. 따라서 CityGML 3.0으로 전환되는 과정에 Benner et al.(2013)와 Chen(2018) 등 소수 시멘틱 LOD 연구가 있었으며, Benner et al.(2013)는 기존 기하학적으로만 정의하던 LOD 체계에서 실내외를 대상으로 GLoD, SLoD로 구분하여 객체에 의미를 담았다. Chen(2018)은 실내객체에 점유공간, 물리적객체 구분과 구조적, 비구조적 구분을 더하여 목적에 따라서 데이터구분이 더 명확해지도록 하였다.
3.2 시멘틱 지오코딩 개념 정의
기존의 일반적 지오코딩 개념은 Fig. 4(a)와 같다. 표준 형태가 아닌 주소에 대해 템플릿을 참고하여 주소 표준화를 진행하고, 표준화된 주소는 위치를 참고할 수 있는 주소정보 공간 객체를 참고하여
해당 위치로 결정한다(Davis Jr and Fonseca, 2007). 국내에서도 그러한 방법대로 19자리의 표준지번코드와 26자리의 표준 도로명코드로 주소표준화를 진행하고, 지적이나 건물 DB를 활용하여 지번이나
건물 수준의 위치를 취득한다. 실내외 계층적 시멘틱 지오코딩 개념은 Fig. 4(b)와 같다. 기존 주소와 건물명 외의 추가 식별자를 의미적으로 인식함으로써 기존 필지나 건물 수준의 지오코딩 개념을 넘어서 더 상세한 범위까지 지오코딩이
가능하도록 한다. 이러한 목적을 구현하기 위해 위치를 추정하는 기계가 세부 수준을 구분할 수 있도록 계층적 시멘틱 지오코딩 LOD 정의가 필요하다.
본 연구에서는 기존 시멘틱 LOD 이론을 분석하고, 시멘틱 지오코딩 LOD를 정의하여 기존 주소보다 더 깊은 수준의 지오코딩과 객체 매핑이 이루어질
수 있도록 한다.
지오코딩 기술은 사람이 직접 입력한 주소를 입력값으로 받아서 위치정보를 출력한다. 하지만 Fig. 5와 같이 데이터에서 주소나 위치를 추정할 수 있는 문구를 AI가 LOD로 구분하여 직접 인식하고 Purves et al.(2018)이 논한 GIR(Geographic Information Retrieval) 방식과 같이 해석하여 SW에 입력한다면 형식에 상관없이 자동 시멘틱 지오코딩이
가능해진다. 본 연구는 이러한 시멘틱 지오코딩 LOD가 적용되어 AI의 자동화가 이루어질 수 있는 기반을 마련하여 공간정보의 활용성 확대에 도움이
되도록 한다.
Fig. 4. General Geocoding Process and Semantic Geocoding Process Concept. (a) General
Geocoding by Davis Jr and Fonseca (2007), (b) Semantic Geocoding
Fig. 5. Example of an Automated AI(Artificial Intelligence) Semantic Geocoding Process
3.3 연구데이터 선정 및 분석
시멘틱 지오코딩 LOD를 활용하는 실험 데이터로 행정안전부의 공공데이터포털 데이터를 대상으로 선정하였다. 공공데이터포털은 「공공데이터의 제공 및 이용
활성화에 관한 법률」 제13조 공공데이터의 효율적인 제공 및 이용 활성과 제공을 근거로 데이터를 제공한다. 데이터는 교육, 국토관리, 공공행정, 재정금융,
재난안전, 문화관광 등 16개의 카테고리 테마로 구성되어 서비스되며 그 중에 공공행정이 14.8 %로 가장 큰 비중을 차지하고 두 번째로 문화관광이
12.1 %, 세 번째로 산업고용이 9.2 %, 다음으로 교통물류가 8.4 % 분포해 있으며 그 외 카테고리의 데이터가 다양하게 분포하여 있다(Ministry of the Interior and Safety, 2024).
연구에서는 24년 05월 31일 기준으로 공공데이터포털에 있는 78,617건을 조사하였고, 그중에서 위치를 식별할 수 있는 문구(좌표, 주소 및 그
외 의미론적으로 위치추정 가능)를 포함한 데이터를 21,321건을 선별하였다 공간정보가 포함되지 않은 데이터를 의미론적으로 해석하여 상세 공간정보를
취득하기 위해서는 공간적으로 위치를 식별할 수 있도록 식별자를 정의하는 것이 중요하다. 이를 정의하기 위해 연구에서는 공공데이터포털을 위주로 공공데이터를
분석하였다. 분석 결과 위치를 식별할 수 있는 문구가 Fig. 6의 예시와 같이 다양한 형태로 존재하는 것을 확인하였다. 기본적으로 좌표나 주소를 보유하고 있는 경우가 일반적이었고, “하행 3-2 승강장 옆”,
“7번 출구 좌측”, “4번 출구 좌측”, “(B3)고객안내센터 근처”, “B1화장실 전방 10m”, “#2출입구 우측 전방” 같이 상세위치 시멘틱
해석이 필요한 부분이 있음을 확인하였다.
공공데이터포털의 자료에서 좌표가 있다면 검증 후 바로 해당 위치를 추정할 수 있으며, 그 외 텍스트 문구로부터 위치를 추정하기 위해서는 주소에서 지오코딩
프로세스로 추출된 좌표값을 활용할 수 있었다. 그리고 더 상세한 위치를 특정하기 위해 건물명, 동, 층, 호 등 세부 주소로 사용되는 명칭들이 쓰일
수 있으며 그 외에는 의미론적으로 위치를 지칭할 수 있는 다양한 정보들이 사용될 수 있다. 21,321건 공공데이터포털 데이터를 연구에서 활용할 수
있는 위치식별자별로 데이터를 구분하여 분석하였다. 데이터 중 도로명주소가 포함된 데이터는 13,919건으로 확인되었고, 지번주소가 포함된 데이터는
7,498건으로 확인되었다. 또한 주소정보외의 상세위치, 상세주소 등 더 상세한 위치가 담긴 데이터는 7,775건이 있었으며 의미론적으로 문구를 해석하여
위치를 추정할 수 있는 데이터는 1,788건이 있었다.
Fig. 6. Analysis of Location Estimation Phrases in Public Data Portal Materials
3.4 실내외 시멘틱 위치추정을 위한 계층적 LOD 정의
기존에는 지오코딩의 위치추정 목적 자체가 주소의 위치를 찾거나 건물의 위치를 찾는데 그쳤다. 따라서 지오코딩 목적에 따라서 LOD를 분류하자면 LOD1(주소
위치추정)과 LOD2(건물 위치추정) 2가지 수준의 LOD에 한정되므로 LOD가 정의될 필요가 없었다. 하지만 공간정보의 구축 범위가 상세해지고 의미적으로
다양해짐에 따라서 위치추정의 기준도 더 상세해지는 방향으로 개발이 진행되고 있으므로 실내외 의미론적 위치추정을 위한 LOD 정의가 필요한 상황이다.
시멘틱 지오코딩을 위한 LOD는 다음 4가지를 기준으로 정의한다:
1. 위치추정을 하는 목적에 따라서 세부 수준을 구분할 수 있도록 함
2. 기존 지오코딩 이상의 상세한 의미론적 위치추정이 가능하도록 정의
3. 기존 시멘틱 LOD 이론의 장단점을 최대한 반영하여 구분
4. CityGML 이외의 다양한 공간정보 데이터 형식을 아우르도록 함
일단 의미론적으로 공간정보의 위치를 추정하기 위한 LOD 개념을 정의한다는 목적을 가장 우선시해서 고려한다. 아울러 CityGML에 한정되지 않고
범 데이터형식으로 실내외 공간정보를 아우르는 LOD가 되는 것으로 한다. 또한 대상을 건물 객체로 한정하지 않고 실내외가 구분되는 모든 시설물 객체를
포함한다.
따라서 Hu(2008)가 활용한 부동산권리를 공간 객체에 연결하는 개념에서 계층적 수평층, 수직벽으로 공간이 분리되는 개념을 기본적으로 활용한다. 그리고 CityGML에서
의미론적으로 SLoD를 구성하는 방식을 참고하여 시멘틱 지오코딩 LOD 모델을 정의한다.
현재 지오코딩의 목적은 건물 객체와 상관없이 주소를 기본 식별자로 하여 필지의 위치를 추정하는 경우와 건물의 위치를 추정하는 개념으로 구분할 수 있다.
이렇게 2가지 유형을 LOD로 구분하자면 필지를 대상으로 하는 수준은 LOD1로 구분하고 건물을 대상으로 하는 수준은 LOD2로 구분할 수 있다.
이 부분은 수직벽을 기준으로 건물의 실내와 실외를 구분하는 개념을 활용하는데서 Hu(2008)의 시멘틱 LOD 개념중 LOD1, LOD2과 유사하다. 그래서 Fig. 7에서와 같이 벽이 없이 수평적으로 정의된 공간에서 수직벽으로 실내와 실외가 구분이 되는 개념으로 LOD 1과 LOD2로 구분하고, 수직 건물의 층으로
구분된 공간을 LOD3 그리고 내부의 최소한의 사물 단위객체나 공간객체를 LOD4로 구분한다.
실내외 또는 벽과 층으로 공간을 구분하는 방법으로 정의하는 LOD 개념으로 정의하면 Chen(2018)이 제시한 바와 같이 점유공간(Occupied space)과 물리객체(Physical feature) 사이의 개념에서 충돌이 있을 수 있다. 따라서
Fig. 8과 같이 점유 공간과 물리 객체에 대한 기본적인 분류를 정의한다. 이와 같이 정의하는 것을 고려할 때 물리 객체가 방안에 있을 것이라는 보장이 없고
동일한 층내에 여러 공간 또는 여러 층에 걸쳐 존재할 수 있으므로 LOD2부터 LOD4까지 존재하는 것으로 정의한다.
Fig. 7. Spatial Representation of the Proposed Semantic Geocoding LOD
Fig. 8. Separation of Occupied Space and Physical Features in the Proposed Semantic
Geocoding LOD
4. 연구결과
본 논문에서 정의한 시멘틱 지오코딩 LOD를 Table 2와 같이 LOD 수준별로 예시를 들어 일반적인 공간개념과 CityGML 3.0 포맷에 예시를 매핑하여 실효성을 검증한다. 기존 지오코딩의 세부수준으로
구분한 지번, 주소에 LOD1과 LOD2를 활용한 만큼 LOD1에는 필지, 단지, 블록이 일반적으로 정의될 수 있다. 그리고 CityGML로는 그에
상응되는 LandUse나 도로와 같은 교통구역이 포함될 수 있다. 그리고 LOD2에는 실내외가 구분되는 건물이 지정될 수 있으며, 건물 외에도 교량이나
지하철역사 지하시설물처럼 실내외가 구분되는 시설물이라면 LOD2의 객체로 정해질 수 있다. 또한 그 안에서 LOD3로 층으로 구분될 수 있으며 LOD3
수준에서는 CityGML 3.0로 BuildingRoom, Storey, BuildingFurniture와 같은 객체가 가능하며, LOD4에서는 BuildingRoom,
BuildingFurniture와 같은 실내 동일층에서 벽으로 구분된 공간이나 그 내부 객체가 가능하다.
또한 제안된 시멘틱 지오코딩 LOD가 주소, 명칭과 같은 각종 위치 추정 식별자들에 범위적으로 얼마나 영향을 끼칠지 Fig. 9와 같이 검증을 하였다. 먼저 주소 관련해서는 지번주소는 LOD1에만 해당되며, 도로명 주소는 아파트와 같은 건물군으로 단지를 표현할 수도 있고 단일
건물을 나타낼 수도 있으므로 LOD1-LOD2에 해당되었으며 상세주소는 동, 층, 호를 포함하기 때문에 동, 층, 호에 대해 선택적으로 LOD2,
LOD3, LOD4를 포함하였다. 그리고 그 외 건물명이나 건물의 용도를 지칭하는 단어나 상호, 지명 등 그 외 사용할 수 있는 식별자가 다양한데
이와 같은 식별자들은 LOD1부터 LOD4까지 다양하게 분포함을 확인할 수 있었다.
아울러 시멘틱 지오코딩 LOD의 활용모델을 검증하기 위해 Fig. 10과 같이 ERD(Entity Relationship Diagram) 논리 데이터모델을 설계하여 활용 방향을 확인하였다. RDBMS(Relational
Database Management System)와 NoSQL을 혼합하여 형식에 상관없이 데이터 컨텐츠를 저장할 수 있도록 설계하였고, 공간정보 연결
공간을 따로 마련하여 플랫폼에 상관없이 유연하게 변경하여 구성할 수 있도록 하였다.
이 모델을 구성함에 따라서 시멘틱 지오코딩 LOD는 비공간정보-공간정보 매핑 이전에 정의되어 지오코딩 프로세스로 활용될 수 있음을 검증하였고, 비공간정보
ID를 부여하여 비공간정보의 개별항목을 NoSQL 트리구조로 형식에 상관없이 공간정보에 연결하여 활용할 수 있음을 검증하였다. 또한 의미론적으로 위치를
추정하기 위한 식별자로는 NoSQL 비공간정보 분석 데이터에 정의한 것과 같이 일반식별자(용도명, 상호명 등), 건물명, 층명, 호명, 경위도좌표,
XY좌표, 지번주소, 도로명주소, 상세주소, 그 외 의미론적으로 위치해석이 가능한 정보가 구성될 수 있었다.
Fig. 9. Verification of the Scope of Geocoding Identifiers in the Proposed Semantic
Geocoding LOD
Fig. 10. Usage Example of Semantic Geocoding LOD in ERD: Data Model Utilizing Spatial
and Non-Spatial Information
Table 2. Verification of Theory Application to General Spatial Concepts or CityGML
|
LOD1
|
LOD2
|
LOD3
|
LOD4
|
General spatial
concept
|
Parcel, Complex, Block
|
Buildings, facilities (such as bridges, underground facilities, etc.), objects where
the interior and exterior are distinguished by vertical walls
|
Indoor spaces divided into floors, or physical objects that utilize floor spaces
|
Spaces divided by vertical walls within the same floor, or physical objects inside
the space
|
CityGML 3.0
|
LandUse and Transportation
|
Building,
BuildingPart,
Tunnel,
Bridge,
CityFurniture
|
BuildingRoom,
BuildingFurniture,
Storey,
BridgeRoom,
BridgeFurniture,
TunnelRoom,
TunnelFurniture
|
BuildingRoom,
BuildingFurniture,
BridgeRoom,
BridgeFurniture,
TunnelRoom,
TunnelFurniture
|
5. 결 론
기존 주소, 건물 단위 보다 상세하게 위치추정 하기 위한 지원 도구로 계층적 시멘틱 지오코딩 LOD를 정의하고 제안하였다. 텍스트 문구와 같이 구조화되지
않은 비공간정보를 위치추정하고 해당 공간정보와 연결하는 목적으로 지오코딩 범위 확대가 필요하였다. 따라서 주소, 건물로 대상을 한정하던 지오코딩에
추가 의미론적인 정보와 해석을 포함하여 시멘틱 지오코딩을 수행하고자 하였고, 그러한 범위에 대하여 LOD 기준이 요구되어 시멘틱 지오코딩 LOD를
정의하였다. 이러한 시멘틱 지오코딩 LOD에 의하여, 단순 텍스트를 참고하여 기계가 어느 정도 범위의 객체인지 인식하고, 어느 정도 범위의 객체를
참고할지 구분이 가능해 졌다. 텍스트정보는 실외 수치지도 데이터나 네비게이션 데이터 등 2차원 실외 공간정보와 연결되거나 CityGML이나 CityJSON과
같은 객체지향 데이터에 연결되어 공간정보의 활용성을 확보하는데 일조할 수 있다. 따라서 정의된 LOD 구분으로 기계가 문구의 범위를 인식하고, 해당
공간정보에 자동 연결하는 일환으로 텍스트 비공간정보의 위치추정 요소를 자동으로 탐지하고 해당 위치를 추정하는 AI 자연어처리 기반 기술이 개발되고
있다. 논문에서 제안하는 기술이 이러한 AI 기술에 적용되어 앞으로 기계가 더 깊이 있는 위치추정 할 수 있는 결과를 기대한다.
Acknowledgement
This work is supported by the Korea Agency for Infrastructure Technology Advancement(KAIA)
grant R&D program of Digital Land Information Technology Development funded by the
Ministry of Land, Infrastructure and Transport(MOLIT) (Grant RS-2022-00143804).
This paper has been written by modifying and supplementing the KSCE 2024 CONVENTION
paper.
References
"Benner, J., Geiger, A., Gröger, G., Häfele, K. H. and Löwner, M. O. (2013). “Enhanced
LOD concepts for virtual 3D city models.” ISPRS Annals of the Photogrammetry, Remote
Sensing and Spatial Information Sciences, ISPRS, Vol. II-2/W1, pp. 51-61, https://doi.org/10.5194/isprsannals-II-2-W1-51-2013."

"Davis Jr, C. A. and Fonseca, F. T. (2007). “Assessing the certainty of locations
produced by an address geocoding system.” Geoinformatica, An International Journal
on Advances of Computer Science for Geographic Information Systems, Vol. 11, pp. 103-129,
https://doi.org/10.1007/s10707-006-0015-7."

"Chen, J. (2018). “Defining semantic levels of detail for indoor maps.” ISPRS Annals
of the Photogrammetry, Remote Sensing and Spatial Information Sciences, ISPRS, Vol.
IV-4/W7, pp. 27-34, https://doi.org/10.5194/isprs-annals-IV-4-W7-27-2018."

"Fosu, R., Suprabhas, K., Rathore, Z. and Cory, C. (2015). “Integration of Building
Information Modeling (BIM) and Geographic Information Systems (GIS)-a literature review
and future needs.” Proc. of the 32nd CIB W78 Conference 2015, Eindhoven, The Netherlands,
pp. 27-29."

"Goldberg, D. W., Wilson, J. P. and Knoblock, C. A. (2007). “From Text to geographic
coordinates: The current state of geocoding.” URISA Journal, URISA, Vol. 19, No. 1,
pp. 33-46."

"Hu, M. Y. (2008). “Semantic based LOD models of 3D house property.” The International
Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. ISPRS,
China, Vol. XXXVII Part B2, 2008, pp. 95-102."

"Kim, J. Y. (2020). “Address of things database design based on the address concept
model suggested in the standard.” Journal of Korean Society for Geospatial Information
Science, KSIS, Vol. 28, No. 3, pp. 85-92, http://doi.org/10.7319/kogsis.2020.28.3.085
(in Korean)."

"Kim, K. Y. and Choi, E. Y. (2011). “The roles of U.S. census bureau to the development
of GIS.” Journal of the Korean Cartographic Association, KCA, Vol. 11, No. 3, pp.
53-68, uci.or.kr/G704-SER000008969.2011.11.3.001 (in Korean)."

"Kim, I. H. and Choi, J. H. (2013). “The status of standardization of BIM and construction
IT.” The BIM_The Building Information Modeling, Summer 2013, buildingSMART KOREA,
Vol. 9, pp. 22-24 (in Korean)."

"Lee, J. Y. (2009). “GIS-based geocoding methods for area-based addresses and 3D addresses
in Urban Areas.” Environment and Planning B: Planning and Design, SAGE, Vol. 36, No.
1, pp. 86-106, https://doi.org/10.1068/b31169."

"Ministry of the Interior and Safety. (2024). Public Data Potal National Data Map:
A data relationship map that allows easy search and discovery of the location information
and interconnections of open data held by all institutions, Available at: https://www.data.go.kr/tcs/opd/ndm/view.do
(Accessed: October 10, 2024) (in Korean)."

"Oh, B. W. (2022). “A method of spatial data classification using CNN.” The Journal
of Korean Institute of Information Technology, KIIT, Vol. 20, No. 4, pp. 25-30, https://doi.org/10.14801/jkiit.2022.20.4.25
(in Korean)."

"Open Geospatial Consortium (2012). OGC City Geography Markup Language (CityGML) Encoding
Standard, OpenGIS® Encoding Standard, Version 2.0, OGC Doc No. 12-019, CityGML, USA."

"Open Geospatial Consortium (2020). OGC City Geography Markup Language (CityGML) Part
1: Conceptual Model Standard, OGC Standard, Version 3.0, OGC Doc No. 20-010, CityGML,
USA."

"Purves, R. S., Clough, P., Jones, C. B., Hall, M. H. and Murdock, V. (2018). “Geographic
information retrieval: Progress and challenges in spatial search of text.” Foundations
and Trends® in Information Retrieval, Now, Vol. 12, No. 2-3, pp. 164-318, http://dx.doi.org/10.1561/1500000034."
