江西地名研究
關(guān)注我們,獲取更多地名資訊
摘要:針對(duì)現(xiàn)有省市級(jí)節(jié)點(diǎn)地名/地址信息未能匹配地名/地址編碼,導(dǎo)致地名/地址檢索準(zhǔn)確性不高,為城市管理與規(guī)劃帶來極大的不利影響,因此,提出基于天地圖的省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù)庫構(gòu)建研究。搭建省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù)庫構(gòu)建框架,以此為基礎(chǔ),對(duì)天地圖地理數(shù)據(jù)進(jìn)行解析與處理,獲取省市級(jí)節(jié)點(diǎn)地名/地址地理數(shù)據(jù),分析地名/地址要素,構(gòu)建標(biāo)準(zhǔn)地名/地址模型,確定地名/地址編碼標(biāo)準(zhǔn),編碼地名/地址地理數(shù)據(jù),采用等分計(jì)算方法匹配地名/地址編碼,通過capabilities、geocode與reverse接口來實(shí)現(xiàn)地名/地址檢索服務(wù),基于天地圖實(shí)現(xiàn)了省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù)庫的構(gòu)建。實(shí)驗(yàn)結(jié)果顯示:相較于現(xiàn)有數(shù)據(jù)庫來看,構(gòu)建數(shù)據(jù)庫地名/地址匹配時(shí)間更短,地名/地址檢索準(zhǔn)確性更高,充分證實(shí)了構(gòu)建數(shù)據(jù)庫的應(yīng)用性能更好。
關(guān)鍵詞:天地圖;節(jié)點(diǎn);地名/地址;數(shù)據(jù)庫
0
引言
中國信息化產(chǎn)業(yè)的高速發(fā)展,使得地理信息系統(tǒng)在各個(gè)領(lǐng)域應(yīng)用的頻率逐漸增多,人們對(duì)信息化服務(wù)的需求也在逐漸提升,全球信息化發(fā)展也為世界帶來了一次變革?!皵?shù)字城市”是現(xiàn)今國家信息化發(fā)展的關(guān)鍵特征之一,也是城市基礎(chǔ)建設(shè)中必不可缺的主要內(nèi)容之一。依據(jù)中國發(fā)布的城市總體規(guī)劃戰(zhàn)略來看,我國“數(shù)字城市”建設(shè)依舊處于初級(jí)階段,主要目的是提升公共服務(wù)效果,加強(qiáng)城市管理效率,以此來滿足城市的信息化需求。
省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù)庫構(gòu)建是“數(shù)字城市”建設(shè)的基礎(chǔ),也是地理空間建設(shè)的前提。省市級(jí)節(jié)點(diǎn)地名/地址編碼指的是依據(jù)一定的編碼規(guī)則與地名/地址模型將自然語言描述的地址位置信息進(jìn)行轉(zhuǎn)換,并將其與空間坐標(biāo)關(guān)聯(lián),使其能夠在地圖上顯示出來。在實(shí)際生活過程中,省市級(jí)節(jié)點(diǎn)地名/地址編碼數(shù)據(jù)至關(guān)重要。相關(guān)專家指出,在政府職能部門中,蘊(yùn)含著海量的業(yè)務(wù)信息量,例如,單位地址、小區(qū)地址等,但上述信息點(diǎn)無法使用文字形式準(zhǔn)確查找到確定的位置,為城市管理帶來極大的不利影響。故提出基于天地圖的省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù)庫構(gòu)建研究。將空間信息與非空間信息進(jìn)行有效地結(jié)合與關(guān)聯(lián),生成一個(gè)綜合性、全面性的省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù)庫,為城市規(guī)劃、管理等相關(guān)部門提供完整的、清晰的數(shù)據(jù)支撐,同時(shí)也為社會(huì)經(jīng)濟(jì)、資源的可持續(xù)化發(fā)展打下堅(jiān)實(shí)的基礎(chǔ),為政府、企業(yè)以及全社會(huì)提供更加優(yōu)質(zhì)的服務(wù)。
1
省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù)庫構(gòu)建研究
1.1
省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù)庫構(gòu)建框架搭建
以數(shù)據(jù)建設(shè)為核心、以服務(wù)應(yīng)用為宗旨、以創(chuàng)新模式為主線、以協(xié)同工作與統(tǒng)籌規(guī)劃為原則,搭建省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù)庫構(gòu)建框架,具體(如圖1所示):

此研究主要以天地圖地理數(shù)據(jù)為基礎(chǔ),通過提取與整合處理獲取省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù),依照一定的編碼模型/標(biāo)準(zhǔn)對(duì)其進(jìn)行編碼、匹配,并設(shè)置檢索與服務(wù)功能,從而實(shí)現(xiàn)數(shù)據(jù)庫的構(gòu)建。
1.2
天地圖地理數(shù)據(jù)的解析與處理
以上述搭建的省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù)庫構(gòu)建框架(如圖1所示)為基礎(chǔ),對(duì)天地圖地理數(shù)據(jù)進(jìn)行解析與處理,獲取省市級(jí)節(jié)點(diǎn)地名/地址地理數(shù)據(jù),具體過程如下:
常規(guī)情況下,天地圖地理數(shù)據(jù)中包含政府公共地理數(shù)據(jù)與社會(huì)公共地理數(shù)據(jù),對(duì)其進(jìn)行解析與處理也劃分為兩個(gè)部分進(jìn)行,避免地名/地址地理數(shù)據(jù)出現(xiàn)混淆事件的發(fā)生。
其中,政府公共地理數(shù)據(jù)解析與處理主要是對(duì)POI數(shù)據(jù)進(jìn)行分類處理。依照現(xiàn)有的標(biāo)準(zhǔn)與要求,將POI數(shù)據(jù)劃分為10個(gè)大類別、14個(gè)中類別、590分小類別。必須對(duì)POI數(shù)據(jù)進(jìn)行逐一分類,保障每個(gè)省市級(jí)節(jié)點(diǎn)地名/地址均有所屬的類別。
POI數(shù)據(jù)結(jié)構(gòu)(如表1所示):

社會(huì)公共地理數(shù)據(jù)解析與處理主要是對(duì)房產(chǎn)數(shù)據(jù)屬性信息獲取。采用RESTful接口,通過正則表達(dá)式等技術(shù)手段在天地圖中獲取房產(chǎn)數(shù)據(jù)。另外,需要注意的是,在房產(chǎn)數(shù)據(jù)解析過程中會(huì)涉及JSON解析,房產(chǎn)數(shù)據(jù)具備特殊的JSON數(shù)據(jù)結(jié)構(gòu),故需要使用XMLSpy對(duì)JSON數(shù)據(jù)進(jìn)行轉(zhuǎn)換,使房產(chǎn)數(shù)據(jù)結(jié)構(gòu)與其他數(shù)據(jù)結(jié)構(gòu)保持一致。
通過上述過程完成了天地圖地理數(shù)據(jù)的解析與處理,獲得了省市級(jí)節(jié)點(diǎn)地名/地址地理數(shù)據(jù),為后續(xù)編碼提供地理數(shù)據(jù)依據(jù)。
1.3
省市級(jí)節(jié)點(diǎn)地名/地址編碼
以上述獲取的省市級(jí)節(jié)點(diǎn)地名/地址地理數(shù)據(jù)為基礎(chǔ),分析地名/地址要素,構(gòu)建標(biāo)準(zhǔn)地名/地址模型,確定地名/地址編碼標(biāo)準(zhǔn),從而完成了省市級(jí)節(jié)點(diǎn)地名/地址的編碼。
依據(jù)國家要求以及天地圖地理數(shù)據(jù)的實(shí)際情況,認(rèn)定省市級(jí)節(jié)點(diǎn)地名/地址要素共為5類,具體如下:
(1)行政區(qū)劃。行政區(qū)劃主要功能為標(biāo)注地名/地址的行政級(jí)別,包含國家層、省級(jí)層與市級(jí)層,此部分在編碼中不得為空。另外,其還能反映地名/地址數(shù)據(jù)的粗粒度信息與所屬行政范圍;
(2)地址部分。地址部分是地名/地址數(shù)據(jù)的關(guān)鍵部分,承擔(dān)著地名/地址的主要內(nèi)容,此部分不得為空。地址部分主要為道路、門牌號(hào)等,反映地名/地址數(shù)據(jù)的中粒度信息;
(3)子地址部分。子地址部分是地名/地址數(shù)據(jù)的剩余部分,是地名/地址的補(bǔ)充信息,包含社區(qū)、樓牌號(hào)等,反映地名/地址數(shù)據(jù)的細(xì)粒度信息;
(4)別名部分。別名指的是城市或者道路或者社區(qū)的曾用名;
(5)補(bǔ)充部分。補(bǔ)充信息能夠防止地名/地址重名帶來的模糊性,結(jié)合補(bǔ)充信息進(jìn)行交叉查詢,能夠有效提升數(shù)據(jù)庫的檢索效率。
標(biāo)準(zhǔn)地名/地址模型是由多個(gè)地名/地址要素形成的集合,并且地名/地址要素之間存在著較為復(fù)雜的層次關(guān)系。目前使用的標(biāo)準(zhǔn)地名/地址模型分為三個(gè)部分,具體如下:
(1) <標(biāo)準(zhǔn)地名 址>: <行政區(qū)劃> <區(qū)域限定物> <局部點(diǎn)位置描述> ,其中, <行政區(qū)劃> 指的是政區(qū)類地名;
(2) <區(qū)域限定物>指的是低于政區(qū)類地名,包含基本地址元素的地名,例如,社區(qū)、道路、廣場、公園等;
(3) <局部點(diǎn)位置描述>是地名/地址的最后元素,指的是點(diǎn)狀地址元素類型,例如,樓號(hào)、建筑物、經(jīng)濟(jì)地名等。
通過上述描述可知標(biāo)準(zhǔn)地名/地址模型為層次結(jié)構(gòu),具體內(nèi)容(如表2所示):

地名/地址編碼是數(shù)據(jù)庫構(gòu)建的基礎(chǔ)與關(guān)鍵,故必須保障地名/地址編碼的正確性與精確性。在地名/地址編碼過程中,必須遵循下述原則:
(1)科學(xué)性原則。能夠在地名/地址編碼中識(shí)別出地理實(shí)體的從屬關(guān)系;
(2)唯一性原則。每一個(gè)地理實(shí)體在構(gòu)建數(shù)據(jù)庫中只能被唯一識(shí)別;
(3)標(biāo)準(zhǔn)性原則。地名/地址編碼必須符合國家標(biāo)準(zhǔn),方便地名/地址編碼數(shù)據(jù)的共享;
(4)層次性原則。地名/地址編碼必須能夠體現(xiàn)包含要素之間的層次關(guān)系;
(5)可擴(kuò)展性原則。以此來保障地名/地址編碼能夠適應(yīng)對(duì)象的發(fā)展與變化。
則地名/地址編碼結(jié)構(gòu)(如圖2所示):

1.4
地名/地址編碼匹配
以上述省市級(jí)節(jié)點(diǎn)地名/地址編碼結(jié)果為基礎(chǔ),采用等分計(jì)算方法匹配地名/地址編碼,提升構(gòu)建數(shù)據(jù)庫的精準(zhǔn)度,方便數(shù)據(jù)庫的應(yīng)用。
一般情況下,若是數(shù)據(jù)庫完備,標(biāo)準(zhǔn)地名/地址編碼能夠成功匹配,并獲得精確的空間坐標(biāo)信息。但若是數(shù)據(jù)庫不夠完備,則需要通過計(jì)算空間坐標(biāo)值,對(duì)其進(jìn)行交互式手動(dòng)匹配定位。
省市級(jí)節(jié)點(diǎn)地名/地址路段與街道門牌存在兩種方式:一種是兩邊均存在門牌號(hào),采用奇偶數(shù)遞增編排;另一種是一邊存在門牌號(hào),依據(jù)門牌號(hào)遞增順序編排。故在數(shù)據(jù)庫不夠完備前提下,必須先對(duì)地名/地址編碼進(jìn)行判斷,這樣才能保障匹配后的數(shù)據(jù)最接近信息點(diǎn)。但上述過程較為麻煩,故此研究利用等分計(jì)算方法匹配地名/地址編碼。該方法將街道看作為一條直線,將建筑物看作為質(zhì)點(diǎn)。設(shè)定地名/地址編碼待匹配門牌為n?(x?,y?),其前一門牌坐標(biāo)信息與后一門牌坐標(biāo)信息分別記為n?(x?,y?)與n?(x?,y?),則待匹配門牌表達(dá)式,如式(1)所示:

假設(shè)前一門牌與后一門牌之間的距離長度為L,該街道與天地圖縱軸之間的夾角為α,則待匹配門牌坐標(biāo)的最大近似誤差計(jì)算公式,如式(2)所示:

為了能夠清晰地觀察到地名/地址編碼待匹配門牌坐標(biāo)的最大近似誤差,采用圖形描述對(duì)其進(jìn)行展示,(如圖3所示):

當(dāng)公式(2)結(jié)果最大近似誤差無限趨近于零時(shí),則完成了地名/地址編碼門牌號(hào)的匹配。
1.5
地名/地址檢索服務(wù)
地名/地址檢索服務(wù)也是數(shù)據(jù)庫的主要功能之一,以此來提升數(shù)據(jù)庫的服務(wù)品質(zhì)。構(gòu)建數(shù)據(jù)庫地名/地址檢索服務(wù)主要通過capabilities、geocode與reverse接口來實(shí)現(xiàn)。其中,capabilities接口承擔(dān)著檢索操作結(jié)果反饋與處理的任務(wù),其參數(shù)與注釋(如表3所示):

geocode接口承擔(dān)著設(shè)計(jì)地名/地址檢索過程參數(shù)的任務(wù)。geocode接口參數(shù)(如表4所示):

reverse接口接收檢索者輸入的信息,與capabilities接口參數(shù)相差一個(gè)point參數(shù),其作用為依據(jù)地名/地址坐標(biāo)信息,反算地名/地址的編碼。
另外,地名/地址檢索服務(wù)還需要滿足前綴后綴規(guī)則、差值規(guī)則與跳躍表規(guī)則,以此來保障檢索的正確性。
通過上述過程實(shí)現(xiàn)了省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù)庫的構(gòu)建,為省市級(jí)城市規(guī)劃、政府相關(guān)管理部門提供數(shù)字化信息支撐。
2
實(shí)驗(yàn)與結(jié)果分析
為了驗(yàn)證構(gòu)建數(shù)據(jù)庫與現(xiàn)有數(shù)據(jù)庫之間的應(yīng)用性能差異,采用MATLAB軟件設(shè)計(jì)實(shí)驗(yàn)。
2.1
實(shí)驗(yàn)對(duì)象選取
此實(shí)驗(yàn)以某省市級(jí)區(qū)域天地圖為對(duì)象,其主要包含DLG數(shù)據(jù)與航片數(shù)據(jù),具體情況(如表5所示):

2.2
性能指標(biāo)確定
為客觀顯示數(shù)據(jù)庫應(yīng)用性能,選取地名/地址匹配時(shí)間與地名/地址檢索準(zhǔn)確性作為數(shù)據(jù)庫應(yīng)用性能指標(biāo)。其中,地名/地址匹配時(shí)間采用計(jì)時(shí)器即可獲得。而地名/地址檢索準(zhǔn)確性數(shù)據(jù)需要對(duì)用戶檢索信息進(jìn)行整理才能獲得。則用戶檢索信息整理程序(如圖4所示):

2.3
實(shí)驗(yàn)結(jié)果分析
依據(jù)上述選取的實(shí)驗(yàn)對(duì)象,確定的性能指標(biāo)進(jìn)行數(shù)據(jù)庫應(yīng)用實(shí)驗(yàn),通過地名/地址匹配時(shí)間與地名/地址檢索準(zhǔn)確性來反映數(shù)據(jù)庫的應(yīng)用性能,具體實(shí)驗(yàn)結(jié)果分析過程如下:
通過實(shí)驗(yàn)獲得數(shù)據(jù)庫應(yīng)用性能數(shù)據(jù)(如表6所示):

(1)地名/地址匹配時(shí)間數(shù)據(jù)
(2)地名/地址檢索數(shù)據(jù)準(zhǔn)確性
如表6(1)數(shù)據(jù)顯示:構(gòu)建數(shù)據(jù)庫地名/地址匹配時(shí)間范圍為86.138s-117.23s,現(xiàn)有數(shù)據(jù)庫地名/地址匹配時(shí)間范圍為120.25s-165.45s。如表6(2)數(shù)據(jù)顯示:構(gòu)建數(shù)據(jù)庫地名/地址檢索準(zhǔn)確性范圍為81.45%-89.45%,現(xiàn)有數(shù)據(jù)庫地名/地址檢索準(zhǔn)確性范圍為59.40%-75.33%。
通過上述實(shí)驗(yàn)數(shù)據(jù)對(duì)比可知:相較于現(xiàn)有數(shù)據(jù)庫來看,構(gòu)建數(shù)據(jù)庫地名/地址匹配時(shí)間更短,地名/地址檢索準(zhǔn)確性更高,充分證實(shí)了構(gòu)建數(shù)據(jù)庫應(yīng)用性能更好。
3
結(jié)束語
此研究以天地圖地理數(shù)據(jù)為基礎(chǔ),構(gòu)建了一個(gè)新的省市級(jí)節(jié)點(diǎn)地名/地址數(shù)據(jù)庫,極大地縮短了地名/地址匹配時(shí)間,提升了地名/地址檢索準(zhǔn)確性,為數(shù)據(jù)庫應(yīng)用與發(fā)展提供幫助,也為數(shù)據(jù)庫構(gòu)建研究提供一定的參考。
作者:陳伊玲
來源:《經(jīng)緯天地》2021年第4期
選稿:耿 曈
編輯:宋柄燃
校對(duì):賀雨婷
審訂:汪鴻琴
責(zé)編:杜佳玲
(由于版面內(nèi)容有限,文章注釋內(nèi)容請(qǐng)參照原文)
微信掃碼加入
中國地名研究交流群
QQ掃碼加入
江西地名研究交流群
歡迎來稿!歡迎交流!
轉(zhuǎn)載請(qǐng)注明來源:“江西地名研究”微信公眾號(hào)
熱門跟貼