[摘要]地理信息系統(tǒng)的迅速發(fā)展和廣泛應(yīng)用導(dǎo)致了空間數(shù)據(jù)多源性的產(chǎn)生,為數(shù)據(jù)綜合利用和數(shù)據(jù)共享帶來不便。本文探討空間數(shù)據(jù)多源性的產(chǎn)生和表現(xiàn),指出多數(shù)據(jù)格式是多源空間數(shù)據(jù)集成的瓶頸;分析和評價(jià)了多源空間數(shù)據(jù)集成的三種模式,并展望了多源數(shù)據(jù)集成的發(fā)展方向。
[關(guān)鍵詞]地理信息系統(tǒng)多格式數(shù)據(jù)源多源數(shù)據(jù)集成
一、多數(shù)據(jù)格式是多源空間數(shù)據(jù)集成的瓶頸
1、空間數(shù)據(jù)多源性的產(chǎn)生和表現(xiàn)
空間數(shù)據(jù)多源性的產(chǎn)生和表現(xiàn)主要可以概括為以下幾個(gè)層次:
(1)多語義性
地理信息指的是地理系統(tǒng)中各種信息,由于地理系統(tǒng)的研究對象的多種類特點(diǎn)決定了地理信息的多語義性。對于同一個(gè)地理信息單元(feature),在現(xiàn)實(shí)世界中其幾何特征是一致的,但是卻對應(yīng)著多種語義,如地理位置、海拔高度、氣候、地貌、土壤等自然地理特征;同時(shí)也包括經(jīng)濟(jì)社會信息,如行政區(qū)界限、人口、產(chǎn)量等。一個(gè)gis研究的決不會是一個(gè)孤立的地理語義,但不同系統(tǒng)解決問題的側(cè)重點(diǎn)也有所不同,因而會存在語義分異問題。
(2)多時(shí)空性和多尺度
gis數(shù)據(jù)具有很強(qiáng)的時(shí)空特性。一個(gè)gis系統(tǒng)中的數(shù)據(jù)源既有同一時(shí)間不同空間的數(shù)據(jù)系列;也有同一空間不同時(shí)間序列的數(shù)據(jù)。不僅如此,gis會根據(jù)系統(tǒng)需要而采用不同尺度對地理空間進(jìn)行表達(dá),不同的觀察尺
……(新文秘網(wǎng)http://120pk.cn省略887字,正式會員可完整閱讀)……
了瓶頸;sql(標(biāo)準(zhǔn)結(jié)構(gòu)化查詢語言)以及odbc的出現(xiàn)為這一難題提供了比較滿意的解決方案。但是空間數(shù)據(jù)如何引進(jìn)這種思想,或者說將空間數(shù)據(jù)也納進(jìn)標(biāo)準(zhǔn)組織和標(biāo)準(zhǔn)協(xié)議進(jìn)行規(guī)范和管理,從而使空間數(shù)據(jù)共享成為現(xiàn)實(shí)。
二、gis多源數(shù)據(jù)集成模式比較
由于地理信息系統(tǒng)的圖形數(shù)據(jù)格式各異,給信息共享帶來了極大的不便,解決多格式數(shù)據(jù)源集成一直是近年來gis應(yīng)用系統(tǒng)開發(fā)中需要解決的重要問題。目前,實(shí)現(xiàn)多源數(shù)據(jù)集成的方式大致有三種,即:數(shù)據(jù)格式轉(zhuǎn)換模式、數(shù)據(jù)互操作模式、直接數(shù)據(jù)訪問模式。
1、數(shù)據(jù)格式轉(zhuǎn)換模式
格式轉(zhuǎn)換模式是傳統(tǒng)gis數(shù)據(jù)集成方法(圖1)。在這種模式下,其他數(shù)據(jù)格式經(jīng)專門的數(shù)據(jù)轉(zhuǎn)換程序進(jìn)行格式轉(zhuǎn)換后,復(fù)制到當(dāng)前系統(tǒng)中的數(shù)據(jù)庫或文件中。這是目前gis系統(tǒng)數(shù)據(jù)集成的主要辦法。目前得到公認(rèn)的幾種重要的空間數(shù)據(jù)格式有:esri公司的arc/infocoverage、arcshapefiles、e00格式;autodesk的d*f格式和dwg格式;mapinfo的mif格式;intergraph的dgn格式等等。數(shù)據(jù)轉(zhuǎn)換模式主要存在的問題是:
。1)由于缺乏對空間對象統(tǒng)一的描述方法,從而使得不同數(shù)據(jù)格式描述空間對象時(shí)采用的數(shù)據(jù)模型不同,因而轉(zhuǎn)換后不能完全準(zhǔn)確表達(dá)源數(shù)據(jù)的信息。
(2)這種模式需要將數(shù)據(jù)統(tǒng)一起來,違背了數(shù)據(jù)分布和獨(dú)立性的原則;如果數(shù)據(jù)來源是多個(gè)代理或企業(yè)單位,這種方法需要所有權(quán)的轉(zhuǎn)讓等問題[1]。美國國家空間數(shù)據(jù)協(xié)會(nsdi)制定了統(tǒng)一的空間數(shù)據(jù)格式規(guī)范sdts(spatialdatatransformationstandard),包括幾何坐標(biāo)、投影、拓?fù)潢P(guān)系、屬性數(shù)據(jù)、數(shù)據(jù)字典,也包括柵格格式和矢量格式等不同的空間數(shù)據(jù)格式的轉(zhuǎn)換標(biāo)準(zhǔn)。許多軟件利用sdts提供了標(biāo)準(zhǔn)的空間數(shù)據(jù)交換格式。目前,esri在arc/info中提供了sdtsimport以及sdtse*port模塊,intergraph公司在mge產(chǎn)品系列中也支持sdts矢量格式。sdts在一定程度上解決了不同數(shù)據(jù)格式之間缺乏統(tǒng)一的空間對象描述基礎(chǔ)的問題。但sdts目前還很不完善,還不能完全概括空間對象的不同描述方法,并且還不能統(tǒng)一為各個(gè)層次以及從不同應(yīng)用領(lǐng)域?yàn)榭臻g數(shù)據(jù)轉(zhuǎn)換提供統(tǒng)一的標(biāo)準(zhǔn);并且sdts沒有為數(shù)據(jù)的集中和分布式處理提供解決方案,所有的數(shù)據(jù)仍需要經(jīng)過格式轉(zhuǎn)換復(fù)制到系統(tǒng)中,不能自動同步更新。
2、數(shù)據(jù)互操作模式
數(shù)據(jù)互操作模式是opengisconsortium(ogc)制定的規(guī)范。ogc是為了發(fā)展開放式地理數(shù)據(jù)系統(tǒng)、研究地學(xué)空間信息標(biāo)準(zhǔn)化以及處理方法的一個(gè)非盈利組織。gis互操作是指在異構(gòu)數(shù)據(jù)庫和分布計(jì)算的情況下,gis用戶在相互理解的基礎(chǔ)上,能透明地獲取所需的信息。ogc為數(shù)據(jù)互操作制定了統(tǒng)一的規(guī)范,從而使得一個(gè)系統(tǒng)同時(shí)支持不同的空間數(shù)據(jù)格式成為可能。根據(jù)ogc頒布的規(guī)范,可以把提供數(shù)據(jù)源的軟件稱為數(shù)據(jù)服務(wù)器(dataservers),把使用數(shù)據(jù)的軟件稱為數(shù)據(jù)客戶(dataclients),數(shù)據(jù)客戶使用某種數(shù)據(jù)的過程就是發(fā)出數(shù)據(jù)請求,由數(shù)據(jù)服務(wù)器提供服務(wù)的過程,其最終目的是使數(shù)據(jù)客戶能讀取任意數(shù)據(jù)服務(wù)器提供的空間數(shù)據(jù)。ogc規(guī)范基于omg的corba、microsoft的ole/com以及sql等,為實(shí)現(xiàn)不同平臺間服務(wù)器和客戶端之間數(shù)據(jù)請求和服務(wù)提供了統(tǒng)一的協(xié)議。ogc規(guī)范正得到omg和iso的承認(rèn),從而逐漸成為一種國際標(biāo)準(zhǔn),將被越來越多的gis軟件以及研究者所接受和采納。目前,還沒有商業(yè)化gis軟件完全支持這一規(guī)范。
數(shù)據(jù)互操作為多源數(shù)據(jù)集成提供了嶄新的思路和規(guī)范。它將gis帶入了開放式的時(shí)代,從而為空間數(shù)據(jù)集中式管理和分布存儲與共享提供了操作的依據(jù)。ogc標(biāo)準(zhǔn)將計(jì)算機(jī)軟件領(lǐng)域的非空間數(shù)據(jù)處理標(biāo)準(zhǔn)成功地應(yīng)用到空間數(shù)據(jù)上。但是ogc標(biāo)準(zhǔn)更多考慮到采用了opengis協(xié)議的空間數(shù)據(jù)服務(wù)軟件和空間數(shù)據(jù)客戶軟件,對于那些歷史存在的大量非opengis標(biāo)準(zhǔn)的空間數(shù)據(jù)格式的處理辦法還缺乏標(biāo)準(zhǔn)的規(guī)范。而從目前來看,非opengis標(biāo)準(zhǔn)的空間數(shù)據(jù)格式仍然占據(jù)已有數(shù)據(jù)的主體。
數(shù)據(jù)互操作規(guī)范為多源數(shù)據(jù)集成帶來了新的模式,但這一模式在應(yīng)用中存在一定局限性:首先,為真正實(shí)現(xiàn)各種格式數(shù)據(jù)之間的互操作,需要每個(gè)每種格式的宿主軟件都按照著統(tǒng)一的規(guī)范實(shí)現(xiàn)數(shù)據(jù)訪問接口,在一定時(shí)期內(nèi)還不現(xiàn)實(shí);其次,一個(gè)軟件訪問其他軟件的數(shù)據(jù)格式時(shí)是通過數(shù)據(jù)服務(wù)器實(shí)現(xiàn)的,這個(gè)數(shù)據(jù)服務(wù)器實(shí)際上就是被訪問數(shù)據(jù)格式的宿主軟件,也就是說,用戶必須同時(shí)擁有這兩個(gè)gis軟件,并且同時(shí)運(yùn)行,才能完成數(shù)據(jù)互操作過程。
……(未完,全文共4931字,當(dāng)前僅顯示2490字,請閱讀下面提示信息。
收藏《gis多源數(shù)據(jù)集成評論》)