原文出自:switchfromshapefile.org
譯者注:本文略偏激,但是我大部分贊同不要再用 shp 格式的思想,積極擁抱新的生產力,
ESRI Shapefile 簡稱 shp 格式,是由 ESRI 公開的一種矢量資料格式,它已經有30多年的歷史了,
盡管這些年它為各行各業提供了巨大的生產力,但是它在現在這個需求越來越變態的行業中已經略顯力不從心,
作為 GIS IT 行業的一員,是時候停止使用 shp 格式并引入新格式了,
shp 格式好的一面
列舉了一些為什么它的占有率如此之高的原因:
- 各種軟體幾乎都內置支持
- 雖然格式是 ESRI 專有,但是其規范是公開的
- 在大多數場景中它夠用
- 索引檔案 (*.shx)為主檔案(*.shp)提供良好的讀取性能
- 檔案體積不大,它在未使用 zip 壓縮時都要比其他格式要小一些(尤其是文本型別的格式)
shp 是一種不好的格式
原因可就多多了:
- 無坐標系定義(憋急,待會你看下面仔細的介紹)
- 是一種多檔案格式
- 屬性名限制在10個字符
- DBF檔案限制了最多255個屬性
- 限制了資料型別,只能是 float、integer、date、text(text最多254字符)
- 并不指明編碼格式
- 單檔案最大2GB
- 無拓撲
- 幾何型別在一個檔案中是單一的
- 復雜的資料結構是存不了的
- 無法存盤帶紋理材質的三維資料;無法存盤引數化物件等
- 投影的定義
- 必須在要素級別挨個指定幾何型別,而不是在資料層面就指定
- 無空值
- ...
無坐標系定義
默認情況下,shp 格式是不帶坐標系定義的,必須額外使用一個 *.prj 檔案來定義,但是這里要說清楚,*.prj 并非 shp 格式規范里的內容,是額外加上去的,
多檔案格式
你至少要三個檔案才能完整使用一個 shp 格式 —— *.shx + *.shp + *.dbf,
你甚至見過更多的檔案,例如上面提到的 prj,還有 cfg,等等等等,通常,你需要進行 zip 打包或者挨個發送,才能保證資料完整,相信新手都有傳少檔案導致烏龍的情況,
屬性名最多10個字符
所以,在一些古老的高校中仍然推崇使用拼音首字母來寫屬性,你用英文單詞還隨時可能爆掉,
最多255個屬性
其實,255個屬性放在先進的場景下也足夠了,譯者并不覺得是什么缺點,
屬性值的型別支持得比較少
僅支持 float、integer、char、date 四種,對于 blob、陣列、影像 就不支持了,
不指明編碼格式
一定有朋友在剛接觸時,發現 shp 的屬性表是亂碼的,這就是編碼問題,原先編輯時用的是 gb 編碼,換一臺機器變成了 utf8,或者反過來,就會導致顯示亂碼,這個是歷史遺留問題,
最大 2GB
.shp 和 .dbf 檔案最大 2GB,雖然 GDAL 的驅動克服了這個限制可以達到 4GB
譯者覺得即使是 2GB,對于單份可編輯型資料來說也很大了,
無拓撲
它不存盤復雜的幾何關系,
不支持多幾何型別
一個 shp 檔案,只能是一種幾何型別的檔案,
譯者覺得保持檔案單一性也挺好的,并不認為一個資料檔案里有多種幾何型別是什么優點,
扁平的資料結構
鏈式資料結構,不支持層級資料的存盤等,
三維的支持很有限
multipatch 雖然是三維幾何形狀,但是并不支持存盤三維資料所需的紋理、材質資訊,
投影資訊互不兼容
通常,定義坐標系的 .prj 檔案使用的是 ESRI WKT 來定義坐標系統投影資訊,這個與 EPSG 的定義是不兼容的,
復合圖形必須在要素層面定義
例如 multi-polygon 和 multi-polyline,
無 NULL 值
無法在屬性欄位里寫“沒有資料”,不過譯者覺得這是個好事,
替代品
目前有完全能替代 shp 檔案格式的格式嗎?似乎沒有,畢竟瘦死的駱駝比馬大,在 shp 格式還沒有完全阻礙到生產之前,新格式并沒有那么重要,
列舉幾個:
- GeoPackage
- FlatGeobuf
- GeoJSON
- GML
- SpatialLite
- CSV
- KML
OGC GeoPackage
譯者注:早些年我就寫過 gpkg 格式的博客,百度搜即可,很容易找到,
主要特點:
- 以 SQLite 為基礎
- 單檔案
- 支持矢量和柵格
- 有官方拓展
- 多軟體支持
FlatGeobuf
譯者注:我也寫過這個格式,好好找找,能找到的~
主要特點:
- 使用 FlatBuffers 二進制編碼
- 單檔案
- 支持矢量資料
- 序列化和流式傳輸相當高效率
- 性能優秀
- 多編程語言、多軟體支持
GeoJSON
這個不必多說,用過都知道,短小精悍,但是缺點也很明顯,
OGC GML
這可能不太算一種 shp 格式的替代品,因為 GML 格式相對來說復雜得多,軟體支持率也不算很廣泛,
SpatialLite
SpatialLite 與 GeoPackage 一樣是基于 SQLite 拓展而來,但是它只支持矢量資料,不過能用 SpatialLite 的場景,一般也支持 GeoPackage,SpatialLite 只是特定場合的 shp 格式替代品,
CSV
就是一文本表格,它不一定是地理資料,但是它存盤地理資料的時候,最大的特點就是簡單,對非 GIS 行業的人來說特別友好,
OGC KML
kml 是因谷歌地球的歡迎而起家的一種矢量資料格式,最大的特點就是能把樣式也帶進資料里,其本質是一種 XML 文本檔案,僅支持 WGS84 坐標系,
ESRI GeoDatabase
作為一種 shp 替代品,GeoDatabase 格式完全稱職,但是它并不開源,且資料格式為 ArcGIS 專有,
特點:
- 面向物件的資料存盤格式
- 存盤介質是多個散列檔案
- 支持極為復雜的資料模型
- 專有格式且是閉源格式
轉載請註明出處,本文鏈接:https://www.uj5u.com/qiye/285875.html
標籤:GIS
上一篇:FlatGeobuf 編碼格式(fgb) —— 或許是 shp 格式的替代品
下一篇:XWiki 12.10.5 + MySql 8.0.23 + Tomcat 9 + Windows 10安裝程序中的一些問題及其解決
