Простой способ подмножества SpatialPolygonsDataFrame (т. е. удаление полигонов) по атрибуту в R


Я хотел бы просто удалить некоторые полигоны из объекта SpatialPolygonsDataFrame на основе соответствующих значений атрибута в @фрейма данных, так что я могу построить упрощенный/выполнена шейп. До сих пор я не нашел способ сделать это.

например, допустим, я хочу удалить все полигоны с этой мировой шейп-файл, которые имеют площадь менее 30000. Как бы я это сделал?

или, аналогично, как я могу удалить Антарктика?

require(maptools)

getinfo.shape("TM_WORLD_BORDERS_SIMPL-0.3.shp") 
# Shapefile type: Polygon, (5), # of Shapes: 246
world.map <- readShapeSpatial("TM_WORLD_BORDERS_SIMPL-0.3.shp")

class(world.map)
# [1] "SpatialPolygonsDataFrame"
# attr(,"package")
# [1] "sp"

head(world.map@data)
#   FIPS ISO2 ISO3 UN                NAME   AREA  POP2005 REGION SUBREGION     LON     LAT
# 0   AC   AG  ATG 28 Antigua and Barbuda     44    83039     19        29 -61.783  17.078
# 1   AG   DZ  DZA 12             Algeria 238174 32854159      2        15   2.632  28.163
# 2   AJ   AZ  AZE 31          Azerbaijan   8260  8352021    142       145  47.395  40.430
# 3   AL   AL  ALB  8             Albania   2740  3153731    150        39  20.068  41.143
# 4   AM   AM  ARM 51             Armenia   2820  3017661    142       145  44.563  40.534
# 5   AO   AO  AGO 24              Angola 124670 16095214      2        17  17.544 -12.296

Если я делаю что-то подобное, сюжет не отражает каких-либо изменений.

world.map@data = world.map@data[world.map@data$AREA > 30000,]
plot(world.map)

тот же результат, если я сделаю это:

world.map@data = world.map@data[world.map@data$NAME != "Antarctica",]
plot(world.map)

любая помощь приветствуется!

5 57

5 ответов:

похоже, что вы перезаписываете данные, но не удаляете полигоны. Если вы хотите сократить набор данных, включая как данные, так и полигоны, попробуйте, например,

world.map <- world.map[world.map$AREA > 30000,]
plot(world.map)

[[Edit 19 April, 2016]] Это решение раньше работало, но @Bonnie сообщает иначе для более новой версии R (хотя, возможно, данные тоже изменились?): world.map <- world.map[world.map@data$AREA > 30000, ] Upvote @ответ Бонни, если это помогло.

когда я попытался сделать это в R 3.2.1, техника Тима риффа выше не работала для меня, хотя изменение ее немного исправило проблему. Я обнаружил, что мне пришлось специально ссылаться на слот данных, прежде чем указывать атрибут для подмножества, как показано ниже:

world.map <- world.map[world.map@data$AREA > 30000, ]
plot(world.map)

добавление этого в качестве альтернативного ответа в случае, если другие сталкиваются с той же проблемой.

я использовал вышеописанную технику, чтобы сделать карту только Австралии:

australia.map < - world.map[world.map$NAME == "Australia",]
plot(australia.map)

запятая после "Австралия" важна, как выясняется.

writeOGR(australia.map,".","australia",driver="ESRI Shapefile")
australia.map < - readOGR(".","australia")
writeOGR(australia.map,".","australia_small",driver="ESRI Shapefile")

в моей системе, по крайней мере, это функция "read", которая удаляет нулевые данные, поэтому мне нужно записать файл после его чтения один раз (и если я попытаюсь повторно использовать имя файла, я получу ошибку). Я уверен, что есть более простой путь, но это, кажется, работает достаточно хорошо для моих целей.

просто чтобы отметить, что subset также делает работу избегая написать имя данных в условии.

world.map <- subset(world.map, AREA > 30000)
plot(world.map)

как второй указатель: это делает не работа для шейп-файлов с "отверстиями" в фигурах, потому что это подмножество по индексу.