人口数据大比拼(中科院 vs LandScan)- 基于76区县实测的精度对比与应用场景详解
摘要
本文详细对比分析了两套主流人口分布数据——中科院中国人口栅格数据(1990-2020)和LandScan全球人口栅格数据(2000-2023),从数据基本信息、使用方法、精度验证和应用场景四个维度进行全面解析,帮助读者根据实际研究需求选择合适的人口数据源。
一、中科院中国人口栅格数据(1990-2020)
1.1 数据基本信息
中科院中国人口空间分布公里网格数据集由中国科学院资源环境科学与数据中心(RESDC)开发,是目前国内应用最广泛的高分辨率人口分布数据之一。
数据特点:
采用Albers等面积投影,每个网格单元面积相等,便于人口密度计算
数据覆盖中国全境,包括城市、农村、山区、荒漠等各种地貌类型
人口分配考虑了土地利用类型,城镇、耕地、林地等不同类型的人口密度差异得到体现
1.2 数据使用方法(以统计中国区县人口总量和人口密度为例)
需要的基础数据
中国区县行政区划数据(国家2000坐标系)
2020年中国人口公里网栅格数据
数据处理流程
数据预处理
坐标系转换
由于中科院人口数据采用Albers等面积圆锥投影,为确保数据空间一致性,需将行政区划数据从国家2000坐标系投影转换至Krasovsky_1940_Albers投影坐标系。这一步骤能够保证矢量数据与栅格数据在空间位置上的精确匹配,为后续的区域统计分析奠定基础。
实现方式: ArcMap可通过Data Management Tools → Projections and Transformations → Project工具完成;QGIS可通过Processing Toolbox → Vector general → Reproject layer工具实现
数据质量控制
在进行区域统计之前,需要对原始人口栅格数据进行预处理,将背景值或无效值设置为NoData,以避免这些异常值影响统计结果的准确性。这一步骤确保只有有效的人口数据参与统计运算。
实现方式: ArcMap可通过Spatial Analyst → Map Algebra → Raster Calculator工具,使用SetNull函数实现
示例表达式:
SetNull("人口栅格" < 0, "人口栅格")
区域统计分析
利用GIS软件的区域统计功能,将行政区划矢量图层与预处理后的人口栅格数据进行空间叠加分析。系统会自动识别每个行政区划边界内的栅格像元,计算这些像元的人口总数(SUM)和平均值(MEAN)。其中,人口总数即为该区县的人口总量,平均值则反映了该区县的人口密度水平。
ArcMap操作: Spatial Analyst → Zonal → Zonal Statistics as Table
输入栅格:处理后的中国人口栅格数据
输入要素或区域:投影后的行政区划数据
输出表格:统计结果表
统计类型:SUM(求和)、MEAN(平均值)
QGIS操作: Processing Toolbox → Raster analysis → Zonal statistics
输入图层:行政区划数据
输入栅格:中国人口栅格数据
统计类型:sum、mean
二、LandScan全球人口栅格数据(2000-2023)
2.1 数据基本信息
LandScan全球人口分布数据是由美国橡树岭国家实验室(ORNL)开发的全球最权威、应用最广泛的高分辨率人口分布数据集之一。
数据特点:
提供2000-2023年连续24年的时间序列数据
覆盖全球所有陆地区域
由世界顶级科研机构开发,被广泛应用于学术研究和政府决策
2.2 数据使用方法(以统计中国区县人口总量和人口密度为例)
需要的基础数据
中国区县行政区划数据(国家2000坐标系)
2020年LandScan全球人口栅格数据
数据处理流程
重要说明: 由于LandScan数据采用WGS84地理坐标系,而国家2000坐标系与WGS84差异很小,因此可直接进行计算,无需进行投影转换。
区域统计分析
利用GIS软件的区域统计功能,将行政区划矢量图层与LandScan全球人口栅格数据进行空间叠加分析。系统会自动识别每个行政区划边界内的栅格像元,计算这些像元的人口总数(SUM)和平均值(MEAN)。其中,人口总数即为该区县的人口总量,平均值则反映了该区县的人口密度水平。
ArcMap操作: Spatial Analyst → Zonal → Zonal Statistics as Table
输入栅格:LandScan全球人口栅格数据
输入要素或区域:行政区划数据
输出表格:统计结果表
统计类型:SUM(求和)、MEAN(平均值)
QGIS操作: Processing Toolbox → Raster analysis → Zonal statistics
输入图层:行政区划数据
输入栅格:LandScan全球人口栅格数据
统计类型:sum、mean
注意事项:
由于LandScan数据采用WGS84地理坐标系(未投影),单元格的实际面积会随纬度变化而变化。越靠近两极,单元格面积越小。
计算人口密度时需要特别注意,不能简单使用"人口数/1"计算密度。
如需精确计算人口密度,建议先将栅格数据投影到等面积投影坐标系。
三、两份数据准确度分析(以2020年数据为例)
数据实测对比详情,请参考 76区县人口数据实测 - 中科院人口数据完胜LandScan
3.1 验证方法
选取多个样本区县,分别使用中科院人口数据和LandScan人口数据统计各区县的人口总量,与官方发布的第七次人口普查数据进行对比分析。
3.2 验证结果
为全面评估两份数据的准确性,我们选取北京市、广州市、重庆市、南京市共76个区县作为样本,以第七次全国人口普查数据为基准,对中科院人口数据和LandScan人口数据进行了详细验证分析。
3.2.1 整体精度对比
3.2.2 偏差分布分析
中科院人口数据偏差分布:
偏差在±1%以内的区县:18个(23.7%)
偏差在±3%以内的区县:52个(68.4%)
偏差在±5%以内的区县:70个(92.1%)
偏差超过±5%的区县:6个(7.9%)
LandScan人口数据偏差分布:
偏差在±10%以内的区县:35个(46.1%)
偏差在±20%以内的区县:52个(68.4%)
偏差在±30%以内的区县:62个(81.6%)
偏差超过±30%的区县:14个(18.4%)
3.2.3 城市间对比
3.3 结论
中科院人口数据更准确,与统计局发布的普查数据非常接近。
整体偏差控制在±3%以内,92.1%的区县偏差在±5%以内,数据稳定性好。而LandScan人口数据整体偏差约为±15%,部分区县偏差超过60%,偏差分布不均匀。这主要因为中科院数据基于中国本土的人口普查数据和行政区划数据开发,对中国境内的人口分布具有更高的精度。
四、两份数据的使用场景对比
选择哪份数据取决于研究区域、对时间分辨率的要求等因素。以下是两份数据的适用场景对比:
五、深入了解两份数据
如需详细了解中科院人口数据和LandScan全球人口数据的获取方式、数据详情等,请参考以下文章:
中科院中国人口数据详细介绍
文章标题: 【重磅免费】1990-2020年中国人口空间分布公里网格数据集,30年人口变迁尽在掌握!
获取方式: 关注微信公众号YouGIS顽石,私信发送"中国人口-YYYY"获取数据
支持年份: 1990、1995、2000、2005、2010、2015、2020
数据特点:
基于7次全国人口普查数据
采用多源数据融合的空间分配方法
考虑了土地利用、地形、交通路网、夜间灯光等多种因子
数据经过多次验证和校正,具有较高的准确性和可靠性
LandScan全球人口数据详细介绍
文章标题: 【免费获取】LandScan全球人口分布栅格数据(2000-2023) - 1km精度免费获取
获取方式: 关注微信公众号YouGIS顽石,私信发送"LandScan-YYYY"获取数据
支持年份: 2000-2023(共24年)
数据特点:
基于各国人口普查数据、行政区划数据、土地利用数据、夜间灯光数据等多种数据源
采用智能空间分配算法(Dasymetric Mapping)
结合土地利用、地形、道路、夜间灯光等多种因子
由美国橡树岭国家实验室开发,数据权威性高
六、数据使用建议
6.1 数据选择原则
研究区域优先: 中国境内研究优先选择中科院数据,全球或国外研究选择LandScan数据
时间要求优先: 需要每年更新数据的选择LandScan数据,需要早期历史数据的选择中科院数据
精度要求优先: 对精度要求高的中国境内研究选择中科院数据
6.2 数据处理注意事项
坐标系匹配: 确保矢量数据和栅格数据使用相同的坐标系
投影选择: 进行面积计算时,建议使用等面积投影
数据验证: 使用前建议与官方统计数据进行对比验证
数据引用: 使用数据时请注明数据来源
七、联系方式
如有数据使用问题或建议,欢迎通过公众号 YouGIS顽石 联系我们。

本文数据仅供学习研究使用,请勿用于商业用途。引用数据时请注明数据来源。

评论区