人口普查怪癖;以UBC区域为例

2022-02-21 01:52:31

人口普查数据是许多下游数据产品的基线,我们喜欢将其视为可靠和权威的数据源。加拿大人口普查的数据确实令人惊讶。但是计算人数是很困难的,人们看得越近,就越能意识到小问题。

要想动摇你对人口普查数据的信心,你只需要花30分钟浏览你熟悉的社区中的传播区块或传播区域数据。

有些领域比其他领域更容易列举。温哥华市以西的灰角半岛(Point Grey Peninsula)是一个更具挑战性的地区,也是人口普查多年来一直在努力解决的问题,该半岛由UBC/UNA/UEL社区组成。这是一个难以列举的领域,学生人数难以到达,他们通常居住的地方往往模棱两可,原因有很多。这一领域正在迅速变化,它涉及到许多判断,即是否将住房单元划分为私人住宅还是集体住宅。

这些问题困扰着加拿大各地的人口普查数据,但在灰点半岛尤其严重。这是一个很好的例子,可以详细了解人口普查数据中的小(有时是大)怪癖。

在比较两次人口普查的数据时,问题往往会突然出现。在2021次人口普查中,我们现在只有人口、家庭和居住人数。这些是所有人口普查数据的支柱,是所有其他数据的基本分母。

我们可以看到过去六次人口普查中发生的变化,这些地区从最初的四年中的单一人口普查道到2016的两次人口普查,在2021年中又分为3次。值得注意的是,涵盖南校区的人口普查区9330069.02基本上保持不变,但在保持相同名称的同时,有一些重要的边界变化。这意味着,如果我们想对普查区域进行统一划分,那么产生的最小公分母区域将是整个灰点半岛,就像这一时期的前四次普查一样。

道2016的2021和2021界限之间的差异有多大?GeoSueGe与新的2021个边界上的2016个人口数据一起,并且在3926处量化它,远低于原始边界中5080的人口。即使像这样微小的边界变化也很重要。

这是一个很大的警示故事,即地理标识可能不会在不同的人口普查中发生变化,即使基础地理发生了变化。这使得跨时间比较人口普查数据变得棘手,我们不能仅仅依靠地理标识符,还需要确保相关的地理区域匹配。向地理唯一标识符(DGUID)的转移以牺牲额外的复杂性为代价,缓解了这些问题。

但是为什么StatCan会改变人口普查区域的边界呢?为了理解为什么会发生这种边界变化,我们需要了解灰角半岛的行政景观。它是选举区A的一部分,是BC的一个非法人区。没有市政府,但有三个准行政实体在这片灰色半岛内运作。有UBC和校园住房服务(大部分)学生。此外还有联合国大学,这是一个准市政机构,拥有选举产生的董事会和有限的权力,监督校园土地上居民的一些事务,包括教职工住房,但也包括普通公共市场租赁和直接或间接从大学租赁的土地上的共管公寓。此外还有UEL,这是一个由该省管理的非法人区域,社区投入的机会有限,是三个群体中最小的(人口),但人们经常用它的名字来指代整个灰角半岛。

最近的边界变更(大致)将人口普查区9330069.04与UEL对齐,将另外两个留给UBC/UNA,这对不同的行政机构很有用。不幸的是,边界变化排除了Lel-m,在点灰色半岛的麝香发展,将是UEL行政区的一部分,但仍然是2021次人口普查中9330069.02的一部分。

将其与相当陈旧的自行人行道UBC项目中各个行政区域的细分进行比较

我们看到了勒姆,还有租给橙色高尔夫球场的穆斯奎姆土地,以及租给温哥华地铁的绿色太平洋精神公园。

我们想关注最近三次人口普查之间发生的事情,因为我们将深入到人口普查区层面,并对地理位置和价值观进行分析。我们将关注最近的三次人口普查。

这篇文章快速概述了三次连续人口普查中同分的地理位置,以及每个地区发生的变化。南校区的强劲增长显而易见。但是,居住单元减少的地区,以及人口大量减少的地区似乎很奇怪。

这值得仔细研究。让我们用图表显示这两个时期每个街区的变化,以便于剔除我们的指标、人口、住宅或家庭变化不到50的街区。

首先看一下住宅,我们注意到一种模式,住宅在2011-2016年被加上,在2016-2021年再次被减。这是地图上从蓝色变为红色的小三角形,主要是本科生家庭学生宿舍。在这段时间内,它既没有建造也没有拆除,只是在2016次人口普查中被重新分类为私人住宅,并在2021改为集体住宅。没有与此相关的人口变化,因为人口以相同的方式计数,主要是因为这不是他们通常的居住地。2016年,人口普查记录了785处住宅,其中136人作为常住居民居住在那里。2021,那里有45人居住,有74人居住。数据发生了巨大变化,但实际情况几乎没有变化。

说到2016-2021年的人口下降,我们可以在地图上更高的位置找到几个红色区域,对应于学生住房。在2021次人口普查期间,UBC在整个学期中一直处于完全远程运行状态,而校内学生人数只是正常规模的一小部分。虽然留在校园的学生中有更高比例的人会在校园里有他们通常的住所(与他们父母的住所相反),但他们的人数要少得多,最终结果是负面的。

让我们看看三次人口普查中这些指标的绝对数量的发展。为了更容易理解发生了什么,我们将根据计数是下降、上升、平坦还是呈现锯齿模式,粗略地对每个块中的每个度量进行分类。

表现出锯齿形图案的区域可能会重新分类,尽管在2011-2016年学生住宅增加,然后学生在2021岁的学生离开校园时,也可能发生人口的上升和随后的下降。表现出下降的地区可能也经历了某种重新分类,表现出持续上升的地区可能出现了住房,然后人口和家庭也增加了。

UBC区域强调了有关列举私人住宅与集体住宅、普通住宅和临时住宅的问题,以及它对居住在这些安排中的人的影响,以及他们在即将发布的人口普查概况数据中的表现。

例如,播送雷鸟学生公寓的传播块59150946020,其中2021个人口普查列出了一个家庭的1个住宅单元,总人口为635人。或拆除59154100003号地块,包括Cecile Green住宅和UBC总裁住宅。2021次人口普查列出了两个私人住宅单位,一个私人住宅和104个居住在那里的居民。

乍一看,人们可能会认为这些街区是大型公社的所在地,但59154100003街区可能发生的情况是,这两个住宅单元位于总统官邸内,总统的家人和家人住在那里。但绝大多数人口可能是Cecile Green居民的子集,他们声称Cecile Green是他们的常住地。类似地,59150946020街区的住宅可能是内部看门人。所有这些都不包括塞西尔·格林或雷鸟的居民,他们将在夏天回到父母的住处,这些都是在他们父母的住所计算的。

此外,居住在Cecile Green或Thunderbird的居民虽然被计算在该地区,但不被视为居住在私人家庭,因此将被排除在今年晚些时候公布的其他人口统计数据之外,年龄组细分除外。我们不会从人口普查资料中了解他们的种族、移民身份、语言、收入或其他人口普查变量。

这可能会产生很大的影响,根据2016年人口普查报告,15890人作为常住地居住在灰角半岛,其中13360人居住在私人家庭,其余2530人不包括在除年龄组细分之外的任何人口普查概况数据中。而那些通常居住在其他地方,但在一年的大部分时间里对该地区生活有很大影响的人,则根本不包括在内。在解释UBC或其他具有类似复杂枚举挑战的地区的人口普查数据时,这增加了额外的复杂性。

在59154083011号楼,我们可以看到更极端的情况,那里没有住宅单元,但有324人居住。有趣的是,虽然邻近的街区有学生宿舍,但这个街区实际上根本没有住房。

UBC校园内还存在其他问题,这些问题可能代表或不代表人口普查中更广泛的问题。块59154083011只是一个例子,但地理编码问题始终存在。它是59150863012号楼,列出了英吉利湾北端海滩上共15套住宅单元中的9户15人。或者更个人化地说,我的校园公寓楼自2016年人口普查以来就有了自己的人口普查区。然而,人口普查列出的住宅单元数量不到我大楼的一半。尽管在2021中向建筑物发送了枚举数。

这些怪癖始终存在,例如人口普查中有679人居住在2016密特草甸的卢格德高速公路中段,并通过2021次人口普查将他们移出,大概是因为他们的地理编码得到了改善。虽然不可能消除所有这样的问题,但令人失望的是,人口普查在地理编码方面仍然相当草率。在卑诗省,我们拥有优秀的卑诗省地址地理编码器,与卑诗省评估卷数据一起,可以极大地提高卑诗省人口普查数据的准确性。这已经通过加拿大住房统计项目掌握在StatCan手中。

人口普查数据很好,但人口普查数据也有很多怪癖和事情,可能会绊倒人们。当一个特定区域的事物看起来很有趣时,考虑谁是谁,谁是谁,总是一个好主意。使用NeXSUMMAPER使它向东变为块级,并读取人口、住所和住户数,以更好地了解更高的地理总计来自何处。卫星图像和街景可以提供更多的背景信息,尤其是在覆盖率很好的地方,我们必须能够通过时间倒退,并与以前的人口普查进行比较,以了解地区是如何变化的。深入的实地知识非常有助于增加额外的背景,有时对解决问题至关重要。

和往常一样,这篇文章的代码,包括从PDF中提取数据的代码,[可在GitHub上获得](https://github.com/mountainMath/doodles/blob/master/content/posts/2022-02-17-以ubc地区为例/指数的人口普查怪癖。任何人都可以复制或适应。

##R版本4.1.2(2021-11-01)###平台:AARC64-apple-darwin20(64位)###运行于:macOS Monterey 12.2.1#####矩阵产品:默认##BLAS:/Library/Frameworks/R.framework/Versions/4.1-arm64/Resources/libRblas。0.dylib##LAPACK:/Library/Frameworks/R.framework/Versions/4.1-arm64/Resources/lib/libRlapack。(1)在美国。UTF-8/ENU CA.UTF-8/UTF-8/ENU CA.UTF-8/ENU CA.UTF-8/ENU CA.UTF-8/ENU CA.UTF-8/ENU CAU.UTF-8/C/UTF-8/C/C/C/ENU CAU.UTF-8/C/C/C/C/C/C/UNU.UTF-8/C/C/C/C/C/U CAU.UTF.UTF-8/C/C/C/C/C/C/C/C/C/C/C/U CAU.UTF.UTF.UTF-8/C/C/C/C/C/C/C/C/C/C/C/C/C/C/C/C/C/C/C/C C C C/C/C C C C C/C C C C C C/C C C C C C/CAU.1.0-6##[3]Canccensus_0.5.0 tongfen_0.3.5##[5]猫_0.5.1 stringr_1.4.0#[7]dplyr_1.0.8 purrr_0.3.4##9.9.9.9.9.9.9.读写器2.2.1.1.1.1.1.1.1.9.9.9.9.9.9.9.9.3.3.3.3.3.5.3.5.5 355.5.5.3.3.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.3.1.1.1.1.1.1.1.1.1.1.1.1.1.3.1.1.1.1.3.1.1.1.1.1.1.1.1.3.1.1.1.1.3.3.3.1.1.3.1.3.3.1.1.3.1.1.3.1.1.3.3.1.1.3.1.1.1.1.1.1 2 R6_2.5.1 cellranger_1.1.0##[9]Backport_1.4.0 reprex_2.0.1 evaluate_0.14 e1071_1.7-9##[13]httr_1.4.21.3.1.1.1.1.1.1.1.1.1.1.1.1.1.3.1.1.3.1.3.1.1.3.1.1.1.3.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.6.6.4.4.4.4.4.4.4.4.4.4.4.4.1.4.4.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1.1选择_1.1.1 bookdown_0.24 fansi_1.0.2蜡笔_1.4.2 #[33]tzdb_0.2.0 dbplyr_2.1.1和R_2.4.31.3.3.3.0生命周期1.0.1 DB1.1.1 DB1.1.1 DB1.1.1 DB1.1.1 DB1.1.1 1.1 1.1.1.1.1.1.1.1.1.1.235#3535353535;35\35#[41]1.1.1.1.1.1.1.1.1.1.1.2\35\353535\35\35\35\35\353535\3535\35353535\35\3535\35353535#[41)#[41)GiT[41)gi2;[41)_0.3.2泛型_0.1.1 35;#[53]vctrs_0.3.8工具_4.1.2胶水_1.6.1 hms_1.1.1##[57]快速地图_1.1.0 yaml_2.2.1色彩空间2.0-2经典0.4-3 ##[61]rvest 1.0.2 knitr 1.36 haven 2.4.3 sass 0.4.0