A Data-Driven Deep Learning Model for Weekly Sea Ice Concentration Prediction of the Pan-Arctic During the Melting Season

发表于 2024-09-05 更新于 2025-03-31 分类于论文阅读

论文地址：researchgate

摘要

作者提出了一个名叫 SICNet 的网络，采用编码器-解码器框架，结合全卷积网络（FCNs），可以以高精度预测未来一周的 SIC。同时，设计了一个时空注意力模块（TSAM）以帮助 SICNet 从 SIC 序列中捕捉时空依赖性。

模型的预测方法为递归预测，同时采用二进制准确性（BACC）指标来衡量预测的海冰范围（SIE）的准确性。

当前基于深度学习的 SIC 预测还有以下 3 个问题：

现有的模型中很不有用于泛北极每日 SIC 的像素级预测模型。
预测的准确性可以进一步提高
纯粹的卫星衍生 SIC 能否支持泛北极每日 SIC 的每周预测

为了解决以上问题，作者提出了纯数据驱动的模型，叫 SICNet，基于全卷积网络，可以输出与输入图像大小相同的图像，而不仅仅是预定义窗口的中心网格。SICNet 采用了编码器-解码器结构。

同时，构建了一个时空注意力模块，将其集成到 SICNet 中，这有助于模型准确捕捉时空依赖关系。

贡献

SICNet 比现有的模型更轻量
仅以 SIC 作为输入，SICNet 在七天前的 SIC 预测中将平均绝对误差降低到 3%以下。
SICNet 比现有基于深度学习的模型表现更佳
SICNet 在递归预测方面比异常持续表现更好
SICNet 效果更好

模型的数据

每日 SIC 数据来自美国国家冰雪数据中心（NSIDC）。

SIC数据的空间分辨率为25公里，采用北极立体投影。我们关注覆盖320×224网格（北纬90°至北纬45°，东经180°至西经180°）的核心区域。时间覆盖范围为33年，从1988年到2020年。由于北极航行活动主要在夏季进行，我们重点预测从4月1日至9月30日的融化季节的SIC，每年共183天。实验数据集包含6039天。

以下是四个 SIC 示例：

模型架构

SICNet 采用编码器-解码器结构，包括五个模块：输入，编码器，解码器，拼接和输出。

首先，编码器从历史 SIC 序列中捕获不同尺度的时空依赖关系，并形成降尺度的时空特征图。其次，解码器逐级恢复降尺度的时空特征图的尺度，直到输出序列与输入序列大小相同，以实现泛北极SIC的像素级预测。最后，由编码器和解码器捕获的中间时空图拼接在一起，形成多尺度的时空依赖关系。

同时，为了增强捕获的时空依赖表示，提出了一个TSAM（时空注意模块）单元，并将TSAM集成到编码器和解码器单元中。

模型的输入

模型使用过去七天的历史 SIC 来预测接下来的几天。所以，输入是前七天的 SIC 序列，如图 2 a 所示。

设当前是第 $T$ 天，则 $X_i$ 是第 $i$ 天的 SIC，其空间形状为 $320224$，所以，对于模型的输入来说，就是 $320224*7$ 的 SIC 序列。

编码器设计

编码器的目标是从历史 SIC 序列中捕获时空依赖关系。编码器包含一个 $CNN_{TSAM}$ 块，8 个 $ResNet_{TSAM}$ 块，4 个最大池化层，可以从图 2 b 所见。

一个 $CNN_{TSAM}$ 块是一个 CNN 层叠加 TSAM，其结构如图 3 a 所示。

一个 $ResNet_{TSAM}$ 块是一个集成了 TSAM 块的残差 CNN 单元。一个 ResNet 单元包含两个堆叠的 CNN 层，并有一个快捷连接将输入和第二个 CNN 层的输出连接在一起。TSAM 堆叠在 ResNet 内部的第二个 CNN 层上，如图 3 b 所示。

编码器有五个阶段，第一个阶段是一个 $CNN_{TSAM}$ 块，剩下的四个阶段中，每个阶段包含两个 $ResNet_{TSAM}$ 块。在五个阶段之间有两个 $22$ 卷积核的最大池化层。每个最大池化层之后，特征图的大小减半、一个阶段中的卷积核数量分别为 C*2,C*4,C*6,C*8,C*10。C 为输入序列中的通道数，为 $7$。编码后，输入的序列的形状（$3202247$）会被转换为特征图形状 $2014*(C*10)$

解码器的设计

解码器的目标是恢复降尺度的时空特征图以进制像素级预测。

解码器有 4 个 $ResNet_{TSAM}$ 块和 4 个上采样层，如图 2 c 所示。$ResNet_{TSAM}$ 块与编码器中的结构相同。4 个上采样层将 $2014$ 的网格放大到其原始大小：$320224$。四个 $Resnet_{TSAM}$ 块中的卷积核数量（从下到上）分别为 $C8,C6,C4,C2$。C 为输入序列中的通道数，$7$。解码步骤后，降尺度的特征图形状为（$2014(C10)$），被重新缩放为特征图形状为 $320224*(C*2)$。

拼接

对于 SIC 预测，时间上的空间依赖存在于不同的空间尺度。比如：北极中心网格的SIC变化很小，而北极盆地边缘海的SIC变化很大。

不同区域的SIC的时空依赖存在于不同的尺度上，尤其是在融化季节。不同尺度的空间依赖被编码到不同层次的特征图中。使用四个拼接来融合多尺度的空间依赖，以连接由相同层次的编码器和解码器捕获的特征图，如图2(d) 所示。

输出

解码器输出的特征图被输入到由一个CNN层和 N 个1 × 1卷积核组成的输出模块中。N 是预测的SIC序列的长度，为 $7$。一个sigmoid层对卷积输出进行非线性激活，以预测每个网格的SIC。sigmoid函数输出所有在 [0, 1] 之间的值，与SIC的范围相同。输出的形状为320 × 224 × 7，这是从 X + 1 到 X + 7 的泛北极SIC预测，

TSAM 设计

CBAM 已经证明了，注意力在感知中起着至关重要的作用。图 3 c 展示了 CBAM 的详细结构。给定一张图，通道注意力有助于优化显著特征。

CBAM 是为计算机视觉任务设计的，比如图像分类与分割。对于分类任务，提取的特征图中的通道通常代表不同类别的特征表示。CBAM 使用 MLP 来生成通道注意力权重。它可以提取任意两个通道之间的全局依赖关系，而不是通道序列之间的顺序依赖关系。但是，输入 SIC 捕获的特征通道包含时间依赖关系，而原始 CBAM 中的 MLP 无法捕获时间依赖关系与顺序依赖关系。为了解决这个问题，提出了一个时间注意力模块来替换 CBAM 中原始的通道注意力模块，形成了 TSAM。

TSAM 有两个过程，时间与空间注意力模块，其结构如图 3 d 所示。时间注意力模块采用时间卷积网络（TCN）来提取特征通道中的时间依赖关系。TCN 使用一个一维全卷积网络架构，其中每个隐藏层的长度与输入层相同，并添加长度为 [卷积核大小-1] 的零填充以保持后续层的长度与前一层相同。

提取序列依赖关系的关键点是不能从未来泄漏到过去，所以使用因果卷积来实现，其中时间 $t$ 的输出仅与上一层中时间 $t$ 及更早的元素进行卷积。因此，因果卷积只能回顾历史，大小与网络深度成线性关系，限制了被建模序列的长度。TCN 使用膨胀卷积来解决上述限制。

以下 a 图是一个膨胀因子 $d=1,2,4$ 和因果卷积滤波器大小 $k=3$ 的 TCN 示例。

当 d=1 时，膨胀卷积就等于常规卷积。较大的膨胀使得顶层隐藏 TCN 层代表更广泛的输入满园，从而有效的了感受长度。

SICNet 中的 TCN 模块如图 4 b 所示。所有的参数都是通道实验确定的。

模型评估

作者将 33 年的数据分为训练集，验证集与测试集：1988-2013 用于训练，2014-2015 用于验证，2016-2020 用于测试。

SICNet在测试数据上的MAE、MAPE和NSE如表I所示。

图5(a)-(e)中展示了五年内MAE、预测值和真实值的时间分布。所有非陆地区域每天的MAE、预测值和真实值（从4月8日到9月29日）都是空间平均的。SIC预测在预测期内与真实值高度一致。融化趋势、最小点以及从融化到冻结的逆转趋势都被SICNet准确拟合。MAE范围为0.97%到5.63%，周期为七天。

图6展示了2019年9月2日至8日的细节。总体而言，预测值与NSIDC数据一致，如图6(a)和(b)所示。前三天，大多数地区的残差在（-10%，10%）范围内。接下来的四天，差异逐渐增加，但大多数情况下残差仍在（-20%，20%）范围内，如图6(c)和(d)所示。结果，SICNet在中心区域高估了SIC，而在北冰洋边缘海域低估了SIC ，见图6(c)。图7展示了与图6相似的趋势。前三天大多数地区的残差范围约为（-10%，10%），如图7(c)和(d)所示。最后四天，大多数地区的残差在（-20%，20%）范围内，北冰洋边缘海域有一些高估值。

在所有三个指标中，SICNet优于CNN和LSTM模型。

理论上，CNN和LSTM模型应该比SICNet更好地拟合测试数据。然而，在实践中，SICNet表现优于其他两个模型。这种现象是因为SICNet在不同层次上捕捉并融合了空间和时间依赖性。

虽然CNN模型也捕捉了空间和时间依赖性，但没有融合不同层次的相关性。LSTM模型仅捕捉时间依赖性，但无法捕捉空间依赖性。

消融实验

TSAM 的有效性

对比了三种模型：

不带任何注意力机制的 SICNet 模型（$SICNet_{noat}$）
带有经典 CBAM 模型（$SICNet_{CBAM}$）
带有 TSAM 模型（$SICNet_{TSAM}$）

结果如下：

可以看到，$SICNet_{CBAM}$ 在所有三个指标上均优于 $SICNet_{noat}$，而 $SICNet_{TSAM}$ 在所有三个指标上均优于 $SICNet_{CBAM}$。

作者使用了显著性检验，来确定三个比较模型的预测 SIC 是否存在统计显著差异。

三个模型的预测通过成对组合进行测试，结果如下所示：

由于所有三个 p 值均小于 0.05，所以三个预测结果之间的差异是显著的，TSAM 带来的改进也是显著的。

作者还探讨了三个比较模型之间 MAE 差异的时间和空间分布。每晶的 MAE 差异如下：

红色/蓝色线分别代表MAE差异（$SICNet_{noat}$ 与 $SICNet_{TSAM}$）/（$SICNet_{noat}$ 与 $SICNet_{CBAM}$）。灰色虚线是零差异的基线。

高于零基线的点意味着被减模型（$SICNet_{CBAM}$ 或 $SICNet_{TSAM}$）的MAE小于 $SICNet_{noat}$ 的MAE。

可以知道：在北极的大多数区域，$SICNet_{TSAM}$ 取得的MAE比 $SICNet_{noat}$ 和 $SICNet_{CBAM}$ 更小。因此，与不带任何注意力机制的模型和经典CBAM机制相比，所提出的TSAM可以有效减少SIC预测中的误差。

讨论

SIC 衍生辅助输入对预测的影响

作者衍生了两种辅助数据：SIC_Anom（SIC 异常值）与 SIC_Last_Year（与预测期一致的去年的 SIC 序列），并将这两种数据逐一加入模型输入、

结果如下表与图 10 a所示：

可以看到：

SIC和SIC_Anom作为输入的误差与仅用SIC相同。
加入了去年的 SIC 只会增加预测误差，所以，这对每周预测没有贡献。

输入长度对预测的影响

将输入从 7 天变化到 28 天，输出保持 7 天不变，其它的设置不变。结果如下表与图 10 b所示：

可以看到，预测误差随着输入的长度的增加而增加，NSE（Nash-Sutcliffe Efficiency，纳什效率系数）系数减少。图 10 b 也能说明，MAE 也出现了类似的趋势。

递归预测：每周到每月

通过递归地预测多周的 SIC 序列，可以看到以下的结果：

MAE和MAPE（Mean Absolute Percentage Error，平均绝对百分比误差）随着递归步骤的增加而增加，NSE相应减少。无论是数值模型还是统计模型，预测性能通常随着预测长度的增加而下降。然而，在四周（28天）的预测长度下，最大MAE为4.20%，仍然相对较小。

为了更好的评估模型在递归预测中的表现，作者基于预测的 SIC 计算海冰边缘，并采用BACC（Balanced Accuracy，平衡准确率）指标来衡量预测和实际冰缘的接近程度。

其定义公式如下：

$$
BACC = (1-\frac{IIEE}{活跃网格单元区域面积} * 100%)
$$
其中，IIEE 定义为所有局部 SIC（Sea Ice Edge，海冰边缘）被高估或低估区域的总和。可以将 BACC 看成是 IIEE 的归一化版本。活跃网格单元区域是1988-2020年观察到的最大每日SIE（SIC大于15%）。

作者使用异常持久性（Persist）方法作为基准来比较模型。选择8月26日至9月22日，共四周（28天），作为评估模型性能的时期。零递归步骤、一个递归步骤和三个递归步骤的预测通过BACC指标进行评估。

其结果如图 11 所示：

作者绘制了两个模型（persist 与 SICNet）的预测 SIC（SIC>15%），结果如下所示：

与Persist的SIE相比，SICNet的SIE与NSIDC观察到的SIE更一致。在第二和第三步预测中，SICNet的优势更加明显。对于第三步预测，四年（2016-2019年）的平均BACC值比Persist高2.82%，如图12(d)、(h)、(l)和(p)所示。基于上述分析，SICNet在递归预测中表现良好，2016-2019年第28天的平均BACC值超过90%（90.17%）。

极端情况下的性能

作者探讨了 SICNet 在三个情况下的表现：即最小SIE值：2007年9月、2012年和2020年。

零递归步骤和三递归步骤的BACC如图13(a)和(b)所示。预测的SIE误差（SIEE），即预测的海冰面积减去观察到的海冰面积，如图13(c)和(d)所示。

对于三个小SIE的情况，随着递归步骤的增加，BACC下降，SIEE增加，SICNet的优势变得越来越明显，如图13(b)和(d)所示。

总体来说， SICNet在22-24天预测中表现出显著优势