Moirai 是 Salesforce 开发的用于时间序列预测的基础模型。它被设计为一种通用模型,能够预测广泛的时间序列。为了实现这种灵活性,该模型解决了时间序列数据相关的几个挑战,包括:

  • 处理各种数据频率(小时、日、周等);
  • 适应任何数量和类型的协变量,无论它们在未来是否已知;
  • 使用灵活的分布生成概率预测,可适应多种情况。

17201126-2024-06-17T12:11:55.png
数据集是任何基础模型的核心组成部分。作者构建了一个大规模且多样化的数据集,包含了270亿观测值,涵盖了九个不同的时间序列领域。另外他们还引入了三个主要的新概念:多尺寸补丁投影层(Multi Patch Size Projection Layers)、任意变量注意力(Any-Variate Attention)和混合分布(Mixture Distribution)。

在分布外/零样本预测评估中,Moirai始终展示出竞争性能,甚至在某些情况下超越了最先进的全样本模型。这种优越性在概率预测和长序列预测基准测试中观察到。
17200959-2024-06-17T12:10:27.png
以下是Moirai在流行数据集上进行零样本预测的一些可视化。如图所示,Moirai巧妙地制作了从ETTh1-1和ETTh1-2中标记出的具有明显季节性模式的预测,同时也准确地捕捉了来自ETTm1-1和ETTm1-2的趋势模式。这些插图强调了Moirai在各种场景中提供有见地预测的能力。

论文:https://arxiv.org/abs/2402.02592
预训练代码:https://github.com/SalesforceAIResearch/uni2ts
预训练数据集:https://huggingface.co/datasets/Salesforce/lotsa_data