机器学习可以在时间序列数据集上应用。这些属于需要预测数值或分类的问题,但数据是按时间排序的。下面介绍7个标准时间序列数据集,可用于使用机器学习进行时间序列预测的实践。 单变量时间序列数据集 只有一个变量的时间序列数据集称为单变量数据集(univariate datasets),其优点是: 简单且容易理解; 支持excel或其他绘图工具; 易于预测结果和期望结果的比较; 易于尝试你并评估新的方法。 以下是4个单变量时间序列数据集,均可从datamarket上下载。 洗发水销售数据集(Shampoo Sales Dataset)
该数据集描述了3年期间的洗发水月销售量,单位是销售量,有36个观察值。下面是该数据集前5行的示例,包括标题行:
日最低温度数据集(Minimum Daily Temperatures Dataset)
该数据集描述了澳大利亚墨尔本市10年间(1981-1990)的日最低温度。单位是摄氏度,有3650个观察值,数据来源为澳大利亚气象局。 下面是该数据集前5行数据的示例:
每月太阳黑子数数据集(Monthly Sunspot Dataset) (责任编辑:本港台直播) |