该数据集描述了230年间(1749-1983)观测到的每月太阳黑子数量。单位是太阳黑子数量,有2820个观察值。数据集的来源为 Andrews&Herzberg(1985)。 下面是前5行数据的示例:
每日女婴出生人数数据集
该数据集描述了1959年加利福尼亚州每日出生的女婴人数。单位是人数,有365个观察值。数据集来源自 Newton(1988)。 下面是前5行的示例:
多变量时间序列数据集 多变量数据集(Multivariate datasets)通常更具挑战性,多变量时间序列数据的主要来源是 UCI 机器学习库(),下文推荐的3个数据集均可下载。 EEG 人眼状态数据集 该数据集描述个体的 EEG 数据,以及他们的眼睛是睁着还是闭着。这个问题是为了根据跟定的 EEG 数据预测眼睛的状态。 这是一个分类预测模型问题,共有14980个观察值和15个输入变量。 分类值“1”表示眼睛闭着,“0”表示眼睛睁开着。 数据按时间排序,记录观察结果的时间是117秒。 下面是数据集前5行的示例:
使用检测数据集(Occupancy Detection Dataset) 这个数据集描述有关房间特征的数据,目的是预测房间是否在使用中。数据集包含几个星期期间,共10560个一分钟的观察,属于分类预测问题。数据集包括7个特征值,例如房间的光线、气温、湿度等。 下面是前5行数据的示例,包括标题行:
臭氧水平检测数据集 这个数据集描述了6年期间的地面臭氧浓度数据,目的是预测是否“臭氧日”。数据集包含2,536个观察值,73个特征。 这是分类预测问题,类别值为“1”表示这天是臭氧日,为“0”表示正常日。 下面是前5行的示例:
总结 本文介绍了 10 个最受欢迎的标准数据集,你可以用它们来进行机器学习的应用练习。 可以采取以下步骤: 选择一个数据集。 选择你最喜欢的工具(例如 Weka,scikit-learn 或 R) 看看你的结果比基准分数高多少。 责编:XJ 新智元招聘 职位 运营总监 职位年薪:36- 50万(工资+奖金) 工作地点:北京-海淀区 所属部门:运营部 汇报对象:COO 下属人数:2人 年龄要求:25 岁 至 35 岁 性别要求:不限 工作年限:3 年以上 语 言:英语6级(海外留学背景优先) 职位描述 负责大型会展赞助商及参展商拓展、挖掘潜在客户等工作,人工智能及机器人产业方向 擅长开拓市场,并与潜在客户建立良好的人际关系 深度了解人工智能及机器人产业及相关市场状况,随时掌握市场动态 主动协调部门之间项目合作,组织好跨部门间的合作,具备良好的影响力 带领团队完成营业额目标,并监控管理项目状况 负责公司平台运营方面的战略计划、合作计划的制定与实施 岗位要求 大学本科以上学历,硕士优先,要求有较高英语沟通能力 3年以上商务拓展经验,有团队管理经验,熟悉商务部门整体管理工作 对传统全案公关、传统整合传播整体方案、策略性整体方案有深邃见解 具有敏锐的市场洞察力和精确的客户分析能力、较强的团队统筹管理能力 (责任编辑:本港台直播) |