wzatv:【j2开奖】机器学习模型出错的四大原因及如何纠错(2)_本港台直播_J2开奖直播

　　召回率则用来测量实际上的正类别多常被准确预测，以计算真正与假负（false negative, 例如预测邮件为非垃圾邮件，但事实上邮件是垃圾邮件）的总和里有多少个真正而得出。

　　另一种理解精确率与召回率区别的方法是，精确率测量的是对正类别的预测中有多少比例成真，而召回率则告诉你预测中多常能真正捕获到正类别。因此，当正类别预测为真的情况很少时，就出现了低精确率，当正类别很少被预测到的时候，就出现了低召回率。

　　一个良好的机器学习模型目标在于，通过试图最大化“真正”的数量以及最小化“假负”和“假正”的数量来实现精确率与召回率的平衡（如上图所示）。

　　5 种改进模型的方法

wzatv:【j2开奖】机器学习模型出错的四大原因及如何纠错

　　如果模型面临高偏差 vs. 高方差的问题，或者在精确率和召回率之间难以平衡，有几种策略可以采用。

　　比如机器学习模型出现高偏差时，你可以试试增加输入特征（input feature）的数量。上文已讨论过，高偏差出现于模型对背后的数据欠拟合时，在训练集和测试集都会出现高失误率。如果把模型的失误以基于输入特征个数的函数画出（见上图），我们发现特征越多，模型的拟合度越好。

　　同理，对于高方差，你可以减少输入特征的数量。如果模型对训练数据过拟合，有可能是你用了太多特征，减少输入特征的数量会使模型对测试或者未来数据更灵活。同样，增加训练样本的数量对高方差也是有益的，这会帮助机器学习算法建出一个更通用的模型。

　　对要平衡低精确率与低召回率的情况，你可以调整区分正负类别的概率临界值（probability threshold）。对低精确率可以提高概率临界值，以使模型在指定正类别时更为保守。反之，遇到低召回率时可以降低概率临界值，以能更常预测到正类别。

　　经过足够迭代，就很有可能找到一个能平衡偏差与方差，精确率与召回率的合适的机器学习模型了。

　　本文是基于 Andrew Ng 在 Coursera 上的斯坦福机器学习课程笔记里教授的概念。

　　原文地址：

新智元招聘

　　职位运营总监

　　职位年薪：36- 50万（工资+奖金）

　　工作地点：北京-海淀区

　　所属部门：运营部

　　汇报对象：COO

　　下属人数：2人

　　年龄要求：25 岁至 35 岁

　　性别要求：不限

　　工作年限：3 年以上

　　语言：英语6级（海外留学背景优先）

　　职位描述

负责大型会展赞助商及参展商拓展、挖掘潜在客户等工作，人工智能及机器人产业方向

擅长开拓市场，并与潜在客户建立良好的人际关系

深度了解人工智能及机器人产业及相关市场状况，随时掌握市场动态

主动协调部门之间项目合作，组织好跨部门间的合作，具备良好的影响力

带领团队完成营业额目标，并监控管理项目状况

负责公司平台运营方面的战略计划、合作计划的制定与实施

　　岗位要求

大学本科以上学历，硕士优先，atv，要求有较高英语沟通能力

3年以上商务拓展经验，有团队管理经验，熟悉商务部门整体管理工作

对传统全案公关、传统整合传播整体方案、策略性整体方案有深邃见解

具有敏锐的市场洞察力和精确的客户分析能力、较强的团队统筹管理能力

(责任编辑：本港台直播)