当你建一个机器学习的模型时,这会很大程度上决定你算法表现的好坏。你需要很多很多的案例才能得到一个好的模型。相较于给外星人看几张照片,给他看更多的案例会让他学习的更好。 “ 但是不变的是,基于大量的数据建立简单的模型胜过只有少量数据的复杂模型。 ——Alon Halevy, Peter Norvig, and Fernando Pereira, Google. The unreasonable effectiveness of data. ” 我们花了很多时间来学习相关的课题,比如阅读,看视频,向人们请教等,但在真正上手练习之前还是会犹豫很久。 唯一能让你有所提高的办法就是去实践。 ◆ 不要死记硬背:避免过度拟合 回顾在学生时代的时候,你是否又有因为死记硬背某个数学题目的解法,却因为考试中的题目与记下来的题目稍有不同而解不出来?这其实是同样的概念,那一点点的不同就可以让你的方法一文不值。 如果你死记硬背一个流程同样会如此,我们会失去将问题普适化、解决没有见过的情形的能力。 在机器学习过程中,这个叫过度拟合。当你训练你的模型通过记忆来学习,就会发生这样的事情。这其实很危险,因为如我们如果用同样的数据集来测验,直播,直播,可能会有100%的拟合度,但当遇到没有见过的问题的时候会表现的很差很差。 当我们知道有办法可以点击一下鼠标就解决问题,就没有必要死记硬背了。 这就是为什么很多人学不会编程。他们会因为有太多的东西去要记忆而失去信心。可是,这正是问题本身——我知道的所有擅长编程的人都很会使用“谷歌”。 根据Eric Mazui (哈佛大学物理学教授,同时也是Peer Instruction的作者)的研究,一个互动式的学习会让学生对问题的理解力比死记硬背的学习高三倍。 这个道理很简单,强迫你自己在没有指导的情况下学习。当你自己弄明白了一些道理之后,你就可以回顾整个过程,这样可以避免没有理解就死记硬背。 ◆ 给你的训练做适当的变化:准备多样、有代表性的数据 我们通常会认为不断重复做同一件事会让我们最终成为专家。即使我们从中取得进步,但还有更快捷的方法。不只是练习本身,而是练习的方式。 最关键的就是使学习有变化。 最好的吉他手不只是演奏一个类型——这也是为什么摇滚明星不可能通过只玩摇滚而成为最卓越的演奏家。要达到他们的高度,需要不断尝试并练习不同的音乐类型。所有这些不同的类型的特质,会帮助吉他手成为全能大师。 “ 如果不知道布鲁士…就没有办法用吉他玩摇滚或是其他大众音乐。 ——Keith Richards ” 要想在某一领域有所建树,你不可以只是重复做同一件事。你必须要使得你做的事情有所变化,这样才能有更普适的能力。 用代表不同情形的数据来训练一个机器学习模型是至关重要的一点。 如果你想教那个外星人朋友椅子长什么样,就需要保证提供给他不同类型、不同视角的照片。 下一次当你想学习一项新的技能,尝试尽可能的从不同的视角进行学习。 ◆ 不要重新发明轮胎:学会迁移学习 在硅谷你会见到很多换了新的工作领域的人都做得非常好。有建筑师转去做设计师,律师去做销售代表,工程师去做市场营销人员等等。有趣的是,他们都会发现有很多原来工作中的知识可以应用到新的工作。 在人工神经网络(主要用于图像识别)领域有一个叫转移学习的技巧。无须把全部的东西重建,你可以用以前训练过的相似的任务中的一部分放入新的任务。不难想象,这会帮助提高模型的表现并能节省很多时间。 (责任编辑:本港台直播) |