Jeff:在上述例子中,数据中心运行良好因为你一次可以执行的操作不多。这有 18 个旋钮,你在那里可以上下旋转它们。结果是可以测量出来的。假设你在适当的可接受的温度范围内工作,你就会得到一个让能耗降低的反馈操作。从这个角度看,这几乎是一个理想的强化学习的问题。 一个更加棘手的强化学习的例子是试图用它来决定我该显示什么样的搜索结果。这有一个更加广泛的搜索结果集,我可以展示出对于不同查询的反应,并且回馈信号有一点嘈杂。就像是用户在看着一个搜索结果,喜欢和不喜欢都不是那么明显。 问:你如何衡量他们不喜欢某一个结果? Jeff:是的,这的确是一个棘手的问题。举个例子,强化学习可能还不够成熟,以至于在这些极度无约束的环境中,回馈信号还不是那么明显。 问:在将研究成果应用于人们每天使用的实际产品时,有哪些比较大的挑战? Jeff:其中一个就是,很多机器学习问题的解决方案和我们对这些解决方案的研究可以在不同的领域中重复使用。例如,我们与地图团队合作了一些研究。他们想要读取出现在街头的所有商业名称和标志来更好的了解世界,比如确定这个东西是披萨店还是别的什么。 事实证明,为了在这些图像中找到文本,你可以训练一个机器学习模型,给它一些样本数据,比如人们在文本周围绘制圆圈或者方框。实际上,你可以用它来训练模型去检测图像中的哪些像素包含文本。 这是一个普遍适用的功能,Map 团队中的不同部门可以重复使用以上模型来完成卫星图像分析任务,比如在美国境内或者世界范围内找到一个屋顶或者估计在屋顶上的太阳能电池板的安装位置。 然后我们发现,同样类型的模型可以帮助我们解决医学成像的初步工作。现在,你有了医学的图像,直播,并且你在尝试找到这些与临床相关的图像的有趣部分。 ©本文为机器之心编译文章,转载请联系本公众号获得授权。 ?---------------------------- 加入机器之心(全职记者/实习生):[email protected] 投稿或寻求报道:[email protected] 广告&商务合作:[email protected] (责任编辑:本港台直播) |