雅虎的机器学习工程师Stacey Svetlichnaya就在解决这些问题。当用户撰写或回复消息时,自动填充建议中应显示哪些表情呢?理想情况下,用户希望可以给出前五个表情符号来选择。 使用表情符号是高度动态的。一些用于替换图像,还有的用于表达情感…… 另一个挑战是emoji在不同平台的视觉风格迥然不同,容易造成误解。 不同平台的不同emoji表情 Svetlichnaya和雅虎视觉与机器学习团队(Yahoo Vision & Machine Learning Team)测试了三种不同的方法: FastText算法,一种快速线性分类器; LSTM算法,一种循环神经网络架构; WordCNN算法,一种平衡性能与复杂性的卷积网络。 当然,三者之中,FastText不出意外地成为了速度的胜利者,但人们似乎更喜欢LSTM的结果。 雅虎不是唯一将机器学习应用于emoji的公司。2015年,InstagramEngineering刊发了一套由工程师Thomas Dimson撰写的系列——Emojineering:机器学习表情符号趋势。 系列文章地址: https://engineering.instagram.com/emojineering-part-1-machine-learning-for-emoji-trendsmachine-learning-for-emoji-trends-7f5f9cb979ad#.wppfkra4e StitchFix更快地找到最适合你的时尚 时尚是件很难的事,但StitchFix使造型这件事变得很轻松。这家个性化造型创业公司使用户可以个性化风格,并且每月将精选的服装和配件送上家门。 定义风格可能是模糊的。毕竟,用户怎么能知道一件衬衫是否复古,或者一件衣服是否“性感”但又不显得“太放荡”。 Christopher Moody Moody是StitchFix的数据科学家,拥有统计学、天体物理学和计算机学的多学科学术背景。事实证明,“书呆子”的学术技能在时尚界是大有可为的。 许多深度学习模型是“黑匣子”,用户很难理解为什么算法得出特定的结论。Moody的研究集中于提高模型可解释性,使人类专家能够对算法的相对性能提供反馈。 一种方法是使用t-SNE(t分布的随机相邻嵌入),一种有助于降低可视化相似对象的维数的方法。许多深度学习模型使用人类不可能概念化的高维数据,维数减少方法将复杂的数据变成更易于理解的二维或三维散点图。 Moody也是k-SVD方法的狂热者。 k-SVD是k均值聚类方法的泛化。在高级非技术术语中,聚类分析指将具有类似属性的对象分组在一起。一旦已经识别出不同的集群,人类专家可以检查组合,以查看它们是否表现出任何统一的特征,并添加适当的标签,例如“背心”。 (责任编辑:本港台直播) |