【j2开奖】业界 | 谷歌开源机器学习可视化工具 Facets：从全新角度观察数据_本港台直播_J2开奖直播

参与：黄小天、李泽南

近日，出于支持 PAIR initiative的目的，谷歌发布了 Facets，一款开源的可视化工具。它可以帮助你理解、分析和调试 ML 数据集。Facets 包含两个部分——Facets Overview 和 Facets Dive——允许用户从不同的粒度观看数据的全景图，还可以轻易地被用在 Jupyter notebooks 之内，或者嵌入网页之中。除了开放 Facets 源代码，谷歌还创建了演示网站，Github 和网站地址见文中。

Github：https://github.com/pair-code/facets

演示网站：https://pair-code.github.io/facets/

从机器学习（ML）模型中取得最佳结果需要你对有数据有真正的理解。然而，ML 数据集的数据点一般有数百万种，每种包含数百个（甚至数千个）特征，开奖，致使不可能直观地理解整个数据集。可视化有助于解决大型数据集的这一难题。一图胜千言，直播，而一个交互式可视化不止胜千言。

出于支持 PAIR initiative，我们发布了 Facets，一款开源的可视化工具，帮助你理解和分析 ML 数据集。Facets 包含两个部分——Facets Overview 和 Facets Dive——允许用户从不同的粒度观看其数据的全景图。你可以使用 Facets Overview 可视化数据每一个特征，或者使用 Facets Dive 探索个别的数据观察集。这些可视化允许你调试数据，这在机器学习中和调试模型一样重要；还可以轻易地被用在 Jupyter notebooks 之内，或者嵌入网页之中。我们除了开放 Facets 源代码，还创建了演示网站，允许任何人在浏览器中直接可视化数据集而无需安装任何软件或设置，也无需数据离开你的计算机。

　　Facets Overview

Facets Overview 自动地帮助用户快速理解数据集中所有特征的值分布。多个数据集（比如训练集和测试集）可在同一个可视化中进行比较。束缚机器学习的一般性数据难题被推向最前端，比如出乎意料的特征值、具有高比例遗失值的特征、带有不平衡分布的特征，数据集之间的特征分布偏态（distribution skew）。