人工智能引擎交互的另一个潜在的副作用是其扩大了训练偏差的风险。例如,一辆无人驾驶汽车可以观察到另一辆无人驾驶汽车以牺牲行人为代价来保护车上的乘客,并且观察到这样的选择机制保障另一辆车自身免出事故,那么这辆车将学会在相似情景下采取相似的做法。这样将会导致偏差泄露,即各自独立训练得到的人工智能引擎能够被其他的人工智能引擎所影响(正面或负面影响)。 学习的敏捷性(Learning Agility) 即使给相似的人工智能引擎提供相同的训练数据,但训练环境和用以训练架构的不同仍会导致训练和学习过程以不同的速率进行,并得出不同的结论来作为输出结果。这些细微偏差经过多次迭代,将导致人工智能引擎的行为表现产生巨大变化,随之而来的是始料不及的后果。 「陈腐」的人工智能引擎和「废料堆积场」 在一个由人工智能驱动的产品组成的世界里,如果这些产品被遗弃或者逐渐消亡将会发生什么。植入的人工智能或许会逐渐被冻结,久而久之变成人工智能的废料堆积场。这些被遗弃的人工智能驱动的产品,是处于对其环境和使用情境学习的巅峰时刻直到消亡时刻到来,如果在另一个时间因为任何原因复活,环境和使用情境还会再次导致不可预测或不理想的作用。 新的人工智能开源模式 我们需要一个开源的人工智能新模式,它可以提供一个框架来解决上面列出的一些问题。考虑到人工智能的特质,仅仅将之前的用于构建人工智能和机器学习引擎的技术开源并嵌入到产品中是远远不够的。此外,与科学研究相似,业界也需要将用于大规模生产的人工智能和机器学习引擎反馈回学界,从而为新的改进的系统、引擎和产品提供基础支撑。 基准、参照和标准 对于所有的基础场景,例如自动驾驶汽车、图像识别、语音文本转换等,尤其是在面对多个服务提供商的情况下,行业需要定义基准和标准,以应对所有其它新的或现有的人工智能引擎和堆栈的评估排名(例如,就像人工智能相当于自动驾驶汽车的美国国家公路交通安全管理局的 5 星级安全评级)。为基础情景定义业界可接受的基准,可以确保服务提供商和消费者能够在选择使用人工智能和机器学习的产品和服务方面做出明智的决策。此外,可以根据现有的基准和标准不断地评估现有的人工智能引擎,以确保这些系统的质量不断提高。 构建人工智能和机器学习模式的公司应考虑将整个人工智能和机器学习模式开源(不仅仅是贡献构建模式的技术和框架)。例如,即使是已经有 5 年开发历史的谷歌图像识别或微软语音文本转换模式,也可以在其它板块行业或垂直行业中更快地激发人工智能和机器学习的创新和同化,直播,从而引发自我创新的持续循环。构建人工智能和机器学习模式的公司应考虑将整个人工智能和机器学习模式开源(不仅仅是贡献构建模式的技术和框架)。 寻找偏差 我们需要能够寻找偏差的能力,以便人工智能和机器学习引擎中的偏差能够尽快被发现和解决。离开这样的能力,业界将非常难以运用通用人工智能引擎,从而无法令这些引擎在不同场景中一致和确定地运行。寻找偏差和解决问题需要以下人工智能开放源模式的支持: 数据的假设和偏差 人工智能使得产品设计者需要确保他们了解人工智能和机器学习引擎中包含的假设和偏差。与人工智能产品交互的其它产品需要确保他们理解并准备好处理人工智能引擎行为带来的后果。为了确保人工智能和机器学习模式的消费者或集成商做好足够的准备,应该为每个人工智能和机器学习模式共享以下标准: 收集标准 数据是怎样收集的?数据生成器是什么?数据生成的频率、地点、时间、方式和原因分别是什么?如何收集、存储和传输? 选择标准 数据是如何被选择而进行训练的?未被选择的数据有什么标准?数据的子集是如何选择和未选择的?定义高质量数据的标准是什么?定义可接受但质量不高的数据的标准又是什么? 处理标准 用于训练的数据需要怎样的处理?数据是如何转换、增强和归纳的?处理的频率如何?什么原因导致需要计划的处理推迟或中止。 特征假设和偏差 (责任编辑:本港台直播) |