上图:词的大小代表该词在演讲中出现的频率大小。词越大表明这个词出现的频率越多。奥巴马演讲中出现最高的词是:国家、一代人、美国、人民等等。 语调分析——用于理解演讲中的关键情绪触发点和听众对其的感知。 上图:在文件层次上对情感,语言风格和社交倾向进行的分析。 演说中关键词和关键主题的情感分析: 上图:对该用户常用词语/词组进行情感分析:判断该短语感情色彩是积极,消极,还是中性。 奥巴马的就职演说使用了更具感情色彩的愉悦的叙事方式,以及更广泛的情感变化范围,很好地烘托出他的竞选主题——“希望”: 上图:情感分析显示奥巴马的演说使用了愉悦的语气。 特朗普与奥巴马的演说 的可视化数据比较 上图:自左到右为特朗普(红色)和奥巴马(蓝色)在智力、激烈度、成就追求度、信任度、强硬态度度5方面的打分。 上图:自左到右为特朗普(红色)和奥巴马(蓝色)在谦虚度、深情程度、挑战权威程度、理解他人能力、不抗压度5方面的打分。 上图:自左到右为特朗普(红色)和奥巴马(蓝色)在挑战、务实、稳定、自由、结构5方面的打分。 上图:自左到右为特朗普(红色)和奥巴马(蓝色)在对变化的接受程度、享乐主义度、保守度、自我提升度、自我超越度5方面的打分。 上图:分别例举了奥巴马(左)和特朗普(右)演讲中使用最多的正面词,中性词和负面词。 结论 前面说到,我将把任何可能由我们的研究结果引发的政治偏见和政治评论留给我们明天的报纸,所以我将让你从IBM沃森的数据中得出你自己的结论。 我的结论是,IBM沃森的分析实际上不是定论性的,特别是考虑到这两个演讲有多么不同。 特朗普的演讲相当有闯劲敢,缺乏同情,而且不太尊重前任总统,而奥巴马的演讲非常具有前瞻性和更加乐观。 然而不可否认,1161字的特朗普的就职演说和2420字的奥巴马的就职演说不是足够大到可以准确分析的数据集。 在这种情况下,虽然IBM沃森提出了一些有趣的见解,但它需要比这长十倍的演讲词来做一种类似人类做出的评估。 当人们谈论“机器学习”时,他们往往是在说机器需要去“学习”。 你给“机器”的数据越多,它们就越准确。 这让我很想把所有特朗普的演讲数据给IBM沃森,而且我敢肯定这样做出来的分析肯定看起来很不一样。 从最后几张图中可以清楚地看出,奥巴马2009年就职演说的情感属性与特朗普2017年就职演说几乎完全相同,IBM沃森根本没有“学习”到如何分辨这两个小数据集之间的差异。鉴于特朗普对“美国屠杀”的黑暗观点与奥巴马的更令人振奋的关于“希望”消息,这两个演说其实是非常不同的。 人类能凭直觉看到这一点,但这对IBM沃森就不是那么容易了。 但谁需要这么冗长的分析? 当沃森试图用几百个词分析特朗普的就职演说时,美国的《今日美国》(USA Today)日报仅仅使用了3个字(“短小”、“黑暗”、“挑衅”)就完美地总结了这篇演说。也许有些工作计算机永远都做不了(特别是像新闻业这样的创造性工作)。 上图:来自《今日美国》(USA Today)的标题:《分析:特朗普短小、黑暗、且有挑衅味的就职演说》 (责任编辑:本港台直播) |