在具体操作方面,OCR识别和图像识别技术双管齐下,对广告主身份和广告内容进行实施甄别。2016年Q3期间,百度文字识别(OCR)基于最新的深度学习技术,以姓名识别精度99.67%,号码识别精度100%的优异表现,在国际文档分类与识别大会(ICDAR)最具挑战性的自然场景类文字识别任务中斩获五项冠军。而百度DeepImage图像识别技术在全球人脸识别最权威的国际评测FDDB与LFW中,均获得第一名成绩,领先于腾讯、FACE++、linkface等同行,几乎接近人脑水平,达到了99.77%的准确率。 目前百度已利用百度大脑AI通过提取页面中文字和图片信息构建机器识别模型,j2直播,通过对变体词模拟、商标知识库、风险词挖掘三大违规行为的处理,对无行业许的医疗推广等违规进行严厉打击。同时借助百度独有的搜索引擎反作弊算法——绿萝算法:全面打击超链中介、出卖链接、购买链接等超链作弊行为。 同时还利用人工智能和大数据打造百度信誉体系,对存在信用问题的广告主绝不姑息。评级方法引入多维度信息,并联手权威第三方公司,以更真实的数据连通线上线下,杜绝非法信息的输出,保护信网民与广告主的利益。 根据百度新公布的打假成果信息,在人工智能和大数据加持下,2016年百度共下线2518家医疗机构、删除1.26亿条医疗广告、把360103个词汇关进搜索关键词黑名单、升级各行业广告审核策略45次、完成超过80万家企业的搜索信息认证、通过审核拒绝16.9亿条违法违规广告、对44451个品牌词进行搜索结果保护、完成3万于起网民保障申请受理。百度用这8个数字对过去一年打击虚假信息、守护互联网良性发展的战斗做出了最好的总结,同时也让网民和企业看到了百度治理非法信息、保护合规推广的决心和行动。 更可喜的是,百度在人工智能的军备竞赛中,充分挖掘了技术的可能性,将百度大脑这一未来前沿能力,有效应用在自身搜索引擎平台的治理和规范上,这无疑属于技术应用的一个场景。在广告审核中应用技术只是一个创新,但未来是无尽想象的空间,这也就能理解,为何百度将下一个十年得技术方向,瞄准了人工智能。 从前,百度在极大程度上改变中国网民的信息获取模式;未来,执人工智能之牛耳的百度,又将会带来哪些改变呢?对此,我们不妨拭目以待。 ---------------------------------------------------------------------------------------------------------- 李安嶙,互联网观察者,著名专栏作者,超级自媒体。他是阅读量超过10亿的专栏作者,文章见百度百家、新浪科技、网易科技、搜狐客户端、今日头条、一点资讯、虎嗅、钛媒体、界面新闻、蓝鲸TMT、艾瑞等国内数十家顶级专栏,文章转载与商务合作加个人微信号:lianlin8866 (责任编辑:本港台直播) |