国家电网应该一直为窃电操碎了心,因为它在努力寻求大数据方案来解决这个问题。 9月24日,在第四届CCF大数据与计算智能大赛启动仪式上,国家电网发布了与此相关的两道赛题。 国家电网公司称,希望通过大数据分析技术,科学的开展防窃电监测分析,以提高反窃电工作效率,降低窃电行为分析的时间及成本。同时,国家电网公司希望通过大数据分析技术,科学的开展电力敏感客户分析,以准确地识别敏感客户,并量化敏感程度,进而支撑有针对性的精细化客户服务策略。 除了国家电网希望借此机会解决上述难题,搜狗、蚂蚁金服、AdMaster、驭势科技、中国联通研究院等多家公司和机构还发布了另外9道赛题,涉及搜索广告、O2O营销、舆情分析、监控识别、计算广告、无人驾驶、市场预测、LBS营销、气候预测等领域。 雷锋网(搜索“雷锋网”公众号关注)了解到,这11道赛题公布的奖金池累积已达到55万人民币,而且按照往届大赛的经验,参加大赛的不仅有广大学生党,还有企业及社会个人、团体专门组队参加。
赛题发布方祭出真实数据 据主办方中国计算机学会(CCF)及发布赛题的企业介绍,有别于同类一些比赛提供的标准数据库的数据,赛题提供的大量真实数据可能是吸引众多参赛选手的原因之一。 国家电网的代表表示,他们发布的赛题来源于以下几个方面: 第一,atv直播,将提供国家电网供电区域的某一个区域的用户日电量信息;第二,经过业务研判以后的异常的用电信息,这些用电信息经过专业人员分析,确实异常。 经过异常用户信息,参赛者可以根据这些数据,发现窃电用户的行为特征,形成窃电用户的画像,准确识别窃电用户,对国家电网而言,提高窃电的监测效率,降低窃电损失。 搜狗的代表则称, 我们提供了一个10万用户量级查询的行为,这是10万用户搜索在线下通过调研问卷各种方式得到真实性别、年龄、学历等数据,我们希望拿出一半数据作为训练题,另外一半作为测试题,来搜索行为来识别一个人年龄性别和学历。 中国联通也表示,他们提供了3万个用户的上网的详单记录,也就是3个月记录上网的行为记录和通话的话单记录,同时有1万个商户的位置数据和活动行为数据。除了原始数据,也在原始数据的基础上提供了中间的过程数据。 当然,上述赛题发布商也强调,上述信息均经过了脱敏处理。 或是一场“练兵”和“人才招聘” 这次大赛的主要目的是什么? 雷锋网编辑注意到,此次启动仪式上,上海教育部的专家以及一些高校代表均站台捧场,不难看出,许多高校想借此机会“练兵”。 对于发布赛题的企业而言,AdMaster的代表就直言,希望通过赛题,真正解决企业的一些问题。他称: 举一个我们公司的案例——怎样识别虚假流量,这个赛题的方案如果做得好,可以直接运用到我们公司的商业场景,也可以应用在整个广告行业。它的好处有几点,第一,对参赛选手而言,不管是学生还是组织,还是其他参赛人员,可以通过各种知识来把各种数据直接到应用到行业中,我们不止是提供奖金,更大的是为整个行业做出了很大的贡献,第二,如果是学生,还可以给他offer。 CCF专家委员会秘书长程学旗现场以案例做起了“广告”。他告诉雷锋网编辑: 第一届大赛一等奖获得者上海交大的团队,后来获奖之后,没有毕业,直接去创业了,当然这还是交大的校长给的政策,创业期间可以以暂时按照休学处理,现在他们快拿到第二轮融资了。 第二届,有一个团队参加了海量科技组织的赛题,当时的赛题是“网络热点事件的快速发现”,那个方法做完之后,海量科技马上用了这个成果,后来在天津事件发生时,用的算法比所有其他的系统业务更精准,更及时。 链接——究竟有哪些赛题? 1.监控场景下的行人精细化识别 行人属性精细化识别是智能监控技术的重要组成部分。本赛题提供监控场景下多张带有标注信息的行人图像,要求参赛者在定位(头部、上身、下身、脚、帽子、包)的基础上研究行人精细化识别算法,自动识别出行人图像中行人的属性特征。标注的行人属性包括性别、头发长度、上下身衣着、鞋子、包的种类和颜色,并提供图像中行人头部、上身、下身、脚、帽子、包位置的标注。 2.Human or Robot? (责任编辑:本港台直播) |