联想大数据团队取得Kaggle顶尖数据科学竞赛优异成绩
近日,联想大数据团队在全球知名的Kaggle数据科学竞赛中,以优异的表现在“网站流量预测”(Web Traffic Time Series Forecasting)竞赛项目跻身前15名。该竞赛云集了全球数据科学领域的众多高手,获得这一突破性的成绩是对联想大数据技团队技术与实践能力的有力证明。
由Google赞助的Kaggle竞赛致力于推动数据科学与机器学习的前沿发展,是该领域所有专业人士的试炼厂,考验数据相关理论知识在实践中所需的各项能力。
此次联想大数据团队参与的“网站流量预测”竞赛项目重点,是预测多个时间序列未来价值的问题,这一直是该领域最具挑战性的问题之一。更具体地说,这个竞赛项目的目标是测试参与者所设计的最先进的方法,预测约145000维基百科文章的未来网络流量问题。
因此,联想大数据团队面对的最大挑战就是,网站数量和流量庞大,并且是关于不同主题、使用不同语言(中文、英文、德语、西班牙语、日语、法语)、又分为不同的浏览媒介(PC、手机等)和不同的浏览对象(人类、爬虫)。这些复杂的组合使得这些网站的浏览量有着非常不同的表现,极难通过单一的模型来刻画,而由于数量过多,分别建模又不可行;不仅如此,需要预测未来60天每天的流览量,时间距离远且单位小。
针对这一挑战,联想大数据团队积极备战近两个月时间,最终拿出的方案是准备多个不同的模型,在模型选取过程中加入一些自适应性,即根据不同模型在历史数据上的表现、数据的分布特征,时间距离让算法自行选择最优模型,并且这些模型有着不同的侧重点,比如有的更注意周期性,有的更注意近期的局部表现,将这些模型进行集成。
最终,这一思路和方案得到了认可,在该竞赛项目中获得第12名的好成绩,取得历史性突破。展望未来,这一技术突破有望运用于供应链管理(如产品销量预测等),或者其他的时间序列预测类场景,能够发挥重要的业务价值。
联想大数据获奖团队成员表示:“很高兴能够在这一国际数据赛事中取得好成绩,并得到业界的认可。大家以绝不服输的精神,把专注、严谨和精湛的专业素质在比赛过程中发挥出来。这次给我们的最大启发,就是更多地走到实践中,积累丰富的知识,灵活地运用到各种场景中,发挥真正的价值。”
相关阅读
最新文章
随机推荐
- 乘客坐高铁餐车 被强制要求买88元一杯茶水
- 红狮教您如何慧眼识“漆”
- “2017年度中国压缩机十大品牌总评榜”荣耀揭晓
- 海洋165班为社区群众做防诈骗宣传
- 飘移窗 海缘飘移窗超强隔音、安全防盗、节省空间、高效保温
- 北大培文杯再启航,第五届写作大赛在京盛大开启
- 成都大型砂石车压扁教练车已致3人遇难
- 未来汽车开发者 爱驰亿维谷峰:挂帅出征再扬帆
- 金大师DIY“母亲节”手账 爱她,别只在朋友圈表达
- 光明随心订在线订如实:呈现酸奶本来的样子
- 小麦草SOMAI--国货强势崛起
- 长沙发之根公司召开年会:总结经验,奋勇前行
- 杭州一小区千余户人家被停水
- 万全智能环境,空净行业质量领军企业
- 两会委员建元宵节、宪法日放假
- 山东村民实名举报村书记 信落入对方手中遭拘留
- 新韶光电热集团亮相cippe上海石化展
- 和博树创造相约“海创会”,刷新你对黑科技的认识
- 十八大后22位中央官员空降地方
- 搜多客首尔KCMA CLUB SALON交流会
最新评论
更多评论