第45版:企业 PDF版阅读

报晓风客户端

报知天下 晓通万家

人民日报:多挖掘大数据“富矿” 崔斌课题组在大数据中取得重要进展



大数据、云存储、物联网不仅为政务办公、组织建设提供技术支撑,更是创新社会治理手段的一座富矿。通过安装在角落的传感器,对整个城市的节能减排进行24小时监测;借助车流量监控和大数据系统,实现红绿灯变换时间的动态调整……海量信息转化为决策资源,大幅提升着城市的精细化管理水平,打造出更加智慧、智能的政府和城市。

推进国家治理体系和治理能力现代化,科技创新是重要抓手。党的十九大报告强调,要为数字中国、智慧社会的建设提供有力支撑。开采、利用好大数据这座“富矿”,推进数据资源整合和开放共享,就能更好地实现提升工作效率与群众获得感的“双赢”,推动新时代的国家治理迈上新台阶。

信息学院崔斌研究员课题组在大数据实时推荐研发中取得重要进展

随着大数据时代的来临,从海量信息中迅速获取有用信息的需求日益强烈。个性化推荐系统以海量数据挖掘为基础,引导用户发现自己的信息需求,现已在多个领域得到广泛应用。传统上,通过定期分析数据来更新模型,导致推荐模型无法保持实时性,破坏对用户当前行为推荐结果的准确性。而实时个性化推荐系统可以通过实时分析用户产生的数据,更准确地为用户推荐,与此同时,还可以根据实时推荐结果进行反馈,改进推荐模型,提升系统性能。

北京大学信息科学技术学院、高可信软件技术教育部重点实验室崔斌研究员课题组与腾讯公司数据平台部从2014年起联合开展大数据实时推荐研发。研究工作针对海量性、实时性、精准性等大数据应用中的实际难点,创新性地同时从系统、数据和算法三方面着手解决,即:系统方面,针对现有系统的不足,提出由实时接入、实时处理和分布式K-V存储三部分组成的系统架构;数据方面,针对现实世界中严重的数据稀疏、隐反馈数据等问题,提出解决方案;算法方面,针对传统机器学习算法难于应对大规模数据实时计算的问题,提出增量计算模型和增量更新方法,有效地实现了分布式流式在线学习。由此研发的实时推荐系统应用于包括视频、新闻等腾讯的多项实际业务,现每天处理千亿条用户行为,支撑百亿级用户请求,推荐效果显著提升,点击率(click-through-rate,CTR)平均提高6%~18%。腾讯大数据日前的官方报道《大数据实时推荐:不只是统计》首日阅读量达上万次。

上述成果还以题为《TencentRec:实时流推荐的系统实践》(TencentRec: real-time stream recommendation in practice)和《实时视频推荐探索》(Real-time video recommendation exploration)的论文连续两年在美国计算机学会数据管理专业组年会(Association for Computing Machinery Special Interest Group on Management Of Data,ACM SIGMOD)上发表。论文第一作者均为信息学院博士研究生黄艳香,通讯作者是崔斌研究员。信息学院徐嬴、谢怡然等研究生以及腾讯平台部蒋杰等也参与该研究。

本研究得到国家自然科学基金、国家重点基础研究发展计划(即“973计划”)和腾讯云计算数据中心的支持。

您的IE浏览器版本太低,请升级至IE8及以上版本或安装webkit内核浏览器。