报告题目:高效大数据管理与分析:一种基于压缩技术的新思路
报告时间:2021年6月20日(周日)16:00-17:30
报告地点:北校区主楼二区319
报告人简介
张峰,中国人民大学杰出学者系列人才岗位副教授,博导。2012年本科毕业于3522vip浦京集团计算机学院,2017年博士毕业于清华大学计算机系,同年加入中国人民大学数据工程与知识工程教育部重点实验室。研究方向包括数据库、高性能计算,主要研究压大数据环境中压缩数据的高性能直接处理与分析。在USENIX ATC、VLDB、TPDS等会议、期刊发表CCF A类论文二十余篇。任多个国际期刊与会议的审稿人。获北京市优秀毕业生、清华大学计算机系优秀毕业生、ACM SIGHPC中国新星奖。
报告摘要
大数据的重要特征之一就是数据容量大而且增长快,对大数据管理系统的数据存储和计算带来了空间和时间上的巨大压力。本研究组提出了在数据压缩状态下直接进行数据管理与分析的方法,主要思路是利用可解释性语法规则对数据进行描述,并将对数据的管理与分析操作转化为对语法的解释与修改。本次报告围绕在非结构化数据压缩的基础上进行数据管理与分析这一主题所具有的挑战、洞察、方法、及解决思路展开讨论。