报告题目:机器学习增强的查询优化器
报告时间:2023年12月18日上午9:30
报告地点:计算机学院B404
报告人:朱鎔
报告人国籍:中国
报告人单位:阿里巴巴达摩
报告人简介:朱鎔博士现为阿里巴巴达摩院智能计算实验室研究科学家,香港中文大学(深圳)兼职企业导师。他分别于2013年和2019年从哈尔滨工业大学获得学士和博士学位。他的研究兴趣包括数据库、机器学习和系统的交叉领域,主要集中于AI4DB方向。他在该领域VLDB, ICDE, TKDE, ICLR等顶级会议和期刊上发表了近30篇论文,并曾在EDBT和CIKM上做tutorial报告。他先后获得2019年教育部自然科学二等奖、2020年CCF优秀博士论文提名奖和2022年ACM SIGMOD中国新星奖。
报告摘要:随时AI4DB技术的迅速发展,基于机器学习的查询优化技术受到了广泛关注。然而,现有的查询优化器均需使用回归模型预测执行计划的执行时间,由于模型固有的不确定性和内生缺陷,导致存在性能不稳定、模型更新慢、训练开销大、不能适应数据变化等问题, 且长期没有得到较好解决。在本报告中,我们率先提出了一种新的学习型查询优化器设计思路。我们将learning-to-rank思想引入查询优化器设计过程,基于pairwise的判别模型设计和实现了一种新的查询优化器Lero。Lero不需要修改原有传统数据库的查询优化器,只需要调节其执行计划产生方法并配合判别模型就能得到更高质量的执行计划。在PostgreSQL和Spark上实际部署的效果表明,Lero大幅提升了查询优化性能,并且表现出良好的稳定性和适应动态数据的能力。
邀请人:江佳伟