学术报告 | 浅析分布式批处理/流计算系统

发布时间:2018-07-05浏览量:406

xuchen.jpg

徐辰 华东师范大学数据科学与工程学院副教授

时间:2018-7-23 08:30-11:30

地点:华东师范大学中山北路校区原二附中实验楼阶梯教室

题目浅析分布式批处理/流计算系统

摘要:随着大数据时代的到来,学术界和工业界都研发了许多大数据处理系统。从以Hadoop、Spark为代表的批处理系统,到以Storm为代表的流计算系统,再到以Flink为代表的批处理与流计算一体化的数据处理系统,构成了丰富多彩的大数据处理系统生态圈。本报告从系统架构、编程模型、查询执行、查询优化以及容错处理等角度,分析这些批处理/流计算系统的异同点,理解批处理/流计算系统的设计思想。此外,报告还将介绍我们在面向分布式迭代数据处理的容错机制方面的最新进展。

简介:徐辰目前是华东师范大学数据科学与工程学院副教授。此前他在德国柏林工业大学担任高级研究助理(2014年-2018年),从事博士后研究,参与Apache Flink系统的研发。

他于2009年在合肥工业大学获计算机科学与技术学士学位,2014年在华东师范大学获计算机应用技术博士学位,曾于2011年赴澳大利亚昆士兰大学短期访问。他的主要研究兴趣是大规模分布式数据管理系统,相关研究成果发表在ICDE、VLDB、SIGMOD、TKDE等一流国际会议和期刊。个人主页http://chenxuhomepage.drivehq.com。