院庆 | 数据科学与工程学术报告会顺利举办

发布时间:2019-01-23浏览量:125

  2018年12月24日下午,数据科学与工程学术报告会在华东师范大学中北校区办公楼小礼堂举办。本次报告会邀请了学院6位老师和学生代表介绍各自实验室的工作和成果,内容涵盖区块链数据库、数据库查询和并行化、混合负载处理优化、IT在线实训平台的建设、金融大数据处理实践、智慧交通实践等方面。本次报告会由我院董启文教授主持,学院70余名师生参加了报告会。

1.jpg

 一、区块链数据库——师大链(张召)

  张召副教授介绍了区块链实验室在过去一年半的工作和成果,以及师大链的自主研发过程。她从区块链相关知识入手,由浅入深一步一步地剖析了现有区块链系统中数据管理所存在的问题,并由此引出师大链的设计目标和实验室正在进行的工作。区块链数据库主要是对区块数据进行管理,她的研究团队对区块数据添加了关系语义,提出了以layered index为代表的索引结构,并基于索引优化了各种算子的执行,师大链支持来自轻客户端丰富的可验证查询,支持SQL-Like语言。最后,她向我们介绍了师大链的发展之路以及即将完成的2.0版本所增加的新功能,即高效的共识算法、智能合约并行执行、支持轻客户端,并指出师大链的未来将会给我们带来更多精彩内容。

2.jpg

 师大链系统架构             师大区块链数据库的发展之路

二、面向内存计算系统的查询流水线并行化研究(方祝和、翁楚良)

  博士生方祝和同学介绍了所在实验室在面向分布式内存数据库的查询流水线并行化方面的研究工作。他们提出了自适应填充和优先权抢占技术,以应对流水线调度中的“资源浪费”与“执行顺序”的两大挑战。基于这两项技术,他们在自主研发的Ginkgo系统中设计并实现了一个两层的实时调度器。最后,他指出实验室针对Executor随着硬件变化而日新月异而提出的一系列工作展望:一、GPU+CPU的异构体系结构。CPU适合于控制复杂逻辑,而GPU擅长高并发计算,二者各有所长,尤其是在统一内存地址机制出现后,二者可以互相访问内存和显存,如何根据应用场景来充分发挥GPU和CPU的特点是一个难题;二、RDMA。NUMA中的远程内存访问和RDMA访问相比来说,RDMA的带宽更高,latency也在同一个level,如果有统一内存地址空间,那么RDMA互连的机器构成一个更大的NUMA架构,这个改变将会引发一连串的变化,他提到实验室现在也在尝试如何用RDMA来优化分布式执行引擎。

 

 

     两项动态调度技术——自适应填充     两项动态调度技术——优先权抢占

 

两层调度框架

三、支持新型关键业务的混合负载处理优化实践(胡卉芪)

  助理研究员胡卉芪老师介绍了分布式数据库系统项目组取得一些科研进展以及项目组在与中国交通银行的合作过程中成功落地了的一些科研成果。这些落地的成果深刻地践行了数据科学与工程学院“做有用的研究”的理念,做到了将科研与产业应用紧密结合起来。在整个汇报中,胡卉芪老师从应用的演变的角度介绍了项目组如何紧追实际应用来实现对新型关键业务的支撑。接下来,胡卉芪老师也介绍了项目组在针对应用做出的一些前沿的科研型的预研工作,保证了科研基于应用、科研领先应用。报告最后,胡卉芪老师为大家介绍了项目组研发的三款系统:CEDAR、CBase以及SolarDB的特点以及它们三者之间的关系。



四、面向情景式学习的IT在线实训平台的建设与挑战(王伟)

  王伟研究员介绍了新时代的教育特点,并对新时代下的“计算教育学”的概念进行了较好的阐释,他认为新时代的教育在学习对象、学习技术、学习环境上都与传统教育有所不同,并提出新时代下的计算教育学是以学习者、教育大数据和教育服务为中心的观点。他的团队设计出了面向情景式学习的IT在线实训平台(KFCoding平台),目前推出的校内版已经成功运用于数据学院数据二期的《数据科学与工程导论》课程中。他表示,KFCoding平台将不断地收集计算教育学下的新诉求,以情景式学习环境作为基础设施,最终形成一个开源、开放、共享的数据科学与工程教研一体化的平台,以满足不同人群的需求。

 

IT在线实训平台的发展历史

 

完整的“数据科学与工程导论”生态

 五、金融大数据处理实践(罗轶凤)

  罗轶凤副教授介绍了金融大数据处理实践过程中所涉及的一些业务背景比如金融知识图谱的构建,事件库的作用,展示了投研知识图谱和公司产品图谱的示例,并围绕目前事件库开发中涉及的三项工作即事件识别与分类、命名实体识别(ner)和实体对关系抽取进行了详细分析与介绍。事件分类作为事件库构建的基础工作,在后期的内容推荐和事件识别中有重要作用;Ner作为Nlp处理中的基础内容在许多领域都有重要作用,在事件库的构建中会直接影响目标实体的识别精度;实体对关系抽取旨在判断金融语料中命名实体间的关系,为后期构建知识图谱奠定基础。

         投研知识图谱关系图                                               事理图谱示例

公司产品图谱示例

六、时空数据赋能智慧交通实践(毛嘉莉)

  毛嘉莉研究员介绍了使用时空数据解决交通拥堵问题所开展的系列工作。她首先提及普遍存在的交通拥堵问题是由于交通管理低效无法满足日益增长的交通出行需求所致,并提出时空数据赋能智慧交通的概念,即融合海量的时空数据,运用物联网、云计算、人工智能等技术自动获取知识,以提供实时、精准的交通信息服务。随后,她展示了她们实验室在交通出行、路径规划、异常检测、地图更新等方面的研究成果,着重介绍了与企业合作的交叉路口识别研究课题中面临的挑战与解决的技术思路。最后,她指出发展智慧交通需要设计高效的实时处理与精准分析方法。

时空数据赋能智慧交通的整体过程分析

   通过聆听学院部分教师代表与博士生同学的精彩报告,在场的同学们对学院的“应用驱动创新”的发展理念有了更深入的解读,也对学院不同领域方向的研究成果增进了了解。此外,本次报告会为老师与同学们提供了良好的学术交流机会,为以后开展交叉性科学研究起到了一定的推动作用。

 

 

文案 | 方敏、刘婷婷、魏星、黄立波、梁鑫

摄影 | 杨大为、刘婷婷

排版 | 方敏