华东师范大学数据学院X-lab开放实验室师生参与完成的《2022中国开源年度报告》发布

发布时间:2023-02-09浏览量:354

近日,由开源社出品的《2022中国开源年度报告》正式发布,作为对中国2022全年的开源发展的总结以及2023新的一年的展望,报告获得了各方广泛关注。开源社2022年度的副理事长、X-lab开放实验室创始人、华东师范大学数据学院教授王伟及其所在的X-lab开放实验室,负责牵头并以开源协作的模式参与此份报告的生产全过程,实验室多位研究生也成为该报告的重要贡献者。

1675914828819048657.jpg

【中国开源年度报告】由开源社从 2015 年发起,是国内首个结合多个开源社区、高校、媒体、风投、企业与个人,以纯志愿、非营利的理念和开源社区协作的模式,携手共创完成的开源研究报告。目标是通过开放、透明的开源协作模式,每年为开源界贡献一份中立、客观、多元而优质的【中国开源年度报告】。

用开源的模式创作一份能够全面反映中国开源发展的年度报告,一直是开源社发起此项活动的初衷。数据学院王伟教授在加入到开源社后,就开始认领这份重量级的年度项目,并借助着自身的数据专业优势,联合实验室的同学们一直不断完善与迭代这个项目。在2022年度的版本中,X-lab开放实验室的同学们在报告的大记事篇、数据篇、问卷篇等几个主要部分均进行了深度参与,同时贡献了整份报告背后的部分“硬核”技术与方法。

1675914889931024991.jpg

X-lab 开放实验室在GitHub上的主页 


以项目为牵引,推动学生在做中学、悟中学

塑造卓越领导力、创新力与执行力


数据学院致力于营造师生共研、共创的良好生态,为学生提供自由成长的卓越学术土壤。此次报告的生产与发布,学生不仅是有力的执行者,而且在组织和协调工作中也发挥重要作用、获得成长。

张翔宇同学是数据学院的二年级硕士研究生。在他看来,今年有机会负责整个报告的组织与协调工作,对自己而言是很难得的学习和历练机会。“因为项目采用多方开放协作的模式,需要涉及到包括开源社区、高校、媒体、风投、企业与个人等多方面的协调,同时我还负责内容生产与交付排版等方面之间的通畅交流,很多事情比较琐碎,需要从全局视角来综合考虑。”张翔宇谈到,“感谢老师和同学们的信任,项目经历不仅对我有专业上的提升,也启发我积极、高效整合资源,以多赢的心态达成项目目标!例如,今年的数据篇,在去年已有的开源活动数据分析的基础上,还联合了包括木兰社区的OpenDigger、Apache的DevLake、LF的CHAOSS Asia等不同组织进行了联合开发。这缘起于2022年暑假机缘巧合,我通过由中科院举办的开源软件供应链点亮计划参与到Apache的DevLake项目中并顺利结题,此次通过社区的连接促成了2022年度开源年报中的合作。”

1675914983885077719.jpg

本次开源年度报告由多个社区/单位共同协作完成


躬身入局积极作为

“真研究问题、研究真问题”


数据学院2022级博士生夏小雅同学是CHAOSS China开源社区的发起人之一,她发挥自身在技术与语言上的优势,一直活跃在国际Linux Foundation基金会下的包括CHAOSS、TODO Group等开源组织中,致力于拉动国内外在开源社区度量与指标体系构建方面的工作。本次报告数据篇中的很多新指标,都是在夏小雅的带领下实现完成的。此外,她还联合了实验室的张欣然、黄温瑞、王婕等同学,参与了问卷篇的整个问卷设计、分发、统计、可视化等工作。作为经验软件工程与方法的实践者,夏小雅谈到:“我一直希望并实践将这些开源社区的实践工作与自己的博士课题进行结合。基于我参与的开源社区实证研究,结合海量开源代码仓库活动数据的挖掘,陆续在包括SANER 2023、APSEC 2022、IEEE COMPUTER等国际会议与期刊上发表了相关学术研究工作,并越来越从所从事的工作中体会到科研的乐趣。”X-lab开放实验室创始人王伟教授说:“这种通过实际参与到开源社区以获取真实的问题,进而开展学术研究的科研模式,取得了不错的效果,非常值得总结与推广。”

1675915037262025791.jpg

基于开源社区实践的科研成果发表


应用驱动创新

开放成就创新


说起整份年度报告数据篇的背后功臣,非OpenDigger莫属了。OpenDigger 开源项目是由X-lab开放实验室联合多所高校共同发起,目前在国家标准院下的木兰开源社区培育孵化的一款面向开源生态数据挖掘与分析的平台,目标是构建开源领域的数据生态,成为促进开源生态持续发展的数据基础设施。赵生宇同学是该项目的发起人、负责人与架构师。他所撰写的“开源项目价值度量三部曲”在互联网上广泛流传,获得了多方的认可。也因为此,每年基于OpenDigger 开放数据与分析指标所发布的技术报告、白皮书、排行榜、数据大屏、数据产品、评价机制等越来越丰富,而本次开源年报中的内容,就像新年OpenDigger新版本发布的示范文档一样,对项目本身又有着很好的宣传作用。这种取之于开源、用之于开源的价值闭环,能够非常好地促进整个开源生态的发展,也是我们高校发起这个项目的初衷。围绕该项目所发展出来的一系列周边生态项目就是最好的证明:顾业鸣同学推动并维护的国际排行榜项目OpenLeaderboard、唐烨男同学推动并维护的浏览器插件项目Hypercrx、娄泽华和毕枫林同学发起推动的开源生态网络基准测试项目OpenPerf、宁志成同学发起的开源可视化大屏项目OpenDashboard等,都在不断地向前发展。

1675915071870009575.jpg

Hypercrx 数据可视化插件项目的数据来自OpenDigger

 

【中国开源年度报告】的发布不是终点,这些内容及其背后的研究、实践、工具、项目反过来又可以很好地作为在高校开展开源教育的素材。而在2023这新的一年中,数据学院也将继续通过“WISA开源教育论坛”、“中国开源教育研讨会(SOSEC)”、“CNCC开源人才培养论坛”、“开源软件通识公开课程”、“OpenDigger 开源软件生态数据分析平台全球大赛”、“开源生态网络分析与图数据挖掘大赛”等这些活动,一方面能够推动高校的开源教育,同时还能有机会通过开源的方式改变目前已有的教育模式,未来可期。


来源 | X-lab开放实验室

排版 | 唐小卉

编审 | 王伟 杜明月

 

 

 

超链接:《金兔迎福报、新春第一炮【2022 中国开源年度报告】》

https://mp.weixin.qq.com/s/zlxVme_0hj7RHdDyb3gULQ