离线
TA的每日心情 | 拍拍 2022-6-27 11:09 |
---|
签到天数: 25 天 [LV.4]
|
有人预言,RISC-V或将是继Intel和Arm之后的第三大主流处理器体系。欢迎访问全球首家只专注于RISC-V单片机行业应用的中文网站
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
王哥说:越来越多的开源项目正在领导着科技前沿的创新,开源项目也成为了科技行业的重要流量入口,一些优秀的开源项目成为了行业的事实标准。2018年,数个开源项目成功实现其巨大的商业价值,无疑给开源带来了新的兴奋点(见下方附注)。我经常被问到类似“开源精神与商业如何取得平衡?”的问题,我认为这本身是一种误解,也并不是矛盾的关系。我对于开源的一些认识,是因为某些有趣的机缘遇见了PerXLab的张先轶博士(OpenBLAS开源项目的发起人)之后才领悟到开源的意义与价值。所以,对于类似的问题,我通常的回答是“通过开源项目,你是想获得免费还是自由呢?”,于是,您将自己寻找到答案。废话少说,还是来让我们看看这份2020年的中国开源年度报告吧。
附注:
•2018年10月29日,IBM计划斥资340亿美元收购全球最大的开源公司红帽 RedHat。
•2018年6月4日,微软5亿美元收购最大的开源社区 GitHub。
•2018年10月6日, Elastic 正式在纽约证券交易所上市,市值一度达到 50 亿美元。这家于2012 年成立,2014 年开始商业化的,仅凭ElasticSearch实现了开源成功的商业范例。
•2018年,RISC-V开源项目被引入中国……
前言
撰写这篇前言,我们的心情一直很复杂,很难用某种词汇来概括。在心里升起的一句话是:“这是最好的时代,这是最坏的时代”。
也许多年以后,我们回看 2020 年,会将其称之为:世界剧变之始。很多朋友在去年,甚至“每一天都在亲历历史,每一天都是活久见!”新冠疫情与中美贸易战,在同一年加剧。而因为疫情和贸易战,世界正在加速发生变化。
在这样的历史大背景下,我们在开源界,也发现了以下三个趋势:
1. 开源大发展以及由实向虚进发的趋势
从各种数据,以及我们自己的感觉都能发现:全球开源都出现一个大发展的趋势。GitHub 的活跃代码仓库与活跃用户数在高速增长(35.3% / 21.2%);Gitee 的代码仓库与用户数在以更加惊人的速度增长(192% / 162%)。
一方面,是开源这么多年一直持续的上升势头。而另一方面,则是我们的一个猜测:疫情以来,越来越多的人开始远程办公,事实上促进了更多的人有机会“斜杠化”,也就是在一台电脑面前方便地切换多种身份,以异步的方式处理多种事务,从而增加了开发者参与开源的时间和机会。
当然,同样由于远程办公,虚拟世界在人类生活中的占比,变得更大了。这样是否更好,还会引发哪些问题?作为站在隧道口的人类,其实是猜不透的。
2. 中国开源崛起以及开源世界分裂的趋势
随着越来越多中国开源项目的影响力不断增加、木兰协议的推出、开放原子基金会的成立,Gitee 的超高速增长,CODE China 的新发布,我们已经可以确信,2020 年是中国开源的崛起之年。接下来阅读报告的朋友们,应该会看到很多确切的证据。
但是,另一个值得注意的现象,也可以从下面的数据里看出来。在 GitHub 上最活跃的中国开源项目,与 Gitee 上最活跃的开源项目之间,完全没有重叠。
随着 Gitee 的继续高速发展,可以大胆预测,今后会有越来越多的,高质量的中国开源项目,选择在 Gitee 上开源。曾经有一位朋友提到的 “One World, Two Systems”,将会逐渐变成现实。
如果中国的开源,以一种与世界隔离的方式 “崛起”,这并不是我们希望看到的未来。
3. 开源向善以及我们尚未做好准备
疫情爆发以来,众多的开源人奉献自己的时间、精力、技术和智慧,投入到一个一个的抗疫相关的开源项目之中,也因此诞生了诸多面向医学、防疫、公益、救援的开源组织和开源项目。其中 wuhan2020 就是典型的代表。
因此,在 2020 年的中国开源年会筹办期间,我们毫不犹豫的选择了 “开源向善(Open Source for Good)”作为年会的主题,也获得了众多讲师、参会者与赞助厂商的一致认同。
但是,接下来应该怎么发展呢?为了抗击疫情而凝聚起来的人,创造的项目,积累的经验,总结的教训,应该如何“整理、封装、模块化”,并为了今后的各种意外,做好准备呢?这些都是值得长期思考并改进的领域。
作为一份力图完整、客观、全面、丰富的报告,值得探讨的问题当然不止上述这些,也欢迎朋友们阅读下面的报告,并随时与我们交流。
—— 庄表伟,开源社理事长
2021 年 1 月 16 日
特邀点评专家
- 吴晟,Apache 软件基金会 Member,Apache Local Community 联合创始人
- 黄东旭,PingCAP 联合创始人兼 CTO
- 马艳军,百度自然语言处理部高级研究员
- 蒋涛,CSDN 创始人 & 董事长,极客帮创投创始合伙人
- 高阳,SegmentFault 思否创始人 & CEO
- 红薯,开源中国创始人 & CTO
- 庄表伟,开源社理事长
- 陈阳,开源社副理事长
- 王伟,开源社执行长
- 刘天栋,开源社理事
一、问卷篇
1、报告背景
2016 年初,开源社发布了《2015 年中国开源社区参会调查报告》,随后的几年中,持续发布了开发者调查报告,旨在从多种维度呈现国内的开源发展情况。今年我们再次启程,结合数据分析手段和调查报告等多种形式,绘制一份 2020 年中国开源世界的地图。
这份问卷是每年中国开源年报的重要一环,不基于调研的分析报告不过是纸上谈兵。在往年的基础上,我们参考了其他现存的主流开发者问卷内容,并加入了一些新的视角。基于 2020 年 COVID-19 这个不容忽视的大背景,这份调查问卷进一步将视角发散到开源世界的线上协作,以及开源能够为世界带来什么等主题。
通过近 60 项左右问题的统计调查与分析,我们希望能够还原出当前中国开源社区的真实现状,从而为开源的后来人提供权威的参考。
- 调查对象:覆盖开发者、社区成员、贡献者、学生、政府企业管理人员
- 调查内容:主要涵盖个人信息、工作状况、开源社区以及开发者技术
- 调查方法:以在线问卷方式搜集样本和数据,交叉对比法分析数据
- 推广方法:线上社交媒体、博客、开源社、开源中国网站
- 问题数量:59
- 问题类型:单选、多选、开放性
- 样本量:236
2、重要发现
由于疫情,今年的问卷全部通过线上的方式传播,因此收集到的样本量相比往年较少,但仍旧能够管中窥豹,观察到中国开源世界的悄然变化。通过分析 2020 年的统计数据,并对比往年数据和其它一些公开发布的统计报告,我们有如下一些重要发现:
- 开源参与者的主力依旧是 20-39 岁人群,相比去年比例仍在上升,而在开源社区的年龄分布中,20-30 岁人群占据了 64%,说明开发者的年龄仍在趋于年轻化;
- 相较于 2019 年,今年参与调研的开发者中,还未工作的人群占了绝大部分,从参与者从事领域和职位分布也可以看出,这些“还未工作”人群多数指向学生群体,这和当前社会普遍追求更高学历深造有关,和本次问卷传播形式有关,但是同时也能说明开源在教育领域取得了不错的进展;
- 开发者所从事的技术方向仍以前后端为主,其中后端开发占比约 31%,其次是 Web 前端、AI 以及大数据分析方向,占比分别为 10%、9%、9%,非技术人员以及其他行业的从业者占比均为 7%,说明开源已经越来越受到社会各界的关注;
- 参与开源的形式由 2019 年以代码和测试为主转变为以代码和文档为主,社区和项目正在意识到文档的重要性,更多开源贡献者投入到了文档撰写中;
- 开源活动的参与频率相较往年有所上升,这与国内愈发繁荣的开源氛围和逐渐丰富的开源活动也有关系。81% 的开发者认为开源活动对促进和推动开源社区至关重要。而对于更倾向于线上还是线下的会议,结果竟惊人地持平;
- 在 2020 年 COVID-19 这个大背景下,各行各业都不可避免受到了冲击和影响;82% 的人认为疫情对于参加开源社区的活动产生了影响,但也具有推动作用,11% 的人认为毫无影响,7% 的人认为疫情的负面影响大于正面影响;
- 在在线文档协作工具的使用上,石墨文档以黑马的形式由第三名一跃成为第一名,压倒了 wiki 和 Google Doc,国内正在涌现出一批优秀的协作工具,并越来越为大家认可;
- 2020 年 9 月 9 日,中国首个开源软件基金会「开放原子开源基金会(OpenAtom Foundation)」官方正式对外发声,大家对此抱有多重期望:推广开源的理念,开源文化教育和社区建设,建立开源生态体系,对开源项目进行早期的孵化和扶持,帮助中国开源社区进行资源的整合和优化,并接轨国际开源社区。
3、开发者群体特征
3.1 参与者普遍年轻且学历较高,男性占比八成
参与者的年龄集中在 20-39 岁,受教育程度普遍在本科及以上,其中男性占比约为 84%,女性为 16%,与去年持平。
【专家点评】
- 刘天栋:女性参与开源的比例这和过去 2 ~ 3 年的调查数据相似,但是和国际平均数据(约 10 ~ 12%)相比高。期盼未来国内能有更多女性参与开源,形成一道美丽的开源风景线。
- 陈阳:多元化一直是开源社区的口号,全球开源社区早在十几年前就开始发起了“鼓励女性参与开源”的号召;开源社在每一年的中国开源年会 (COSCon) 上, 都有举办女性论坛的传统。2020 年的 COSCon 上, 我们邀请到了开源社区中的女性领袖,以她们独特能力和视角将整个社区链接起来。GitHub COO Erica Brescia,管理着超过 5 千万程序员的社区;Stormy Peters,从 GNOME 基金会执行总监,到现在负责着微软的开源办公室;来自亚洲越南的 Hong Phuc Dang,从创办 FOSSASIA 开始参与开源,目前出任着 OSI 的董事会 VP。女性参与开源的广度和深度,正在按照我们所期望的方向发展,让这个世界变得有趣和多元化。
3.2 从业时间及行业领域
参与者中还未参加工作的人数最多,占比约 36%,其次则是从业时间为 3-5 年、6-10 年的参与者占比分别为 19%、15%,从业时间在 10 年以上的约 2 成。
在参与者中,有近七成参与者从事互联网开发/软件开发领域,其次则是教育/学术/科研领域的参与者,占比约 15%,金融银行、媒体广告娱乐等领域也在积极参与开源。
3.3 职位分布
参与者中学生和开发者占绝大多数,相比于 2019 年,学生占比大大增加,约 37%,开发者占比约 36%。
3.4 所从事的技术方向
参与者所从事的技术方向以后端开发为主,占比约 31%,其次是 Web 前端、AI 以及大数据分析方向,占比分别为 10%、9%、9%,非技术人员以及其他行业的从业者占比均为 7%,说明开源已经越来越受到社会各界的关注。
【专家点评】
- 陈阳:开源早期的时候, 开源 = Linux。作为当时开源项目的主战场,Linux 操作系统、桌面办公软件(GNOME、OpenOffice)和浏览器(Mozilla)掀起了第一波开源的浪潮;近年来随着互联网的兴起,开源的项目和技术越来越百花齐放,从数据库到中间件,从前端到后端,从编程语言到编译器,从物联网到微服务,从大数据到人工智能,开源的技术和项目越来越丰富和多样化。
4、开源工作现状
4.1 接触开源的时间
有近三成参与者接触开源的时间在 1-2 年,近八成参与者接触开源时间在一年以上。
【专家点评】
- 陈阳:开源社区人员非常稳定, 有一种类似大家庭的凝聚力。十几年前的开源圈子, 活跃于一小群早期的开源人之间。我观察到身边的开源人士大多数都是超过 10 年以上的,并且未来也会持续投入开源。2020 年数据显示有 3 成新参与者,从另外一个角度也印证了开源运动在发展多年之后,呈现出一种出圈的状态。
4.2 在开源中的时间投入
约有 44% 的参与者每周在开源上的时间投入不足 5 小时,每周对开源投入时间在 5-20 个小时的参与者约有 40%。
【专家点评】
- 吴晟:较低的职业开源开发者(一周超过 20 小时的贡献者)比例,显示出中国企业对于开源项目,依然主要停留在用户层面。多数开源贡献者依然使用业务时间或者工作间隙进行有限的贡献和参与。
4.3 开源活动
绝大多数参与者每年只会参加几次线上/线下的开源活动,每个月参加一到两次线上/线下开源活动的参与者占比约两成。线下的开源活动大多以沙龙、讲座等为主,线上的开源活动以在线会议、邮件列表讨论、PR 活动等为主。
81% 的参与者认为开源活动对促进和推动开源社区至关重要。
【专家点评】
- 高阳:我们鼓励开发者积极参与到开源活动中来,尤其鼓励大家积极参与线下活动。线下的见面、沟通有助于建立起人与人之间的信任,对于社区的繁荣、人与人之间更高效的协作有重要意义。
- 关于开展线上还是线下的开源活动/会议,参与者们各抒己见,线下活动可以面对面地沟通交流,交流更有效率,氛围更好,可以有更多走出去看看,结交新朋友的机会,而线上活动则更加安全、便捷,不受时间、地域等限制,成本低廉,且会议内容可以录像,方便会后复查,当然,线下录像也是越来越普遍。
2020 年是十分特殊的一年,COVID-19 这场世界性的疫情给各行各业都带来了不同程度的冲击,82% 的参与者认为,疫情对于参加开源社区的活动产生了影响,但也具有推动作用。
【专家点评】
- 刘天栋:新冠疫情的冲击,加速了更多远程上班的族群参与了开源活动。以开源社在 2020 年 10 月 24-25 日举办的「第五届中国开源年会 + Apache 中国路演」为例,有超过百万人次在线参与,这是过去线下活动参与人数的千倍的成长,同时也有比往年更多的国际与国内的开源大咖在线分享。虽然这次大会也同步在五个城市举办了线下聚会,但是我们可以预期未来线上会议将成为常态。
4.4 开源收入
可以看到,很多人参与开源并不追求物质回报,有三成参与者没有开源收入,但依然热衷于开源工作,同时,我们还可以注意到有 12% 的参与者表示企业会支付工资支持员工全职/部分参与开源,有 23% 的参与者表示学校科研项目或社团投入方面有在支持参与开源,可见现在企业和学校都开始逐渐关注并重视开源。
【专家点评】
- 吴晟:能够获得开源收入比例和开源参与时间超过 20 小时的比例高度一致,很好的显示出商业价值在开源贡献强度上的显著变化。虽然,贡献时间和收入并不代表开源贡献和开源项目的质量,但高质量的项目需要一定的商业支持才能得到良性循环。
- 陈阳:有 12% 的参与者从开源中获得兼职或全职收入, 开源布道师, 开源运营经理, 开源开发者等都是 2020 年的热门职业,这说明开源的生态正在进一步完善, 企业开始进行开源人才储备,开源的商业逻辑正在明晰。
4.5 远程办公
远程办公是当下非常重要的一种办公方式,在参与者中,有八成认为远程办公是重要的,并且有接近九成的参与者有过远程办公的经历。
【专家点评】
- 高阳:远程办公会变成一种常态化的办公和协作方式融入到我们的工作和生活中,开源运动和分布式、远程协同本来就是天然融合的。
4.6 第一次接触的开源产品
有 32% 的参与者第一次接触的开源产品为互联网产品,紧随其后的便是操作系统相关的产品与开发工具,调查结果与以往基本一致,说明互联网产品和操作系统相关产品仍然是大家了解和接触开源的最初窗口。
4.7 最希望能够开源的产品
相比于 2019 年,开发工具在今年成为大家最希望能够开源的产品类型第一名,紧接着的是操作系统,数据库产品与中间件产品也是很多人希望能够开源的产品类型。
4.8 企业对开源的贡献
在参与者眼中,GitHub 对于开源软件的贡献最大,其次是 Google,而在国内企业中,Alibaba、Huawei 和 Baidu 分别占据前三名。
4.9 机器人流程自动化
对于开源项目是否继承了 RPA,即机器人流程自动化工具,有四成参与者表示一部分项目集成了 RPA,16% 的参与者表示几乎所有项目都有集成 RPA,同时也有 24% 的参与者表示从来没有在开源项目中集成过 RPA。
5、开源社区参与现状
5.1 开源最吸引你的因素
开放透明的代码和知识共享,以及开源的精神理念成为开源最吸引参与者的因素,而软件的购买成本却并不是主要的因素。
5.2 最喜欢的开源产品是什么
Linux 以巨大优势,成为参与者最喜爱的开源产品,MySQL 紧随其后,Apache 和容器界的黑马 Docker 分别位列第三、第四。
5.3 具体参与的社区工作
绝大多数参与者在社区都参与代码或文档撰写的工作,测试、本地化以及活动组织也是很多人在社区会参与的工作。
5.4 最看好的开源产品
开源产品的前景展望中,互联网产品以 34% 的比例成为参与者最看好的开源产品发展方向。人工智能和开发工具异军突起,成为现在开源产品中的风口和热点。
5.5 开源社区的交流方式
在社区的交流方式中,微信和邮件列表目前最为普遍,QQ 也是国内重要的即时交流工具。新锐的交流工具比例上升:Slack 和 Zoom 也是值得关注的现象。
【专家点评】
- 吴晟:微信、QQ 群的高强度使用,仍然显示出开源圈子缺少国际化社交和协作能力的一贯性短板。同样反映出中文依然是绝大部分的开源参与者唯一热衷的交流方式。
5.6 社区与代码的关系
有近九成的参与者认为在开源社区中,社区的价值大于或等同于代码,因为围绕代码而生的社区,会让代码变得更加优秀。
【专家点评】
- 高阳:很高兴看到大家对于社区价值的认同,在我们看来,一个健康的社区远比优秀的代码更重要,只有健康、多样和友好的社区才能推动项目可持续发展,正如一句话说的“一个人走的很快,一群人走得很远”。
5.7 开源社区年龄分布
开源社区中,20-30 岁的贡献者是主要组成部分,占比超过六成。
【专家点评】
- 吴晟:开源参与者中年轻研发者较多,一方面反映了中国对于开源的参与时间较晚,学生做为可塑性较高的群体,更容易跟随最近的开源热度,选择参与到开源。缺少 35-40 岁以上的开发者,正面反应了中国资深工程师的缺乏。缘起中国的开源项目的大规模崛起,将十分依赖此部分人的比例提升。
5.8 开源软件安全
有近七成的参与者表示不会有不安全感,但同时也仍有 25% 的参与者表示会有此类担忧,开源软件的安全问题仍然值得我们关注。
【专家点评】
- 红薯:开源软件由于其机制的关系,通过开源社区不断地发现问题并维护,其安全问题可能并不是开发者们的主要关注点。其实除了技术方面的安全问题,开源合规性等许可证方面的安全问题同样需要开发者们重视,许可证冲突问题所带来的法律风险影响非常大且很难被发现,尤其是对于企业来说,检查所使用的开源软件合规性,其重要性不亚于其技术安全。
5.9 中国成立开源基金会的作用
参与者们一致认为中国成立开源基金会是非常有意义的,可以推广开源的理念,开源文化教育,社区建设,建立开源生态体系,利于开源项目早起的孵化和扶持,帮助中国开源社区进行资源的整合和优化,也有助于接轨国际开源社区。
【专家点评】
- 蒋涛:在全球科技竞争和中国开源核心技术发展态势下,从开源生态制高点着眼,建设和发展中国开源基金会意义重大。通过中国开源基金会的发展壮大,不断鼓励国内巨头科技企业和社会力量合力共建开源创新生态环境;同时,通过学习借鉴更完善的基金会运行模式、组织机制和法律制度,建设可持续发展的中国开源创新力量。此外,在当前全球开源商业模式越来越成熟的市场环境下,建设开源基金会,还可以引导国内外基金和投资机构孵化支持开源,培育中国开源『独角兽』,最终形成资本、企业、开发人员为主体、共享共惠的中国开源商业生态体系。
- 高阳:2020 年中国首个开源基金会开放原子面世,这对于在本土推动开源教育的普及以及开源生态的整体繁荣有重要意义。我们期待看到开放原子可以成为开源的连接器,连接国际开源社区、链接国内外优质资源,帮助开源项目成长与成功。
6、开发者技术现状
6.1 开发语言
开发语言呈现多超多强的状态,前三甲分别为 Java、JavaScript 和 Python,排名与去年基本保持一致。
【专家点评】
- 王伟:编程语言是大家喜闻乐见的话题,排名方面没有太大的变化。值得一提的是 SQL 语言,这个平时存在感貌似不是很强,但实用性却非常强。实际上,本报告中的 GitHub 数据篇中的基础数据全部都是用 SQL 跑出来的,是一项开发者必备的重要基础技能。
6.2 在线文档协作编辑工具
在线文档编辑工具中,石墨文档是目前中国开源社区经常使用的工具,wiki 也依然是非常多参与者使用的协作工具。
6.3 编辑器
VS Code 今年仍然是最受欢迎的编辑器,紧随其后的是 vim 以及 notepad++。
6.4 版本控制工具
毫无疑问的是,Git 一枝独秀,具有绝对性优势。SVN、TFS、CVS 目前仍有不少参与者在使用。
6.5 数据库
数据库使用情况中,不出意外地,MySQL 以绝对优势遥遥领先,MongoDB 与 PostgreSQL 跟随其后。
6.6 操作系统
操作系统的使用中,Windows、Linux、MacOS X 三分天下。
6.6 会议工具
腾讯会议是目前参与者们使用最多的会议工具,其次则是 Zoom、钉钉。
6.7 聊天运维工具
目前,绝大多数的参与者都没有使用过聊天运维工具来进行项目的自动化管理,而对于使用过该类工具的参与者来说,Hubot 是他们使用最多的 ChatOps 工具。
6.8 开源平台
如果要开源自己的项目,87% 参与者都表示将会在 GitHub 来开源自己的项目,其次则是 Gitee 和 Gitlab。
【专家点评】
- 蒋涛:随着开源规模和商业化的快速发展,开源平台作为开源项目和开发者生态的重要基础及支撑体系,未来将承载更多的服务和应用场景,也将发展出各自特色。2020 年新发布的 CODE China,作为独立第三方开源平台,将重点围绕 AIOT,为更多开源项目和开发者提供运营支持和生态服务。
6.9 技术论坛
知乎和 CSDN 目前是最受参与者们青睐的两个技术论坛,其次则是 StackOverflow,开源中国与博客园也受到很多参与者的喜爱。
7、总结 & 致谢
本次问卷在传播和收集过程中多有坎坷,最终呈现的不过是开源世界的小小一隅,但意义重大。见微知著,不难察觉到中国的开源结构已经在发生变化,开源的星星之火正在燎原,势不可当。希望这份报告能够抛砖引玉,吸引更多的社区和开发者加入。
该报告的问卷问题, 报告文档均发布在代码托管平台,开源社官方网站和合作伙伴网站平台,基于 Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) 许可证协议分享。对于问卷的问题设计和报告内容有任何建议和想法,欢迎您在代码托管平台上提交 Patch, 对报告进行补充和贡献。您的一小步,整个中国开源社区的一大步。
此报告问卷篇作出贡献的开源社中国开源年度报告小组成员:夏小雅,宁泽欣;社区合作伙伴:X-lab,Gitee,微软 Reactor。感谢特邀的开源领域的专家,更要特别感谢积极参与我们调研的每一位朋友。
完
|
上一篇: RISC-V架构在AI芯片中崭露头角下一篇: 2020中国开源年度报告(二)
|