记得几年前当人们谈论起分布式数据库技术之时,往往会冠以“未来、前景”等词汇来描述。而我们走过2021这一数据库技术的变革之年,回首望去,未来已来,分布式数据库的时代大幕已然悄然拉开。
2022年1月6日,由中国电子技术标准化研究院指导、CSDN主办、OceanBase承办,木兰开源社区、开源中国、51CTO、思否、极客邦科技、稀土掘金、墨天轮、dbaplus协办的DC2021分布式数据库开发者大会于线上正式召开。本次大会以“数聚未来”为主题,邀请了MySQL之父、MariaDB创始人Michael“Monty”Widenius与PostgreSQL全球开发组联合创始人Bruce Momjian带来 的行业解析,同时OceanBase创始人阳振坤、CEO杨冰、CTO杨传辉、腾讯分布式数据库TDSQL首席架构师李海翔、华为云数据库首席架构师冯柯、PingCAP副总裁刘松、巨杉首席架构师&研发副总裁陈元熹等国内顶级分布式数据库行业先行者,技术专家带来精彩的演讲分享,为开发者们贡献了一场分布式数据库领域的“盛宴”。
中国电子技术标准化研究院研究室主任杨丽蕴在致辞中表示:去年国家明确了数据为第五大生产要素,这对于我国数据库软件既是重大的发展机遇,也是重要的挑战。分布式数据库即没有传统数据库的“旧包袱”,又依托于开源模式下的资源积累,在取得长足进步的同时也在走向更多的核心产业市场。我相信在国家新创战略下,我国分布式数据库软件顺应了数字化发展的需求,必将取得快速创新和发展。
CSDN创始人&董事长、极客帮 创始合伙人蒋涛表示:在CSDN 20年关键词统计中我们发现“数据库”一词在十余年中一直高居榜首,所以说长久以来数据库一直都是软件开发最重要的基底。开源时代下,云原生技术作为土壤,为产品注入了商业与服务的价值,这也是为何近几年间分布式数据库产品拥抱开源与云原生技术的因由所在。而对于国产数据库厂商而言,在如今这个闭源走向开源,传统集中式走向分布式的关键时间节点,国产数据库产品走向世界的绝佳时机已经到来。
数聚未来,数据库掌门人共话分布式
MySQL之父、MariaDB创始人Michael“Monty”Widenius发表了主题为“从MariaDB看全球数据库的机遇和挑战”的主题演讲。他认为庞大的用户群是指引数据库发展方向的重要对象,在创建Maria DB之时正是通过对于用户需求的分析,同用户一同去解决问题,才能从容地应对挑战。他表示:分布式数据库能够在不同节点上进行基本计算,所以在处理大量数据以及组计算的时候有很大的优势,但在事务处理方面则会慢一些,所以对于技术而言没有绝对的完美,更多的基于需求的权衡。
OceanBase创始人&首席科学家阳振坤分享了《原生分布式数据库是数据库的新物种》主题演讲。他表示:移动互联网时代,当数据库面向社会大众,面临几千万甚至几亿用户的并发访问,传统集中式数据库遇到了“小马拉大车”般的严峻挑战。而分布式数据库采用了多匹马协同并进的思路,虽然极大地增加了数据库自身的复杂度与技术挑战,但却极大地简化了业务流程。在分布式数据库场景下,OLAP与OLTP兼得虽然成为可能,但我们也在面临着前所未有的挑战。在不久的将来,HTAP场景下的所有挑战都将被我们所克服。
PostgreSQL全球开发组联合创始人Bruce Momjian发表了主题为《开源引领数据库发展》的演讲。他认为开源对于全球的开发者而言都是一个绝好的机遇,在开源的整体环境下,开发者的作品能够在全球范围内得到认可,其本人能够有机会在国际性会议上发言。谈到分布式数据发展,他认为随着市场成熟与价值的显露,会有越来越多的人将目光投向分布式,而对于从业者而言,更多是要投入到创新与保障整体项目的健康度之上,这样才能做到真正的先市场而行。
腾讯分布式数据库TDSQL首席架构师李海翔带来了《TDSQL关键技术深入解读数据异常体系化研究》主题演讲。在演讲中他回溯了数据库体系建立以来对于数据异常的定义与概括,并详细阐述了数据异常与整个事务处理领域关于数据异常、隔离级别与一致性三者之间的关系。TDSQL的研究团队通过定义冲突关系,构建冲突图,建立图与异常的映射并进一步对数据异常进行分类的方式,成功建立了体系化的研究数据异常的框架,并初步描述了并发访问算法。
华为云数据库首席架构师冯柯分享了主题为《华为云GaussDB,深耕创新,打造根技术竞争力》的演讲。在演讲中他围绕数据库六大关键技术方向:全球多活高可用、软硬 协同、企业级混合负载、云原生、数据安全与可信、AI-Native阐述了华为GaussDB的根技术能力打造之路。
OceanBase CTO杨传辉发表了题为《重新定义“分布式数据库”》的演讲,他表示:OceanBase作为原生分布式数据库的代表,它背后的核心技术便是一体化架构,一方面原生分布式架构能够享受到分布式技术的无限扩展,另一方面对外体现了对传统数据库的完美兼容。在2021年,OceanBase取得了包括OLTP到HTAP整体性能、单核性价比、跑批能力、Oracle平滑迁移、易用性五大核心产品技术突破。
同时在本次大会上,杨传辉正式公布了OceanBase全新的3.X工具家族—运维监控工具OCP、开发者工具ODC以及迁移同步工具OMA&OMB,并发布了OceanBase社区版3.1.2。
OceanBase CEO杨冰分享了《最好的时代,共建分布式数据库未来》的主题演讲。在演讲中他表示:根据IDC测算,中国关系型数据库软件市场规模增长更加迅猛,年复合增长率达到29.5%,其中云数据库增长贡献较大,云 + 分布式无疑是数据未来发展的关键趋势。而在这样的大趋势中,OceanBase正在逐步完成由金融走向国计民生,由用户认可走向核心系统“首选”的道路。在数据库行业百家争鸣的良性竞争生态中,OceanBase将携手业界同仁,一起构建分布式数据库时代的光明未来。
大势所趋之下的数据库技术转型之路
在CSDN创始人&董事长、极客帮 创始合伙人蒋涛的主持下,OceanBase CTO杨传辉、巨杉首席架构师&研发副总裁陈元熹、腾讯分布式数据库TDSQL首席架构师李海翔、PingCAP副总裁刘松与华为云数据库首席架构师冯柯一同展开了主题为《传统数据库向分布式数据库转型的价值及趋势》的圆桌对话。
OceanBase CTO杨传辉认为,分布式数据库发展在于天时地利人和,天时是专有服务器的迭代以及公有云的趋势,地利是在大数据时代下客户对于更高数据量并发的需求,人和是随着互联网的兴起带动了分布式数据库行业,使得参与门槛也相应降低。
PingCAP副总裁刘松表示,我们开始进入到分布数据库的下一个时代,从最初的互联网需求到金字塔顶端的数字化需求,是驱动全社会关注分布数据库行业的最大背景之一。同时新一代的云原生应用场景对分布式数据库的需求非常强烈,分布式数据库未来最大使命便是促成千行百业的数字化目标。
华为云数据库首席架构师冯柯认为,分布式数据库就是契合当前中国的发展阶段,由中国的人口红利驱动的流量运用,下面产生的一种新的数据库的形态。分布式数据库可以比喻成高铁,单机比喻成轿车。分布式开发起来尽管复杂,就像我们可能没办法把高铁做成像轿车那样方便灵活,但二者都是通向同样的智能化目标。
腾讯分布式数据库TDSQL首席架构师李海翔表示,分布式数据库是建立在单机数据库的基础之上发展起来的新技术,其最主要的特征是在具备极强可扩展性的同时与智能化技术进行了很好的结合。我们在数据库领域需要着重于基础性技术的创新,而在基础性的创新之后,下一阶段在工程领域便会有叠加式、迭代式的创新产生,应用的创新也会不断推进。
巨杉首席架构师&研发副总裁陈元熹认为对于分布式数据库来说,如何通过从技术上提升可扩展存储与海量算力去解决客户实际场景中遇到的问题是我们面临的最大挑战。无论是开源还是闭源,归根结底是为了做出产品,只要能够做出一个合乎用户使用习惯,帮助客户解决问题的产品就是好产品,就能够取得商业成功。
海纳百川,百花齐放,分布式数据库技术正当时
在本次大会上,进行了2021DC分布式数据库开发者大会“海纳奖”的颁奖典礼。本次奖项由CSDN联合极客邦、思否、开源中国、51CTO、掘金、木兰开源社区共同评选,选出了分布式技术领域“2021年度海纳奖——分布式数据库十佳实践人物”。
他们分别是中联重科的中台架构师姜维、恒生电子的数据库技术小组组长,云基础部门副总经理林景忠、中国人寿的数据中心数据库管理组负责人卢强、浙江移动信息技术部云智能中心的平台架构部主管潘宇虹、涛思数据的创始人陶建辉、滴普科技CTO吴小前、武汉大学副教授杨先娣、南京银行鑫云 & 基础平台负责人朱孝天、字节跳动的基础架构数据库技术负责人 张雷以及SphereEx的创始人张亮。作为首个分布式数据库领域的重要奖项,“海纳奖”的出现为分布式数据库行业发展树立了榜样,极大地推动了分布式数据库产业的发展。
在DC2021分布式数据库开发者大会的下午场,进行了分布式数据库技术、分布式数据库开源生态与应用两场分量极重的分论坛内容分享。
在分布式数据库技术分论坛中,OceanBase 首席架构师杨志丰、华为 GaussDB 技术专家王磊、阿里云智能数据库 PolarDB-X 产品经理胡中泉、OceanBase 产品部总经理王南、巨杉数据库联合创始人 & 高级研发副总裁许建辉、StarRocks 产品负责人赵恒、偶数科技数据库首席架构师陶征霖与MongoDB 中文社区主席 Tapdata Founder & CEO 唐建法带来了深入浅出的核心产品技术能力解读。
而在之后的分布式数据库开源生态与应用分论坛上,InfoQ主编王一鹏、OceanBase 开源负责人封仲淹、SphereEX 创始人&CEO张亮、Apache Doris PPMC & 百度资深研发工程师杨政国、CSDN 开源平台负责人谢志锋、红象云腾创始人 &Hadoop 技术讲师童小军、Flink CDC Maintainer & Apache Flink Committer 徐榜江与Seata 开源社区负责人季敏围绕开源生态议题进行了多维度的内容分享。
在大会晚间安排的“极客夜宵”环节中,OceanBase CTO杨传辉,OceanBase研发总监&开源负责人封仲淹以及OceanBase技术专家李帅带来了干货满满的技术分享。在杨传辉的日照公开课中,他首次进行了基于一段涂鸦文字代码page的OceanBase coding show演示。在演示过程中,杨传辉深入浅出地通过项目所需要的功能模块对OceanBase的一体化架构进行了详细解读。在封仲淹带来的MySQL数据库迁移实践课程中,他详细介绍了OceanBase全新推出的OCP管控平台与OMS数据迁移工具,并通过实际项目演示对这两大工具进行了 解析。李帅分享的OceanBase 性能调优演示通过最后执行计划与性能场景的调优两大例子,帮助开发者解决了性能调优过程中遇到的瓶颈与问题。
科技发展战略之下,数据库等基础软件正逐步站上IT产业发展的舞台中央。在本次DC2021分布式数据库开发者大会上,我们更是见证了被称之为“数据库技术未来”—分布式数据库技术的风采。相信在政产学研四界的共同推动下,数据库技术将迈入一个名为分布式数据库技术的全新篇章。