这几天,一则“有足球场大小的小行星可能在 2032 年撞击地球,联合国首次启动《行星安全协议》”的新闻引发全球关注。当然,天文专家已经指出这颗小行星给人类造成危害的可能性微乎其微,无需惊慌焦虑。
不过,试想,如果真的发生了如陨石撞击一般,能够导致城市级网络瘫痪的事故,数据库是否能够有效应对、快速恢复,以保障服务的连续可用呢?
近日, OceanBase CTO 杨传辉做客全球知名开发者论坛 Stack Overflow,在最新一期播客中与 Stack Overflow 高级内容创作官 Ryan Donovan 共同就分布式数据库可靠性、一致性保障、HTAP 架构以及 AI 时代分布式数据库何去何从等热门话题进行了分享与讨论,揭秘 OceanBase 的“前世今生”,以及其背后鲜为人知的有趣故事。
精彩速看
对于 HTAP 来说分布式数据库是最佳选择
首先,如果我们将 OLTP 系统和 OLAP 系统合并,数据量相比之前将大幅增加,分布式数据库能够处理更大规模的数据。其次,分布式数据库中每一份数据都有多个副本。我们可以在主副本中使用行存来处理 OLTP,在次级副本中使用列存来处理OLAP。只要我们有一个优秀的 SQL 优化器,就可以找到最佳方式来支持混合工作负载。
分布式数据库有很多种原生分布式SQL数据库是终极解决方案
实现分布式数据库的方式有很多种,比如常见的 NoSQL 数据库、分库分表。相比之下,我认为原生分布式 SQL 数据库才是终极解决方案。它既能实现高可用性和可扩展性,又能提供完整的 SQL 支持。
高连续性业务城市级容灾是必选项
对于支付宝等要求高业务连续性的企业,仅仅具备数据中心级别的容灾是不够的,城市级别的灾难恢复能力不仅是可选项,而是必选项,尤其是对于 OLTP 数据库来说,这一点至关重要。
相比独立向量数据库通用数据库加向量插件是未来发展方向
向量数据库目前主要有两种类型:一种是独立的向量数据库,另一种是带有向量插件的通用数据库,也就是“SQL + AI”。后者在传统 SQL 数据库的基础上引入了向量存储和处理能力。我认为,带有向量插件的通用数据库是未来的发展方向。OceanBase 在 2024 年 10 月 正式发布了向量能力。
AI 时代数据库的一大技术趋势是「混合搜索」
混合搜索指同时支持 SQL、NoSQL 和向量等多种数据模型。如果能在通用数据库的基础上支持向量功能,就可以通过一个 SQL 查询实现混合搜索。我认为这将大大简化 AI 技术栈,帮助企业更快地进行 AI 应用开发。

