分享

基于飞腾芯片的StarDB分布式数据库解决方案

一、概述

京东StarDB分布式数据库,是基于Share Nothing 架构构建的分布式数据库,核心模块包含计算引擎、存储引擎和管控引擎,提供多节 点分布式和单节点集中式两种高可用拓扑解决方案,满足不同数据容量的应用需求。它将数据库核心能力进行技术 整合,拥有高性能、高可用、高扩展、高安全、易维护等优异特性,打造能够提供平稳高效的DB服务以及合理运 维管控能力一体化的分布式数据库生态体系。StarDB已经历了15次京东618、京东11.11大促的考验,对内支撑了京东支付、京东保险、京东客服、京东机器人等多个核心业务,同时对外服务了多家海内外金融机构,包括清算机构等,适用于交易支付、风控、保险、账务清算、资产管理、企业征信等多种金融业务场景。

二、方案背景

长期以来,传统金融业务系统采用集中式IOE架构,系统运行稳定,但建设和维护成本较高;同时,传统金融业务面临数字化转型挑战,集中式IOE架构已无法适应业务转型、科技创新、客户体验等要求。分布式架构应用将支撑起未来全面数字化的海量客户请求和庞大数据运算任务,是金融业务系统改造是必然的趋势。

金融、统信、能源、交通等行业,伴随着换代、主机下移、新业务系统建设等项目落地,在一般业务系统和核心业务系统都有分布式的落地案例,主要集中在微服务架构引入,分布式中间件、分布式数据库的使用,云原生技术和DevOps持续交付的实践。同时,行业客户对数据安全、自主研发的要求更高,要求分布式数据库产品具备软硬件兼容适配基础设施的能力。因此,京东科技提供StarDB分布式数据库产品和解决方案,针对飞腾芯片架构,已完成性能调优工作;基于飞腾芯片成熟稳定的硬件底座,保障分布式数据库软件在基础设施上性能可靠稳定,安全。

三、适配平台

京东云专有云解决方案兼容以下主流技术路线:

- 飞腾 FT-2000+/64和S2500 CPU

- 中国长城-擎天EF860

- 银河麒麟高级服务器操作系统(飞腾版)V10

- 统信服务器操作系统(飞腾版)V20

四、方案介绍

(一)方案的架构

StarDB系统架构主要包括三部分:数据存储、数据计算和智能一体化管控平台。

2e1f1b74efb84031a2eebfa599abae05.png.jpg

Ø 数据存储:通过多副本数据强同步做到金融级数据强一致性,提供多数据中心高可用容灾方案。

Ø 数据计算:核心是数据分片算法、分布式事务和SQL解析路由以及查询优化。目前支持两种应用访问模式,应用程序引入驱动包客户端模式、Proxy代理模式。

Ø 管控平台:完善的智能管控平台,覆盖数据库应用管理的全生命周期,提供分布式管理能力、数据服务能力、智能运维和安全管控能力,打造了一体化分布式数据库生态体系。


(二)应用场景

1、实时高并发交易场景

各个行业客户的互联网场景在用户基数大、核心业务系统数据库单表上亿行且访问日益变慢等问题,制约业务发展。StarDB分布式数据库提供弹性扩展能力,能够极大提升数据库处理能力,可以面对类似全网推广、限时秒杀等营销活动;配合热点更新,强同步复制能力,即使是敏感业务类业务也可以完全用产品承载。

2、海量数据存储访问场景

随着各个行业互联网业务的广泛开展,海量数据的存储和访问成为了系统设计的瓶颈问题。会产生超过单机数据库存储能力极限的数据,数据库实例超过TB级别且持续快速增长,造成数据库容量瓶颈,限制业务发展。StarDB分布式数据库可以线性扩展存储空间,支持挂载管理多个 MySQL 实例,提供 PB 级存储能力。可广泛应用于互联网、金融、工业制造等超大规模数据存储访问场景。

3、数据实时分析场景

数据分析在提高企业洞察力和用户体验方面发挥着举足轻重的作用,且实时数据分析能够让企业更快速、灵活地调整市场策略,适应快速变化的市场方向和消费者体验。使用 StarDB分布式数据库,在线业务实时分析时可使用只读实例,对海量数据规模下的多表关联、聚合、排序、子查询操作可秒级返回处理结果,无需进行额外的数据同步操作,大幅节省整体架构的运维及预算成本。

4、数据高安全依赖型场景

在各个里,存储了非常多的个人基本信息和金融交易数据,保障数据的安全性是首要考虑的问题,一旦发生数据丢失或者泄露,会造成不可估量的损失,因此该类业务对于存储核心数据的数据库系统安全非常依赖,包括数据查询结果加密,数据存储加密,以及事后审计需求。StarDB分布式数据库提供高可用、高安全能力,可保障数据的安全。

技术特点

1、金融级高可用:多数据中心容灾架构、秒级监控,保证异常故障自动完成高可用切换,无需人工干预;多副本数据强同步,保证任意事务数据完成时都至少有两份副本数据,避免数据丢失,RTO小于30秒,RPO为0。

2、弹性伸缩:设置弹性扩缩容节点数量,自动完成存量数据迁移,增量数据同步和数据一致性校验,并推送规则,实现自动扩缩容。

3、高性能:源码内核层面对系统资源进行用户态管控,内存自动回收优化,增加线程池功能,实现特性场景的查询优化,同时具备性能链路监控、主动优化和故障自愈的能力。

4、安全合规: 拥有全面的分布式权限管控系统,实现了配置加密和数据加密功能,提供全链路数据库审计以及历史信息追溯等功能。

5、智能管控:拥有超大规模集群自动化运维管理能力,实现了资产管理可视化、性能管控自主化、容灾切换自动化、故障诊断智能化。


版权说明:论坛帖子主题均由合作第三方提供并上传,若内容存在侵权,请进行举报

没找到任何评论,期待你打破沉寂

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

联系在线客服