海盒MPP数据库SeaboxMPP

SeaboxMPP是北京东方金信科技股份有限公司自主开发的大规模分布式并行数据库集群系统,采用Shared-nothing分布式架构,支持传统物理服务器部署或云主机部署方式,支持x86及arm等平台架构,能够与国产CPU、操作系统良好适配。

产品概述
海盒MPP数据库由多个SeaboxSQL实例组成,主要特点包括:SMP + MPP并行计算,支持按行/列存储,高性能向量计算引擎,多层次全方位的高可用保障,在线扩容能力等。适用于企业级大数据平台、数据中台、数据仓库/数据集市、决策支持系统、即席查询/分析等应用场景。
场景
主要功能
标准SQL数据库
基于PostGreSQL,兼容PG语法生态;支持ANSI SQL 2008 标准,支持JDBC/ODBC标准接口。
事务支持
支持ACID特性、分布式事务、支持标准隔离级别。
行列混合存储
独立的列引擎,支持压缩等高级特性,适用于大数据分析及混合类应用等;列引擎支持小批量加工行存优化。
超强分析和挖掘能力
支持各类常见函数,包括聚集函数、OLAP函数,内置数十种AI算法,支持算法扩展。
高性能计算
节点间并行 + 节点内并行(多线程架构),执行向量计算引擎,提供超强的计算能力。
易用高效的数据集成能力
支持多种数据源、多种数据格式的数据通过SQL方式加载入库,支持数据联邦集成Hadoop、Spark生态及其他DBMS,通过MapReduce或SQL访问不同平台。
全方位高可用
调度、计算、存储采用独立的高可用模型;调度与计算为无状态节点,快速切换、恢复,可保障业务不中断;存储节点同步冗余,实现用户无感的故障转移和容灾备份。
简单易用
通过控制台操作,即可实现集群部署管理、扩容、替换、监控维护等工作,无需关注底层基础设施的繁重运维工作。
核心优势
标准SQL数据库
支持ANSI SQL 2008 标准,支持JDBC/ODBC标准接口。
行列混合存储
独立的列引擎,支持压缩等高级特性,适用于大数据分析及混合类应用等;列引擎支持小批量加工行存优化。
高性能计算
节点间并行 + 节点内并行,执行向量计算引擎,提供超强的计算能力。
多层次高可用特性
管理节点与计算节点采用独立的高可用模型;存储节点同步冗余,实现用户无感的故障转移和容灾备份。
安全可靠
支持信息系统安全保护等级2.0三级功能要求,强化审计功能、支持透明存储加密,支持国密算法等。
事务支持
支持完整的ACID特性、支持分布式事务。
超强分析、挖掘能力
库内集成数十种AI算法,支持算法扩展。
简单易用
无需关注底层基础设施,通过控制台即可实现集群部署管理、扩容、替换、监控维护等工作。
应用场景
企业级数据仓库及大数据平台
高并发查询系统
实时数据湖场景
SeaboxMPP数据库产品是典型shared-nothing架构的大规模并行处理集群,满足超过1000节点部署,支持10PB以上结构化数据的存储与管理,产品支持的列存储、高效压缩、高性能关联聚合分析均适用于大规模企业级数据仓库及大数据平台的建设,满足银行、保险、电信等数亿用户的集团企业全面数据分析与治理需求。
SeaboxMPP数据库支持的行列混合存储、高效压缩、稀疏索引、高性能汇总分析等能力对银行、电信、证券等领域的实时账单查询、BI查询系统有良好的支撑,在数千并发的复杂查询场景下,能够保证秒级响应;对上百并发的多表关联与汇总分析场景,能够支持10秒级响应。
海盒数据库自主研发的data-flow组件支持实时将OLTP数据库通过CDC机制抽取的变化数据同步至SeaboxMPP,该组件支持多项特性,包括增全量衔接、流批结合、两阶段入库,同时提供针对表结构不一致、DDL变化等异常的跳过及自动处理机制,尤其满足企业级实时数据湖的建设需求。
客户案例