海盒MPP数据库SeaboxMPP

海盒MPP数据库SeaboxMPP是一款包含大规模并行计算技术和数据库技术最新的研发成果:包括MPP并行计算架构,支持按行/列存储数据库,数据库内压缩,支持高性能向量计算引擎,支持计算与存储分离架构、在线扩容,多级容错等等。该软件产品属于具备强大分析能力的分析型(OLAP)数据库软件。已有多家重大客户在各自生产环境中采用该软件。

产品优势

行列混合存储

独立的行存储与列引擎,行存储适用于事务处理场景;列存储支持压缩等高级特性,适用于大数据分析及混合类应用等;支持行列混合存储优化,尤其擅长海量数据加工、高频度小规模数据写入的混合负载应用场景。

了解更多
高性能运算

节点间并行 + 节点内并行,支持多线程模式,全面支持向量计算引擎,提供超强的计算能力,同类产品对比性能提升数倍。

了解更多
多层次高可用特性

数据库集群所有组件均为多活架构设计;任一节点或服务异常会有其他节点或副本提供对等的服务,单台节点损坏不影响集群的整体可用性,实现用户无感的故障转移;支持全量、增量备份与恢复功能,确保极端情况数据完整性;支持集群双活,实现集群之间的灾备与负载均衡。

了解更多
高效数据集成

内置多种数据源的数据加载与数据联邦功能,不依赖其它组件,部署简单;直接读写外部数据源,利用集群的分布式执行,无单点瓶颈;直接使用SQL操作,适用所有API。支持从Oracle、MySQL等OLTP数据库通过CDC机制准实时同步增量数据,且支持流批结合模式,更好支持企业数仓建设。

了解更多
超强扩展能力

支持超过1000节点大规模集群部署,支持10PB以上数据管理;支持在线扩容、缩容;支持多种外部数据源联邦查询、机器学习算法等功能扩展。

了解更多
多租户及资源管理

支持逻辑集群部署架构,将一个大的物理集群按不同业务场景划分为多个子集群,子集群间运算资源完全隔离,整个集群管理统一且数据相互可访问;单个子集群内部支持物理资源及任务资源的管理,支持静态及动态资源组。

了解更多
安全可靠

支持信息系统安全保护等级2.0三级功能要求,支持主客体设置的强制访问控制;支持透明存储加密,支持国密算法;支持数据动态脱敏。

了解更多
可视化管理工具

SeaboxMPP提供运维管理平台SDMS、企业管理器、迁移工具等可视化管理工具,通过图形化工具操作,即可实现集群部署管理、扩容、替换、监控维护等工作,无需关注底层基础设施的繁重运维工作。

了解更多
国产兼容性

海盒MPP数据库已经与主要国产上下游厂商完成适配,包括:飞腾、海光、鲲鹏、兆芯、龙芯、申威等CPU;麒麟OS、统信UOS、中科方德等操作系统;东方通、中创、金蝶等中间件;长城、宝德、紫光、曙光等服务器整机;永洪、金山云、数睿数据、安华金和等应用

了解更多

主要功能


支持PostgreSQL生态语法及接口
支持ANSI SQL 2008 标准,支持JDBC/ODBC标准接口
支持事务,支持标准隔离级别
支持表、索引、视图、触发器、序列、物化视图等数据库对象
支持数值、字符串、时间日期等常见数据类型,支持几何、数组、JSON/XML等高级数据类型
支持存储过程及自定义函数(SQL、Python、C/C++、Java等多种语言开发)
支持hash、random、复制等分布方式
独立的列引擎,支持压缩、粗粒度索引等高级特性,适用于海量数据分析
支持行列混合存储,可适用于小批量频繁入库+海量数据分析的混合类应用负载
支持字符串、日期、聚集等多个类型函数
支持常见OLAP函数、CTE、grouping set等复杂SQL
易用、高性能的数据集成与数据联邦能力,支持多种数据源、多种数据格式
全方位高可用能力,自动异常切换及恢复
支持在线扩容、在线节点替换、在线升级等运维功能
支持全文、GIS、Madlib机器学习等扩展插件
提供图形化集群管理监控工具、数据库对象管理工具及迁移工具组件

应用场景


海盒MPP数据库适用于构建大规模的高性能数据仓库和商业智能査询(BI)平台,尤其擅长海量结构化数据的实时查询或批量加工。目前海盒MPP数据库已经在能源、政务等领域规模化应用,主要应用场景包括以下几类:
企业级数据仓库及大数据平台
SeaboxMPP数据库产品是典型shared-nothing架构的大规模并行处理集群,满足超过1000节点部署,支持10PB以上结构化数据的存储与管理,产品支持的列存储、高效压缩、高性能关联聚合分析均适用于大规模企业级数据仓库及大数据平台的建设,满足银行、保险、电信等数亿用户的集团企业全面数据分析与治理需求。
SeaboxMPP数据库与同类型国外开源产品对比,tpch、tpc-ds等基准测试性能有3-5倍的显著提升。
高并发查询系统
SeaboxMPP数据库支持的行列混合存储、高效压缩、稀疏索引、高性能汇总分析等能力对银行、电信、证券等领域的实时账单查询、BI查询系统有良好的支撑,在数千并发的复杂查询场景下,能够保证秒级响应;对上百并发的多表关联与汇总分析场景,能够支持10秒级响应。
实时数据湖场景
海盒数据库自主研发的data-flow组件支持实时将OLTP数据库通过CDC机制抽取的变化数据同步至SeaboxMPP,该组件支持多项特性,包括增全量衔接、流批结合、两阶段入库,同时提供针对表结构不一致、DDL变化等异常的跳过及自动处理机制,尤其满足企业级实时数据湖的建设需求。