海盒大数据平台SDP

海盒大数据平台(SDP)集成多种数据存储组件,包括分布式分析型数据库、NoSQL、宽表、文档、图、时序、键值、内存数据库,以及分布式文件系统和对象存储;分布式计算引擎涵盖批处理、实时流计算、联邦查询、多维分析和搜索引擎。同时提供基于这些组件的操作管理、部署运维、任务调度及数据安全等二次开发功能。

产品概述
海盒大数据平台提供大数据的基础能力,包括分布式存储、分布式计算、分布式分析,集成了多个大数据基础组件,包括数据接入、分布式存储引擎(分布式文件系统、数仓管理、存储服务、消息队列、对象存储管理、内存数据库管理、多集群管理等)、分布式计算引擎(计算资源管理、离线开发、实时开发、列式数据库开发、联邦查询等)、分布式分析引擎(多维分析、交互查询、图数据库分析、数据可视化)、任务调度、数据安全(用户管理/租户管理/项目管理、票据下载、访问管理)和部署运维(集群管理、监控告警、日志中心、反向代理)等多个功能模块。SDP可满足不同规模和业务需求下的湖仓一体和流批计算的大数据处理和分析需求。
场景
主要功能
部署运维 SDP-D
支持对多个大数据集群中的多个节点进行统一安装部署、系统管理和优化,以提高整个集群的性能和稳定性。
存储引擎管理 SDP-S
支持业界主流的多种存储模型管理,满足不同业务场景,提高易用性,将各种类型的数据进行集中存储、查询和处理,满足对结构化、半结构化和非结构化数据的统一管理需求。
计算引擎管理 SDP-C
支持多数据源的流/批/OLAP计算、百万级高吞吐、毫秒级低延时业务需求和海量数据离线计算,可以帮助用户快速开发湖仓一体、流批一体、实时数据仓库、实时报表分析、实时智能推荐、实时欺诈检测与风险控制等应用。
分析引擎管理 SDP-A
能够在更短的时间内从更多来源利用更多数据,并使用户能够以不同方式协同处理和分析数据,从而做出更好、更快的决策。
任务调度 SDP-T
可以解决大数据任务之间错综复杂的依赖关系,整个数据处理开箱即用。
核心优势
创新的多模型技术架构
支持业界主流的多种存储模型管理,包括宽表数据库管理、缓存数据库管理、分析型数据库管理、时序数据库管理、消息队列管理、ES集群管理等在内的多种数据存储模型管理。
海量数据存储
支持分布式文件、NoSQL从GB到PB量级的存储解决方案。高可扩展设计,存储系统可动态随数据量增加从G到P级的动态扩容,支持系统不停机动态扩容、负载均衡等。
数据湖仓化- 新一代的披流融合简洁架构
打破传统流处理和批处理独立模式,采用统一计算引擎,能同时处理实时数据流和批量存储数据。提供统一存储平台,能存结构化、非结构化和半结构化数据,并进行统一管理。
存算分离化
能让存储和计算系统独立发展,存储系统可线性扩展,计算系统可灵活调配资源,提高资源利用率、降低成本,增强系统灵活性与扩展性。
多源异构联邦查询
处理和分析来自不同数据源和数据格式的数据的技术。它允许用户在一个统一的查询界面中,对多个异构数据源进行查询和分析,而无需关心底层数据源的具体细节。
租户和应用资源管理优化
在父租户下创建子租户时,子租户可以从 yarn 总队列再次分配独属于自己的计算资源。这需要在 yarn 资源管理系统中,为父租户和子租户分别设置合理的资源队列和资源分配策略。同时,在数据存储和访问层面,通过数据加密、访问控制列表(ACL)等技术手段,确保用户在不同租户和项目中的操作数据相互隔离,保障数据安全。
简易运维部署及百亿小文件处理方案
支持产品便捷部署、组件一键升级和图形化运维,并提供了异常告警和可视化健康监测功能,帮助用户简化运维过程。大量的小文件会占用大量的文件系统资源,影响系统性能。因此,小文件合并是优化大数据处理性能的关键步骤。
自主研发、安全可控
通过自主研发,掌握核心技术,减少对外部技术的依赖,增强技术自主权。大数据平台可以在国产化适配过程中更好地满足国内用户的需求,提升系统的安全性、稳定性和性能。
应用场景
一键式安装与动态扩容
大数据集群运维
数据仓库构建
全文检索与日志分析
数据仓库开发与调试
实时数据分析
跨数据源联合分析
通过图形化界面实现分布式集群的快速部署,支持动态扩展计算与存储资源,适配企业从单节点到多节点集群的弹性需求。
管理和运维多个Hadoop、Spark等分布式计算集群,支持PB级数据存储与处理,支持界面一键巡检及报告导出。
整合多源结构化数据(如销售、库存),支持SQL查询与OLAP分析。
内置集群动态扩缩容、故障自动切换及数据备份机制,保障金融交易、医疗数据分析等高可靠性场景的连续性。
处理Kafka流数据,结合窗口函数实现用户行为分析(如电商点击流统计),响应延迟可达毫秒级。
通过Web界面编写Hive SQL、Spark任务,简化ETL流程,适用于金融数据建模、电商用户画像分析。
整合分布式文件系统、数仓管理、消息队列等多系统数据,支持金融、政务领域的全链路数据洞察。
客户案例