提供不少于HDFS、MapReduce、Hive、Spark、Solr、HBase、Hive,Storm等组件,组件内核与Apache Hadoop开源社区版本保持兼容性,不使用私有架构和组件 厂商的大数据平台提供Spark组件,并且保持开放性。 2 基本功能 分布式数据库:大数据平台能够提供NoSQL能力,支持聚簇表/聚簇索引,支持将现有数据库中的多个具有相似功能或者存在业务关联的数据表聚簇到一个大表中,从存储层面确保在关键场景下的跨表关联查询的高性能,提供详细的技术实现方式。 分布式文件系统:文件系统应提供海量文件存储能力,支持亿级文件和PB级数据容量。支持POSIX/REST/FTP接口访问。支持多副本,支持跨机房容灾,支持在某个时间点创建文件系统快照,支持文件系统元数据周期自动备份,支持磁盘异构,支持分级存储。 (责任编辑:本港台直播) |