The Future of Data Management Solutions is Autonomous

分析市场(Analytics )的数据管理解决方案随着云的地位的巩固而不断发展,Hadoop的使用案例得到澄清,逻辑数据仓库的采用不断扩大,中国供应商(aliyun,腾讯)向国外拓展。在这种动态背景下,本报告将帮助您找到适合您业务的合适供应商。

市场定义/描述

我们将分析数据管理解决方案(DMSA)定义为支持和管理一个或多个文件管理系统(通常是数据库)中的数据的完整软件系统。 DMSA包含特定的优化以支持分析处理。这包括但不限于支持关系模型处理,非关系型处理(如图形处理)以及机器学习和编程语言(如Python和R)。数据不一定存储在关系结构中,并且可以有多个模型使用 - 例如关系,XML,JSON,键值,文本,图形和地理空间。

虽然传统的数据仓库用例仍然是大多数组织的分析计划的基础,但他们也有兴趣管理和处理日益多样化的内部和外部数据格式。因此,完整的DMSA必须能够适应多种数据类型。这些可能包括交互和观测数据 - 例如物联网(IoT)传感器 - 以及非关系数据,如文本,图像,音频和视频数据。

相关角色和技能的广度和范围也在不断扩大,因为组织正在参与新的使用案例,这些案例可以更全面地了解来自越来越多来源的数据。

我们定义了DMSA的四个主要用例,它们反映了数据和用例的多样性(另请参见注释1):

  1. 传统的数据仓库
  2. 实时数据仓库
  3. 与上下文无关的数据仓库
  4. 逻辑数据仓库(LDW)

我们的定义还指出:

• DMSA不是特定的类别或类型的技术。

• DMSA可以由许多不同的技术组合而成。但是,任何产品或服务组合的核心都必须能够通过开放式访问工具通过标准API(如开放数据库连接(ODBC),Java数据库连接(JDBC),代表性状态传输( REST)和对象链接和嵌入数据库(OLEDB)访问。

• DMSA必须为独立的前端应用程序软件提供数据可用性,包括隔离工作负载需求的机制以及在受管数据实例中控制最终用户访问的各种参数。

• DMSA必须对其正在使用的数据进行管理控制。这意味着它必须控制数据如何被持久,访问,管理和保护。

• DMSA有许多不同的交付模式,例如独立DBMS软件,认证配置或参考体系结构,数据库平台即服务(dbPaaS)产品和数据仓库设备。这些是在我们对每个供应商的分析中一起评估的。

魔力象限:

供应商的优势和注意事项

Actian

总部位于美国加利福尼亚州帕洛阿尔托市的Actian为分析工作负载提供Actian Vector分析平台,Actian Vector in Hadoop,Actium X提供用于联合操作和分析处理。 Actian Vector分析平台还可以通过自带许可证模式或通过亚马逊机器映像(AMI)部署在亚马逊网络服务(AWS)和Microsoft Azure上,以实现社区支持的免费版本。

优势

• 对DMSA的再投资:由于战略和路线图的变化,Actian没有出现在魔力象限的2017年版本中。但是,在引入新的领导力后,现在正在重新投资Vector技术以满足分析需求。

• 性能:Actian Vector是一个面向列的内存DBMS,它使用矢量处理来执行查询。参考客户对该技术的性能表示赞赏。

• 物有所值:许多参考客户都称赞Actian的性价比。在我们的参考客户调查中,Actian比其他类别的价值更高。

注意事项

• 云支持:Actian尚未提供强大的云平台即服务(PaaS),即使云正在快速成为标准部署选项。这限制了Actian解决潜在客户群的能力。然而,Actian最近发布的AMI社区版以及计划在2018年为多种云平台上的Vector提供完全托管的企业PaaS选项的计划应该能够满足这种需求。

• 2016年中断:Actian在参考客户调查中获得了许多标准的最低四分位数,其中包括支持,产品功能以及与供应商开展业务的整体经验。我们认为这是由于Actian在2016年经历了内部破坏,当时它在全面改变领导层之前暂停了对DMSA平台的支持。重建互信和市场接受度需要Actian的努力,但我们已经看到早期迹象表明这已经在进行中。

• 易于实施和系统可用性:参考客户给予Actian低于平均水平的评级。然而,最近Actian已经开始积极与现有客户进行合作,以提高整体产品性能和可靠性,这应该有所帮助。

阿里云

阿里云是一家总部位于中国杭州的全球云计算公司。它提供各种服务,例如面向MySQL,SQL Server和PostgreSQL的云数据库RDS(关系数据库服务);基于PostgreSQL的HybridDB,基于开源Greenplum数据库; 用于OLAP分析的AnalyticDB;适用于大型数据仓库实施的MaxCompute;和Hadoop的E-MapReduce。此外,Apsara Stack Agility提供了内部部署私有云实施。

优势

• 广泛的产品组合:与亚马逊一样,阿里云从云计算零售商开始,其致力为客户提供多种服务选择。

• 混合部署方法:尽管阿里云主要提供公共云服务,但它也提供了在本地部署Apsara产品的可能性。这是一种差异化的方法,因为许多其他云提供商仅提供公共云部署备选方案。

• 大型部署:阿里云的参考客户中有一半表示他们的部署大于100TB,一些则拥有以PB为单位的分析数据集。

注意事项

• 易于实施:阿里云的参考客户评估其易于实施的平均值低于平均水平,尽管这是云PaaS提供商通常得分很高的标准。我们认为这是由于将多种云服务和阿里云的期望结合在一起的复杂性,以及客户需要了解哪种服务用于哪种用例。

• 评估,合同谈判和物有所值:阿里云在评估和合同谈判经验的参考客户调查中处于最低水平,物有所值也处于最低水平。我们认为这是由于阿里云对这个市场的相对新兴而产生的,我们认为这些得分会随着公司获得市场经验而提高。

• 市场营销和定位:阿里云提供的各种技术产品很难与特定用例清晰地对准。阿里云将从澄清其产品定位和推荐的架构中受益。

亚马逊网络服务

亚马逊网络服务(AWS)是亚马逊的全资子公司,总部位于美国华盛顿州西雅图市。AWS在云端提供Amazon Redshift(一种数据仓库服务)。 Amazon Redshift包括Redshift Spectrum,这是一种无服务器的计量查询引擎,它使用与Amazon Redshift相同的优化器,但查询Amazon Simple Storage Service(S3)和Redshift的本地存储中的数据; Amazon S3,一个云对象存储; Amazon EMR,托管Hadoop服务;和亚马逊雅典娜(Amazon Athena),这是一款无服务器计费查询引擎,用于存储Amazon S3中的数据。此外,最近宣布的亚马逊海王星提供图形功能。

优势

• 云主导地位:AWS是占主导地位的云供应商的一个显着优势,只有微软在市场份额方面更接近。这种优势为其所有服务提供了更高的网络效应,因为DMSA用例的数据源更可能驻留在AWS服务中,而不是来自任何其他云供应商的服务中。

• 最适合的解决方案方法:AWS提供了几种可用于不同DMSA用例的不同服务。这种方法使客户能够仅选择定义用例所需的那些功能,而所有服务的云特性有助于降低支持多种产品的复杂性。

• 定价:A​​WS在低成本即付即用定价方面处于领先地位,对可选定期承诺进行折扣。此外,AWS还为亚马逊EMR提供现货定价模式,使客户能够以显着较低的成本获得额外资源,以响应其他客户产能过剩的投标。 AWS最近还推出了针对某些服务的按秒计费和无服务器选项,从而提高了灵活性和成本优化机会。

注意事项

• 无本地部署产品:AWS的DMSA产品仅在云中提供。而有些客户需要一个既支持本地软件又支持基于云的服务的混合环境,既可以是临时解决方案,也可以是长期解决方案。 AWS在云中提供多种服务,但没有用于本地使用的软件,尽管与VMware的合作旨在弥补本地部署与云部署之间在某些使用情况下的差距。

• 不断演变的Redshift体系结构:Amazon Redshift具备较好可配置性,其中包括集群内的固定数量的计算能力和存储,Redshift Spectrum可扩展计算资源以查询Amazon S3中的数据。对于本地存储配置,客户无法独立扩展资源,调整大小或更改机器实例类型需要重新配置群集,在重新分配数据时可能需要几个小时,并且在整个持续时间内将群集置于只读模式。针对Amazon S3中数据的Redshift Spectrum不受此问题影响,但无法在所有用例中提供与Redshift相同的绝对性能级别,并且它具有不同的基于消费的定价模型。

• 集成复杂性:通过提供专门构建的独立服务,AWS可以降低每个服务的复杂性,但这会增加集成独立服务所需的工作量。集成需求必须由客户解决,因此随着服务实例的激增可能需要客户付出巨大的努力。 AWS Glue提供托管提取,转换和加载(ETL)服务和数据目录,这应该有所帮助。

Cloudera

位于美国加利福尼亚州帕洛阿尔托的Cloudera提供Cloudera Enterprise平台,其版本包括Cloudera Enterprise Data Hub,Cloudera Analytic DB(用于基于Apache Impala的商业智能[BI]和SQL工作负载),Cloudera Data Science (用于基于Apache Spark和Cloudera Data Science Workbench的数据处理和机器学习)和Cloudera Operational DB(用于基于Apache HBase和Apache Kudu的实时数据服务)。通过其“共享数据体验”(SDX)技术,该平台可跨这些工作负载以及跨部署环境提供统一的安全性,治理和元数据管理。 Cloudera的平台可在本地使用;跨主要云环境(包括对Amazon S3和Azure Data Lake Store的本机对象存储支持);并作为Cloudera Altus品牌下的托管服务。

优势

• 市场占有率:根据Gartner公布的收入数据,在所有纯粹的Hadoop发行版中,Cloudera是该市场中最成功的。在我们的参考客户调查中,它在Hadoop供应商中的进一步购买意向比例也是最高的。 Gartner的合同评审数据证实了这一发现。此外,在同一次调查中,Cloudera是Oracle和IBM之后第三大经常考虑但未被选中的供应商,这表明它是最受欢迎的纯粹Hadoop供应商。

• 产品和包装:我们调查的受访者赞扬Cloudera的功能和包装,并表示所有组件都能很好地协同工作。经常提到Cloudera的增值组件,如Cloudera Manager,Kudu和Impala。通过提供其核心平台的多个版本,包括Analytic DB,Data Science&Engineering和Enterprise Data Hub,Cloudera为客户提供更多选择,以帮助他们满足其用例要求。

• 物有所值和支持:参考客户的Cloudera的物超所值得分高于平均分,而Cloudera的服务和支持平均得分位居前四分位。参考客户经常称赞其技术支持的质量。

注意事项

• 核心Hadoop堆栈的潜在侵蚀:与其他Hadoop发行版厂商一样,Cloudera也面临着挑战,因为新的处理方案(如Apache Spark)和新的存储选项(如用于云对象存储的Amazon S3)不需要完整的Hadoop堆栈。 Cloudera已在2013年将Spark添加到其发行版中,并通过直接访问2016年存储在Amazon S3中的文件和2016年在Microsoft Azure Data Lake Store中存储的文件来解决此风险。

• 传统数据仓库性能问题:我们调查的受访者评估了Cloudera在数据传统数据仓库工作负载的性能处于最低四分位。尽管仍然很高,但使用其他解决方案进行传统数据仓库操作的客户较高。

• 云成熟度:dbPaaS产品Cloudera Altus是相对较新的产品,具备功能和性能,但仍未获得客户的重视。

GBASE

位于中国北京的天津南大通用数据技术公司的GBase提供GBase 8a,一个关系型大规模并行处理(MPP)数据仓库平台;数据仓库一体机GBase Infinidata 8a; GBase UP是支持GBase 8a,Hadoop和其他平台之间数据虚拟化的LDW平台;和在QingCloud应用中心提供的GBase云数据库(GBase 8a)。

优势

• 在中国获得成功并在全球市场获得早期的推动:GBase在中国的大型市场取得了强劲的业绩,在金融和电信领域部署了PB级。它在南美,非洲,东欧和北美的电信行业也正在获得牵引力。

• 客户忠诚度:GBase在我们的客户持久性调查中得分很高。其参考客户中有超过90%表示他们打算在未来12个月内向公司购买额外的许可证,甚至更多的人表示他们会向其他人推荐GBase。

• LDW愿景:通过GBase UP,GBase旨在为LDW提供产品支持。虽然现在评估该产品的成功为时尚早,但它显示了早期的承诺。

注意事项

• 品牌化:GBase的GBase DBMS品牌与Oracle的品牌非常相似。这引发了人们对公司产品在全球市场长期可行性的担忧 - 如果GBase要在中国本土市场之外继续增长,则需要改变。

• 客户满意度:令人惊讶的是,对比其在客户持久性方面的优势,GBase在我们的调查中得分低于客户满意度平均水平。魔力象限中的供应商中,它获得了定价,合同灵活性和物有所值的最低分数,其易于实施的分数处于倒数第三位。

• 国际业务:GBase仍主要在中国销售。为了使产品吸引全球市场,特别是北美和欧洲市场,将需要额外投资。

谷歌

Google位于美国加利福尼亚州山景城,是Alphabet控股公司的全资子公司。 Google Cloud,专注于向商业市场提供解决方案和服务。谷歌云平台中的dbPaaS产品包括BigQuery,一种托管数据仓库产品; Bigtable,一个非关系wide-column型的DBMS; Cloud Dataproc,托管的Spark和Hadoop服务;以及云数据流和云端发布/订阅,都关注实时流数据处理。

优势

• 现代云架构和定价模式:谷歌在其云平台上投入巨资,其产品利用高速网络和现代定价选项,专注于无服务器和基于性能指标的目标。多年来,BigQuery和其他DMSA产品和组件(例如TensorFlow)像谷歌云平台的许多产品一样,已经在Google内部部署。

• 易于实施和物有所值:参考客户称赞Google云平台易于实施和物有所值,并表示它允许他们专注于业务问题而不是管理数据仓库。毫不奇怪,Google和其他云供应商一样,获得了快速实施的最佳成绩。

• 重点关注全球业务:Google正在DMSA市场上开发其企业产品,并在一些早期的高端客户获胜方面取得良好进展。作为资源丰富的全球性组织,我们预计其DMSA产品将迅速成熟。

注意事项

• 支持:我们调查的受访者表达了对Google支持的担忧,他们得分在最低四分位。一位受访者将故障排除过程描述为技术过度。

• 平台成熟度和文档:Google云平台仍然给人一种快速发展的生态系统的印象。产品文档和整体平台成熟度需要改进。

• 开发合作伙伴生态系统:参考客户报告称,Google云平台仍然不是第三方供应商和系统集成商的优先考虑事项,这些厂商和系统集成商倾向于关注传统的本地DMSA平台和其他主要云平台。然而,Google已经采取措施来发展其合作伙伴生态系统,因此我们预计情况会有所改善。

Hortonworks

Hortonworks位于美国加利福尼亚州圣克拉拉市,它提供名为Hortonworks Data Platform(HDP)的Hadoop发行版; Hortonworks DataFlow用于流式数据传输和摄取;适用于Microsoft Azure的HDInsight Hadoop服务;以及针对Amazon AWS的Hortonworks Data Cloud Hadoop服务。此外,该公司最近还推出了Hortonworks Dataplane Service,这是一种统一的架构,可管理多个用例的存储,处理和访问数据集。

优势

• 扩展能力和强大的合作关系:Hortonworks开始支持针对各种数据的面向批处理的分析功能。它的用例已经扩展到支持新的需求,例如基于云的数据湖,可以访问Amazon S3和使用DataFlow的物联网用例。此外,Hortonworks还与微软和IBM合作,为更广泛的客户提供其功能。

• 丰富的基于开源的组件:Hortonworks仍然是Hadoop社区的主要贡献者,但它也吸取了其他开源计划的贡献,如Apache Spark,用于敏捷分析的Apache Zeppelin以及用于数据治理和元数据的Apache Atlas管理。

• 客户满意度:相对较大比例的Hortonworks参考客户会向其他人推荐其技术。他们称赞供应商的开源方法,但表示运行该解决方案需要专门的技能并与特定用例和业务成果保持一致。

注意事项

• 严格遵守开源堆栈:虽然Hortonworks坚持开源堆栈的战略意味着它的优势,但它始终需要找到新的方式来区分自己。

• 物有所值和产品功能:Hortonworks在我们调查的物有所值和整体产品功能获得了最低四分位。这主要是由于对期望的调整,因为我们的参考客户调查和其他客户互动表明,组织现在更清楚地了解哪些用例最适合Hadoop以及Hortonworks。因此,Hortonworks需要关注其技术已被证明是成功的关键用例。

• 易于实施:总的来说,参考客户给予Hortonworks更低的分数,比此魔力象限中的其他供应商更低。这可能表明他们需要专业服务形式的帮助。

华为

位于中国深圳的华为提供FusionInsight大数据平台,这是一个数据管理平台,它将Apache Hadoop,Spark和Storm的组件与FusionInsight LibrA(一种专有的MPP DBMS)相结合。华为添加了行业特定的领域模型,Hadoop平台的专有扩展,用于事件流处理,图形和机器学习功能,以及与MPP数据库兼容并在Hadoop上运行统一SQL引擎。使用华为Superior Scheduler对Hadoop调度程序以及Apache CarbonData支持的Hadoop分布式文件系统(HDFS)文件格式进行了额外的增强。华为的产品也可以通过合作伙伴在公共云中获得。

优势

• 行业专长:华为利用其在电信行业的实力,构建广泛适用于一般用例的综合DMSA产品。此外,由于对电信行业的深刻理解,华为在物流,语音业务和视频企业智能领域拥有丰富的经验。

• 客户忠诚度:华为受访参考客户对其技术表示赞赏,并表示有意在未来12个月内向公司购买额外的许可证。

• 丰富的产品组合和功能:FusionInsight大数据平台通过统一的SQL引擎将Hadoop,流式计算和关系型MPP数据库融合在单一环境中。它可以部署在本地,华为公共云或合作伙伴的公共云环境中。 Hadoop开源内核的扩展已经在Apache CarbonData分布式存储引擎中进行,HiGraph用于图形处理,调度和编排以及Elk交互式查询语言。还提供了关系引擎和Hadoop之间的紧密集成。

注意事项

• 市场占有率:在亚太地区以外,华为在数据和分析软件市场上并不出名。 Gartner的客户咨询服务用户很少问及华为的DMSA,而其他供应商的调查参考客户并不经常考虑华为。然而,华为正在积极拓展国际市场,并投资于欧洲和北美的本地研发设施。

• 用户体验不一致:Gartner关于华为客户体验的信息来源显示出难以解决的不一致模式。我们认为这代表了实施方面的不一致以及与华为做生意的整体经验。

• 复杂的实现:虽然华为的平台功能非常广泛,但这种广度几乎总是需要集成,因为客户需要定制全部或部分平台以满足其特定需求。

IBM

IBM位于美国纽约的Armonk,提供独立的DBMS(用于z / OS的Db2,Db2,Informix),一体机设备(用于分析的PureData系统,用于操作分析的PureData系统,集成分析系统,Db2分析加速器),Hadoop解决方案(BigInsights),托管数据仓库云服务(云上的Db2仓库)以及私有云数据仓库功能(Db2仓库)。 IBM的BigSQL和Fluid Query为广泛的DBMS和Hadoop提供了一个整合的访问层。此外,IBM的DataFirst方法和Watson数据平台支持混合云和内部部署和管理的进一步扩展。

优势

• 统一DBMS引擎:尽管已有Informix和Netezza数据库引擎(Netezza平台软件),IBM在过去几年中大部分时间都在向单个DBMS引擎迁移,以推动其DMSA计划。其结果是重新关注Db2,它支持纯软件,云和一体机设备形式;它继承了基于Netezza的PureData System for Analytics的一些组件,它将取代它。

• 庞大且忠诚的安装基础:IBM通常被许多客户视为强大的战略合作伙伴。我们调查的IBM参考客户中超过94%打算在未来12个月内从公司购买额外的许可证,产品或功能。此外,IBM的参考客户会向其他人推荐其产品和服务,96%的人表示他们会毫无保留地这样做。

• 产品组合的深度和广度:作为一个庞大而成熟的组织,IBM拥有深厚的产品组合,涵盖了从产品功能到部署选项的广泛客户需求。

注意事项

• 繁杂的品牌和营销策略:IBM的品牌和营销策略混淆了许多客户。参考客户强调,从基于Netezza的产品向基于Db2的产品过渡的战略方向不明确,以及关于Informix未来的企业沟通不足。但是,IBM重新关注对公司具有战略意义的Db2应该有所帮助。

• 对衰落市场的持续和迟到投资:IBM最近宣布了Integrated Analytics System。这是一款基于Db2的下一代数据仓库设备,兼容Netezza并整合了Spark,专注于扩展数据仓库的角色,将强大的数据科学支持作为集中式数据中心的一部分。然而,我们相信一体机设备市场正处于长达十年之久的衰退期。此外,相比一些竞争对手,IBM的一体机设备产品仍然在产品灵活性、跟进常规硬件更新方面记录不佳。

• 难以吸引新客户:虽然IBM仍然是其现有客户的标准战略合作伙伴,但寻求关于“绿地”部署的技术解决方案建议的Gartner客户很少会问及IBM。

MapR科技

位于美国加利福尼亚州圣何塞的MapR Technologies公司在开源和商业软件版本中提供融合数据平台(CDP)。 CDP使用网络文件系统(NFS)和MapR-XD(一种可扩展的符合POSIX标准的数据存储层)实现了性能和存储优化; MapR-DB,支持键-值,文档,宽列,图形和时间序列模型的非关系DBMS;事件流功能(MapR-ES);高可用性改进;和配置管理工具。 MapR Edge是CDP的一种小尺寸版本,它将MapR的功能扩展到物联网环境常用的边缘处理用例。

优势

• 融合平台:MapR的CDP将分析功能与运营和实时流数据相结合。参考客户喜欢这种“一体式”方法。 MapR的参考客户报告使用其产品用于所有四个DMSA用例。

• 企业级可用情况:参考客户一致称赞MapR的运营可靠性,性能,灵活性和可扩展性。 Hadoop兼容的MapR文件系统(MapR-FS),非关系型数据库管理系统(MapR-DB)以及归因于本地NFS支持的易用性常常被视为核心差异因素。

• 不断增长的产品组合和用例覆盖率:MapR在过去的一年中推出了强大的流数据功能,可扩展的存储产品和边缘分析功能,因为它试图扩大其用例覆盖范围。

注意事项

• 市场知名度:MapR的市场知名度仍然有限。 Gartner的客户咨询服务收到的关于MapR的查询比魔力象限中的其他供应商更少,MapR很少出现在提交给Gartner审查的合同中。 MapR需要不断提高市场对其产品和愿景的认识。

• 生态系统跟进步伐:几位参考用户指出,MapR的开源软件包可能落后于开源社区提供的最新版本。此外,有些人抱怨说,当新功能实施时,他们不遵守定义的开源标准。然而,这并不完全出乎意料,因为许多供应商故意将自己与纯开源产品区分开来。

• 用例选择:尽管MapR的用例覆盖范围在不断扩大,但参考用户报告说,为MapR平台选择和验证适当的用例仍然很重要。

MarkLogic

位于美国加利福尼亚州圣卡洛斯的MarkLogic公司提供非关系型多模DBMS,它被称为“运营和交易”型DBMS。该产品有两个版本:Essential Enterprise和一个免费开发者版本。 Essential Enterprise可以部署在本地,云中以及跨AWS,Microsoft(Azure)和Google(Google Cloud Platform)等混合基础架构以及VMware,Pivotal(Cloud Foundry)和Red Hat平台。

优势

• 强大的多模式功能:尽管MarkLogic是一种非关系型文档数据库管理系统,它还支持原子性,一致性,隔离和持久性(ACID)事务,并且包含一个搜索引擎和一个元组存储库,以使用图形数据库功能定义语义关系。 MarkLogic最近引入了一个额外的API来访问单个查询中的行,文档和元组。

• 关注数据的统一访问:MarkLogic将自己定位为访问数据的统一力量。实质上,它提供了一个新的操作数据存储版本。这种定位的优势在于,具有复杂数据格局的组织不仅受益于MarkLogic的方法和功能,而且在运营数据存储中结合了更多数据和元数据时也获得了越来越多的好处。

• 客户满意度:MarkLogic在参考客户调查中取得了非常好的成绩。它获得了与供应商开展业务的总体经验得分最高的分数以及供应商支持的第三高分数。 Gartner客户咨询服务的用户也表示对MarkLogic的高度满意度。

注意事项

• 受限的销售机会:拥有复杂数据格局的大型机构非常适合MarkLogic的功能。较小或较不成熟的组织可能不会意识到在额外的数据管理平台上进行投资会产生适当的收益。

• 市场知名度:与此魔力象限中的其他厂商相比,MarkLogic在该市场的知名度较低。虽然有关MarkLogic的询问逐年增加,但Gartner收到的询问MarkLogic的询问数量仍低于该供应商的竞争对手。

• 重点转变:MarkLogic两年前将重点转向数据整合,并且仍在向市场宣传其愿景的好处。虽然Gartner认为其愿景是健全的,但MarkLogic能否被广泛采用还有待观察。

MemSQL

总部位于美国加利福尼亚州旧金山的MemSQL提供了一个分布式的,横向扩展的SQL DBMS,它具有内存中的行存储以及支持事务和分析用例的同时支持内存和磁盘的列存储。 MemSQL通过Apache Spark或Apache Kafka的流数据实时分析来扩展其DBMS平台。 MemSQL提供了一个免费的开发版,用于非生产用途,以及可以在本地部署或作为在AWS或Microsoft Azure基础架构上运行的完全托管云服务的付费企业版。

优势

• 实时低延迟功能:MemSQL的行列混合存储组合,内置流式数据传输功能,代表了低延迟分析的融合平台。近一半的MemSQL参考客户报告近乎实时地持续加载数据 - 这比魔力象限中的任何其他供应商都要多。

• 性能和易用性:参考客户经常赞扬MemSQL产品的性能和易用性,以及运营开销要求。它的MySQL兼容性也被认为是易于实现的优势。

• 混合云和多云视角:尽管一些参考客户发现托管云服务存在部署问题,但MemSQL对建立可部署在任何云或内部部署中的单一平台的愿景非常强大。

注意事项

• 定价问题:MemSQL根据管理的数据量购买许可。这促使一些参考客户在数据量不断增长的环境中表达对定价的担忧,并且关注这种定价模式的长期可行性。

• 产品成熟度:相对较大比例的MemSQL参考客户发现缺少某些功能或功能较弱,这表明其产品仍在成熟。然而,MemSQL在性能,错误和可靠性方面得分很高,这表明当功能交付时,它们通常都是高质量的。

• 客户持续性:可能与上述定价问题有关。 MemSQL声称,其客户在头12个月内的平均授权容量平均增加了近一倍,但可能仅仅反映了最初的小型实施迅速发展。

Micro Focus

位于英国纽伯里的Micro Focus提供Vertica分析平台。该平台可作为Vertica Enterprise提供,这是一种列式关系数据库管理系统,作为以软件方式的本地使用解决方案提供;云中的Vertica,可作为来自AWS,Microsoft Azure和Google Cloud Platform市场的机器映像提供;还有基于Hadoop上的Vertica for SQL产品。

优势

• 将存储和计算分离的统一引擎:Vertica DBMS引擎可用于传统MPP横向扩展版本,具有直连式存储。它还通过基于Hadoop的Vertica for SQL支持主要的Hadoop发行版(从Cloudera,Hortonworks和MapR),它支持多种文件格式,包括Apache Avro,Parquet和ORC。

• 性能,可靠性和可扩展性:参考客户称赞Vertica Analytics Platform的性能,可靠性和可扩展性。另外,他们经常提到产品的成熟度具有优势。

• 客户体验:我们对参考客户的调查显示,Micro Focus几乎获得了客户满意度追踪指标的高于平均水平的得分。它在产品功能,价格和定价灵活性方面得分特别高。

注意事项

• 收购Hewlett Packard Enterprise(HPE)软件:Micro Focus收购HPE软件资产的市场仍存在重大不确定性。虽然有迹象表明Micro Focus打算继续投资Vertica平台,并且坚持支持Vertica品牌,但潜在客户可能希望谨慎行事。他们应该期待一些过渡性的摩擦,直到Micro Focus的长期增长和投资策略得到证实并取得积极成果。

• 云成熟度:虽然Vertica Analytics Platform在主要云环境中可用,但参考客户报告称,它更像基础架构即服务(IaaS),而不是完全托管的PaaS。采用Eon模式定价的Vertica 9应该可以缓解这些担忧。

• 维护和管理问题:参考客户报告了添加和删除节点的难题,以及备份和恢复操作的性能差。前一个魔力象限中也发现了管理问题,但最近的产品增强功能应该可以提高可管理性,备份和弹性。

微软

位于美国华盛顿州雷德蒙市的微软公司将SQL Server作为纯软件解决方案提供经过认证的配置。它还提供分析平台系统,一个MPP数据仓库一体机设备。此外,它还销售Azure SQL数据仓库(完全托管的MPP云数据仓库),Azure HDInsight(基于Hortonworks的Hadoop发行版),Azure Databricks(基于Apache Spark的分析平台)和Azure Data Lake(大数据存储和分析平台)作为云服务。

优势

• 聚焦云和功能:微软表现出对市场云需求和所需功能的强烈理解。借助Azure SQL数据仓库,它可以满足对云数据仓库日益增长的兴趣,而且可以满足混合内部部署和云使用案例的需求,并且正在开始展示基于拉伸表(Stretch tabls)的混合功能。微软的Azure Data Catalog提供跨多个云存储库的综合信息源。此外,Azure SQL数据仓库还为LDW架构提供了良好的支持,并支持通过Microsoft的PolyBase软件与Hadoop和Azure Data Lake无缝集成。

• 物有所值:参与我们参考客户调查的受访者普遍对从微软收到的物有所值感到满意。供应商的相对简单的包装和不捆绑许多昂贵的选件似乎与其客户产生共鸣。

• 客户忠诚度:相对较大比例的微软参考客户受访者表示他们将在未来12个月内向微软购买更多产品或服务。

注意事项

• 定价问题:参考客户对微软基于CPU核心的SQL Server许可模式表示担忧,并指出随着硬件厂商释放更多内核的CPU,导致成本上升。然而,Gartner并不认为这是一个重大问题,因为基于CPU核心的许可证是一种行业惯例,而且微软也提供不基于核心的云定价模式。

• 培训和支持:微软在最终用户培训和客户支持质量方面的参考客户调查中得分接近最低。然而,微软表示,它正在大量投资于文档,培训和支持,并看到这些投资的积极成果。我们期望这些分数得到改善。

• 实施规模和企业功能缺失:微软客户发现其最大DMSA实例的平均规模、经常用于查询的数据集相对较低,这表明微软尚未完全满足生产环境中大型企业的需求。此外,他们表示认为,微软在SQL Server中的Always On功能用于读横向扩展(scale-out)不如竞争对手提供读/写横向扩展的产品。

Neo4j

Neo4j位于美国加利福尼亚州的San Mateo和瑞典的Malmö,提供了一个图形(Graph)平台,其中包括Neo4j原生图形数据库,图形分析,Cypher图形查询语言,数据集成以及图形可视化和发现工具。该公司提供开源的Neo4j社区版; Neo4j桌面,开发人员和数据科学家免费;以及用于生产部署的付费Neo4j企业版。

优势

• 图形数据库管理系统:Neo4j在独立图形数据库管理系统市场中的领先份额和客户采用率(它宣称其Neo4j数据库软件下载量超过1000万)领先。尽管许多供应商都在为他们的产品添加图形功能,但需要非常强大的图形功能以及广泛的功能(包括从关系数据库管理系统迁移而来的分析算法和工具)的客户可能会发现Neo4j更适合他们的需求。

• 易于实施,性能和培训:我们调查的参考客户没有报告任何与实施和使用Neo4j平台有关的问题。另外,关于产品性能问题的报道非常少。此外,Neo4j的参考客户的培训质量高于平均水平。

• 客户倡导与支持:Neo4j因客户愿意向其他人推荐产品而获得了调查中的最高分。此外,我们调查的受访者经常赞扬Neo4j的支持组织,提供快速响应和快速解决问题的报告。

注意事项

• 关注图形解决方案:许多更大和更成熟的供应商正在为其产品添加图形功能。虽然它们的功能在功能和性能方面可能还不如Neo4j强大,但这些供应商可能会满足客户对图形功能的最初需求,并可能会响应不断增长的需求而增强其图形功能。 Neo4j对openCypher的支持 ——一种Cypher查询语言的开源版本 - 旨在扩展Neo4j作为图形标准的采用,但现在还处于初期阶段。

• 购买意愿低:Neo4j在未来12个月中表示有意购买更多的参考客户的比例最低,这是令人惊讶的,因为他们大力倡导。被调查的客户对Neo4j进行各种与业务相关的测量,包括许可,定价和定价灵活性得分不佳。 Neo4j最近修改了许可条款,并预计在2018年提供云托管服务。

• 升级和企业成熟度:调查对象报告升级Neo4j平台的问题 - 他们提到有时会产生意想不到副作用的挑战性升级。此外,一些公司报告说,在几个关键企业领域缺乏成熟度或能力,包括安全,监控和自动化。 Neo4j平台的最新版本(包括服务器到服务器加密)应至少解决其中一些问题。

Oracle

Oracle位于美国加利福尼亚州Redwood Shores,提供Oracle数据库12c,Oracle数据库一体机,Oracle大数据一体机,Oracle大数据管理系统,Oracle大数据SQL和Oracle大数据连接器。此外,Oracle云服务还提供Oracle数据库云服务,Oracle数据库云Exadata服务和Oracle大数据云服务 - Oracle自动数据仓库云将添加到其中。 Oracle的云产品组合还包括以客户的Oracle数据库Exadata云和客户的Oracle大数据云的形式提供的本地解决方案——将Oracle云产品进行私有云形式部署。

优势

• 技术愿景和能力:Oracle数十年来一直是DBMS技术的领导者,其功能使其成为DMSA市场上最著名的供应商之一。自主(autonomous)数据仓库云的增加将使Oracle能够满足市场对基于云的服务的期望。甲骨文在产品功能参考客户调查中获得最高分。

• 与Hadoop发行版集成:利用Big Data SQL,Oracle将其覆盖范围扩展到大量Hadoop发行版。它不仅提供了对Hadoop中数据的虚拟访问,还提供了诸如对目标平台的谓词下推等高级功能。

• 市场占有率:Gartner的数据显示,超过70%的DMSA购买决策都与客户的DBMS供应商有关。这与甲骨文在DMSA领域的强大技术能力相结合,使Oracle成为Magic Quadrant中涵盖的用例的热门选择。超过80%的甲骨文受访参考客户还将Oracle用于他们的交易系统。

注意事项

• 客户不满意:Oracle高额并强势的合同,这可能会导致客户不满意。大量使用Gartner查询服务的Oracle客户对其业务实践并不满意。

• 未经证实的云功能:Oracle最可行的云产品是新产品,但尚未在生产环境中证明其功能以及许可和定价模式。但是,Oracle声称对现有企业客户非常感兴趣,并且正在大力投资于使其云产品获得成功。

• 定价和支持:参考客户调查的受访者经常对Oracle的定价和支持表示担忧。客户通常不喜欢基于选件的许可方式,特别是对于有效使用生产所必需的功能。不过,甲骨文最近推出了其云服务的Universal Credits,并降低了云中服务的数据库云价格,这应该有助于缓解一些云计算价格问题。

Pivotal

位于美国加利福尼亚州旧金山的Pivotal提供基于PostgreSQL的开源MPP数据库Pivotal Greenplum Database。它既可以作为软件,也可以作为AWS或Microsoft Azure基础架构中的云提供。 Pivotal还提供戴尔EMC数据计算一体机设备和内存数据网格产品GemFire形式的一体机设备。此外,Pivotal出售名为Pivotal Cloud Cache的缓存服务,该服务基于GemFire并在Pivotal Cloud Foundry平台上运行。

优势

• 开源:Pivotal在2015年将Greenplum数据库开源,并且2016年在这一领域取得的发展势头一直在持续,因为Greenplum 5现在与PostgreSQL 8.4兼容,并且该公司已开始致力于与PostgreSQL 9的兼容性。此外,阿里云使用Greenplum数据库作为其部分数据仓库产品的基础。

• 实施复杂计划:Pivotal的参考客户没有报告任何复杂实施方面的问题。这至少部分是因为Greenplum数据库倾向于吸引技术敏锐的用户,他们能够很好地处理大型复杂的项目。

• 强大的数据库内分析功能:Pivotal Greenplum数据库整合了Apache MADlib分析库,以提供全面的“数据库内分析功能”套件。这些包括数学,统计学,机器学习,地理空间,时间序列,文本分析和图形算法。这使得Greenplum数据库非常适合探索性和数据科学用例,以及传统的数据仓库。

注意事项

• 实施难度:Pivotal Greenplum数据库吸引喜欢在较高技术层面参与产品的最终用户。 Pivotal的易于实施分数处于倒数第三位。值得注意的是,Pivotal不提供REST API,这个API越来越成为这个市场中产品的标准功能。

• 软件缺陷和质量:Pivotal的参考客户报告了相对较多的错误问题。然而,他们也指出,Pivotal的软件质量在最近的发布中有了很大的改进。

• 业务体验:在我们的参考客户调查中,Pivotal在与供应商开展业务的经验中取得了最低四分位数。我们认为这至少部分是由于Greenplum数据库实现的相对复杂性所致。

Qubole

Qubole总部位于美国加利福尼亚州圣克拉拉市。它提供Qubole数据服务企业版(QDS),这是一个基于云的Hadoop和Spark处理引擎,用于处理其自身管理下或由云对象存储或其他数据管理解决方案管理的数据,比如关系数据库管理系统。 Qubole还提供Qubole云代理,这是附加服务,用于优化云资源消耗和自动化工作负载。 Qubole的产品可在AWS,Microsoft Azure和Oracle云平台上使用。

优势

• 易于实施和商业体验:Qubole的参考客户称赞QDS易于实施,在我们调查涵盖的供应商中排名前三分之一。由于它提供了真正的PaaS,Qubole不同于其他基于Hadoop的分销商。此外,Qubole在我们的调查中获得了商业体验好评。它在支持体验方面名列前茅。

• 存储数据多元化:Qubole提供了一个PaaS,可以管理存储在多个存储库中的数据,例如对象库和关系数据库管理系统。这是特别有价值的,因为分析数据的感知需求越来越具有挑战性。同时,对数据访问的灵活性和灵活性的需求也在增加。

• 优化云资源的使用:Qubole提供优化来降低客户的拥有成本,例如群集自动终止和现场实例的使用。存储和计算资源的分离使优化处理成为可能 - 这是另一个与其他基于Hadoop的产品差异化的因素。

注意事项

• 产品功能和用例:Qubole使用开源处理框架,例如Apache Spark,支持Presto,Hive和Pig的Hadoop,这些工具不适合所有类型的工作负载。 Qubole在参考客户调查中获得了最低四分位产品功能。考虑到Qubole的企业应确保其用例符合其处理能力。

• 企业级安全功能:尽管Qubole提供加密和安全断言标记语言(SAML)支持等安全功能,但企业应确保Qubole满足其安全需求,例如基于行和列的访问控制。这可能很困难,因为数据可能并不总是在Qubole的管理之下。

• 竞争加剧:Qubole提供独特的云部署和处理灵活性。然而,其位置将受到云查询服务的挑战,云查询服务还允许直接查询数据,例如Amazon Athena和Amazon Redshift Spectrum提供的功能。其中许多服务虽然不如Qubole的产品灵活,但对于某些用途而言可能足够好。

SAP

SAP位于德国瓦尔多夫。它提供了SAP HANA,这是一种支持运营和分析用例的内存式列存储数据库管理系统。还有一个打包的数据仓库解决方案SAP BW / 4HANA。两者都作为云解决方案提供(用于在公共云和私有云以及SAP云平台上部署)以及作为类似设备的硬件参考体系结构。 SAP还为Spark和Hadoop处理提供SAP云平台大数据服务,一个基于云的Hadoop发行版和SAP Vora。

优势

• 性能:SAP参考客户称赞SAP HANA的性能。 Gartner与客户的互动加强了这种认可,这表明分析用例的性能提高是SAP HANA采用的重要推动力。

• 成熟度:SAP参考客户对其产品的成熟度表示满意。一半的SAP参考客户声称部署时间仅需三个月,这一观点得到了进一步的强化。

• 满意的参考客户:超过90%的SAP受访参考客户表示有意在未来12个月内从SAP购买额外的DMSA产品许可证。相对较大比例的愿意向其他人推荐产品的SAP参考客户强调了这一发现。

注意事项

• 渗透到SAP已安装的基础之外:SAP HANA主要用于支持SAP生态系统内的SAP应用程序。渗透更大的非SAP市场仍然是SAP的一个挑战。部分原因是由于SAP运行时许可证和企业使用许可证(用于非SAP应用程序)之间的定价差异,这表明SAP的重点仍然是SAP应用程序生态系统的重点。

• 定价和定价灵活性:我们参考客户调查的一些响应者对SAP定价的复杂性和定价灵活性表示担忧。但是,这可能反映出对运行时许可不同的SAP HANA的完全使用缺乏了解。

• 数据湖和云计划:SAP云计算对象存储数据湖的路线图以及存储和计算资源的分离落后于市场需求。 SAP的产品仍然专注于Hadoop发行版和SAP云平台大数据服务。

Snowflake

总部位于美国加利福尼亚州圣马特奥市的Snowflake公司在AWS基础设施上提供完全托管的数据仓库服务。它支持符合ACID标准的关系处理,以及对文档存储格式(如JSON,Avro和XML)的本机支持。本地Apache Spark连接器,R语言集成,对用户定义函数的支持,动态扩展性,暂时支持和最近宣布的数据共享功能完善了核心产品。 Snowflake目前仅在AWS云中提供。

优势

• 客户满意度和易于部署:Snowflake客户满意其易于实施,部署灵活和性能非常强大的数据集。 Snowflake的易于实施和整体体验的分数领先我们的参考客户调查覆盖的所有其他供应商的分数。

• 市场动力:雪花虽然仍是一个小供应商,但正在获得市场吸引力。这从客户数量的强劲增长和整体生态系统的稳定增长中可见一斑。

• 数据共享:除了使组织能够轻松实施新的分析用例之外,Snowflake还推出了数据共享功能,使客户能够轻松共享和利用存储在Snowflake中的数据获利。

注意事项

• 仅AWS支持:虽然AWS是主要的云提供商,但随着PaaS交付的数据仓库解决方案数量不断增加,云计算提供商数量不断增加,其中包括Microsoft(Azure)和Google。不过,Snowflake确实计划很快将其产品扩展到其他云提供商。

• 将数据加载到Snowflake的要求:要从服务的处理灵活性和存储和计算资源的分离中受益,必须先将数据加载到Snowflake中。参考客户表示,事先将用例与Snowflake的处理能力进行匹配是非常重要的。一位客户指出,数据加载是实施中最昂贵的方面。另一位希望能够直接在Amazon S3中分析数据,而不必将其加载到Snowflake中。

• 定价可预测性:虽然Snowflake的定价适用性得分在我们的调查结果中位居前三,但一些受访者指出,难以控制成本。然而,最近宣布的按秒计费应该会有所帮助。

Teradata

Teradata总部位于美国加利福尼亚州圣迭戈市,其产品包括业务和分析咨询服务,基于Teradata数据库的Teradata分析平台,这是一款纯软件数据库管理系统解决方案; Teradata IntelliFlex和IntelliBase一体机设备以及一系列云数据仓库解决方案(均带有MPP)。 Teradata IntelliCloud是公共云基础架构(AWS和Microsoft Azure)和Teradata Cloud(优化基础架构)上提供的“即服务”云服务。对LDW的支持采用Teradata统一数据架构(UDA)的形式。 Teradata QueryGrid(UDA的一部分)通过Teradata自己的软件以及通过开源Presto提供多系统查询支持。 Teradata还为Cloudera,Hortonworks和MapR发行版提供Aster Analytics和Hadoop支持。

优势

• 适应新的需求:Teradata扩大了产品范围,努力改变人们认为它仅适用于先进的大型数据仓库的看法。为了满足需求,它现在还为本地和云部署选项提供免费的开发人员许可证和竞争性基础许可证定价。

• 产品创新:Teradata进行创新以满足市场的期望。例如,它已经在UDA中引入了健康监测和基于成本的优化。 Teradata分析平台的创新之处在于它支持多平台查询和分析处理,SQL,统计和机器学习。

• 部署和许可灵活性:通过Teradata Everywhere,Teradata现在支持所有部署模式,包括公共云,Teradata Cloud和“即服务”IntelliCloud产品以及本地IntelliFlex和VMware产品。它支持混合本地和云部署,并为所有部署提供单一便携式许可证模式。

注意事项

• 定价和物有所值:被调查的参考客户对Teradata的定价和资金价值表示担忧。有人指出,其定价很复杂,可能是因为该公司在2017年转向基于订阅的定价和包装。我们认为这至少部分是由于对订阅定价的真实成本的不切实际的理解以及这一转变会带来不切实际的期望从长远来看成本较低。

• 客户管理和客户满意度:Teradata参与调查的客户对客户管理和客户满意度的分数今年低于平均水平。我们认为这反映了不断变化的市场需求,这促使客户调查替代供应商(即使他们实际上并没有离开Teradata),并且这可能是一个短期现象。

• 销售和市场执行:Teradata做出了重大改变,以解决市场对数据仓库设备兴趣下降的问题,例如,引入了云和仅供软件的产品。但是,Gartner与客户的交互表明,他们仍然经常无法将Teradata识别为云数据仓库提供商。此外,订购定价模式的改变已经影响了Teradata的收入。

Treasure Data

Treasure Data总部位于美国加利福尼亚州Mountain View。它提供客户数据平台,一个在AWS基础设施上运行的完全托管的DMSA,并在美国和日本设有可用区域。客户数据平台提供了一个云数据湖,与关系数据集市结合在一起。从各种来源获取数据以及向下游数据管理平台提供数据的能力是Treasure Data的重点。

优势

• 数据集成和物联网焦点:Treasure Data专注于构建灵活的数据集成功能,这对于数据湖方法非常重要。通过Fluentd和Embulk插件进行的数据集成提供了流数据和基于批处理的功能。 Treasure Data早期专注于物联网数据为其大部分平台开发提供了基础。

• 高级分析功能:Treasure Data支持本地用户定义功能,地理空间和统计模型的内置分析功能,以及与R语言和Python的强大集成。 Apache Spark集成正在进行beta测试。

• 支持和定价:参考客户调查的受访者称赞了Treasure Data的支持和定价模式。 Treasure Data的总体支持排名第三,其次是定价灵活性。

注意事项

• 产品成熟度和学习曲线:被调查的参考客户报告称,Treasure Data的平台运行良好,但要求用户具有强大技术能力和技巧才能从中获得最大价值。该公司计划在2018年提高这些能力。

• 专注于数据湖泊:尽管Treasure Data向下游传统的关系数据集市和企业数据仓库提供服务,但其平台的核心优势仍然是基于Hive和Presto的数据湖功能。我们参考客户调查的受访者定期使用Treasure Data的平台以及其他数据仓库解决方案。该公司可以提供关系型云数据集市,并声称大约三分之一的客户以这种方式使用其产品。

• 有限的全球影响力:Treasure Data的客户几乎都在日本和美国,尽管他们通常是拥有全球影响力的大型企业。其他国家的客户可能会发现本地化和支持资源有限。

供应商添加和删除

随着市场变化,我们审查并调整魔术象限的纳入标准。由于这些调整,任何魔力象限中的供应商组合可能随时间而改变。供应商出现在魔力象限一年而下一年消失,并不一定表明我们已经改变了我们对该供应商的看法。这可能反映了市场的变化,因此改变了评估标准或供应商改变了关注点。

添加的

• Actian

• 阿里云

• GBASE

• Micro Focus

• Neo4j

• Qubole

• Treasure Data

删除的

• 1010data,没有证明至少有10%的客户位于其本土区域之外,因此未能达到要求至少两个地理区域的生产客户的纳入标准。

• EnterpriseDB,它没有证明它完全支持四个已定义用例中的至少两个。

• Hewlett Packard Enterprise,于2016年9月完成了其软件部门与Micro Focus的分拆和合并。其中包括Vertica软件产品,该产品现在被视为Magic Quadrant对Micro Focus评估的一部分。

• MongoDB,没有证明它完全支持四个定义用例中的至少两个。

• Transwarp Technology,没有证明其客户至少有10%在本地以外,因此未能达到要求来自至少两个地理区域的客户的纳入标准。

注释1:

主要DMSA用例

  1. 传统的数据仓库

这个用例涉及管理来自多个来源的结构化历史数据。数据主要通过批量加载和批量加载进行加载。

该用例可以管理大量数据,主要用于标准报告和仪表盘。在较小程度上,它也用于自由形式的临时查询和挖掘以及运营查询。鉴于混合工作负载对查询和用户技能的要求,它需要强大的系统可用性和管理和管理功能。

  1. 实时数据仓库

此用例为分析用例添加了实时组件,旨在减少延迟 - 数据生成时间与可分析时间之间的时间延迟。它主要管理通过微博和/或流式分析不断加载的结构化数据,以支持实时决策支持,应用程序中的嵌入式分析,实时数据仓库和运营数据存储。

该用例主要支持针对运营需求和低延迟决策支持的报告和自动查询。它需要高可用性和灾难恢复功能来满足运营需求。管理不同类型的用户和工作负载(如临时查询和挖掘)以及存储大量历史数据的能力并不重要,因为主要驱动因素是在运营时提供低延迟实时视图和分析数据。

  1. 上下文无关的数据仓库

这个用例允许探索新的数据值,数据形式的变体和新的关系。它支持搜索,图形和其他高级功能,以发现新的信息模型。

此用例主要用于自由形式查询,以支持预测,预测建模或其他挖掘风格,以及支持多种数据类型和来源的查询。它没有运营要求,并且支持数据科学家和业务分析师等高级用户。它会导致可能的多种数据类型的自由格式查询。

  1. 逻辑数据仓库

此用例为DBMS充当各种数据源的逻辑层的结构化数据类型和其他内容数据类型管理数据种类和数量。

除了来自交易应用程序的结构化数据之外,此用例还包括其他内容数据类型,例如机器数据,文本文档,图像和视频。因为额外的内容类型可以产生大量数据,并且具有特定的数据持久性要求,所以访问不同存储库中的数据非常重要。 LDW还必须支持各种查询功能和不同的用户技能。此用例支持将查询扩展到除数据仓库DBMS之外的其他源,并且可能包含元数据或数据虚拟化组件。

Leave Comment