nosql数据库的特点是什么

编辑: admin 分类: mysql 发布时间: 2023-06-10 来源:互联网

nosql特点:1、灵活的可扩展性;nosql去掉了关系数据库的关系型特性,数据之间无关系,很简单就能够扩展。2、灵活的数据模型;NoSQL采用键/值、列族等非关系模型,允许在一个数据元素里存储不同类型的数据。3、NoSQL可以凭借自身良好的横向扩展能力,充分自由利用云计算基础设施,很好地融人到云计算环境中。4、nosql有着非常高的读写性能,特别是在大数据量之下。5、高可用。

nosql数据库的特点是什么

本教程操作环境:windows7系统、Dell G3电脑。

NoSQL简介

NoSQL是一种不同于关系数据库的数据库管理系统设计方式,是对非关系型数据库的统称,它所采用的数据模型并非传统关系数据库的关系模型,而是类似键/值、列族、文档等非关系模型。NoSQL数据库没有固定的表结构,通常也不存在连接操作,也没有严格遵守ACID约束。因此,与关系数据库相比,NoSQL具有灵活的水平可扩展性,可以支持海量数据存储。

什么是ACID?

  • 事务的原子性(Atomicity)是指一个事务要么全部执行,要么不执行,也就是说一个事务不可能只执行了一半就停止了。比如你从取款机取钱,这个事务可以分成两个步骤:1划卡,2出钱。不可能划了卡,而钱却没出来。这两步必须同时完成,要么就不完成。
  • 事务的一致性(Consistency)是指事务的运行并不改变数据库中数据的一致性。例如,完整性约束了a+b=10,一个事务改变了a,那么b也应该随之改变。
  • 独立性(Isolation):事务的独立性也有称作隔离性,是指两个以上的事务不会出现交错执行的状态。因为这样可能会导致数据不一致。
  • 持久性(Durability):事务的持久性是指事务执行成功以后,该事务对数据库所作的更改便是持久的保存在数据库之中,不会无缘无故的回滚

NoSQL数据库的特点

1)灵活的可扩展性

传统的关系型数据库由于自身设计机理的原因,通常很难实现“横向扩展”,在面对数据库负载大规模增加时,往往需要通过升级硬件来实现“纵向扩展”。NoSQL数据库在设计之初就是为了满足“横向扩展”的需求,因此天生具备良好的水平扩展能力。

2)灵活的数据模型

关系数据库具有规范的定义,遵守各种严格的约束条件。这种做法虽然保证了业务系统对数据一致性的需求,但是过于死板的数据模型,也意味着无法满足各种新兴的业务需求。相反,NoSQL数据库采用键/值、列族等非关系模型,允许在一个数据元素里存储不同类型的数据。

3)与云计算紧密融合

云计算具有很好的水平扩展能力,可以根据资源使用情况进行自由伸缩,各种资源可以动态加人或退出,NoSQL数据库可以凭借自身良好的横向扩展能力,充分自由利用云计算基础设施,很好地融人到云计算环境中,构建基于NoSQL的云数据库服务。

(4)大数据量,高性能

nosql数据库都有着非常高的读写性能,特别是在大数据量之下,一样也表现的非常的优秀,这主要得益于它的无关系性,数据库的结构简单。

通常的nosql使用Query Cache。

nosql的Cache是记录级的,是一种细粒度的Cache,所以说,nosql从这个方面来说的话,性能就要高了很多了。

(5)高可用

高可用也是nosql很明显的一个特点,nosql在不太影响性能的情况之下,就能够非常方便的实现高可用的架构,典型的例如:Cassandra、HBase模型,通过模型的话也可以实现高可用。

NoSQL兴起的原因

1、关系数据库已经无法满足Web2.0的需求。主要表现在以下几个方面:

  • 1)无法满足海量数据的管理需求

  • 对于上述网站而言,很快就可以产生超过10亿条的记录,对于关系数据库来说,在一张10亿条记录的表里进行SQL查询,效率极其低下。

  • 2)无法满足数据高并发的需求

  • 3)无法满足高可扩展性和高可用性的需求

2、关系数据库的关键特性在Web 2.0时代成为“鸡肋”

关系数据库的关键特性包括完善的事务机制和高效的查询机制。但是,关系数据库引以为傲的两个关键特性,到了Web2.0时代却成了鸡肋,主要表现在以下几个方面:

(1) Web 2.0网站系统通常不要求严格的数据库事务

对于许多Web 2.0网站而言,数据库事务已经不是那么重要。数据库事务通常有一套复杂的实现机制来保证数据库一致性,需要大量系统开销,对于包含大量频繁实时读写请求的Web 2.0网站而言,实现事务的代价是难以承受的。

(2)Web 2.0并不要求严格的读写实时性

对于关系数据库而言,一旦有一条数据记录成功插人数据库中,就可以立即被查询。

对于Web 2.0而言,没有这种实时读写需求。

(3)Web 2.0通常不包含大量复杂的SQL查询

复杂的SQL查询通常包含多表连接操作。但是,Web 2.0网站在设计时就已经尽量减少甚至避免这类操作,通常只采用单表的主键查询,因此关系数据库的查询优化机制在Web 2.0中也就难以有所作为。

NoSQL与关系数据库的比较

RDBMS:关系数据库

1.png

2.png

3.png

NoSQL与关系数据库比较 小结:

1)关系数据库

优势:以完善的关系代数理论作为基础,有严格的标准,支持事务ACID四性,借助索引机制可以实现高效的查询,技术成熟,有专业公司的技术支持

劣势:可扩展性较差,无法较好支持海量数据存储,数据模型过于死板、无法较好支持Web2.0应用,事务机制影响了系统的整体性能等

2NoSQL数据库

优势:可以支持超大规模数据存储,灵活的数据模型可以很好地支持Web2.0应用,具有强大的横向扩展能力等

劣势:缺乏数学理论基础,复杂查询性能不高,大都不能实现事务强一致性,很难实现数据完整性,技术尚不成熟,缺乏专业团队的技术支持,维护较困难等

(3)关系数据库和NoSQL数据库各有优缺点,彼此无法取代

关系数据库应用场景:电信、银行等领域的关键业务系统,需要保证强事务一致性

NoSQL数据库应用场景:互联网企业、传统企业的非关键业务(比如数据分析)

采用混合架构

  • 案例:亚马逊公司就使用不同类型的数据库来支撑它的电子商务应用
  • 对于“购物篮”这种临时性数据,采用键值存储会更加高效
  • 当前的产品和订单信息则适合存放在关系数据库中

NoSQL的四大类型

NoSQL数据库虽然数量众多,但是,归结起来,典型的NoSQL数据库通常包括键值数据库列族数据库文档数据库图形数据库

1.键值数据库

键值数据库(Key-Value Database) 的表中有一个特定的Key和一个指针指向特定的Value。Key可以用来定位Value,即存储和检索具体的Value。Value对数据库而言是透明不可见的,不能对Value进行索引和查询,只能通过Key进行查询。Value可以用来存储任意类型的数据,包括整型、字符型、数组、对象等。

应用场景:一个面向会话的应用程序(如 Web 应用程序)在用户登录时启动会话,并保持活动状态直到用户注销或会话超时。在此期间,应用程序将所有与会话相关的数据存储在主内存或数据库中。会话数据可能包括用户资料信息、消息、个性化数据和主题、建议、有针对性的促销和折扣。每个用户会话具有唯一的标识符。除了主键之外,任何其他键都无法查询会话数据,因此快速键值存储更适合于会话数据。一般来说,键值数据库所提供的每页开销可能比关系数据库要小。

4.png

2.列族数据库

5.png

3.文档数据库

6.png

4.图形数据库

7.png

5.不同类型数据库比较分析

8.png

  • MySQL:产生年代较早,而且随着LAMP大潮得以成熟。尽管其没有什么大的改进,但是新兴的互联网使用的最多的数据库
  • MongoDB:是个新生事物,提供更灵活的数据模型、异步提交、地理位置索引等五花十色的功能
  • HBase:是个“仗势欺人”的大象兵。依仗着Hadoop的生态环境,可以有很好的扩展性。但是就像象兵一样,使用者需要养一头大象(Hadoop),才能驱使他
  • Redis:是键值存储的代表,功能最简单。提供随机数据存储。就像一根棒子一样,没有多余的构造。但是也正是因此,它的伸缩性特别好。就像悟空手里的金箍棒,大可捅破天,小能成缩成针

NoSQL的三大基石

所谓的CAP指的是:

  • CConsistency):一致性,是指任何一个读操作总是能够读到之前完成的写操作的结果,也就是在分布式环境中,多点的数据是一致的,或者说,所有节点在同一时间具有相同的数据
  • A:Availability):可用性,是指快速获取数据,可以在确定的时间内返回操作结果,保证每个请求不管成功或者失败都有响应;
  • PTolerance of Network Partition):分区容忍性,是指当出现网络分区的情况时(即系统中的一部分节点无法和其他节点进行通信),分离的系统也能够正常运行,也就是说,系统中任意信息的丢失或失败不会影响系统的继续运作。

CAP理论告诉我们,一个分布式系统不可能同时满足一致性、可用性和分区容忍性这三个需求,最多只能同时满足其中两个,正所谓“鱼和熊掌不可兼得”。

9.png

当处理CAP的问题时,可以有几个明显的选择:

  • CA:也就是强调一致性(C)和可用性(A),放弃分区容忍性(P),最简单的做法是把所有与事务相关的内容都放到同一台机器上。很显然,这种做法会严重影响系统的可扩展性。传统的关系数据库(MySQL、SQL Server和PostgreSQL),都采用了这种设计原则,因此,扩展性都比较差

  • CP:也就是强调一致性(C)和分区容忍性(P),放弃可用性(A),当出现网络分区的情况时,受影响的服务需要等待数据一致,因此在等待期间就无法对外提供服务

  • AP:也就是强调可用性(A)和分区容忍性(P),放弃一致性(C),允许系统返回不一致的数据

BASE

前面说到ACID ,现在浅谈一下BASE(Basically Availble, Soft-state, Eventual consistency)

ACID

BASE

原子性(Atomicity)

基本可用(Basically Available)

一致性(Consistency)

软状态/柔性事务(Soft state)

隔离性(Isolation)

最终一致性 (Eventual consistency)

持久性 (Durable)


BASE的基本含义是基本可用(Basically Availble)、软状态(Soft-state)和最终一致性(Eventual consistency):

基本可用

基本可用,是指一个分布式系统的一部分发生问题变得不可用时,其他部分仍然可以正常使用,也就是允许分区失败的情形出现

软状态

“软状态(soft-state)”是与“硬状态(hard-state)”相对应的一种提法。数据库保存的数据是“硬状态”时,可以保证数据一致性,即保证数据一直是正确的。“软状态”是指状态可以有一段时间不同步,具有一定的滞后性

最终一致性

一致性的类型包括强一致性和弱一致性,二者的主要区别在于高并发的数据访问操作下,后续操作是否能够获取最新的数据。对于强一致性而言,当执行完一次更新操作后,后续的其他读操作就可以保证读到更新后的最新数据;反之,如果不能保证后续访问读到的都是更新后的最新数据,那么就是弱一致性。而最终一致性只不过是弱一致性的一种特例,允许后续的访问操作可以暂时读不到更新后的数据,但是经过一段时间之后,必须最终读到更新后的数据。

更多编程相关知识,请访问:编程教学!!

【本文由:武汉网页开发公司 http://www.1234xp.com/wuhan.html 复制请保留原URL】