笔记:分布式相关的各种概念性问题_active standby和master slave-程序员宅基地

技术标签: 笔记  分布式  

1、节点(node):

一个实体服务器(计算机)的抽象名称。

2、网络分区(network partitions ):

用网络连接的两个节点不再连通(如:断网)时,节点被分成了多个独立区域。

3、分布式(distributed)XXX:

相较于普通的XXX分散在同一个节点而言,分布式XXX分指XXX散在不同的节点上,节点间通常用网络连接在一起实现原有的XXX功能。

4、分布式CAP定理:

在发生分区的分布式系统中,分散的两个节点间进行读写时,仅能保证CAP中的两个,其中之一必须牺牲。

一致性(Consistency):对某个指定的客户端来说,读操作保证能够返回最新的写操作结果。
可用性(Availability):非故障节点将在合理的时间内返回合理的响应(不是错误或超时)。
分区容错性(Partition tolerance):当网络分区发生时,系统将继续正常运作。

定理理解如下:

  1. 若要满足分区容错性,则必然需要副本节点(避免单点故障)。
  2. 在原节点和副本节点刚发生分区时,系统并未感知分区(故障节点)的存在:
  3. 若选择一致性,则原节点的写会被同步更新到副本节点,但由于分区存在,会使同步被卡住,写也就被卡住,后续新到的读写操作都会被卡住,系统丧失可用性。
  4. 若选择可用性,由于写操作因数据同步被卡住而卡住,后续新到的读会返回未被更新的值,使得系统一致性不满足。
    综上:满足分区容错性时,一致性和可用性只能二选一。

5、分布式一致性(Distributed Consistency)分类:

强一致性(Strong Consistency):指CAP定理中的一致性。关系型数据库通常采用强一致性。
弱一致性(Weak consistency):与强一致性相反,允许读到错误的数据,即:写入的数据可能丢失。
最终一致性(Eventual Consistency):写入数据后,允许中间读到的数据不一致,但经过一定时间后,读到的数据都会变成之前写入的,通常为异步备份。如:因果一致性、读己之所写、会话一致性、单调读一致性和单调写一致性。

6、分布式BASE理论:

虽然CAP定理已经指出CAP三者不可兼得,但BASE理论是在保证P的情况下,可适当降低A来改善C。

基本可用(Basically Available):基本可用指的是系统仍然可以正常使用,只是效率变低了或是核心功能仍然可用。
软状态(Soft state):原节点和副本节点之间的数据同步允许存在一定时延。
最终一致性(Eventual consistency):如上所述。

7、事务(transaction):

指一个完整的执行单元(unit),可以由一个或多个操作组成,具有ACID属性。

原子性(atomicity):一个事务中的操作要么都做,要么都不做。
一致性(consistency):事务执行成功时,数据正常更新,事务执行失败时,回滚到事务执行前的状态。
隔离性(isolation):事务间的执行不会相互干扰,即一个事务内部的操作及使用的数据对并发的其他事务是不可见的。
持久性(durability):持久性也称永久性(permanence),指一个事务一旦提交,数据将永久性的改变。

8、事务并发(transaction concurrency):

多个事务并发执行时,不同事务隔离级别下,可能出现如下问题:

脏读(Dirty Read):读到了因事务回滚而失效的值。
不可重读(Nonrepeatable Read):读取某一个指定行时,多次重复读取到的值不同。
幻读(Phantom Read):按照相同条件筛选行时,得到的行数发生改变。

9、事务隔离级别(transaction isolation levels):

适当牺牲事务的隔离性,以提高事务并发效率。

读未提交的(Read uncommitted):一个事务未提交时,其修改的值可以被另一个事务读取到。相当于什么都没做,脏读、不可重读、幻读问题都存在。
读已提交的(Read committed):一个事务只有提交后,其修改的值才能被其他事务读取到。读到的值不存在事务回滚,解决了脏读问题,但存在多个事务提交,导致不可重读和幻读存在。
可重复读取(Repeatable read):一个事务内多次读取同一个数据,其值不会因其他事务的修改和提交而发生改变。解决了脏读、不可重读问题,但其他事务提交仍然可以导致幻读问题。
可串行化(Serializable):事务在逻辑上的串行执行,可通过合理的并行调度来实现。属于最高的事务隔离级别,脏读、不可重读和幻读都已解决。

10、分布式计算(Distributed Computing):

计算可分为串行计算并行计算,而分布式计算仅对可以并行计算的任务才是有意义的,故:分布式计算也是一种特殊的并行计算。通过将计算拆分为多个可以并行的计算,将其分配到不同计算机上实现并行执行。
相关的概念还有:网格计算云计算

11、分布式存储(Distributed Storage):

把数据分散到不同节点上存储。

12、分布式框架Hadoop:

可应用于大数据存储和计算的分布式框架,Hadoop框架最核心的设计就是:分布式文件系统HDFS(Hadoop Distributed File System)和并行运算编程模型MapReduce。

13、集群(cluster):

  1. 解决单点数据量过大(内存不够)的问题。
  2. 通过某种规则,将一个整体的数据源分散到多个提供相同服务类型的节点上进行处理,每个节点只处理按照规则分配到的数据。
  3. 节点故障或恢复后,重新按照规则为数据分配节点。
  4. 客户端可向任意节点发起请求,然后由服务端重定向到该数据的真实所在节点。
  5. 为了保证节点故障后,数据被切换到其他节点后的一致性,不同节点通常会共享一个持久化的数据中心。

单仲裁设备集群(Single quorum device cluster ):只要有一个节点能够提供服务,集群就可以继续提供服务,是否可用仲裁由共享的数据中心决定。
多数节点集仲裁集群(Majority Node Set Quorum):指每个节点都参与仲裁,故障发生后,只有具有大多数(总数的一半+1)节点的部分可以继续运行,其余节点的必须下线,若不存在大多数节点,则集群停止服务。

14、主从(master-slave):

解决单点故障问题。
主可被读写,从仅可读,主从均在线。主从之间存在数据交换,且从的更新源于主,主从都拥有全量数据。主一旦出问题,从之间会重新选出一个主。主和从都可为多个,但由于多主的配置麻烦,通常采用一主多从的模式。

15、主备(active-standby):

主提供服务,被不提供服务,主异常后由被接管提供服务。

16、热备(hot-standby):

与主备类似。

17、主从复制(master-slave replication):

将主节点的数据同步复制到从节点。

18、读写分离(read-write separation):

读写分别在不同的网络节点上执行。目的是提高数据的访问性能。
读写节点之间的数据同步方式有:

异步:写请求的返回和数据同步并行的。
全同步:写请求同步到所有读节点后才返回写请求。
半同步:写请求同步到部分读节点后就可以返回写请求。

19、缓存(cache):

本意指存储临时数据的存储器,通常也指被临时存储而不需要持久化的数据,使用缓存的目的是提高系统性能。

20、分布式一致性(Distributed Consistency):

原节点和副本节点的数据完全相同。

21、分布式事务(Distributed transaction):

需要在多个节点间提交和回滚的事务。

两阶段提交(two-phase commit, 2PC):分为准备和提交两个阶段,需要引入一个协调者,阶段1时,协调者向所有节点发送准备请求,通常各节点会有日志记录,阶段2时,协调者向所有节点发起提交或是回滚请求。
三阶段提交(three-phase commit, 3PC):分为准备、预提交和提交三个阶段,引入了超时机制,如果节点等待预提交超时,则中断事务,如果节点等待提交超时,则提交事务。

22、分布式共识算法(Distributed consensus algorithm):

多个节点就某一件事达成共识,其中最为有效的是Paxos算法,用于领导(Leader)节点节点故障后,重新选举出新的领导节点。Raft算法Paxos算法的一种简化实现。

23、分布式一致性算法(Distributed Consistency Algorithm):

使不同网络节点之间的数据达到一致。
Gossip算法通过节点间的随机通信,类似疫情传播,能够使网络节点间的数据达到最终一致,具有去中心化、容错和指数级收敛速度的特点。

24、分布式协调功能(distributed coordination function):

跨网络节点间互斥的访问同一个资源,即:跨节点的进程或线程间同步。

25、分布式锁(Distributed Lock):

分布式协调功能的一种实现。分布式锁必须高可用,否则就失去了“锁”的意义。锁要高可用就必须在其他节点存储副本,避免单点故障。要在其他节点存储副本就必须考虑多节点的分布式一致性问题。所以高可用的分布式锁实现比较难。

基于数据库实现分布式锁;
基于缓存(Redis等)实现分布式锁;
基于Zookeeper实现分布式锁;

26、高可用集群(High Availability Cluster,简称HA Cluster):

通过集群来实现系统的高可用。

27、多实例(multiple instances):

同一个程序在一台机器上开多个。

28、单点故障(Single Point of Failure,缩写SPOF):

单个节点故障导致整个系统故障。

29、负载均衡(Load balancing):

根据某种策略将流量发送到指定节点。节点资源作为热点数据,本身不一定大,处理也不耗时,但访问访问流量很高,导致单点的耗时都在网络排队上。解决单点网络流量过高的问题。

30、高可用(High Availability):

系统在指定时间段内连续运行而不会出现故障的能力,通常用5个9来衡量,即:系统在99.999%的时间都是可用的。需要增加冗余(备份)节点解决单点故障问题,进而提高可用性。

31、持久化(Persistence):

一般指数据的持久化,将数据永久保存,如:将数据从内存保存到磁盘。

相关资料:

What are Redis master-slave and Redis clusters and the difference between them?
WHAT IS SERVER CLUSTERING AND HOW DOES IT WORK?
Model 2: Single quorum device server cluster configuration
What Is a Majority Node Set? (Server Clusters: Majority Node Set Quorum)
Motivation (Server Clusters: Majority Node Set Quorum)
Load Balancing vs Server Clustering: Understand the Difference
high availability (HA)
Basically Available, Soft State, Eventual Consistency (BASE)
CAP Theorem for Databases: Consistency, Availability & Partition Tolerance
CAP Theorem: Availability vs consistency
CAP Theorem
Ali three sides: do you understand cap and base theory? It can be said in combination with actual cases
Transaction Isolation Levels (ODBC)

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_46691179/article/details/123279272

智能推荐

分布式光纤传感器的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告_预计2026年中国分布式传感器市场规模有多大-程序员宅基地

文章浏览阅读3.2k次。本文研究全球与中国市场分布式光纤传感器的发展现状及未来发展趋势,分别从生产和消费的角度分析分布式光纤传感器的主要生产地区、主要消费地区以及主要的生产商。重点分析全球与中国市场的主要厂商产品特点、产品规格、不同规格产品的价格、产量、产值及全球和中国市场主要生产商的市场份额。主要生产商包括:FISO TechnologiesBrugg KabelSensor HighwayOmnisensAFL GlobalQinetiQ GroupLockheed MartinOSENSA Innovati_预计2026年中国分布式传感器市场规模有多大

07_08 常用组合逻辑电路结构——为IC设计的延时估计铺垫_基4布斯算法代码-程序员宅基地

文章浏览阅读1.1k次,点赞2次,收藏12次。常用组合逻辑电路结构——为IC设计的延时估计铺垫学习目的:估计模块间的delay,确保写的代码的timing 综合能给到多少HZ,以满足需求!_基4布斯算法代码

OpenAI Manager助手(基于SpringBoot和Vue)_chatgpt网页版-程序员宅基地

文章浏览阅读3.3k次,点赞3次,收藏5次。OpenAI Manager助手(基于SpringBoot和Vue)_chatgpt网页版

关于美国计算机奥赛USACO,你想知道的都在这_usaco可以多次提交吗-程序员宅基地

文章浏览阅读2.2k次。USACO自1992年举办,到目前为止已经举办了27届,目的是为了帮助美国信息学国家队选拔IOI的队员,目前逐渐发展为全球热门的线上赛事,成为美国大学申请条件下,含金量相当高的官方竞赛。USACO的比赛成绩可以助力计算机专业留学,越来越多的学生进入了康奈尔,麻省理工,普林斯顿,哈佛和耶鲁等大学,这些同学的共同点是他们都参加了美国计算机科学竞赛(USACO),并且取得过非常好的成绩。适合参赛人群USACO适合国内在读学生有意向申请美国大学的或者想锻炼自己编程能力的同学,高三学生也可以参加12月的第_usaco可以多次提交吗

MySQL存储过程和自定义函数_mysql自定义函数和存储过程-程序员宅基地

文章浏览阅读394次。1.1 存储程序1.2 创建存储过程1.3 创建自定义函数1.3.1 示例1.4 自定义函数和存储过程的区别1.5 变量的使用1.6 定义条件和处理程序1.6.1 定义条件1.6.1.1 示例1.6.2 定义处理程序1.6.2.1 示例1.7 光标的使用1.7.1 声明光标1.7.2 打开光标1.7.3 使用光标1.7.4 关闭光标1.8 流程控制的使用1.8.1 IF语句1.8.2 CASE语句1.8.3 LOOP语句1.8.4 LEAVE语句1.8.5 ITERATE语句1.8.6 REPEAT语句。_mysql自定义函数和存储过程

半导体基础知识与PN结_本征半导体电流为0-程序员宅基地

文章浏览阅读188次。半导体二极管——集成电路最小组成单元。_本征半导体电流为0

随便推点

【Unity3d Shader】水面和岩浆效果_unity 岩浆shader-程序员宅基地

文章浏览阅读2.8k次,点赞3次,收藏18次。游戏水面特效实现方式太多。咱们这边介绍的是一最简单的UV动画(无顶点位移),整个mesh由4个顶点构成。实现了水面效果(左图),不动代码稍微修改下参数和贴图可以实现岩浆效果(右图)。有要思路是1,uv按时间去做正弦波移动2,在1的基础上加个凹凸图混合uv3,在1、2的基础上加个水流方向4,加上对雾效的支持,如没必要请自行删除雾效代码(把包含fog的几行代码删除)S..._unity 岩浆shader

广义线性模型——Logistic回归模型(1)_广义线性回归模型-程序员宅基地

文章浏览阅读5k次。广义线性模型是线性模型的扩展,它通过连接函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。广义线性模型拟合的形式为:其中g(μY)是条件均值的函数(称为连接函数)。另外,你可放松Y为正态分布的假设,改为Y 服从指数分布族中的一种分布即可。设定好连接函数和概率分布后,便可以通过最大似然估计的多次迭代推导出各参数值。在大部分情况下,线性模型就可以通过一系列连续型或类别型预测变量来预测正态分布的响应变量的工作。但是,有时候我们要进行非正态因变量的分析,例如:(1)类别型.._广义线性回归模型

HTML+CSS大作业 环境网页设计与实现(垃圾分类) web前端开发技术 web课程设计 网页规划与设计_垃圾分类网页设计目标怎么写-程序员宅基地

文章浏览阅读69次。环境保护、 保护地球、 校园环保、垃圾分类、绿色家园、等网站的设计与制作。 总结了一些学生网页制作的经验:一般的网页需要融入以下知识点:div+css布局、浮动、定位、高级css、表格、表单及验证、js轮播图、音频 视频 Flash的应用、ul li、下拉导航栏、鼠标划过效果等知识点,网页的风格主题也很全面:如爱好、风景、校园、美食、动漫、游戏、咖啡、音乐、家乡、电影、名人、商城以及个人主页等主题,学生、新手可参考下方页面的布局和设计和HTML源码(有用点赞△) 一套A+的网_垃圾分类网页设计目标怎么写

C# .Net 发布后,把dll全部放在一个文件夹中,让软件目录更整洁_.net dll 全局目录-程序员宅基地

文章浏览阅读614次,点赞7次,收藏11次。之前找到一个修改 exe 中 DLL地址 的方法, 不太好使,虽然能正确启动, 但无法改变 exe 的工作目录,这就影响了.Net 中很多获取 exe 执行目录来拼接的地址 ( 相对路径 ),比如 wwwroot 和 代码中相对目录还有一些复制到目录的普通文件 等等,它们的地址都会指向原来 exe 的目录, 而不是自定义的 “lib” 目录,根本原因就是没有修改 exe 的工作目录这次来搞一个启动程序,把 .net 的所有东西都放在一个文件夹,在文件夹同级的目录制作一个 exe._.net dll 全局目录

BRIEF特征点描述算法_breif description calculation 特征点-程序员宅基地

文章浏览阅读1.5k次。本文为转载,原博客地址:http://blog.csdn.net/hujingshuang/article/details/46910259简介 BRIEF是2010年的一篇名为《BRIEF:Binary Robust Independent Elementary Features》的文章中提出,BRIEF是对已检测到的特征点进行描述,它是一种二进制编码的描述子,摈弃了利用区域灰度..._breif description calculation 特征点

房屋租赁管理系统的设计和实现,SpringBoot计算机毕业设计论文_基于spring boot的房屋租赁系统论文-程序员宅基地

文章浏览阅读4.1k次,点赞21次,收藏79次。本文是《基于SpringBoot的房屋租赁管理系统》的配套原创说明文档,可以给应届毕业生提供格式撰写参考,也可以给开发类似系统的朋友们提供功能业务设计思路。_基于spring boot的房屋租赁系统论文