账号:
密码:
最新动态
产业快讯
CTIMES / 文章 /
复制 (Replication) - 适时取得正确的资料
电子商务储存管理方案白皮书

【作者: Veritus】2001年04月01日 星期日

浏览人次:【1988】

为何要复制?

在典型的电子商务中,资料无需太久的时间就会成长到需要多重的处理地点。为因应客户、供应商与员工的回应要求,电子商务的系统通常会决定将资料放置在最接近使用者的位置,以发挥最大的效率。若要从多重地点取得资料,就必须将资料复制或放置到那些地点。例如价目表、产品规格、网页等等通常全都会被复制到电子商务的各营运地点。很明显地这类资料在所有地点都必须一致,资料变更时也必须同步。


资料通常也会复制以供资料查阅使用。随着电子商务益趋成熟,会出现堆积如山的营运历史资料。各企业的历史资料可以储存在资料仓储中以供查阅,或供各种计划用途的趋势分析使用。虽然这些资料非常有用,但由于资料查阅非常依赖I/O,故若无重大的营运改变,电子商务的线上资料通常不作查阅用途。同时,为避免资料查阅影响系统运作效能,资料大多被复制到独立的伺服器(资料仓储),供应电子商务营运必要的查阅使用。


复制资料的第三个理由,或许是最重要的理由,就是为了灾难复原(disaster recovery)。随着电子商务的成长,资料中心停摆对社会经济的影响将非常重大。审慎的商业运作乃是企业的生存之道,因此,电子商务必须能够迅速从火灾、洪水、恶意破坏、供电故障、软体故障或其他的突发事件中迅速恢复运作。


复制的本质

无论是以布告、查阅或灾难复原为目的,资料复制的本质都是相同的。营运资料的最新副本会一直维持在线上,位于主要资料中心以外的独立地点,而且必须与用来营运企业的主要资料库同步。


复制可以保持多份与应用软体线上使用的电子商务资料相同之副本。复制技术特点如下:


  • ●从主要的档案系统复制到不同电脑的多个档案系统。


  • ●从主要的磁区群组复制到不同电脑的多个磁区群组。



无论是档案或磁区群组的复制软体都被设计成即使网路或系统故障时,仍可保持复制资料的完整性,同时提供营运实务上所需的适当效能。


应用软体在主要伺服器上执行,更新档案系统和储存在磁区群组中的资料库表格中的资料(有或无档案系统) 的同时,档案系统和磁区群组的副本会储存在第二个伺服器中。可以看出复制的三个要点:


* 无论档案系统或磁区群组(包括多个档案系统)都必须能够复制。档案系统的复制功能对众多档案之许多管理工作非常有用,这些档案是复杂的电子商务应用软体中不可分割的一环。磁区群组复制比较适合使用于储存少量的大型档案与分散在多重磁区的多个档案系统的资料库。


* 复制是一对多的作业。源头是单一的,而目标则是各复制档案系统或磁区群组。复制的源头为应用软体提供资料读写存取能力,而档案系统副本则可被指定供应用软体使用。实际上,进行复制作业时,磁区群组副本是无法供应用软体使用的。


* 复制所运用的是传统硬体零组件与网路连线。复制资料无需特定硬体,也不需要指定复制专用的通讯连结(虽然VERITAS建议使用专线,以获得最佳效能与应用软体反应速度)。此外,虽然复制磁区应有相同的容量,但主要与次要的资料副本无需储存在同一磁碟上。


复制是资料存取与管理堆叠的一个层级,而由于复制物件是档案系统或磁区,因此所有的储存管理基础功能如Quick I/O for Databases,包含可用性强化,如镜射与效能强化,都可以用来连结资料副本。


复制必需具有策略基础。系统管理者可以制定适当的复制政策,以满足企业需求。复制政策包含:


  • ●资料源头的哪个档案系统或磁区组群需要复制。


  • ●次要位置的哪个档案系统或磁区是复制目标。


  • ●必须与资料源头维持何种程度的同步性。


  • ●如何处理暂时性的故障,例如:网路停摆。



一旦制定政策后,就可以自动执行复制作业,除非发生灾害等意外事故,完全无​​需系统管理者介入。


无论档案系统或磁区群组的复制都可以达成相同的基本目标,就是维持多部电脑的资料一致,差异只是在于产生副本的本质。这些差异将影响各种类型的应用软体使用副本的方式。


档案系统复制

档案系统复制是同步的作业。这表示应用软体在资料源头的写入作业必须到所有目标位置都写入完成为止,才会结束。同步复制的机制将在后续章节讨论,然而此种复制会使应用软体写入至复制档案系统时,花费较写入本地档案系统更多的时间。因此,档案系统复制通常不适合较高更新率的应用软体来使用。


由于档案系统将最新资料复制保存在次要位置,资料源头与次要位置的副本绝对是相同的,因此无需保有更新记录,即可从通讯故障或次要位置故障时恢复。此种方式可降低复制所需之I/O资源,然而缺点是,当资料源头与次要位置之间的通讯故障时,会要求冗长的再同步程序。


网路停摆后,资料源头和次要档案复制位置必需透过各自计算档案总数来进行比对,确认所持有的副本是否彼此相同。若次要位置的档案总数不相符,则次要位置的版本会被资料源头的副本所取代。


与记录重播的方式相比较,这种恢复技术比较费时。由于档案系统的复制作业,必需牺牲恢复时间来降低对正常作业所造成之效率影响。档案系统复制因此比较适合通讯或网路具备有较高可用性的环境,以免网路时常停摆造成再次的同步作业。


档案系统复制的另一项优点就是其复制可以是双向的。在次要位置的应用软体也可以存取位于复制档案系统的档案。在某些情况下,应用软体于次要位置档案中所作的修改可以复制回资料源头,当然这就不是​​磁区组群复制的讨论范围了,因为磁区组群复制是无法双向作业的。


磁区组群复制

在磁区群组复制时,写入资料源头的区块会复制到多个次要位置的磁区。由于磁区复制仅需极少的相关作业,因此可以是非同步复制。非同步复制的机制将在下一章节讨论。然而对应用软体而言,磁区群组复制的主要优点在于改善应用软体效能以及从网路停摆中迅速恢复。


在网路停摆时,主要的磁区复制位置会记录所有的需复制至复制磁区群组之所有更新。在网路恢复后,网路停摆时在资料源头该区块的更新记录会传送到次要位置。因此,磁区群组复制很适合用于资料源头与次要位置之间的网路稳定性较差时的环境。


由于磁区群组复制的特性无法使位于次要位置的应用软体在复制进行当中使用副本,因此磁区群组复制技术最适合用于以下两种情况:


资料公布:

某些企业在中心位置保管资料,然后公布至多个次要位置以供使用。如在多个电子商务据点使用的网页、价目表、产品规格与其他的文件就是这类应用的极佳范例。


灾难复原:

灾难复原中心通常设置在距离主要资料中心非常遥远的地方,以便发生灾害时仍能继续营运。 (例如,设置在距离主要位置非常遥远的另一个地震区块,以避免区域性的灾害。)主要位置的磁区群组可以复制到灾难复原中心。若主要位置发生灾害,则可以在灾难复原中心迅速重新启动应用软体,并运用最新的资料副本重新营运。


以上两者的相同特色都是在复制后使用次要位置的资料,而非在复制当中使用资料。


同步复制

若次要位置的磁区群组内容与主要位置的对应区域相同时,次要副本就可以说是最新的。若要次要位置随时保有最新资料,那么所有更新都必须同步复制到所有位置。也就是说,每个应用软体更新都必须写入到主要磁区与次要位置磁区的相对应位置,然后才会允许应用软体继续执行。


同步复制所需的连续作业可能导致无法接受的冗长应用软体反应时间。部分厂商提供的磁区复制最佳化技术,可改善应用软体反应时间,而无需牺牲资料复制的目标。这种技术使得同步写入至磁区的资料可在写入后立即执行以下功能:


  • ●于主要位置记录所有复制要求


  • ●复制到所有次要位置


  • 复制结构的时间序列,说明了平行发生的动作。与写入至本地的非复制磁区相比较,同步写入复制磁区耗时较长,原因如下:



  • ●本地的记录时间 (磁碟I/O时间);


  • ●写入完成确认信号于次要位置来回传送时间;



然而运用图二所示的复制机制,可保障资料安全,免于以下状况发生导致资料遗失:


  • ●主要位置(primary site)灾难毁损,因为有副本在各次要位置(secondary site);


  • ●次要位置或通讯连结故障,因为所有更新都记录在主要位置;



即使拥有如此的绝佳方案,若经常更新应用软体,或是需复制为数众多的次要位置,将使系统遭遇瞬间的网路过载,,都将因同步复制作业而导致应用软体效能低落。若磁区复制可支援非同步复制模式,可解决这种状况。


非同步复制

运用非同步复制技术,可让应用软体将写入要求记录在主要位置之后,立即继续执行。资料传送与写入至次要位置的磁区是非同步发生的,通常会在应用软体被通知写入已经完成之后。说明同步与非同步复制的应用软体时间差。


如图三所示,非同步复制可以减少延迟,或一连串应用软体写入要求的执行时间。然而,非同步复制的更重要影响是,避免因瞬间的网路超载拖延应用软体效率或导致写入要求失败。写入至非同步复制磁区的应用软体不会因为网路超载而慢下来或无法连接网路,因为其操作执行独立于通讯连结与次要位置之外。


只要网路与次要位置可以负荷,复制管理软体会尽快传送写入要求的主要位置记录至次要位置。若网路超载是短暂的,最后仍会清除,而次要位置仍可维持最新资料。若网路超载时间漫长,则尚未复制至次要位置之记录会增加,此时主要位置之应用软体仍能正常运行,不受影响。非同步复制可运用暂存来因应短期的网路超载,但绝非替代不稳定状态的网路频宽。


非同步复制的优点是拥有较佳的应用软体反应速度(与同步复制相比)、瞬间网路超载的容忍度,以及在次要位置故障或网路停摆后的快速恢复。而缺点是次要位置的磁区会有短暂时间无法维持最新状态。倘若在这状况下,次要电脑当机或通讯连结故障,则会在恢复后从主要位置传送资料并写入。然而,倘若主要位置遭遇无法恢复的灾害,而主要记录内容无法恢复时,次要位置的恢复作业就必须以稍微过时的资料来执行了。


为降低这种风险,系统管理者可以限制次要位置被允许处于未更新状态的最大写入次数。超过此限时,在主要位置的应用软体写入动作会暂停(不会给予完成讯号),直到未传送的资料量低于临界值为止。这个临界值的设定可以有效控制未即时更新至次要位置的资料总量。


虽然非同步复制无法达到完美的一致性,然而其超高效能仍是作业上相当需要的。无论是瞬间的更新超载,或因其他来源造成网路超载而增加应用软体反应时间,非同步复制可免除复制资料所需的大部分动作,提高应用软体的反应时间,而差异就在于复制作业是否实际了。


使用复制磁区

使用磁区复制时,无论是否拥有档案资料、档案系统资料、资料库页面或其他物件,复制管理软体不会有任何更新区块的资料。若无该资料,复制管理软体将无法使主要与次要位置同步更新。因此,磁区群组复制是无法双向进行的,仅可从主要位置复制区块到次要位置,但无法反向复制。


混合式恢复技术

若运用非同步复制技术的主要位置发生无法恢复的灾害时,次要位置磁区会稍微过时。某些在主要位置处理完成的更新 (可能是应用软体或使用者动作所造成) 可能还在传输,或记录下来以供灾害后立即传输,这种更新就不会反应到次要资料库。而混合式技术运用较高阶的系统功能 (例如:资料库记录) ,通常会被求在这种状况下执行恢复作业。


例如,资料库表格空间可能包含在复制磁区群组中磁区的内建档案系统内。磁区群组可能使用非同步复制,以提升效能。然而,资料库记录通常会存在使用同步复制方式之档案系统的档案中。也就是说,即使主要位置因灾害可能导致资料表更新在传输中遗失,但如透过redo记录复原,会使次要位置资料库副本完整无缺,并使次要位置维持最新状况。因为记录是同步复制的,即使资料库本身未同步复制,所有的资料库更新都会反应在记录上。


灾害 vs. 故障

前面已就储存装置复制在灾后复原时的重要性加以说明。拥有重要资料的远端副本,使电子商务的企业可以迅速从灾害中再站起来。在远端的最新资料是企业永续经营的重要一环,但基于考量还有员工、通讯、运输等等因素,除非遭遇致命的灾害,否则企业通常都不愿意从主要资料中心将营运重心移动到备援位置。


一般而言,最好还是以本地问题的方式来处理系统故障与储存装置故障。而拥有容错功能的RAID,是解决储存装置故障的最佳解决方案。拥有自动应用软体故障恢复功能的丛集架构 (在后续章节讨论),可让资料中心保持完整无缺而且能够运作,是解决系统当机的最佳解决方案。任何电子商务灾害恢复重点策略必须运用客观的标准,来区别可能中断复制的短期故障和需要次要资料中心暂时接手的真实灾害。


主要或次要伺服器的网路停摆以及故障都可能会中断磁区复制。主要与次要的复制记录是防止这种中断的机制,可在所需的设备再度取得时,重新同步并恢复复制。主要位置的复制记录会保留更新资料,直到传输给次要位置为止。若主要位置遭遇灾害而需要次要位置取代成为新的主要位置时,就会使用次要位置的复制记录。


交互式灾后复原

将主要与次要复制位置的角色与档案系统的复制磁区群组加以连结有助于交互式灾后复原作业。因此,以某伺服器当作主要伺服器,而另一复制磁区群组当作次要伺服器,且互为次要位置是非常可行的。 (图六)说明交互式灾害恢复的机制。


图六所示的系统拥有专属于应用软体A与B的伺服器。应用软体A的资料被复制到应用软体B的伺服器的复制磁区群组中,反之亦然。若任一位置故障时,应用软体会在另一伺服器上重新启动,且运用最新资料。


随着电子商务成长而开始采用专属的应用软体伺服器,必需谨慎地考虑交互式灾后复原技术,当作企业成长管理策略的一部份。此一技术对于电子商务成长时增加的庞大硬体投资提供下列好处是:


  • ●储存装置需要的资料副本。


  • ●渐增的伺服器处理能力和记忆体容量,可以在故障时处理复制并提供适当的效能。


  • ●充分的网路频宽以容纳复制流量与作业流量。


  • ●当灾害摧毁整个资料中心时,电子商务能够定位自己,迅速地重新恢复营运并继续从事交易。


  • (本白皮书系列由精业公司主机周边事业部提供,精业公司为VERITAS台湾区总代理)


相关文章
打开讯号继电器的正确方式
生成式AI助功率密集的计算应用进化
AI赋能智慧制造转型
生成式AI刺激应用创新 带动软硬体新商机
台湾AI关键元件的发展现况与布局
comments powered by Disqus
相关讨论
  相关新闻
» AI浪潮来袭!伺服器面临高热密度挑战 Vertiv协助矽谷主机代管商在既有机房突破散热瓶颈
» 英业达捐赠台大高效伺服器 引领学术研究高算力大未来
» 数位部办理5G专网国际论坛 机械业看好有助於短链劳动力
» 欧盟规划6G计画主席来台 与经济部签约合作跨国研发
» TrendForce:伺服器供应链重组 云端大厂扩大分散基地避险


刊登廣告 新聞信箱 读者信箱 著作權聲明 隱私權聲明 本站介紹

Copyright ©1999-2024 远播信息股份有限公司版权所有 Powered by O3  v3.20.1.HK86IC4TGRWSTACUKL
地址:台北数位产业园区(digiBlock Taipei) 103台北市大同区承德路三段287-2号A栋204室
电话 (02)2585-5526 #0 转接至总机 /  E-Mail: webmaster@ctimes.com.tw