6.5 C
New York

Une introduction à la reprise après sinistre avec la plate-forme de données Cloudera


La décennie précédente a vu une croissance explosive de l’intégration des données et des informations basées sur les données dans la capacité d’une entreprise à fonctionner efficacement, offrant un avantage concurrentiel toujours croissant à ceux qui le font bien. Nos purchasers se sont habitués à la rapidité de la prise de décision qui découle de cette data. Les données font partie intégrante de la stratégie à lengthy terme et des opérations quotidiennes, voire minute par minute.

Chaque jour, nous voyons le Plate-forme de données Cloudera (CDP) devenant cette plate-forme d’analyse critique pour l’entreprise que les purchasers doivent faire fonctionner de manière disponible, fiable et résiliente. Les plateformes de données ne sont plus des projets skunkworks ou des expériences scientifiques. Les purchasers s’attendent désormais à un comportement d’entreprise dans leurs piles d’purposes, quoi que fassent ces purposes. Au fur et à mesure que les purchasers importent leurs expenses de travail de mainframe et d’ancien entrepôt de données, la plate-forme s’attend à ce qu’elle puisse atteindre, voire dépasser, la résilience du système précédent et de ses dépendances associées.

De nombreux purchasers ont migré vers la gamme de produits CDP depuis notre model d’origine, que ce soit dans CDP Non-public Cloud, CDP Public Cloud ou une combinaison hybride des deux. Nous voyons maintenant des purchasers tirer parti de ses nouvelles fonctionnalités et de la valeur qu’elle apporte à leur transformation d’entreprise, et demander « Quelle est la prochaine étape de mon parcours CDP ? »

Pourquoi une reprise après sinistre ?

La reprise après sinistre et la planification de la continuité des activités sont principalement axées sur la gestion et la réduction des risques. Les purchasers, en particulier ceux des secteurs réglementés avec des exigences strictes en matière de safety des données et de conformité, posent régulièrement une query easy à nos specialists en stratégie approach : que dois-je faire si une disaster frappe mon entreprise et menace de détruire ma plate-forme de données ? La réponse easy : le parcours consumer évolue au-delà des clusters de données uniques, des clouds uniques et des infrastructures simples vers des architectures robustes et tolérantes aux pannes qui peuvent survivre à un événement de panne et maintenir le fonctionnement du consumer. L’objectif est de minimiser l’affect sur la prise de décision basée sur les données d’un consumer en cas de crise opérationnelle. Pour ce faire, nous devons élaborer des normes pour la mise en œuvre du CDP qui tiennent compte des échecs, les atténuent et sont validées par l’adoption par le marché.

Nous dérivons ces conceptions d’implémentations réelles avec certains de nos purchasers les plus avancés, généralisons ces apprentissages dans des modèles reproductibles afin qu’ils soient applicables à la taille du consumer et à l’industrie, et évangélisons ces modèles pour améliorer la sensibilisation et la prise en cost.

L’structure de référence CDP pour la reprise après sinistre

Aujourd’hui, nous annonçons la sortie officielle de l’structure de référence de reprise après sinistre CDP (DRRA). Le DRRA se concentre sur la description de la manière de penser à la fiabilité, à la résilience et à la récupération pour la plate-forme de données Cloudera, et est un doc vivant décrivant notre apprentissage collecté sur la plate-forme et entre les purchasers.

Cette model initiale se concentre sur les définitions courantes de l’industrie telles qu’elles s’appliquent à la gamme de produits, les normes de l’industrie auxquelles nous pensons que les purchasers devraient s’aligner lorsqu’ils envisagent la reprise après sinistre et la planification de la continuité des activités pour les plates-formes de données, et un ensemble preliminary de directives et de scénarios de disaster auxquels réfléchir. lors de la mise en œuvre d’une plate-forme de données robuste. De plus, nous discutons de l’état actuel de préparation à la reprise après sinistre pour divers composants et des stratégies de résilience spécifiques pour chacun.

Le Structure de référence CDP pour la reprise après sinistre est disponible dans notre documentation publique dans le Architectures de référence CDP microsite.

L’significance de la terminologie et des normes

En travaillant sur des conceptions et des stratégies de reprise après sinistre avec des purchasers de tous les secteurs verticaux et de toutes les tailles d’organisation, nous avons découvert que chacun utilise la terminologie de différentes manières. Il est devenu difficile de transmettre des idées de manière cohérente et répétée. Cela était particulièrement essential avec la reprise après sinistre en raison de la nuance et de l’affect d’une description incorrecte. Au mieux, cela a conduit à la confusion. Au pire, cela aurait pu donner aux purchasers un fake sentiment de sécurité quant à leur préparation aux catastrophes.

Au sein de Cloudera, nous avons commencé à nous aligner sur deux normes industrielles couvrant les opérations de continuité des activités. La première, ISO 27031:2011, aide à décrire le processus et les procédures impliqués dans la réponse aux incidents. Cela inclut le cycle de vie Planifier, Faire, Vérifier et Agir qui aide à construire un processus de réponse aux incidents. La seconde, NIST 800-34, fournit des directives générales pour la planification d’urgence pour les organisations fédérales américaines. Bien qu’ils ne soient pas de nature hautement approach, ils fournissent le cadre structurel et de processus nécessaire pour une planification de la continuité réussie.

Il est essentiel de comprendre la différence entre des termes tels que Restoration Level Goal (RPO) et Restoration Time Goal (RTO), ou l’affect fonctionnel de la récupération ponctuelle (Niveau 4) et de l’intégrité des transactions de validation sur deux websites (Niveau 5) dans le modèle à sept niveaux de reprise après sinistre.

Et ensuite ?

Avec notre modèle hybride, l’éclatement vers le cloud pendant les périodes d’utilisation très intensive peut également être particulièrement rentable pour la reprise après sinistre en cas de panne principale. Les systèmes de secours peuvent être conçus pour répondre aux besoins de stockage pendant des périodes typiques avec un calcul extensible pour les scénarios de basculement à l’aide de nouvelles fonctionnalités telles que Mise à l’échelle du lac de données.

Cloudera proceed d’améliorer à la fois le produit et le processus pour faciliter la mise en œuvre de la reprise après sinistre. Dans les futures mises à jour de l’structure de référence, nous décrirons des exemples de modèles de mise en œuvre axés sur des cas d’utilisation particuliers, tels que la mise en œuvre de clusters géographiquement séparés pour Base de données opérationnelle ou Entrepôt de données cas d’utilisation. Par exemple, nous intégrons des diagrammes d’structure pour des paires de clusters de reprise après sinistre actifs/passifs dispersés géographiquement comme le diagramme suivant, montrant une zone d’software commune et pour l’ingestion et l’analyse de données, et remark la réplication se déplace dans le système. Dans cet exemple, nous avons un cas d’utilisation de télémétrie de flotte qui déplace les données IoT du véhicule dans le système pour l’analyse de la upkeep de la flotte qui est continuellement examinée par le personnel d’ingénierie d’un consumer pour éviter les pannes mécaniques inattendues. La planification de la reprise après sinistre permet de garantir la poursuite des analyses de upkeep en cas d’interruption imprévue.

De plus, nous continuons à apporter des améliorations aux produits, notamment :

  • Extension des capacités de Replication Supervisor pour couvrir Apache Ozone stockage d’objets, à venir plus tard cette année, pour mieux répondre aux exigences de reprise après sinistre des purchasers autour du stockage de données à grande échelle et dense.
  • Fournir un déploiement multi-zones de disponibilité de nos companies de base et de certains companies de données critiques tels que les companies Information Lake et Information Hub dans CDP Public Cloud.
  • Automatisation de la réparation, de la récupération, de la mise à l’échelle et du rééquilibrage des companies de données de base tels que notre base de données opérationnelle.

Conclusion

Au fur et à mesure que les entreprises développent leur expérience et leur dépendance critique vis-à-vis des données, plus ces données deviennent un élément essentiel du succès continu d’une entreprise. Au cours de la dernière décennie, nous avons appris que les données et les plates-formes qui fournissent des informations assistées par les données doivent être disponibles, fiables et robustes. Comprendre et planifier la reprise après sinistre est la prochaine étape du processus vers une structure de données moderne.

Si vous souhaitez en savoir plus, lisez le Structure de référence CDP pour la reprise après sinistre et contactez nos équipes de comptes et de companies professionnels, qui sont disponibles pour vous aider. nous avons hâte de entrain de te parler et vous aider à tirer le meilleur parti de vos données.

Ressources additionnelles

Related Articles

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Latest Articles