Bit - loader

Servicios de almacenamiento en Microsoft Azure

   Artículo | Microsoft Azure Bit - Servicios de almacenamiento en Microsoft Azure
Ángel M. Rayo | 15/05/17

Continuando con la serie de Big Data en Microsoft Azure, iniciada en el artículo anterior, veremos los servicios disponibles en Microsoft Azure relacionados con almacenamiento de datos.

 

Ilustración 1 – Productos y servicios Storage en Microsoft Azure

Categorías

Dentro de los servicios de almacenamiento (Storage) podemos encontrar cuatro categorías de servicios y productos.

  • Almacenamiento general
  • Almacenamiento “Big Data”
  • Almacenamiento empresarial
  • Copia de seguridad y restauración

 

Almacenamiento general

Los servicios de almacenamiento general permiten guardar distintos tipos de elementos de manera similar a como lo hacemos en dispositivos fijos, extraíbles o en nube. Adicionalmente a este tipo de almacenamiento también permite gestionar sistemas de mensajería (Queues) y NoSQL (Tables).

Todos los servicios de almacenamiento general se crean dentro de cuentas de almacenamiento. Estas cuentas de almacenamiento ofrecen, además de las tres copias de los datos, tres modelos de replicación:

 

Ilustración 2 – Modelos de replicación

 

Según el modelo o estrategia de replicación tendremos las siguientes características:

 

 

Las regiones disponibles están actualizadas llegando hoy a 34.

 

Ilustración 3 – Regiones de Azure

 

Archivo – File Storage

Ofrece recursos compartidos de archivos en la nube utilizando el protocolo Server Message Block (SMB) 3.0 estándar. Permite compartir los archivos almacenados utilizando API REST o API Windows. Fue lanzado como versión preview en mayo de 2014. Para poder mover archivos podremos utilizar en Windows el siguiente comando:

net use z: \\<nombrecuenta>.file.core.windows.net\<nombreshare> /u:<nombrecuenta> <clavecuenta>

 

Disco – Disk Storage

Ofrece almacenamiento en discos (hdd o Premium (SSD)) con tres copias simultáneas de los datos de manera predeterminada. Esto permite garantizar la permanencia de los datos y la tolerancia a errores. Si los datos están “en reposo” están protegidos mediante cifrado.

Éste servicio es el utilizado para la creación de los archivos VHD de las máquinas virtuales pudiendo en cualquier momento subir o descargar archivos utilizando el portal, las API disponibles o herramientas de terceros.

 

Blobs – Blob Storage

Ofrece almacenamiento de objetos que se pueden consultar, modificar o eliminar de manera rápida a través de las API disponibles. Contamos con los siguientes tres tipos de bloques: Bloque, Append y Página.

Los blobs de Bloque añaden nuevo contenido, los de Append añade sus bloques a un blob existente y los de página permiten modificar blobs existentes.

 

Ilustración 4 – Blobs de Bloque

Ilustración 5 – Blobs de Append

Ilustración 6 – Blobs de página

 

Colas – Queue Storage

Almacena mensajes en colas simples de manera sencilla, económica y de larga duración. Está optimizado para grandes cargas de trabajo y ofrece tres ventajas principales para las aplicaciones:

  • Componentes desacoplados: las aplicaciones se limitan a enviar o a recibir mensajes de las colas. La aplicación es independiente de la cola de la que lee mediante ficheros de configuración.
  • Resiliencia: si parte de la arquitectura de nuestra aplicación deja de funcionar, el sistema de colas mantendrá los mensajes hasta que se hayan procesado definitivamente.
  • Escalado para ráfagas: la llegada de una carga de trabajo alta inesperada podría hacer que nuestra aplicación se bloqueara. De esta forma el sistema de colas absorbe todos los mensajes que van llegando y nuestra aplicación ya los procesará posteriormente.

 

Tablas – Table Storage

Table Storage consiste en un almacén de clave-valor NoSQL orientado al trabajo con datos semiestructurados masivos. La serialización se realizará en formato JSON y las consultas de las tablas podremos realizarlas mediante OData.

 

Almacenamiento “Big Data”

Data Lake Store ofrece almacenamiento de archivos sobre Hadoop (disponible en un clúster HDInsight). El acceso al almacén se puede hacer utilizando API REST compatibles con WebHDFS. Está disponible en Azure desde octubre de 2015, momento en el que se lanzó la versión Preview.

Su uso está orientado principalmente a almacenar durante un tiempo millones de archivos procedentes de diferentes fuentes (dispositivos, redes sociales, IoT, web, datos relacionales, …) incluyendo archivos en formato estructurado, semiestructurado y no estructurado.

 

Ilustración 7 – Data Lake Store

 

Almacenamiento empresarial

StorSimple está principalmente dirigido a entornos empresariales que requieran utilizar un almacenamiento en modelo nube híbrida ahorrando costes considerablemente. La idea principal es que todos los datos generados en servidores físicos (on-premise) pasen de un almacenamiento iSCSI (on-premise) a Microsoft Azure desde donde se podrá consumir desde las diferentes sedes corporativas a través de Internet.

Ilustración 8 – StorSimple

 

Copia de seguridad y restauración

Backup

Azure Backup es la solución de copia de seguridad ofrecida por Microsoft para realizar copias de seguridad de los datos para su posterior recuperación, si es necesaria. Azure Backup permite hacer copias de seguridad de datos locales y de datos disponibles en la nube.

Azure Backup ofrece cuatro componentes diferentes para realizar copias de seguridad:

 

Ilustración 9 – Componentes de Azure Backup

 

Las copias de seguridad se podrán realizar tanto de datos, como de máquinas virtuales y de cualquier otro componente Azure, incluyendo configuraciones de redes virtuales.

 

Site Recovery

Azure Site Recovery ofrece un servicio de tipo DRaaS (Disaster Recovery as a Service) para poder automatizar la recuperación de los servicios si nos encontramos ante una situación de interrupción de un sitio del centro de datos. Site Recovery nos permitirá monitorizar el estado de nuestro centro de servicios antes de que se produzca la interrupción controlando en todo momento cuentas de almacenamiento, máquinas virtuales y aplicaciones.

 

Próximos artículos

En próximos artículos veremos más en profundidad los servicios relacionados con Big Data del resto de categorías disponibles en Azure.

 

Conclusión

Como dijo Sir Timothy “Tim” Berners-Lee, británico, científico de la computación, desarrollador, fundador de la W3C y creador junto a su equipo del lenguaje HTML, el protocolo HTTP y el sistema de localización de objetos en la web URL: Data is a precious thing and will last longer than the systems themselves” (Los datos son algo precioso y durarán más que los propios sistemas)


Entradas relacionadas

Cursos relacionados
Nuestro sitio utiliza cookies para análisis. Si no estás seguro de ello, echa un vistazo a nuestra política de privacidad.