Bit - loader

Servicios de bases de datos en Microsoft Azure

   Artículo | Data Analytics Bit - Servicios de bases de datos en Microsoft Azure
Ángel M. Rayo | 16/05/17

Continuando con la serie de Big Data en Microsoft Azure veremos los servicios disponibles en Microsoft Azure relacionados con bases de datos.

 

Ilustración 1 – Productos y servicios de bases de datos en Microsoft Azure

Categorías

Dentro de los servicios de bases de datos (Databases) podemos encontrar cuatro categorías de servicios y productos. Éstas son:

  • Bases de datos SQL
  • Almacén de datos
  • Base de datos NoSQL
  • Caché
  • Procesamiento de datos

 

Bases de datos SQL

Los servicios SQL Database y SQL Stretch Database presentan funcionalidades de SQL Server como SaaS y como complemento respectivamente.

 

SQL Database

SQL Database ofrece una base de datos administrada dirigida a desarrolladores de aplicaciones que necesiten tener un almacén relacional sin la complejidad de preparar el entorno necesario para instalar el sistema gestor de bases de datos.

 

Este servicio ofrece las siguientes ventajas:

 

  • Aprende y adapta el rendimiento al uso que hace la aplicación de los datos
  • Escalado automático sin apenas tiempo de inactividad
  • Crear aplicaciones multiusuario aislando a los clientes pero sobre un único servicio presentado como SaaS.
  • Ofrece conectividad con multitud de plataformas de desarrollo y sistemas operativos como Ruby, Python, Java, JavaScript, PHP o .NET.

 

La capacidad y el rendimiento ofrecidos por el servicio se miden en Unidades de Transacción de base de datos (DTU), elásticas en los grupos elásticos (eDTU). Una DTU o eDTU es una medida que combina CPU, memoria, datos de E/S y E/S de registro de transacciones. Para saber qué DTU asignar a nuestro servicio SQL será necesario analizar las estadísticas de uso.

 

Ilustración 2 – Niveles de servicio SQL y DTU

 

El acceso a la base de datos se podrá realizar a través de la herramienta de administración de SQL Server (SQL Server Management Studio) o desde Visual Studio.

 

SQL Server Stretch Database

SQL Server Strecht Database permite migrar de manera automática los datos fríos de servidores SQL Server de manera segura a Azure.

Esta funcionalidad está disponible desde SQL Server 2016 y el funcionamiento lo podemos ver en la siguiente imagen:

Ilustración 3 – Stretch Database

 

Almacén de datos

SQL Data Warehouse

Azure SQL Data Warehouse es una base de datos relacional que ofrece procesado en paralelo masivo de datos funcionado en entorno Cloud.

 

Ofrece los siguientes elementos:

 

  • Combina SQL Server con las capacidades de escalado del Cloud
  • Desacopla el almacenamiento del procesado de datos
  • Permite incrementar, decrementar, pausar o resumir las operaciones de cómputo
  • Utiliza las herramientas SQL y el lenguaje Transact-SQL
  • Cumple con diferentes requisitos legales y de seguridad del negocio como SOC o ISO

 

El diagrama de funcionamiento de SQL Data Warehouse lo podemos ver a continuación:

 

Ilustración 4 – SQL Data Warehouse

 

Base de datos NoSQL

DocumentDB

DocumentDB es un servicio de base de datos NoSQL orientada a documentos de Microsoft orientada al uso por parte de aplicaciones con alta disponibilidad y distribuidas a nivel global.

A DocumentDB se puede acceder vía API REST o utilizando el lenguaje JSON de MongoDB.

DocumentDB ofrece adicionalmente la posibilidad de crear Procedimientos Almacenados, Triggers y funciones definidas por usuario (UDF).

Al trabajar con JSON ofrece integración con .NET, Python, .NET Core, Java y JavaScript.

Desde el pasado 10 de mayo, DocumentDB se convierte en un servicio mejorado de base de datos NoSQL llamado Azure Cosmos DB. Se convierte así en el primer servicio de datos distribuido globalmente que permite un escalado elástico de procesamiento y almacenamiento de datos manteniendo una latencia baja y una alta disponibilidad. Azure Cosmos DB es compatible e integrable con las API de DocumentDB, MongoDB, Graph y Table utilizando .NET, Java, javaScript, Python o Apache TinkerPop™ a través de la consola Gremlin.

 

Caché

Redis Cache

Azure Redis Cache es un servicio construido sobre la caché Redis Open Source. Redis Cache ofrece un sistema de alta rendimiento para obtener respuesta rápida ante las consultas de las aplicaciones en un entorno seguro con autenticación y conexiones SSL.

 

Azure Redis Cache básicamente gestiona un almacén de pares clave / valor en modelos de servicio que oscila entre 250 MB de caché y 256 conexiones y 53 GB de caché y 40.000 conexiones, pudiendo contar con más recursos en el modelo Premium.

 

Procesamiento de datos

Data Factory

Azure Data Factory permite crear y organizar los datos consumidos por nuestras aplicaciones a gran escala. Ofrece la posibilidad de crear canalizaciones de datos definiendo diferentes reglas y patrones de búsqueda consumiendo datos desde diferentes fuentes y monitorizando y visualizando todas las transformaciones.

 

Ilustración 5 – Azure Data Factory

 

Como fuentes de datos podremos utilizar todas las siguientes:

 

 

Ilustración 6 – Orígenes de datos Data Factory

 

Una vez tenemos las fuentes de datos disponibles podremos crear canalizaciones para obtener, preparar, transformar y publicar datos. Para ello haremos uso del diseñador de canalizaciones que nos permite agregar los siguientes tipos de actividades:

 

Ilustración 7 – Actividades de Data Factory

 

Próximos artículos

En próximos artículos veremos más en profundidad los servicios relacionados con Big Data del resto de categorías disponibles en Azure.

 

Conclusión

Como dijo K. C. Cole, escritora científica estadounidense, ganadora del premio de escritura del American Institute of Physics: “One person’s data is another person’s noise (Los datos de una persona son el ruido de otra)”


Entradas relacionadas

Cursos relacionados
Nuestro sitio utiliza cookies para análisis. Si no estás seguro de ello, echa un vistazo a nuestra política de privacidad. ACEPTAR