¿Qué es Microsoft Fabric?
Microsoft Fabric es la nueva plataforma unificada de análisis de datos de Microsoft y Azure Data, responsable de reunir una serie de herramientas de datos (algunas de las cuales ya existen en el conjunto de productos Azure) bajo un mismo paraguas. Piénsalo como una solución única para hacer números y ofrecer información.
El objetivo de Microsoft Fabric es permitir a los profesionales de las empresas y los datos liberar el potencial de sus datos para la era de la inteligencia artificial. Fabric ha revolucionado la forma de interpretar los datos y ha puesto la analítica al alcance de todos, no sólo de los genios de la ciencia de datos.
En este artículo, vamos a desmitificar Microsoft Fabric aún más, profundizando en sus características principales, incluyendo OneLake, y las diferentes cargas de trabajo disponibles en la plataforma. Al final del artículo, tendrá una idea actualizada de lo que es Fabric y por qué es beneficioso.
¿Qué es Microsoft Fabric?
Microsoft Fabric es una plataforma de análisis todo en uno creada para empresas y profesionales de los datos. La plataforma se encarga de todo, desde la ciencia de datos y el análisis en tiempo real hasta el almacenamiento y la migración de datos. Es una plataforma cohesionada que combina varias herramientas y tecnologías en una única solución.
La mejor manera de conceptualizar Fabric es entender su propósito: la simplicidad. Con esta herramienta, las organizaciones pueden combinar datos de varias fuentes en un único entorno. Esta simplicidad permite a los profesionales de los datos centrarse en los resultados y no en la tecnología que utilizan. También significa que los equipos de datos no tienen que pasar horas distinguiendo cómo interactuarán entre sí las licencias de Synapse, Azure Data Factory y Power BI.
Características de Microsoft Fabric
Hay cinco áreas clave que el equipo de Microsoft ha definido como diferenciadoras entre Fabric y el resto del mercado. Estas áreas incluyen:
Visión general de Microsoft Fabric
#1 Una plataforma analítica completa
Cada proyecto de análisis depende de varios sistemas de apoyo. Estos sistemas de apoyo suelen tener un conjunto único de requisitos y a menudo requieren la colaboración de otros proveedores. Integrar los distintos productos de estos proveedores puede ser una tarea difícil, frágil y costosa.
Aquí es donde entra en juego Microsoft Fabric.
Microsoft Fabric alivia este problema proporcionando a los equipos una única solución que ofrece una interfaz de usuario y una arquitectura uniformes, así como otras herramientas necesarias para extraer información de los datos y presentarla.
#nº 2 Lago céntrico y abierto
Los lagos de datos suelen ser desordenados y complejos, lo que convierte su creación, integración y gestión en una tarea extremadamente difícil. También está el problema de la duplicación de datos y la dependencia del proveedor que surge una vez que el lago de datos está operativo; esto se deriva del uso de múltiples productos de datos que emplean varios formatos de datos propietarios en el mismo lago de datos.
Fabric resuelve este problema introduciendo un lago de datos multicloud integrado de software como servicio (SaaS) llamado "OneLake". Del mismo modo que todas las aplicaciones de Microsoft 365 se conectan automáticamente a OneDrive, todas las cargas de trabajo de Fabric se conectan a OneLake.
La integración incorporada de OneLake ayuda a eliminar los silos de datos ubicuos y desorganizados, que surgen cuando los miembros del equipo configuran sus propias cuentas de almacenamiento segregadas. OneLake ofrece a todo el equipo una unidad de almacenamiento única y unificada que permite descubrir y compartir datos de forma sencilla.
#3 Inteligencia artificial
El servicio OpenAI de Azure está integrado en Microsoft Fabric en cada capa para ayudar a los usuarios a liberar todo el potencial de sus datos. Esta integración también permite a los desarrolladores aplicar la potencia de la IA generativa a los datos de los clientes y ayudar a los usuarios empresariales en su búsqueda para descubrir perspectivas en los datos.
Dado que Copilot está integrado en todas las experiencias de datos de Microsoft Fabric, los usuarios pueden utilizar el lenguaje conversacional para:
- Construir modelos de aprendizaje automático
- Desarrollo de flujos y canalizaciones de datos
- Generar código y funciones completas
- Visualizar los resultados
Incluso es posible que los usuarios creen sus propias experiencias de lenguaje conversacional personalizadas que combinen sus datos con los modelos de Azure OpenAI Service y luego las publiquen como plug-ins.
#4 Capacitación para todos los usuarios de la empresa
Los equipos de una organización aspiran a impulsar una cultura basada en datos cuando todo el mundo está capacitado para tomar mejores decisiones utilizando datos. Microsoft Fabric ayuda a fomentar esta cultura poniendo la analítica al alcance de todos. Más concretamente, Fabric está profundamente integrado con las aplicaciones típicas y cotidianas de Microsoft 365. Esto hace posible convertir sus aplicaciones de Microsoft 365 en un punto focal para descubrir y aplicar conocimientos.
#5 Reducción de costes mediante capacidades unificadas
Cuando se combinan varios productos de distintos proveedores en un mismo proyecto, suele producirse un desperdicio considerable. Esto se debe al aprovisionamiento de capacidad informática en múltiples sistemas, como la ingeniería de datos, el almacenamiento de datos y la inteligencia empresarial. En el momento en que uno de estos sistemas está inactivo, su capacidad no puede ser utilizada por otro sistema, lo que significa que se están desperdiciando recursos.
Fabric alivia este problema reduciendo la complejidad de la compra y gestión de recursos. Con Fabric, es posible adquirir un único conjunto de recursos informáticos para alimentar todas las cargas de trabajo (por ejemplo, integración de datos, ciencia de datos, etc.). Este modelo "todo incluido" reduce significativamente los costes, ya que los recursos informáticos no utilizados en una carga de trabajo pueden ser utilizados por cualquiera de las cargas de trabajo.
OneLake: El corazón del tejido
En el corazón de Microsoft Fabric se encuentra OneLake. OneLake es efectivamente donde se almacenan todos los datos utilizados dentro de Fabric. Como su nombre indica, OneLake es un lago de datos único, unificado y lógico que se encarga de dar soporte a todas las cargas de trabajo de Fabric.
A menudo se establece una comparación entre OneLake y OneDrive. Por ejemplo, esto es lo que dijo Microsoft: "De forma similar a como Office almacena archivos de Word, Excel y PowerPoint en OneDrive, Fabric almacena lagos, almacenes y otros elementos en OneLake." Esto ha llevado a muchos a adoptar la analogía de que OneLake es a los datos lo que OneDrive es a los archivos.
Antes de la llegada de OneLake, las organizaciones solían crear varios lagos para distintos equipos en lugar de colaborar en un único lago de datos, independientemente de que ello supusiera gestionar recursos adicionales. OneLake se introdujo para eliminar estos retos rompiendo los silos de datos y mejorando la colaboración al simplificar la gestión de los datos organizativos.
Microsoft OneLake en acción - Fuente de la imagen
Entre sus principales características figuran:
Atajos
La función de acceso directo permite a los usuarios combinar datos de distintos grupos empresariales y dominios en su producto de datos virtual. Esto significa que las organizaciones pueden compartir datos fácilmente entre distintos usuarios y aplicaciones sin necesidad de mover o duplicar información innecesariamente. El término "acceso directo" se refiere a los datos almacenados en otras ubicaciones de archivos, que pueden estar dentro del mismo espacio de trabajo o en otros diferentes. Independientemente de la ubicación, la referencia al acceso directo hace que los archivos y carpetas aparezcan como si estuvieran almacenados localmente.
Apertura
Azure Data Lake Storage (ADLS) Gen2 de Microsoft es un conjunto de funciones para el análisis de big data que se basa en el almacenamiento Azure Blob. Además de ofrecer almacenamiento masivo, ADLS Gen2 acepta tanto tipos de datos estructurados como no estructurados. Esta información es útil ya que OneLake está construido sobre ADLS Gen2, lo que lo hace abierto a todos los niveles.
OneLake también es compatible con las aplicaciones ADLS Gen2 existentes, como Azure Databricks, ya que admite las mismas API y SDK de ADLS Gen2. Por lo tanto, no se requiere experiencia con Microsoft Fabric para acceder a los datos subyacentes; los usuarios pueden abordar los datos en OneLake como si se tratara de una cuenta de almacenamiento masivo ADLS para toda la organización.
Una copia de los datos
Con OneLake, el proceso de copiar datos para poder utilizarlos con otro motor o romper silos para poder analizar los datos con otros datos ha quedado obsoleto. Ya no es necesario. Según la documentación de OneLake, "el objetivo de OneLake es ofrecerle el máximo valor posible a partir de una única copia de datos, sin movimiento ni duplicación de datos".
Gobernanza por defecto
Una de las ventajas exclusivas de los servicios SaaS es el concepto de inquilinos. Un tenant define un grupo de clientes que comparten un acceso común y privilegios específicos a una instancia de software. La documentación de OneLake afirma: "Saber dónde empieza y termina la organización de un cliente proporciona un límite natural de gobierno y cumplimiento, que en última instancia está bajo el control de un administrador de inquilinos". Básicamente, todos los datos que llegan a OneLake se rigen por defecto.
Cargas de trabajo y experiencias de usuario de Fabric
Microsoft Fabric viene con varias cargas de trabajo, cada una de ellas desarrollada pensando en personas específicas, que se conectan automáticamente a OneLake para ofrecer a cada usuario una experiencia de plataforma única.
Estas cargas de trabajo incluyen:
Fábrica de datos
La fábrica de datos ofrece más de 150 conectores a fuentes de datos en la nube y locales, la capacidad de orquestar canalizaciones de datos y experiencias de arrastrar y soltar para la transformación de datos.
Ingeniería de datos de sinapsis
La carga de trabajo de ingeniería de datos tiene características interesantes que funcionan dentro de Fabric, como Lakehouse. Un artefacto Lakehouse existe dentro de su propio espacio de trabajo y permite lo que Microsoft describe como "grandes experiencias de creación" utilizando el motor Spark. También hay otras ventajas interesantes, como el inicio instantáneo con grupos en directo y la posibilidad de colaborar.
Almacén de datos Synapse
La carga de trabajo del almacén de datos proporciona a los ingenieros y analistas de datos una experiencia convergente de Lakehouse y almacén de datos. Detrás del almacén está su motor SQL líder en el sector (sobre formatos de datos abiertos), unificado, sin servidor y dedicado.
Análisis de sinapsis en tiempo real
La carga de trabajo de análisis en tiempo real permite a los desarrolladores transmitir datos de dispositivos de Internet de las Cosas (IoT), telemetría, registros, etc. También son capaces de analizar grandes volúmenes de datos semiestructurados con alto rendimiento y baja latencia, ya que Kusto Query Langauge (KQL) es su base.
Sinapsis de la ciencia de datos
La carga de trabajo de Ciencia de Datos permite a los usuarios trabajar a través de todo el proceso de ciencia de datos de principio a fin. Para ello, ofrece a los científicos de datos una serie de herramientas necesarias para crear sofisticados modelos de IA, colaborar en proyectos y entrenar, desplegar y gestionar modelos de aprendizaje automático.
Inteligencia empresarial (Power BI)
En el centro de la carga de trabajo de inteligencia empresarial de Fabric se encuentra Power BI, el servicio de análisis de Microsoft líder del sector y basado en IA . Esto permite a los analistas de negocio y a otros usuarios descubrir información dentro de los datos de la organización. También está profundamente integrado con Microsoft 365, lo que significa que las organizaciones pueden obtener información relevante directamente desde cualquiera de los productos 365.
Activador de datos
Data Activator es una interfaz intuitiva y sin código dentro de Microsoft Fabric, diseñada para iniciar de forma autónoma acciones en respuesta a patrones identificados o condiciones específicas en datos en evolución.
Conclusión
Microsoft Fabric es una plataforma revolucionaria que reúne diversas herramientas y servicios de Azure bajo un paraguas unificado.
Sus características principales, como OneLake y sus diversas cargas de trabajo, permiten a las empresas y a los profesionales de datos tomar decisiones más inteligentes y basadas en datos. Tanto si es un científico de datos experimentado como un analista empresarial que busca aprovechar el poder de los datos, Microsoft Fabric ofrece una solución completa que simplifica las complejas tareas de datos.
Una de las principales integraciones de Microsoft Fabric es con Power BI, el servicio de análisis de Microsoft líder en el sector. Si desea profundizar en el análisis y la visualización de datos, consulte nuestro curso sobre Fundamentos de Power BI. Este curso le dotará de los conocimientos necesarios para convertir datos sin procesar en perspectivas significativas, una habilidad que complementa a la perfección las capacidades de Microsoft Fabric.
blog
Las 6 mejores herramientas de Business Intelligence para 2024 que debes conocer
blog
Cómo analizar datos para tu empresa en 5 pasos
blog
¿Qué es el análisis de datos? Una guía experta con ejemplos
tutorial
Tutorial de Modelado de datos en Power BI
tutorial
Cuadros de mando de Power BI frente a informes: Una guía completa
Maarten Van den Broeck
8 min