Pular para o conteúdo principal
InicioBlogData Analysis

O que é o Microsoft Fabric?

Descubra como o Microsoft Fabric revoluciona a análise de dados e saiba como seus principais recursos capacitam as empresas a tomar decisões orientadas por dados.
abr. de 2024  · 10 min leer

O Microsoft Fabric é a nova plataforma unificada de análise de dados da Microsoft e do Azure Data, responsável por reunir uma série de conjuntos de ferramentas de dados (alguns dos quais já existem no conjunto de produtos do Azure) em um único guarda-chuva. Pense nisso como uma solução única para processar números e fornecer insights.

O objetivo do Microsoft Fabric é permitir que os profissionais de negócios e dados liberem o potencial de seus dados para a era da inteligência artificial. A Fabric vem revolucionando a maneira como os dados são interpretados e tornando a análise acessível a todos, não apenas aos especialistas em ciência de dados.

Neste artigo, vamos desmistificar ainda mais o Microsoft Fabric, analisando seus principais recursos, incluindo o OneLake, e as diferentes cargas de trabalho disponíveis na plataforma. Ao final do artigo, você terá uma visão atualizada do que é o Fabric e por que ele é benéfico.

O que é o Microsoft Fabric?

O Microsoft Fabric é uma plataforma de análise completa criada para empresas e profissionais de dados. A plataforma lida com tudo, desde a ciência de dados e a análise em tempo real até o armazenamento e a migração de dados. Trata-se de uma plataforma coesa que combina várias ferramentas e tecnologias em uma única solução.

A melhor maneira de conceituar o Fabric é entender sua finalidade: simplicidade. Com a ferramenta, as organizações podem combinar dados de várias fontes em um único ambiente. Essa simplicidade permite que os profissionais de dados se concentrem nos resultados e não na tecnologia que usam. Isso também significa que as equipes de dados não precisam passar horas distinguindo como o licenciamento do Synapse, do Azure Data Factory e do Power BI irá interagir entre si.

Recursos do Microsoft Fabric

Há cinco áreas principais que a equipe da Microsoft definiu como diferenciais entre a Fabric e o restante do mercado. Essas áreas incluem:

Uma visão geral do Microsoft Fabric

#1 Uma plataforma de análise completa

Cada projeto de análise depende de vários sistemas de suporte. Esses sistemas de suporte geralmente têm um conjunto exclusivo de requisitos e, muitas vezes, exigem a contribuição de vários outros fornecedores. Integrar os diferentes produtos desses fornecedores pode ser uma tarefa difícil, frágil e cara.

É aqui que o Microsoft Fabric entra em ação.

O Microsoft Fabric alivia esse problema fornecendo às equipes uma única solução que oferece uma interface de usuário uniforme, arquitetura e uma variedade de outras ferramentas necessárias para que os insights sejam extraídos dos dados e apresentados.

#2 Centrado no lago e aberto

Os lagos de dados costumam ser confusos e complexos, o que torna a criação, a integração e o gerenciamento deles uma tarefa extremamente desafiadora. Há também a questão da duplicação de dados e do aprisionamento ao fornecedor que surge quando o lago de dados está em operação; isso decorre do uso de vários produtos de dados que empregam vários formatos de dados proprietários no mesmo lago de dados.

A Fabric resolve esse problema com a introdução de um data lake integrado de software como serviço (SaaS) e de várias nuvens chamado "OneLake". Da mesma forma que todos os aplicativos do Microsoft 365 são automaticamente conectados ao OneDrive, todas as cargas de trabalho da Fabric são conectadas ao OneLake.

A integração incorporada do OneLake ajuda a remover silos de dados onipresentes e desorganizados, que surgem quando os membros da equipe configuram suas próprias contas de armazenamento segregadas. O OneLake oferece a toda a equipe uma unidade de armazenamento única e unificada que simplifica a descoberta e o compartilhamento de dados.

#3 Inteligência artificial

O serviço OpenAI do Azure está integrado ao Microsoft Fabric em todas as camadas para ajudar os usuários a desbloquear todo o potencial de seus dados. Essa integração também permite que os desenvolvedores apliquem o poder da IA generativa aos dados do cliente e ajudem os usuários corporativos em sua busca para descobrir insights nos dados.

Como o Copilot está integrado a todas as experiências de dados do Microsoft Fabric, os usuários podem utilizar a linguagem de conversação para:

  • Criar modelos de aprendizado de máquina
  • Desenvolver fluxos de dados e pipelines de dados
  • Gerar código e funções inteiras
  • Visualize os resultados

É possível até mesmo que os usuários criem suas próprias experiências de linguagem de conversação personalizadas que combinem seus dados com os modelos do Azure OpenAI Service e depois os publiquem como plug-ins.

#4 Capacitação para todos os usuários corporativos

As equipes de uma organização aspiram a promover uma cultura orientada por dados quando todos têm autonomia para tomar decisões melhores usando dados. O Microsoft Fabric ajuda a promover essa cultura, tornando a análise acessível a todos. Mais especificamente, o Fabric está profundamente integrado aos aplicativos típicos e cotidianos do Microsoft 365. Isso permite converter seus aplicativos do Microsoft 365 em um ponto focal para descobrir e aplicar insights.

#5 Redução de custos por meio de capacidades unificadas

Quando vários produtos de diversos fornecedores são combinados em um único projeto, geralmente há um desperdício significativo. Isso se deve ao fato de a capacidade de computação ser provisionada em vários sistemas, como engenharia de dados, armazenamento de dados e business intelligence. No momento em que um desses sistemas está ocioso, sua capacidade não pode ser utilizada por outro sistema, o que significa que os recursos estão sendo desperdiçados.

O tecido alivia esse problema ao reduzir a complexidade da compra e do gerenciamento de recursos. Com a Fabric, é possível adquirir um único pool de computação para alimentar todas as cargas de trabalho (por exemplo, integração de dados, ciência de dados etc.). Esse modelo com tudo incluído reduz significativamente os custos, pois todos os recursos de computação não utilizados em uma carga de trabalho podem ser utilizados por qualquer uma das cargas de trabalho.

OneLake: O coração do tecido

No coração do Microsoft Fabric está o OneLake. O OneLake é efetivamente onde todos os dados utilizados no Fabric são armazenados. Como o nome sugere, o OneLake é um lago de dados único, unificado e lógico que é responsável por dar suporte a todas as suas cargas de trabalho do Fabric.

Uma comparação comum é feita com frequência entre o OneLake e o OneDrive. Por exemplo, veja o que a Microsoft disse: "Da mesma forma que o Office armazena arquivos do Word, Excel e PowerPoint no OneDrive, a Fabric armazena lagos, armazéns e outros itens no OneLake". Isso fez com que muitos adotassem a analogia de que o OneLake é para os dados o que o OneDrive é para os arquivos.

Antes da chegada do OneLake, as organizações normalmente criavam vários lagos para equipes diferentes em vez de colaborar em um único lago de dados, independentemente de isso significar o gerenciamento de recursos adicionais. O OneLake foi introduzido para eliminar esses desafios, eliminando os silos de dados e melhorando a colaboração ao simplificar o gerenciamento dos dados organizacionais.

Microsoft OneLake em ação - Fonte da imagem

Microsoft OneLake em ação - Fonte da imagem

Os principais recursos incluem:

Atalhos

O recurso de atalho permite que os usuários combinem dados de diferentes grupos e domínios de negócios em seu produto de dados virtual. Isso significa que as organizações podem compartilhar facilmente dados entre diferentes usuários e aplicativos sem a necessidade de mover ou duplicar informações desnecessariamente. O termo "atalho" refere-se a dados armazenados em outros locais de arquivos, que podem estar no mesmo espaço de trabalho ou em espaços diferentes. Independentemente do local, a referência de atalho faz com que os arquivos e pastas apareçam como se estivessem armazenados localmente.

Abertura

O Azure Data Lake Storage (ADLS) Gen2 da Microsoft é um conjunto de recursos para análise de big data criado com base no armazenamento de Blob do Azure. Além de oferecer armazenamento maciço, o ADLS Gen2 aceita tipos de dados estruturados e não estruturados. Essas informações são úteis, pois o OneLake foi desenvolvido com base no ADLS Gen2, o que o torna aberto em todos os níveis.

O OneLake também é compatível com os aplicativos ADLS Gen2 existentes, como o Azure Databricks, já que ele suporta as mesmas APIs e SDKs do ADLS Gen2. Portanto, não é necessário ter experiência com o Microsoft Fabric para acessar os dados subjacentes; os usuários podem lidar com os dados no OneLake como se fosse uma conta de armazenamento ADLS maciça para toda a organização.

Uma cópia dos dados

Com o OneLake, o processo de copiar dados para que possam ser usados com outro mecanismo ou de quebrar silos para permitir que os dados sejam analisados com outros dados é obsoleto. Isso não é mais necessário. De acordo com a documentação do OneLake, "o OneLake tem como objetivo oferecer a você o maior valor possível de uma única cópia de dados sem movimentação ou duplicação de dados".

Governança por padrão

Um dos benefícios exclusivos dos serviços de SaaS é o conceito de locatários. Um locatário define um grupo de clientes que compartilham acesso comum e privilégios específicos a uma instância de software. A documentação da OneLake afirma: "Saber onde a organização de um cliente começa e termina fornece um limite natural de governança e conformidade, que, em última análise, está sob o controle de um administrador de locatário". Essencialmente, todos os dados que chegam ao OneLake são governados por padrão.

Cargas de trabalho de malha e experiências de usuário

O Microsoft Fabric vem com várias cargas de trabalho, cada uma delas desenvolvida com personas específicas em mente, que são automaticamente conectadas ao OneLake para oferecer a cada usuário uma experiência de plataforma exclusiva.

Essas cargas de trabalho incluem:

Fábrica de dados

A fábrica de dados oferece mais de 150 conectores para fontes de dados na nuvem e no local, a capacidade de orquestrar pipelines de dados e experiências de arrastar e soltar para a transformação de dados.

Engenharia de dados de sinapse

A carga de trabalho de engenharia de dados tem recursos interessantes que funcionam no Fabric, como o Lakehouse. Um artefato do Lakehouse existe em seu próprio espaço de trabalho e permite o que a Microsoft descreve como "excelentes experiências de criação" usando o mecanismo do Spark. Há também outros benefícios interessantes, como o início instantâneo com pools ao vivo e a capacidade de colaborar.

Armazém de dados do Synapse

A carga de trabalho do data warehouse oferece aos engenheiros e analistas de dados uma experiência convergente de Lakehouse e data warehouse. Por trás do warehouse está o mecanismo SQL líder do setor (em formatos de dados abertos), unificado, sem servidor e dedicado.

Análise em tempo real do Synapse

A carga de trabalho de análise em tempo real permite que os desenvolvedores transmitam dados de dispositivos da Internet das Coisas (IoT), telemetria, registros e muito mais. Eles também são capazes de analisar grandes volumes de dados semiestruturados com alto desempenho e baixa latência, uma vez que a Kusto Query Langauge (KQL) está em sua base.

Ciência de dados do Synapse

A carga de trabalho de ciência de dados permite que os usuários trabalhem em todo o processo de ciência de dados de ponta a ponta. Ele faz isso oferecendo aos cientistas de dados uma variedade de ferramentas necessárias para criar modelos sofisticados de IA, colaborar em projetos e treinar, implementar e gerenciar modelos de aprendizado de máquina.

Business Intelligence (Power BI)

No centro da carga de trabalho de business intelligence da Fabric está o serviço de análise líder do setor e orientado por IA da Microsoft, o Power BI. Isso permite que os analistas de negócios e outros usuários descubram insights nos dados organizacionais. Ele também está profundamente integrado ao Microsoft 365, o que significa que as organizações podem obter insights relevantes diretamente de qualquer um dos produtos 365.

Ativador de dados

O Data Activator é uma interface intuitiva e sem código dentro do Microsoft Fabric, projetada para iniciar ações de forma autônoma em resposta a padrões identificados ou condições específicas em dados em evolução.

Conclusão

O Microsoft Fabric é uma plataforma revolucionária que reúne uma variedade de ferramentas e serviços do Azure em um único guarda-chuva unificado.

Seus principais recursos, como o OneLake e suas várias cargas de trabalho, capacitam as empresas e os profissionais de dados a tomar decisões mais inteligentes e orientadas por dados. Não importa se você é um cientista de dados experiente ou um analista de negócios que deseja aproveitar o poder dos dados, o Microsoft Fabric oferece uma solução abrangente que simplifica tarefas complexas de dados.

Uma das principais integrações do Microsoft Fabric é com o Power BI, o serviço de análise líder do setor da Microsoft. Se você quiser se aprofundar na análise e visualização de dados, confira nosso curso de habilidades Fundamentos do Power BI. Esse curso o equipará com as habilidades necessárias para transformar dados brutos em insights significativos, uma habilidade que complementa perfeitamente os recursos do Microsoft Fabric.

Temas
Relacionado

blog

As 9 melhores ferramentas de análise de dados para analistas de dados em 2023

Está pensando em começar uma nova carreira como analista de dados? Aqui está tudo o que você precisa saber sobre as ferramentas de análise de dados que liderarão o setor de ciência de dados em 2023.
Javier Canales Luna's photo

Javier Canales Luna

16 min

blog

O que é análise de dados? Um guia especializado com exemplos

Explore o mundo da análise de dados com nosso guia abrangente. Saiba mais sobre sua importância, processo, tipos, técnicas, ferramentas e as principais carreiras em 2023
Matt Crabtree's photo

Matt Crabtree

15 min

blog

As 6 principais ferramentas de business intelligence para 2024 que você precisa conhecer

Descubra como o business intelligence é essencial para o sucesso dos negócios e as principais ferramentas de BI que tornam isso possível.
Joleen Bothma's photo

Joleen Bothma

12 min

tutorial

Entendendo a assimetria e a curtose e como traçá-las

Um guia visual abrangente sobre assimetria/curtose e como elas afetam as distribuições e, por fim, seu projeto de ciência de dados.
Bex Tuychiev's photo

Bex Tuychiev

10 min

tutorial

Principais técnicas para lidar com valores ausentes que todo cientista de dados deve conhecer

Explore várias técnicas para lidar eficientemente com valores ausentes e suas implementações em Python.
Zoumana Keita 's photo

Zoumana Keita

15 min

tutorial

Como escrever um script Bash: um tutorial simples de scripts Bash

Descubra os fundamentos da criação de scripts Bash e aprenda a escrever um script Bash.
Kurtis Pykes 's photo

Kurtis Pykes

5 min

See MoreSee More