Course
Se você trabalha em um setor com muitos dados, com certeza já ouviu falar de bancos de dados. Uma forma muito comum de acessar os dados armazenados em um banco de dados é por meio do SQL. Neste artigo, você vai aprender mais sobre SQL. Mas, em vez de ir direto ao assunto, aprendendo a sintaxe e as terminologias usadas no SQL, vamos analisar alguns conceitos-chave da ciência da computação que nos ajudarão a responder à pergunta: o SQL é uma linguagem de programação?
O que é SQL?
Primeiro, vamos começar definindo o que é um banco de dados. Em termos simples, um banco de dados é um sistema de armazenamento para abrigar dados estruturados. Além disso, um sistema de gerenciamento de banco de dados(DBMS) serve de interface entre o banco de dados e seus programas ou usuários finais. Para saber mais sobre essa relação, confira o curso Projeto de Bancos de Dados da DataCamp.
O tipo mais comum de DBMS é um sistema de gerenciamento de banco de dados relacional (RDBMS), no qual armazenamos dados estruturados, ou seja, dados que incluem relações entre entidades e variáveis. Essas entidades e variáveis são organizadas como um conjunto de tabelas com colunas e linhas.
Os dados no RDBMS são armazenados em um objeto de banco de dados chamado de tabela. Um banco de dados geralmente contém várias tabelas. Cada tabela é identificada por um nome exclusivo e contém uma coleção de entradas de dados relacionadas, estruturadas como linhas e colunas. As colunas de uma tabela são conhecidas como campos e contêm valores referentes a uma propriedade específica de uma tabela. Cada linha de uma tabela é conhecida como registro.
SQL, pronunciado como "S-Q-L" ou "sequel", significa Structured Query Language, ou seja, linguagem de consulta estruturada. O SQL é usado em programação e foi desenvolvido para gerenciar dados armazenados em um RDBMS usando consultas SQL.
Uma consulta nada mais é do que uma instrução que consiste em vários comandos SQL que, juntos, executam uma tarefa específica para acessar, gerenciar, modificar, atualizar, controlar e organizar dados. Essa definição de consulta parece muito próxima de um "programa de computador"; isso significa que o SQL é uma linguagem de programação?
Vamos entender melhor o que significa linguagem de programação na próxima seção.
O que é uma linguagem de programação?
Uma linguagem de programação consiste em um conjunto predefinido de vocabulário e regras gramaticais. Essa linguagem pode então instruir um computador ou dispositivo de computação a executar tarefas específicas.
Há muitos tipos de linguagem de programação, cada uma com os próprios recursos e propósitos. Entretanto, em geral, elas podem ser divididas em dois grupos: linguagens de programação de baixo nível e de alto nível.
As linguagens de programação mais próximas do código de máquina ou binário (zeros e uns) são conhecidas como linguagens de baixo nível.
As linguagens de baixo nível geralmente são difíceis de serem interpretadas pelas pessoas porque são estruturadas para escrever instruções como uma máquina pensa. Ainda assim, são mais fáceis de entender em comparação com os zeros e uns puros.
Então, por que usar linguagens de baixo nível? Porque são rápidas! Além disso, proporcionam ao programador um controle mais preciso do funcionamento do hardware do computador.
Por outro lado, as linguagens de alto nível estão mais próximas da forma como os seres humanos se comunicam. Em suas instruções, elas usam palavras próximas à linguagem que usamos no dia a dia, o que facilita a programação e a manutenção. A desvantagem é que levam mais tempo para serem traduzidas em código de máquina para que o computador entenda.
Mas, à medida que os computadores ficam mais potentes, a diferença de desempenho entre as linguagens de baixo nível e de alto nível costuma ser de apenas milissegundos. É por isso que a maioria dos empregos de programação procura pessoas com competências de programação de alto nível.
O que é completude de Turing?
Para medir a capacidade de uma linguagem de programação, os cientistas da computação geralmente usam o conceito de completude de Turing. Seu nome é uma homenagem a Alan Turing, cientista da computação que, em 1936, propôs a máquina de Turing. Ele se tornou a base das teorias sobre computação e computadores.
A máquina de Turing era um dispositivo que imprimia símbolos em uma fita de papel de forma a imitar uma pessoa seguindo instruções lógicas.
As linguagens de programação são sistemas de regras formais que acessam e modificam dados. Se as regras conseguem simular a máquina de computação hipotética de Turing, diz-se que as regras são completas segundo Turing. Em um sistema completo segundo Turing, pode ser matematicamente comprovado que ele é capaz de realizar qualquer cálculo possível.
É altamente recomendável assistir a este vídeo da Computerphile para saber mais sobre as máquinas de Turing e seus vídeos complementares sobre o conceito de completude de Turing.
Linguagem de programação de uso geral x linguagem de domínio específico
O SQL tem um conjunto predefinido de palavras-chave e segue uma sintaxe rígida. Para começar a programar em SQL, confira o curso Introdução ao SQL da DataCamp, em que começamos com a seleção e filtragem de registros e campos e, em seguida, passamos para as funções de agregação, classificação e agrupamento.
Considerando a definição de linguagem de programação como apresentar um determinado vocabulário e uma sintaxe específica, o SQL com certeza se qualifica como linguagem de programação. No entanto, ela não se qualifica como uma linguagem de uso geral (GPL), sendo na verdade uma linguagem de domínio específico (DSL).
Uma linguagem de domínio específico é uma linguagem de computador criada especificamente para resolver problemas em um determinado domínio, e não se destina a resolver problemas fora dele.
São criadas com objetivos específicos de projeto e implementação. Por exemplo: o SQL foi criado especificamente para trabalhar com bancos de dados, para consultar os bancos de dados e trabalhar com os dados armazenados neles. Não é possível criar um aplicativo inteiro usando apenas SQL.
Outro exemplo de DSL é o Cascading Style Sheets, popularmente conhecido como CSS, que é usado para estilizar o HTML de sites.
Uma DSL é diferente de uma linguagem de uso geral (GPL, General Purpose Language), que é amplamente aplicável a vários domínios. Ela é projetada para permitir que você escreva qualquer tipo de programa com qualquer tipo de lógica necessária.
Você pode criar todos os tipos de aplicativo usando uma GPL, inclusive aplicativos móveis, web ou de desktop. Algumas das GPLs mais usadas são Python, C++, Ruby, Java e JavaScript.
Em termos gerais, as DSLs são menos poderosas do que as GPLs. No entanto, isso traz certo benefício. Devido ao seu domínio de aplicação restrito, o SQL é relativamente mais fácil de aprender do que a maioria das linguagens de programação de uso geral.
Incentivamos você a seguir o programa Fundamentos de SQL da DataCamp, no qual o levamos de iniciante a profissional em SQL com 5 cursos em apenas 21 horas.
Afinal, o SQL é uma linguagem de programação?
A completude de Turing, como discutimos antes, é uma indicação da capacidade de uma linguagem de programação. Quanto mais avançada é uma linguagem, mais cálculos complicados é capaz de realizar. Com a introdução das expressões de tabela comuns (CTEs) e funções de janela do SQL, podemos realizar cálculos recursivos e hierárquicos com o SQL, tornando-o ainda mais eficaz e qualificando-o como completo segundo Turing.
No entanto, demorou muito tempo para que o padrão SQL adicionasse os recursos de consultas hierárquicas e recursivas. Assim, alguns RDBMSs mais antigos e tradicionais podem não se qualificar como completos segundo Turing.
Discutimos antes a diferença entre uma linguagem de programação geral e uma linguagem de programação de domínio específico. Quando as pessoas dizem "linguagem de programação", geralmente querem dizer "linguagem de programação de uso geral", o que às vezes pode ser confuso.
Portanto, quando se trata da definição adequada de uma linguagem de programação, o SQL é uma linguagem de programação de domínio específico que é completa segundo Turing. Isso qualifica o SQL como uma linguagem de programação.
Para aqueles que já conhecem os conceitos básicos de SQL e gostariam de dar um passo adiante e começar a usar funções de janela, confira o curso interativo da DataCamp sobre Estatísticas de Resumo e Funções de Janela do PostgreSQL. Você aprenderá a criar consultas para fins de análise e engenharia de dados com funções de janela, a arma secreta do SQL!
Os diferentes tipos de SQL
Talvez você já tenha ouvido falar dos diferentes tipos ou dialetos de SQL: T-SQL, PostgreSQL, MySQL, etc. Mas você pode estar se perguntando o que são esses diferentes tipos de SQL e por que existem. Vamos dar uma olhada em uma breve história do SQL.
Edgar Frank Codd, um cientista da computação britânico que trabalhava na IBM, publicou um artigo chamado "A Relational Model of Data for Large Shared Data Banks" (Modelo relacional de dados para grandes bancos de dados compartilhados) em 1970. Foi quando ele inventou o modelo relacional para gerenciamento de bancos de dados, que tem servido de base teórica para bancos de dados relacionais e sistemas de gerenciamento de bancos de dados relacionais desde então.
Depois disso, foram feitos esforços para criar um padrão SQL oficial no final da década de 1980.
O SQL tornou-se um padrão do American National Standards Institute (ANSI) em 1986 e da International Organization for Standardization (ISO) em 1987. O padrão SQL foi revisado várias vezes desde a década de 1980, embora os recursos básicos do SQL padrão tenham se mantido estáveis desde 1992.
No entanto, novas variações continuaram surgindo à medida que os implementadores de bancos de dados que trabalhavam em diferentes empresas precisavam resolver novos problemas ou contornar problemas já existentes que não eram abordados no padrão SQL. Isso explica por que vários dialetos de SQL surgiram e ainda coexistem hoje em dia.
Atualmente, existe apenas uma linguagem SQL, mas os diferentes sistemas de gerenciamento de bancos de dados estenderam o padrão SQL original para incluir suas próprias funcionalidades ou adaptar a sintaxe ao seu próprio modo de funcionamento. Ao fazer isso, deram origem a uma variedade de dialetos SQL.
Você pode ler mais sobre esses diferentes dialetos em nosso artigo de blog convenientemente intitulado “SQL Server, PostgreSQL, MySQL... qual é a diferença? Por onde devo começar?”
Por qual dialeto SQL começar?
Sugerimos que comece pelo PostgreSQL.
O PostgreSQL é um sistema de banco de dados objeto-relacional avançado, de código aberto, que usa e amplia a linguagem SQL. Ele também tem vários recursos que armazenam e dimensionam com segurança as cargas de trabalho de dados mais complicadas.
É o mais próximo do SQL padrão e é um dialeto SQL muito utilizado. Ao começar pelo PostgreSQL, você terá a ferramenta mais flexível para se adaptar a outros dialetos SQL mais tarde e transferir suas competências para outros RDBMSs.
O curso Funções para Manipulação de Dados no PostgreSQL da DataCamp é um ótimo curso interativo de nível intermediário para que você siga na direção certa.
Linguagens SQL e procedurais
Assim, sabemos que o SQL não é uma linguagem de programação de uso geral. No entanto, é possível combinar o SQL com linguagens procedurais para imitar alguns comportamentos semelhantes aos de GPLs. Isso torna tecnicamente possível usar o SQL em um domínio diferente do pretendido.
As linguagens procedimentais são linguagens de programação que envolvem especificamente o uso de funções, instruções condicionais e variáveis para escrever programas reconhecíveis por computadores a fim de chegar a um determinado resultado computacional.
Todos os sistemas de gerenciamento de bancos de dados (DBMSs) aceitam um ou mais dialetos de linguagens procedurais. Alguns exemplos são:
Linguagem procedural para SQL (PL/SQL, Procedural Language for SQL)
Trata-se de uma extensão do SQL criada pela Oracle Corporation. Semelhante às linguagens de programação de uso geral, o PL/SQL permite condições e loops. Com o PL/SQL, também é possível declarar constantes, variáveis, tipos de variáveis, disparadores, procedimentos e funções.
Linguagem procedural/PostgreSQL (PL/pgSQL, Procedural Language/PostgreSQL)
É uma linguagem procedural compatível com o sistema de gerenciamento de bancos de dados objeto-relacionais PostgreSQL de código aberto. É muito semelhante ao PL/SQL da Oracle descrito acima e inclui elementos como loops e condições. Ele permite que funções definidas pelo usuário e também operadores sejam herdados.
Transact-SQL (T-SQL)
É uma extensão de programação da Sybase e da Microsoft que permite a declaração de variáveis locais. Também fez alterações nas instruções DELETE e UPDATE tradicionais do padrão SQL. Inclui controle de transações e tratamento de exceções e erros. É usado no Microsoft SQL Server, um banco de dados comum.
Com o uso dessas extensões, o SQL pode ter um desempenho semelhante ao de uma GPL, o que o torna uma competência ainda mais eficaz e fundamental a ser aprendida!
Comece a usar o SQL.
Esperamos tê-lo convencido de que o SQL não é apenas uma linguagem de programação. Trata-se de uma linguagem de programação avançada que o ajuda a extrair o máximo dos dados!
A DataCamp é uma excelente plataforma para aprender análise e ciência de dados online. Temos muitos cursos online de alta qualidade que podem ajudá-lo a entender o SQL e suas nuances.
Nosso curso de Introdução ao SQL Server é um desses cursos interativos em que você terá a oportunidade de testar conhecimentos e aumentar sua confiança colocando em prática o que aprendeu. Você vai trabalhar com um banco de dados de mídia digital para analisar as vendas de vários artistas e faixas, conjuntos de dados do Eurovision e tendências de queda de energia nos EUA para analisar vários tipos de dados e cenários diferentes.
Bom aprendizado!
Cursos de SQL
Course
Joining Data in SQL
Course
Intermediate SQL
blog
Para que o SQL é usado? 7 Principais usos do SQL
blog
O que é SQL? - A linguagem essencial para o gerenciamento de bancos de dados
Summer Worsley
16 min
blog
R vs. SQL - o que devo aprender?
blog
SQL vs Python: Qual você deve aprender?
tutorial
Exemplos e tutoriais de consultas SQL
tutorial
Tutorial de visão geral do banco de dados SQL
DataCamp Team
3 min