O que é Ciência de Dados?
A Ciência de Dados é o estudo científico da criação, validação, transformação e modelagem de dados para criar conhecimento. O conhecimento por sua vez é a informação respaldada por evidência cientifica que cria significado. A Ciência de Dados se tornou a quarta abordagem para o descobrimento científico, em adição a experimentação, modelagem e computação.
Os objetivos da Ciência de Dados envolvem descrever o dado e sua distribuição, fazer inferência sobre o dado e prever futuros comportamentos ao entender a correlação entre as variáveis. A base da Ciência de Dados é a estatística e esta usa a matemática para entender o dado, sua distribuição e descrição.
O profissional que trabalha com a Ciência de Dados é o cientista de dados e este possui algumas atribuições importantes, entre estas , identificar os problemas de análise de dados da organização de modo a enxergar oportunidades, determinar quais dados existentes podem ser utilizados, definir quais dados inexistentes devem ser coletados e como coletá-los, ser capaz de trabalhar com grande volume de dados , preparar os dados para serem utilizados (Data Enginnering), aplicar as melhores técnicas de estatística e Machine Learning, encontrar padrões e tendências nos dados de forma a apresentar resultados através de relatórios personalizados.
Alguns termos podem ser confundidos com Ciência de Dados, entre eles, a estatística que é um componente crucial da ciência de dados, mas a estatística foi desenvolvida para problemas de antes da era da computação e a Ciência de Dados nasceu em decorrência disso e está mais capacitada a lidar com modelos de programação e grande massa de dados.
Ciência de Dados também pode ser confundida com o significado de análise de dados, essa se baseia na resposta de especialistas na área de análise e resulta em decisões mais intuitivas e enviesadas, já a Ciência de Dados propõe uma decisão baseada em evidências que coloca a estatística a frente da experiência pura e simples.
O termo Big Data também é tratado de forma separada da ciência de dados. Big Data é a técnica para armazenar e manipular grandes quantidades de dados de forma rápida e confiável. Big Data não decorre de como usar os dados e a Ciência de Dados não requer Big Data, sendo assim, são conceitos distintos que se complementam.
O Business Intelligence está mais próximo da análise de dados do que da Ciência de Dados, pois ajuda na tomada de decisões ao prover os dados de forma rápida e flexível, mas não inclui modelos de previsão, como inteligência artificial e Machine Learning.
A Ciência de Dados é multidisciplinar e abrange diversas áreas de conhecimento, tais como, matemática, estatística, conhecimento prévio sobre a área que determinado dado se encontra, conhecimento sobre como coletar dados e programação utilizada em Machine Learning. O mercado já conta com diversas ferramentas para auxiliar em todas as etapas de tratamento do dado que podem ser aproveitadas para todas as disciplinas que envolvem a Ciência de Dados.