Minha jornada ao mundo de ciência de dados

Um pouco de história

Tivemos a época do Full-stack developer, depois veio o DevOps e SRE e agora estamos na moda do Data Scientist, então, para você que resolveu entrar também nessa onda, vamos conversar aqui hoje sobre como começar nessa carreira.

Minha primeira lembrança de onda de empresas movidas a ciência de dados foi dada pela compra da Climate pela Monsanto. Conheci sobre em um dos eventos da clj-sp no iMasters. Na mesma época, também participava de um meetup de big data, não achei o link, que em geral era na MapLink que e era tocado pelo Luca Bastos.

Hoje o termo e a área está totalmente em alta no mercado e na mídia. Várias empresas mudando adotando a postura Data-driven, orientadas por dados, para evoluir o negócio. Comparando a empresa com uma banda de rock, foi como pegar o baterista, funcionário do BI, e colocar ele de guitarrista ou vocalista da banda como um novo rótulo, Data Scientist!

O que é data science?

DataScienceDisciplines

Na imagem acima temos uma das várias que você vai encontrar no Google Images se procurar por "data science". Eu discordo da imagem por considero Data Science mais um fluxo que uma ideia central em torno de um conjunto de disciplinas, pois acho que precisa ter uma coordenação entre elas. A seguir um diagrama que representa parte do meu pensamento a respeito, não estou considerando que inteligência artificial faça parte do escopo de ciência de dados.

data-science-flow

Acho que esse diagrama é mais realista com o que penso sobre o assunto. Também acho que não se resume a isso e nem estou completamente correto sobre, é apenas minha opinião.

Como comecei

Acho que o primeiro passo é entender onde você está e onde você pretende chegar. Por exemplo, eu venho de uma histórico que fui muito envolvido com algoritmos, estrutura de dados e competição de programação na universidade. Depois fui para o mercado de trabalho e fiquei bastante tempo focado no desenvolvimento de software e tive a minha passagem pelo mundo de operações. Com isso, o caminho mais fácil para mim é trabalhar como Engenheiro de Dados.

Data engineers build massive reservoirs for big data. They develop, construct, test and maintain architectures such as databases and large-scale data processing systems. Once continuous pipelines are installed to – and from – these huge “pools” of filtered information, data scientists can pull relevant data sets for their analyses.

O que fiz? Felizmente, tive a oportunidade de trabalhar na Intelie onde tive um proximidade muito grande com o trabalho de ciência de dados, desde a coleta até a visualização. Para completar a essa experiência acabei fazendo 2 cursos na Udacity (I e II) ano passado de Data Science que foram basicamente Python e suas bibliotecas básicas para isso, estatística, visualização de dados e Tableau.

A parte em Python acabei aproveitando pouco pois já programo em Python tem anos, o mais interessante mesmo ficou por conta da melhor introdução ao numpy e pandas que tive. Estatística foi uma revisão do que vi na graduação e a parte de visualização e Tableau que foram realmente novidade para mim.

Hoje e futuro

Depois de começar essa jornada de troca de foco na carreira que começou quando entrei nos cursos da Udacity, só falta trabalhar com isso. Felizmente, surgiu a oportunidade de vir para a Wine.com.br trabalhar na equipe de Data Insights. Junto disso, me matriculei no meu primeiro MBA fora da área de TI que foco em aplicabilidade da ciência de dados na FUCAPE - Inteligência Competitiva.

Pretendo discutir mais o assunto por aqui no blog e outros relacionados. Fiquem atentos!

Author image
Vitória - ES, Brasil Website
Formado em Engenharia de Computação na UFES e trabalhando com desenvolvimento de software para o mercado desde 2012. Hoje estou focado na área de ciência de dados e negócios.