* Por Ana Cristina Santos
Atualmente, o cientista de dados é um dos profissionais mais requisitados no mercado de trabalho. Uma pesquisa feita pela Michael Page, líder mundial em recrutamento de executivos, aponta que os gestores de negócios em Business Intelligence e Big Data, juntamente com os cientistas de dados, serão os especialistas mais procurados no segmento de Tecnologia da Informação nos próximos dois anos, com salários variando entre R$ 12 mil e R$ 30 mil.
A procura crescente por esse especialista deve-se em parte pela grande popularidade que a subárea da Inteligência Artificial, chamada de Aprendizagem de Máquina (Machine Learning em inglês), ganhou nos últimos anos. Uma pesquisa feita pela MIT Technology Review e pela Google Cloud, publicada em março de 2017, indica que 26% das empresas entrevistadas planejam alocar mais de 15% do seu orçamento no setor.
Associado a isso, como a área de Big Data está em foco na indústria de tecnologia, Machine Learning tornou-se essencial por permitir que se façam previsões com base em grandes volumes de dados.
Dentre os exemplos mais comuns de Machine Learning estão: os algoritmos da Netflix que fazem sugestões de filmes de acordo com as preferências do espectador, os algoritmos da Amazon que recomendam livros com base nas últimas compras do usuário e os algoritmos adotados pelo Facebook que analisam atualizações de status para definir o conteúdo do seu feed.
O cientista de dados deve aplicar princípios, processos e técnicas para criar soluções inteligentes para problemas de negócios por meio da análise automática de informações. Para tanto, é preciso possuir sólidos conhecimentos em:
Machine Learning: é uma subárea da Inteligência Artificial baseada em algoritmos matemáticos e sua automação, permitindo que uma máquina aprenda e/ou aperfeiçoe o seu desempenho em alguma tarefa. Os principais algoritmos envolvidos no processo são: árvore de decisão, redes neurais artificiais, técnicas de agrupamento e associação de dados, regressão linear e regressão logística.
Sistemas de programação como Python, R, Scala ou o conhecimento de linguagens de consulta e tecnologias associadas como SQL, MySQL, PostgreSQL, Cassandra, MongoDB são fundamentais. Além disso, é importante saber trabalhar com bibliotecas e ferramentas de Machine Learning, tais como RapidMiner, TensorFlow, Power BI e Anaconda. Para o Big Data é essencial ter familiaridade com o Hadoop, MapReduce, Spark, Pig e Hive, por exemplo.
Visualização: o foco aqui é o Visual Analytics, ou seja, a representação apropriada de dados complexos por meio de imagens e gráficos para facilitar o desenvolvimento de análises. É importante conhecer algumas das ferramentas como D3, Tableau e Qlikview.
Formação
Embora seja uma discussão atual, ainda não existe curso de graduação em Ciência de Dados. Assim, aos que desejam investir na área, é recomendado que procurem por cursos que contemplem e tenham em suas estruturas curriculares uma linha de formação voltada ao setor, com disciplinas como: Estatística, Análise Exploratória de Dados, Inteligência Artificial, Mineração de Dados ou Data Mining, Machine Learning, Banco de Dados estruturados e não estruturados, Desempenho de Negócio e Big Data.
A capacitação pode ser realizada na pós-graduação, em que há um grande número de cursos lato sensu e MBA que contribui para a formação dos cientistas de dados, bem como programas de pós-graduação stricto sensu, como um mestrado ou doutorado. O caminho para se tornar um especialista envolve uma jornada de estudos e programas de formação, além do uso da Metodologia de Pesquisa aplicada na análise e solução de problemas reais.
* coordenadora do curso de Pós-Graduação em
Business Intelligence com Big Data da Faculdade Impacta
Acesse os outros sites da VideoPress
Portal Vida Moderna – www.vidamoderna.com.br
Radar Nacional – www.radarnacional.com.br
–