Uma recente pesquisa da consultoria Ovum aponta que o mercado de big data também é “big” e crescerá seis vezes até 2019. Fazendo jus ao termo, a multiplicação de oportunidades é do mesmo tamanho do crescimento geométrico dos dados no mundo. O mesmo relatório destaca que o tempo de experimentação acabou e as empresas estão prestes mudar o foco de seus investimentos nessas soluções, saindo do gerenciamento do dia a dia para um salto de competitividade com novas estratégias.
O estudo mostra que há quase plena garantia de empregabilidade para quem entender sobre negócios e tecnologia. Mesmo as linguagens open source terão projetos comerciais e a urgência de lidar com o big data poderá vir a ser uma guerra por talentos. Para se preparar melhor, é bom conhecer as principais linguagens usadas hoje e as que ganham espaço no mundo do big data. Listamos as principais:
Python
Open source, popular e ganhando fãs ela é uma das linguagens ideais para trabalhar grandes e complicados volumes de informação. Muito de seu crescimento é consequência de ser fácil de aprender. Como a maioria das open source, a python ainda ganha créditos por ter uma comunidade especializada e disposta a ajudar. Várias outras linguagens são derivadas dela e isso pode outro ponto a favor. Está entre as preferidas de 2015.
https://www.python.org/
R
Quem trabalha com estatísticas e data minning provavelmente executa uma função escrita em R todo dia. Google, Facebook e Twitter também a usam, então, todos nós temos contato com ela diariamente. Está também entre as populares e também é de código aberto. Não chega a ser simples com a Python, mas é poderosa para trabalhar com dados e tirar informação deles. O big data só fez ela ganhar mais força. Várias interfaces gráficas também ajudaram.
https://www.r-project.org/
Julia
Recente e poderosa, essa linguagem vem ganhando espaço com os programadores e cientistas de dados. A versatilidade de lidar com vários tipos de aplicações e o poder de trabalhar com sistemas distribuídos fazem dela mais do que uma aposta para o futuro do big data.
https://julialang.org/
SAS
Desenvolvida nos laboratórios da Universidade da Carolina do Norte a SAS (Statistical Analysis System) é uma plataforma analítica usada desde a década de 60. Mas é popular ainda hoje graças aos aprimoramentos constantes. Não é open souce, pertence à empresa de mesmo nome.
https://www.sas.com/pt_br/home.html
Java e SQL
Nenhum dos dois pode ser chamado de linguagem para o big data exatamente. Mas dependendo do projeto que você se mete, ambas serão as melhores escolhas para migrar do passado para o futuro. O SQL ainda é usado em muitas empresas e elas não irão abandonar o legado escrito nele. Java e Java-based frameworks também estão em muitas companhias e a prototipagem para construir grandes sistemas pode ficar facilitada passando por eles.
Scala
Devido ao explicado com Java, essa linguagem pode ser uma boa escolha. Scala é baseada em Java e compilada em Java Virtual Machine, o que significa que pode ser executado em praticamente qualquer plataforma. Seu nome não é por acaso, ela tem escalabilidade, e por isso vem ganhado espaço com cientistas de dados.
https://www.scala-lang.org/
Matlab
Não é de código aberto, o que a deixa com um fator a menos para decidir sobre o aprendizado. Mas é poderosa. Seu nome vem de sua eficiência em trabalhar com matrizes para modelagem estatística.. É também versátil para criação de algoritimos. Apesar de não ter a comunidade das open source, é muito usada em instituições acadêmicas, portanto não chega a ser complicado achar alguém disposto a trocar ideias e ensinar truques. Octave é uma linguagem similar à Matlab, e é free. Mas é muito restrita.
https://www.mathworks.com/products/matlab/
HiveQL
É a linguagem do Apache Hive e datawarehousing executadas em ambiente Hadoop. Essa combinação está presente em grandes empresas da internet e sua estruturação parecida com T-SQL faz com que ganhe adeptos tanto por sua identificação imediata quanto pelo mercado potencial.
https://hive.apache.org/
Kafka e Storm
Não nasceram juntas mas o mercado as uniu. Kafka é para quem precisa de rapidez, muita rapidez. Foi criada no LinkedIn para seus sistemas proporcionarem respostas quase imediatas. Infelizmente, a precisão não combina com tanta velocidade. Por isso, muitas empresas usam duas bases para seus projetos, uma em Kafka e outra em Storm, que é um framework feito em Scala.
https://kafka.apache.org/
https://storm.apache.org/
Go
Criada pelo Google, será reconhecida por quem tem familiaridade com C. É bem recente no mercado, mas tem recebido elogios. É robusta e alguns analistas de mercado já apontaram que ela vem ganhando projetos que seriam em Java ou Python. Parte desse sucesso é devido a ela chamar rotinas de outras linguagens e ser, além de tudo, rápida.
https://golang.org/
Acessse os outros sites da VideoPress
Portal Vida Moderna – www.vidamoderna.com.br
Radar Nacional – www.radarnacional.com.br