Você sabe o que é Big Data? Pode parecer estranho, mas o Big Data provavelmente sabe quem você é.

Todos os dias, sistemas de informação coletam, tratam e armazenam alguns exabytes (sem h) de dados mundo afora. Um exabyte corresponde a um bilhão de gigabytes.

Assim, o volume total de dados armazenados em todo o mundo já está na casa dos zetabytes (trilhões de gigabytes).

É provável que entre tantas informações armazenadas, lá estejam seus dados pessoais, seus hábitos de consumo, suas preferências, etc.

Mas tão importante quanto a existência desse grande volume de dados é a existência de ferramentas e técnicas adequadas para lidar com ele. Aqui, entra em cena o conceito de Big Data Analytics.

Neste artigo, vamos abordar o que é Big Data e o que é Big Data Analytics, trazendo alguns exemplos de aplicação prática desses conceitos.

O que é Big Data?

A expressão “Big Data” foi utilizada pela primeira vez em 1997, já como referência ao grande volume de dados que começava a se acumular a partir da popularização da internet.

Certamente, não existe um sistema que, sozinho, acesse ou manipule toda a quantidade de dados existentes no mundo.

Entretanto, mesmo as inúmeras aplicações que lidam com partes dessa grande base têm manipulado quantidades de dados nunca antes reunidas.

Mas para se entender o que é Big Data, precisamos percebê-lo como mais que um mero amontoado de dados.

Os 5 V’s do Big Data

Big Data apresenta cinco aspectos bem característicos, conhecidos como os 5 V’s: Volume, Variedade, Velocidade, Veracidade e Valor.

Em primeiro lugar, Volume, Variedade e Velocidade dizem respeito, respectivamente a:

  • Dados em grande quantidade;
  • Dados de diferentes origens e formas;
  • Dados que exigem um processamento eficiente.

Por outro lado, Veracidade diz respeito à confiabilidade do dado coletado, essencial para a finalidade a que ele se presta.

Enquanto isso, o Valor está relacionado à utilidade que o dado pode ter após passar por uma análise.

A origem do Big Data

O grande crescimento do volume disponível de dados tem origem na evolução natural dos recursos de hardware e de software.

Foi particularmente importante nesse crescimento o surgimento de ferramentas preparadas para lidar com dados não estruturados.

Mas o que seriam dados estruturados e não estruturados?

Dados estruturados

Dados estruturados são aqueles que possuem um padrão conhecido de organização, permitindo uma fácil manipulação, classificação e armazenamento.

Em resumo, são os dados com os quais os sistemas de TI sempre trabalharam, normalmente mantidos em bancos de dados.

Assim, por exemplo, o cadastro de fornecedores do módulo de FI do sistema SAP ERP será composto tipicamente por dados estruturados, que incluem CNPJ, Razão Social, endereço, dados bancários e outros.

Dados não estruturados

Em contrapartida, dados não estruturados se caracterizam pela ausência de padrões em sua constituição, dificultando a manipulação por uma ferramenta.

Dessa forma, incluem-se nessa categoria os conteúdos em forma de vídeos, imagens, áudio e mesmo textos não estruturados (como comentários ou observações, em que o conteúdo relevante está diluído em uma estrutura não padronizada).

Boa parte dos dados produzidos atualmente tem a característica da não estruturação e sem entendê-los, não pode haver uma boa compreensão sobre o que é Big Data.

Big Data x Business Intelligence

Ainda para se compreender o que é Big Data, é importante diferenciá-lo do Business Intelligence (BI).

De forma resumida, Big Data se coloca como algo mais abrangente, no qual BI pode estar inserido.

O BI trabalha essencialmente com dados estruturados coletados dos sistemas da empresa, tendo, portanto, um escopo mais específico quanto ao alcance de sua análise.

Por outro lado, o Big Data não só incorpora o tratamento a dados não estruturados, como estabelece relacionamentos com um universo de dados muito mais amplo, em muitos casos externo à empresa.

Os tipos de dados tratados em Big Data

Os dados contidos no Big Data costumam ser classificados em três categorias: dados sociais, dados empresariais e dados pessoais.

Dados sociais (Social Data)

São dados demográficos e comportamentais, extraídos das redes sociais e de ambientes onde há interação entre as pessoas.

Uma análise sobre esses dados pode revelar informações como:

  • Com quais grupos a pessoa se relaciona;
  • Que tipo de comentários ela costuma fazer;
  • Quais assuntos ela costuma pesquisar no Google;
  • Etc.

Dados sociais são muito utilizados para campanhas de marketing, com o objetivo de fazer ofertas personalizadas de produtos ou serviços.

Dados empresariais (Enterprise Data)

Referem-se aos diferentes dados que as empresas geram (da área financeira, da área de operações, do RH, etc.).

Dados empresariais são importantes para processos internos da empresa, como medição dos índices de produtividade e de eficiência dos processos.

Dados pessoais (Personal Data)

Os dados pessoais são obtidos a partir de aparelhos como smartphones, geladeiras, televisores, carros, etc.

Estão muito associados à Internet das Coisas e mostram as preferências pessoais de uma pessoa.

Fontes de dados para Big Data

Além das próprias bases de dados dos sistemas da empresa, outras fontes podem fornecer subsídios igualmente importantes para Big Data.

Seguem alguns exemplos de fontes que podem enriquecer o Big Data para a empresa:

  • E-mails: seja no corpo da mensagem, seja em arquivos anexos, os e-mails há muito tempo constituem uma espécie de documentação do andamento das atividades em uma empresa, ainda que de modo informal.
  • Mídias sociais: cada vez mais, o que as pessoas comentam nas mídias sociais pode ser tomado como uma expressão do próprio mercado. Pode representar um feedback de valor inestimável para a empresa.
  • Open Data: diversas iniciativas governamentais, em todo o mundo, estão colocando à disposição do público em geral dados sobre finanças, saúde, mercado e outros, constituindo uma importante referência para o planejamento estratégico.
  • Ferramentas da web: algumas ferramentas como o Google Analytics, por exemplo, fazem um intenso monitoramento da internet, oferecendo uma visão privilegiada de como ela vem sendo utilizada.
  • Planilhas eletrônicas: em muitas empresas, planilhas eletrônicas formam um universo à parte de dados. Em alguns casos, elas complementam os dados existentes em sistemas; em outros, chegam mesmo a substituir sistemas.

A análise de dados

Entendido o que é Big Data, é preciso avançar na compreensão de como trabalhar com esse grande volume de dados.

Tão importante quanto coletar dados é submetê-los a análises, de onde surgirão os insights para direcionar as estratégias das empresas.

A análise consiste em inspecionar os dados, elaborar hipóteses  e realizar testes para se chegar a uma melhor compreensão dos padrões que caracterizam um fenômeno ou um cenário.

Em última instância, a análise de dados procura encontrar padrões de comportamento, que passam a ser monitorados.

Hoje, há pessoas especializadas nesse tipo de análise, como os cientistas de dados, os analistas de dados e outros.

O que é Big Data Analytics?

Big Data Analytics refere-se à utilização de softwares com poder de processamento para a análise de grandes volumes de dados.

Esse poder de processamento se aplica não só aos dados estruturados, mas principalmente aos não estruturados, que, em teoria só poderiam ser diretamente tratados por humanos.

Assim, o Big Data Analytics permite extrair, organizar, cruzar e tratar dados estruturados e não estruturados, transformando-os em uma importante informação para a tomada de decisões estratégicas.

Com o Big Data Analytics, torna-se possível:

  • Identificar perfis de consumidores.
  • Definir padrões bastante precisos de comportamento e hábitos de consumo.
  • Analisar as ações de empresas concorrentes.
  • Identificar desenvolvimentos necessários para ajustar os produtos às necessidades do mercado.
  • Monitorar as próprias ações de marketing da empresa, identificando aquelas que estão alcançando melhores resultados.
  • Identificar a movimentação de clientes insatisfeitos, prestes a abandonar o relacionamento com a empresa (churn).

Como resultado, são obtidos insights que podem levar a empresa a novas soluções para suas estratégias de mercado.

Exemplos de insights

Alguns exemplos ajudam a esclarecer o que é Big Data Analytics e o que ele pode oferecer às empresas.

Medidas para a redução das taxas de churn

Analisando queixas de clientes nos sites de reclamação e mesmo nas mídias sociais, a empresa consegue se antecipar à ação do cliente, oferecendo formas de demovê-lo da ideia de encerrar seu relacionamento.

Personalização de serviços / produtos

A identificação do padrão de comportamento do cliente torna possível oferecer a ele produtos ou serviços mais adequados às suas preferências. Isso pode até mesmo representar uma elevação no ticket médio desse cliente.

Além disso, abre-se a possibilidade de incrementar programas de fidelidade, tornando-os mais próximos do dia a dia do cliente.

Adequação da comunicação com o cliente

A análise do comportamento do cliente também permite identificar quais são seus canais de comunicação preferidos quando o assunto é relação de consumo.

Assim, isso pode representar uma grande racionalização das estratégias de divulgação da empresa, com resultados muito mais objetivos.

Melhor retorno sobre o investimento em marketing

O monitoramento constante das ações de marketing permite corrigir rapidamente aquelas que, ou não geraram os resultados esperados, ou geraram até mesmo resultados contrários.

Antecipação de tendências e eventos

Ao monitorar as ações dos clientes, torna-se possível também identificar comportamentos não usuais.

Um exemplo clássico foi a identificação de uma epidemia de gripe em uma região dos Estados Unidos pelo simples fato de que, entre a população local, aumentou de forma significativa a procura no Google por sintomas, remédios e tratamentos para a gripe.

Combate a atividades ilícitas

No âmbito da Justiça, o cruzamento de dados propiciado pelo Big Data Analytics tem permitido rastrear crimes de corrupção e de lavagem de dinheiro, por exemplo.

Implantação de cidades inteligentes

Para o setor público, o Big Data torna possível o monitoramento, em tempo real, das muitas variáveis que interferem no dia a dia de uma cidade, como:

  • O consumo de energia, para evitar uma sobrecarga;
  • A sincronização inteligente de semáforos, para fazer fluir melhor o trânsito;
  • Os índices de poluição sonora e do ar;
  • Etc.

Só para exemplificar, a cidade de Barcelona na Espanha, já adotou esse programa.

Big Data na prática

O que é Big Data na prática? Há muitas formas de se trabalhar com ele. Veja a seguir alguns exemplos.

  • A rede de varejo Walmart coleta alguns petabytes de dados por dia, o que lhe permite manter um controle bastante preciso de seus níveis de estoque. Um petabyte corresponde a um milhão de gigabytes.
  • A loja de departamentos Macy’s solucionou a dificuldade de gerenciar seu inventário de 70 milhões de itens utilizando ferramentas de Big Data Analytics.
  • A Nissan tem monitorado as queixas de seus clientes, procurando se antecipar na resolução de falhas relatadas em seus produtos.
  • A NFL, liga profissional de futebol americano, equipou os uniformes dos jogadores de todas as equipes com sensores que coletam uma grande variedade de dados durante os jogos. Esses dados são utilizados pelos próprios atletas, pelas comissões técnicas das equipes, pelos torcedores e também pelo público das apostas esportivas.
  • A Amazon está desenvolvendo uma ferramenta de análise preditiva que permitirá a ela fornecer reposição de produtos de consumo recorrente sem que o cliente precise fazer a solicitação.
  • A Starbucks tem utilizado Big Data Analytics para mapear os locais mais adequados para a abertura de novas lojas.
  • Netflix, Spotify, Facebook e Instagram têm estabelecido uma comunicação mais personalizada com seus clientes a partir do Big Data Analytics.

SAP e Big Data

A SAP, empresa líder em softwares de gestão empresarial, tem em seu portfólio algumas soluções para Big Data.

O SAP Cloud Platform oferece Big Data como um serviço, possibilitando a seus clientes o armazenamento de grandes volumes de dados, estruturados ou não, para análise a partir de suas ferramentas preferidas.

O serviço permite uma integração com o SAP HANA, enriquecendo o seu data warehouse. Esse tipo de integração permite às empresas implementar alguns fluxos de dados como:

  • Coletar, armazenar e processar novas fontes de big data como a Internet das Coisas (IoT).
  • Executar tarefas de extração, transformação e carga (ETL) para analisar, enriquecer e agregar dados que poderão ser integrados ao data warehouse do SAP HANA.
  • Gerenciar dados, movendo aqueles usados ​​com menos frequência no data warehouse para o repositório de big data (data lake).

Utilizando o repositório Big Data

O uso do repositório de Big Data (data lake) é uma forma de eliminar silos de dados e desvendar valor dos dados, consolidando-os de forma centralizada.

Entretanto, é preciso assegurar que esse repositório seja constituído por dados consistentes e confiáveis.

A SAP oferece o SAP Data Hub, uma ferramenta integrada ao Big Data Services que permite organizar e catalogar fluxos de dados para vários cenários de integração em um ambiente distribuído.

Conclusão

As principais barreiras tecnológicas que dificultavam a constituição do Big Data estão superadas. Big Data é hoje uma realidade e muitas empresas já estão utilizando-o plenamente.

Assim, para as empresas que pretendem manter sua competitividade no mercado, torna-se obrigatório compreender o que é Big Data e o que é Big Data Analytics, identificando as oportunidades que essas ferramentas trazem para seus negócios.

O que é Big Data e para que ele é utilizado?
5 (100%) 3 votos