MATURIDADE

Dados: em escala de um a cinco, Brasil está no meio do caminho

Empresas atravessam fases de curiosidade e teste antes de avançar na governança.

26 de março de 2024 - 17:26
Pedro Bocchese em entrevista ao Baguete. Foto: divulgação.

Pedro Bocchese em entrevista ao Baguete. Foto: divulgação.

As organizações brasileiras estão, de forma geral, no meio do caminho para chegar a um futuro orientado por dados (data driven, como diz o jargão).

É o que acredita Pedro Bocchese, head de inovação e tecnologia das Empresas Processor, que falou sobre o tema durante o South Summit, evento global realizado em Porto Alegre na última semana.

Bocchese explica que existem basicamente cinco níveis de maturidade em relação à governança de dados e, no Brasil, observa-se um movimento entre os números dois e três dessa escala.

O primeiro nível, já superado por muitas organizações, está relacionado ao processo de negação, com a crença de que pequenos relatórios já adiantam para a tomada de decisão. 

Em seguida, há a fase de curiosidade, onde a companhia começa a trazer alguns aspectos de implementação, inclusive utilizando ferramentas de Business Intelligence (BI) como Power BI, Tableau e QlikView.

“Isso se desdobra quando elas começam a testar os seus dados e, a partir desses testes, a evolução está muito relacionada a começar a justificar as decisões com base neles. Então chegamos a empresas, pessoas e processos orientados a dados”, explica Bocchese.

Bruno Rocha da Silva, gerente corporativo de digital e inovação da Equatorial Energia, avalia que o setor de utilities (corporativês para serviços de utilidade pública) está justamente entre os níveis de curiosidade e teste.

“A gente vê de tudo um pouco no setor. Algumas empresas estão buscando ferramentas novas, mas utilizam os mesmos processos de 20, 30 anos atrás. Outras estão investindo em programas mais robustos. Vejo também muitas tentando implementar aceleradamente uma estratégia de inteligência artificial sem pensar na estrutura básica de dados”, comenta Silva.

Para o executivo, essas organizações que não dão a devida atenção à engenharia de dados e querem ir direto ao machine learning vão, inevitavelmente, falhar.

“Você tem que ter uma base, uma governança de dados, criar um catálogo, uma estrutura. Sem essa preparação, o cientista de dados não consegue gerar valor. Algumas empresas estão apostando na IA generativa como solução de todos os problemas, mas sem contexto ela não serve para nada”, alerta Silva.

Bocchese ressalta que, para ter um controle do fluxo de dados, uma das questões mais relevantes é pensar em arquiteturas que dêem sustentação a isso.

Segundo o head, uma prática muito adotada hoje nas organizações é o Delta Lake, que consiste em três camadas dentro do armazenamento de dados: bronze (dados brutos), prata (dados limpos, estruturados e normalizados) e ouro (onde está o data warehouse).

“Isso significa que nós temos três camadas para garantir que, lá na ferramenta de BI, o usuário final tem acesso somente àquele registro através de um dashboard, de uma forma muito mais rápida, sem aquele modelo que nós costumamos ver de passar lotes. A gente já fala em streaming de dados, dados em tempo real”, explica Bocchese.

Outro ponto levantado pelo executivo da Processor é que as organizações já estão enxergando que podem apostar na monetização de dados a partir do seu enriquecimento, tratamento, higienização, anonimização e consolidação.

“Na perspectiva de fornecedor, nós aplicamos algumas técnicas de anonimização ou despersonalização de dados. Isso é tão relevante porque várias ferramentas hoje já estão disponibilizando bases de dados para que sejam consumidas por outras empresas”, destaca Bocchese.

O South Summit é um evento criado em Madrid, em 2012, que escolheu o Brasil para estrear fora da Espanha. A primeira edição aconteceu em Porto Alegre em maio de 2022. Com o sucesso, vieram as sequências em 2023 e 2024.

Neste ano, a edição contou com a presença de 140 fundos de investimento, 900 investidores, 3 mil startups e 800 palestrantes. Em sete palcos com 10 trilhas de conteúdo, a programação simultânea aconteceu entre os dias 20 e 22 de março.

O público foi de 23,5 mil pessoas, 1,5 mil a mais do que em 2023. A próxima edição já está confirmada para os dias 9, 10 e 11 de abril de 2025.

*A cobertura do Baguete no South Summit tem o apoio das Empresas Processor.