A OLX conta com escritórios em São Paulo e no Rio de Janeiro. Foto: Renato Mangolin/Divulgação.

A OLX, portal de compra e venda online que recebe 500 mil novos anúncios por dia, conta com recursos de machine learning para aproveitar a alta quantidade de dados geradas pelos usuários e lançar melhorias customizadas.

No último ano, o portal registrou a geração de quase 1 petabyte de dados por dia nos dias de semana.

Por dia, a OLX insere aproximadamente 4 terabytes de dados no seu data lake (repositório central de informações). A quantidade equivale a 2 mil horas de filme, o que significaria passar 83 dias assistindo filmes por 24 horas.

O time de big data da empresa é responsável por coletar, armazenar e disponibilizar as informações para todas as áreas da OLX. A equipe é composta por 30 profissionais dos times de data engineering, data service & BI e data science. 

Juntamente com a unidade de produto, o time de cientistas de dados está desenvolvendo projetos com o uso do machine learning, por meio de métodos automáticos que incluem colocar máquinas para identificar padrões e analisar grandes quantidades de dados de uma só vez.

O primeiro projeto consiste em um serviço de identificação automática do que o usuário pretende inserir em um anúncio. A ideia é que o vendedor tire uma foto do produto e a plataforma consiga reconhecer e especificar o item automaticamente, além de indicar a categoria a qual ele faz parte.

A equipe trabalha com plataformas de código aberto como PyTorch (para treinar o modelo e fazer o reconhecimento de imagem) e Pandas e Jupyter (para descoberta, análise e preparação dos dados).

Desenvolvido em parceria com o time de Autos, o segundo projeto é um serviço de dados que dará uma estimativa de preço do veículo que o usuário está anunciando, com base nas informações que ele preencher no formulário de inserção.

Além da tabela FIPE, essa estimativa levará em consideração o histórico da OLX, que concentra 25% de todas as vendas de automóveis no Brasil.

Os dois novos produtos estão em fase de testes para, em seguida, serem lançados no mercado. A previsão é que as novidades cheguem nos canais da OLX até o fim de 2018.

Presente no país desde 2010, a empresa conta com escritórios em São Paulo e no Rio de Janeiro, que abrigam um time de quase 600 profissionais. A OLX Brasil é fruto de uma parceria entre os grupos de mídia e investimento em marketplaces Naspers (sul-africano) e Schibsted (norueguês).