Futebol é momento. Futebol não tem lógica. Mesmo assim, o futebol ama as estatísticas. Normalmente, elas ajudam a explicar o andamento de uma partida. Nem sempre, o seu resultado. Há sempre um fator externo que pode desequilibrar: o brilho do craque, do fora de série, uma falha… O imponderável é o melhor amigo do futebol. E, nesta Copa, derrubou todos os estatísticos que previram a vitória do Brasil e, em alguns casos, a medida que o torneio caminhava, a vitória da Argentina.
O primeiro a acusar o golpe foi Nate Silver, famoso por ter acertado os resultados da eleição de Obama em 50 estados americanos. No Twitter, durante a goleada histórica de 7 a 1 sofrida pelo Brasil, o matemático lamentou com um lacônico, mas expressivo, OMG (acrônimo de “Ah, meu Deus”, por inglês). Em seu site FiveThirtyEight.com, Nate havia previsto, ainda em junho, que o Brasil tinha 44% de chances de ser campeão. Ato contínuo, revendo as contas, publicou uma análise dando ao Brasil 71% de chances de levar a medalha de terceiro lugar. Errou feio e viu seu prestígio ser abalado.
Em reportagens na imprensa internacional, especialistas em Big Data culparam a metodologia usada por Silver, que descarta dados não estatísticos na análise. O que teria derrubado também os analistas da Goldman Sachs, que também previram o Brasil campeão. E até mesmo os estatísticos da Universidade Federal de São Carlos (UFSCar) e do Instituto de Ciências Matemáticas e de Computação (ICMC), da USP, que começaram apontando o Brasil campeão e, a partir das oitavas, já usando dados do torneio, passaram a apostar na Argentina. Quase deu…
De acordo com o Wall Street Journal, os economistas do Goldman Sachs compilaram dados de 14 mil jogos para chegar a um relatório de 67 páginas que calculou os resultados de todos os jogos, publicado em 30 de maio. Depois da primeira fase da Copa, mudaram metade dos times, uma vez que a realidade já não correspondia totalmente aos dados históricos.
Analisando as previsões originais, feitas antes do início da Copa, apenas 37,6% dos jogos da primeira fase terminaram da forma que o modelo do Goldman Sachs previu. Quando o banco atualizou suas previsões no fim da primeira fase do torneio, acertou o resultado das partidas — vitória, derrota ou empate — em 60% das vezes. Mas fracassou na tentativa de acertar os resultados das semifinais e acabou prevendo as equipes erradas na final.
As amostras usadas eram enviesadas? Os dados eram viciados? Como explicar as falhas?
As respostas podem estar em dois alertas que os especialistas vêm fazendo, seguidamente, a respeito do Big Data. O primeiro: a maioria das análises está trabalhando com dados imprecisos e desatualizados. É preciso saber que informações usar. Além disso, é preciso saber fazer as perguntas certas e adequar os modelos matemáticos e de análise a elas.
A abordagem de análise de dados mo Big Data é um pouco diferente da proposta pelo BI tradicional, mais focado em estatísticas e dados estruturados, que olha mais o passado histórico baseado em fatos que aconteceram para a tomada de decisão. A do vantagem de analisar fatos no momento em que estão ocorrendo para antecipar medidas.
Por isso, para os profissionais envolvidos com Big Data o grande desafio é a modelagem dos dados. Em meio a uma montanha...
de dados, esses profissionais devem localizar padrões e identificar insights. O que, em tese, os tornaris diferentes dos estatísticos. “Um estatístico não manipula dados. Ele os recebe em um arquivo e geralmente não participa do caminho anterior”, explicou Pedro Desouza, cientista de dados da EMC, para um reportagem publicada pela revista COMPUTERWORLD.
“Se começarmos com um propósito, avaliarmos a questão central que procuramos responder, pensarmos sobre os dados corretos que são necessários, e em seguida, trabalharmos o nosso caminho até o funil de modelos e fontes necessárias, há uma boa chance de que possamos limitar nosso espaço de busca e podar as fontes que não sejam relevantes para o problema em questão”, afirma Allen Bonde, analista do Digital Clarity Group e assessor do Art+Science Partners, à CIO.com.
Além disso, observação e intuição precisam ser cultivadas como qualidades e habilidades indispensáveis ao profissional de Big Data. O velho e bom “gut feeling” precisa ser um aliado das estatísticas.
“É uma coisa complicada, diz Peter Swabey, editor sênior de tecnologia da Economist Intelligence Unit (EIU), divisão de pesquisa e análise do The Economist Group. “Ambas têm um papel no contexto”, diz Swabey. “Juntar dados é o processo de tentar identificar qual é a informação verdadeira. E nessa etapa de identificação, sua intuição é um guia muito útil”.
Moral da história: em vez de ser encarada como uma fraqueza que precisa ser evitada, a intuição deveria ser vista como uma habilidade apropriada em determinados momentos.
Big Data: o bom exemplo
Mais do que as estatísticas e os muitos exercícios de visualização de dados gerados à exaustão nessa Copa, a grande demonstração de uso correto de Big Data veio da seleção alemã, que partiu de uma premissa básica: para serem valiosos, seus dados têm de ser facilmente aplicados aos problemas do dia a dia.
Além disso, o time alemão se concentrou no chamado “small data” para melhorar a velocidade e a eficiência das análises. “Não queremos uma enciclopédia de dados, queremos ver os dados de forma simples em tempo real”, afirmou Oliver Bierhoff, atual gerente da seleção alemã à Folha de São Paulo.
Por isso, a Alemanha escolheu analisar dados de treinamentos e jogos, sobrepostos, para melhorar o desempenho do time.
Os alemães gravam e avaliam situações de jogo e treinos. Depois, analisam erros e acertos de cada jogador, em função da tática que deveria ter sido aplicada, e apontam os cada membro da equipe precisa corrigir e melhorar.
A solução SAP Match Insights, resultado de um projeto de co-inovação entre a SAP e a DFB, permite que os técnicos e a comissão processem um volume enorme de dados para buscar e avaliar situações importantes em cada jogo visando melhorar o desempenho de cada jogador e da equipe como um todo.
Em vez de serem obrigados a assistir demoradas sessões de vídeo, os jogadores recebem clipes curtos de suas participações em jogos e treinos, comentados pela equipe técnica.
Isso foca a equipe no momento individual e coletivo. E futebol é momento! Especialmente em uma Copa do Mundo. Foi o que considerou a Microsoft, para alimentar as previsões feitas pelo assisntente digital Cortana. A ferramenta usou apenas dados e estatísticas sobre o desempenho das seleções em cada jogo da Copa. As previsões começaram nas oitavas. Os resultados? Apenas um erro: o vencedor da disputa de terceiro lugar entra Brasil e Holanda.
Estatísticas históricas servem apenas para acirrar a competição. Alimentar a fome de quebra de recordes. A luta para manter a primazia. O que, no nosso caso, infelizmente, não funcionou.
Fonte:Circuito De Luca
