Mais um topico que eu reposto do Forum:
Em meus tempos de folga, enquanto nao jogava, estava pensando em como usar a estatistica e a ciencia da computacao para conseguir mais informacoes sobre os nossos queridos joguinhos. Foi entao que descobri no BoardGameGeek ferramentas para obter os dados dos varios jogos que eles tem cadastrados. O banco de dados do BoardGameGeek é uma fonte de informacoes ainda pouco explorada e eu pensei em usar algoritmos de data mining e ferramentas estatisticas para extrair essas informacoes “escondidas”. Espero poder fazer o mesmo com o Ludopedia no futuro 
Nesse meu primeiro estudo de teste, eu fiz a seguinte pergunta:
O que tem de especial nos jogos que estao no topo do ranking do BBG?
Para tenter responder essa pergunta analisei dados de jogos do BoardGameGeek usando uma classificacao supervisionada (arvore de decisao).
Observacao: Os dados nao sao conclusivos e o metodo utilizado tem algumas falhas, que vou tentar corrigir no futuro.
Os Dados:
Eu selecionei os 200 melhores jogos de tabuleiro no ranking do bgg (vou chamar de HG) ,como tambem os que estao entre as posicoes 1000 e 1400 (vou chamar de LG). Os dados foram extraidos no dia 21 de janeiro de 2016.
As caracteristicas utilizadas para analise foram:
- Mecanica
- Subdominio
- Ano de publicacao
- Categoria
- Tempo minimo e maximo de jogo
- Familia
- Numero minimo e maximo de jogadores
- Artista
- Design
Os Resultados:
O classificador teve uma porcentagem de mais de 80% verdadeiros positivos para os LG e apenas 50% para os HG. Indicando que é mais facil dizer que um jogo será mal avaliado do que dizer que um jogo será bem avaliado. O resultado da classificacao vem em forma de uma arvore de decisão, nenhuma categoria se mostrou altamente preditiva por si. Geralmente a combinacao de varias caracteristicas que torna a predição possível.

A maioria das caracteristicas mais importantes parecem bastante obvias se você for um jogador experiente:
- Estrategia. Esse é o fator mais importante, o mais alto na arvore de decisão. Se voce for um jogo fora dessa categoria é bem provavel que voce nao seja bem qualificado. Essa regra so eh quebrada para jogos anteriores a 2009. Ou seja, jogos anteriores a 2009, mesmo de estrategia, não serão bons o suficientes para estarem no top.
- Tempo maximo de jogo. Durar menos de 70 min nao é um bom sinal.
- Family games. Eles nao estao no topo, e isso é meio obvio. Jogos para familia tambem sao menos estrategicos e duram menos, contribuindo para os fatores anteriores.
- Tableau Building. Uma categoria bastante representada nos top 200 HG
- Card Drafting, Worker Placement, Variable Player Powers e Hand Management. Sao mecanicas bem menos representados nos LG. Na arvore de decisao os jogos Kickstarter fogem desse padrao. Pretendo fazer um estudo no futuro avaliando essas diferencas.
- Periodo Colonial Europeu. Esse tema esta muito presente nos HG
- Arte. A arte parece ser muito importante muito importante, dois artistas apareceram na arvore de decisao favorecendo HG: Henning Ludvigsen e Dennis Lohausen.

Grafico de distribuicao do tempo maximo de jogo. Em vermelho LG e em azul HG.
Se voce gosta desse tipo de analise, vai gostar tambem do blog chamado Ludometrica, eles fizeram algo parecido, mas com apenas mecanicas. As analises sao bem mais detalhadas e as tabelas e graficos sao profissionais. Ele chegou a conclusoes semelhantes, por exemplo Worker Placement, Card Drafting, Cooperative Play e Variable Player Powers estao como determinantes de HG. Ele tambem encontrou como surpresas as mecanicas Grid Movement e Player Elimination entre os Jogos TOP.
Se quiser saber mais detalhes voce pode conferir no post original no meu blog:
MeepleZone
E no post do blog
LudoMetrica
Se voce tiver alguma ideia ou sugestao (que queira compartilhar) deixe seu recado.