Este trabalho apresenta o desenvolvimento de um conjunto de métodos baseados na teoria de Hodge combinatória, chamado HodgeRank, cujo objetivo principal a criação de um ranking estatístico. Os métodos de HodgeRank são aplicáveis a conjuntos de dados incompletos e desbalanceados, características comuns dos conjuntos de dados modernos, para os quais algoritmos tradicionais de ranqueamento são geralmente ineficazes. Dado um conjunto de eleitores, um conjunto de alternativas elegíveis e um conjunto de avaliações conectando os dois, é possível utilizar técnicas de comparação em pares para tornar o conjunto de dados menos incompleto, através da construção de uma estrutura de grafo que surge naturalmente. O problema a ser resolvido pode ser tratado através da solução de um sistema linear, que lida com um fluxo nas arestas do grafo de comparação em pares. Os métodos de HodgeRank, além de providenciarem um ranking global, geram também um "certificado de confiabilidade", ou seja, uma forma de validar o ranking através da determinação de suas inconsistências. A partir dos dados referentes a 26 anos do Campeonato Brasileiro de Futebol Série A, foram criados e analisados rankings dos 50 clubes que passaram pela Série A desde 1988. Foram obtidos rankings aceitáveis de acordo com o desempenho dos clubes no período analisado, sendo possível definir os melhores clubes.
This work presents the development of a set of methods based on combinatorial Hodge theory, HodgeRank, whose main objective is to create a statistical ranking. Hodge- Rank methods can be applied to incomplete and imbalanced data sets that are commom characteristics of modern data sets, where traditional ranking algorithms are usually ineffective. Given a set of voters, a set of eligle alternatives and a set of ratings connecting them, it is possible to use pairwise comparison techniques to make the data set less incomplete, by endowing it with a graph structure that comes up naturally. The problem to be solved can be treated using the solution of a linear system, related to an edge ow on a pairwise comparison graph. Besides providing a global ranking, the HodgeRank methods also generate a "reliability certificate". In other words, it provides a tool to validate the ranking and to analyse its inconsistencies. Using data from 26 years of the first division of the Brazilian Soccer Championship, rankings, of the 50 clubs that competed in the first division since 1988, were created and analyzed. Acceptable rankings were obtained according to the performance of clubs in the analyzed period, and was possible set the best clubs.