Busca por similaridade em índice invertido utilizando o paradigma Map-Reduce
Resumo
Na área de Recuperação de Informação, é comum o uso de índices invertidos para realizar a busca por objetos. A consulta por similaridade pode ser uma estratégia poderosa, pois consegue recuperar objetos que poderiam não ser encontradas em buscas por equivalência. Porém, a quantidade de objetos e complexidade da busca podem tornar proibitivo o custo desse processamento. Esse trabalho explora a possibilidade de distribuição de processamento, através do modelo de programação Map-reduce, para o tipo de busca apresentado. O artigo propõe um mapeamento para consulta e faz uma comparação entre as abordagens distribuída e pseudo-distribuída.