Esta dissertação apresenta a mineração de três textos sobre o tema Nutrigenômica, cujo objetivo consistiu em confrontar os resultados referentes aos agrupamentos criados pelos métodos não-hierárquicos fuzzy em Mineração de Textos. O uso de algoritmos na Mineração de Texto otimiza a busca em função das palavras-chave geradas por eles. Primeiramente, os textos foram coletados de sites sobre o tema proposto, e em seguida passaram por um processo de limpeza e tratamento, conhecido como pré-processamento. Após esta etapa, foram aplicados os algoritmos de agrupamento fuzzy C-Means e fuzzy C-Medoids onde se observou que, apesar de a quantidade de grupos ter sido previamente definida através da visualização gráfica da correlação de postos de Spearman, o fuzzy C-Means constituiu menos agrupamentos que o pré-fixado, enquanto que o fuzzy C-Medoids fez o proposto. No entanto, em ambos os métodos houve a sobreposição de agrupamentos, isto é, interseção entre dois ou mais grupos, característica em métodos fuzzy A validação dos resultados via Análise Discriminante, apesar das taxas apresentarem valores próximos, o fuzzy C-Medoids mostrou-se mais eficiente na classificação dos grupos, pois sua taxa de acurácia foi de 94% contra 90% do fuzzy C-Means, logo, conseguiu agrupar com mais eficiência termos que possuem características em comum em um mesmo grupo. A meta da criação de palavras-chaves que contribuirão para a busca da informação segundo a tipologia da Nutrigenômica e Nutrigenética foi atingida, o que retratou diferenças intuitivas e conceituais, aspectos considerados relevantes em estudos sistemáticos para definir diferentes categorias.
This dissertation presents the mining of three texts under Nutrigenomics theme, whose objective was to compare the results related to the grouping created by fuzzy non-hierarchical methods in Text Mining. The use of text mining algorithms optmizes the search in accordance with keywords to conceive by them. First of all, the texts were collected from websites about the proposed theme and afterwards them passed for a process of cleaning and treatment a known as pre-processing. After this step, the fuzzy C-Means and fuzzy C-Medoids clustering algorithms, were applied where was observed that despite the number of groups have been defined previously through of the graphical visualization Sperman s Correlation Rank, the fuzzy C-Means constituted fewer clusters than the pre-fixed, while the fuzzy C-Medoids did the suggested. However, in both methods there were clustering overlapping, that is, instersection between two or more groups, fuzzy methods characteristics. In the results validation through Discriminant Analysis, despite of the rates have similar values, the fuzzy C-Medoids was more efficient in classifying groups because its accuracy rate was 94% cons 90% of fuzzy C-Means, so it was get more efficiently group terms that have common characteristics. The goal of the creating keywords that will contribute for the search of the information according the typology of Nutrigenomics and Nutrigenetics was attain what showed intuitive and conceitual differences, considered relevants aspects in systematic studies to define different categories.