DATA MINING IN ORGANIC GEOCHEMISTRY: CASE STUDY IN POTIGUAR BASIN
Mineração de dados na Geoquímica Orgânica: estudo de caso na Bacia Potiguar
DOI:
https://doi.org/10.5016/geociencias.v41i1.16161Resumo
A quantidade de dados provenientes de análises geoquímicas de amostras coletadas em poços de petróleo cresce simultaneamente ao investimento no setor de exploração e produção. Por outro lado, o tratamento e a interpretação desses resultados ainda é muito dependente de especialistas, e demanda tempo. Com a geração de extensas bases de dados, a mineração de dados se apresenta como uma boa alternativa para explorá-los por meio de métodos estatísticos e computacionais, proporcionando diferencial tecnológico e agilidade ao sistema. De forma experimental, com dados de 200 óleos da Bacia Potiguar, essas ferramentas foram implementadas, com a consequente sugestão de um fluxo de trabalho que, ao final, pôde retornar uma precisão razoável na previsão da classificação genética das amostras. Usando escalonamento multidimensional (MDS) e agrupamentos (dos tipos dendrograma e k-means) de 60 atributos iniciais, o conjunto ideal foi reduzido para 26. Aplicando aprendizado de máquinas, 92,50% de acurácia mediana foram obtidos no algoritmo de Árvore de Decisão, 95,00% na Floresta Aleatória e 87,50% em Rede Neural Artificial. Comparando a uma análise previamente apresentada na literatura pertinente, os benefícios em termos de eficiência podem ser percebidos com a adoção da metodologia aqui proposta.
Palavras-chave: Geoquímica Orgânica; Mineração de dados; Estatística multivariada; Fluxo de Trabalho.