PubRunner: um quadro leve para atualizar resultados de mineração de texto.
Abstrato
A mineração de texto biomédico promete ajudar os biólogos a navegar rapidamente o conhecimento combinado em seus domínios. Isso permitiria uma melhor compreensão das interações complexas nos sistemas biológicos e geração de hipóteses mais rápida. Novos artigos de pesquisa biomédica são publicados diariamente e as ferramentas de mineração de texto são tão boas quanto o corpus do qual trabalham. Muitas ferramentas de mineração de texto estão subutilizadas porque seus resultados são estáticos e não refletem o conhecimento em constante expansão no campo. Para que a mineração de texto biomédico se torne uma ferramenta indispensável usada pelos pesquisadores, esse problema deve ser abordado. Para este fim, apresentamos o PubRunner, uma estrutura para a execução regular de ferramentas de mineração de texto nas publicações mais recentes. O PubRunner é leve, simples de usar e pode ser integrado a uma ferramenta de mineração de texto existente. O fluxo de trabalho envolve o download dos resúmenes mais recentes do PubMed, executando uma ferramenta definida pelo usuário, empurrando os dados resultantes para um conjunto de dados público FTP ou Zenodo e divulgando a localização desses resultados no site público PubRunner. Nós ilustramos o uso desta ferramenta re-executando a ferramenta comummente utilizada de word2vec nos resumos PubMed mais recentes para gerar representações de vetores de palavras atualizadas para o domínio biomédico. Isso mostra uma prova de conceito que esperamos que encoraje os desenvolvedores de mineração de texto a criar ferramentas que realmente ajudarão os biólogos a explorar as últimas publicações.
Contact Information:
Anekalla KR, Courneya JP, Fiorini N, Lever J, Muchow M, Busby B
Tags:
, Wire, Artificial Intelligence Newswire, United States, Portuguese
Keywords: afds, afdsafds