banner
Centro de notícias
Proficiência excepcional em seu ofício.

Um humano

Apr 10, 2023

Scientific Reports volume 13, Número do artigo: 8699 (2023) Citar este artigo

903 acessos

1 Altmétrica

Detalhes das métricas

Este artigo ilustra os resultados obtidos usando modelos de aprendizado profundo de segmentação semântica pré-treinados para a detecção de sítios arqueológicos no ambiente de várzea da Mesopotâmia. Os modelos foram ajustados usando imagens de satélite disponíveis abertamente e formas vetoriais provenientes de um grande corpus de anotações (isto é, locais pesquisados). Um teste randomizado mostrou que o melhor modelo atinge uma precisão de detecção em torno de 80%. A integração da experiência de domínio foi crucial para definir como construir o conjunto de dados e como avaliar as previsões, pois definir se uma máscara proposta conta como uma previsão é muito subjetivo. Além disso, mesmo uma previsão imprecisa pode ser útil quando contextualizada e interpretada por um arqueólogo treinado. Partindo dessas considerações, fechamos o artigo com uma visão para um fluxo de trabalho de colaboração humano-IA. Começando com um conjunto de dados anotado que é refinado pelo especialista humano, obtemos um modelo cujas previsões podem ser combinadas para criar um mapa de calor, para serem sobrepostas em imagens de satélite e/ou aéreas ou, alternativamente, podem ser vetorizadas para fazer análises adicionais em um GIS software mais fácil e automático. Por sua vez, os arqueólogos podem analisar as previsões, organizar suas pesquisas no local e refinar o conjunto de dados com anotações novas e corrigidas.

Este artigo documenta os resultados de uma colaboração entre cientistas de dados e arqueólogos com o objetivo de criar um sistema de inteligência artificial (IA) capaz de auxiliar na tarefa de detectar possíveis sítios arqueológicos a partir de imagens aéreas ou, no nosso caso, de satélite. O uso de modelos de segmentação semântica nos permitiu traçar contornos precisos e a avaliação humana no loop mostrou que a precisão da detecção está em torno de 80%.

Este procedimento se enquadra no domínio do Sensoriamento Remoto (RS) que indica o ato de detectar e/ou monitorar um ponto de interesse à distância. No mundo da arqueologia, esta operação tornou-se inestimável com a disponibilidade de mais e melhores imagens de satélites que podem ser combinadas com fontes de informação mais antigas (por exemplo, as imagens de satélite CORONA) para localizar um maior número de sítios arqueológicos, bem como rastrear seus degradação sucessiva por fatores antrópicos1. Dependendo da área de investigação e do tamanho das feições arqueológicas que estão sendo levantadas, o esforço necessário, principalmente em termos de tempo, pode ser enorme para o pesquisador.

Essa colaboração visa resolver exatamente esse problema usando modelos de aprendizado profundo para simplificar, mas não automatizar completamente, o processo. Assim, a partir de um conjunto de dados de formas vetoriais para todos os sítios arqueologicamente registrados na planície de inundação do sul da Mesopotâmia (que representa uma região geomorfológica suficientemente coerente), treinamos um modelo para detectar e segmentar sítios em uma determinada imagem de entrada. À medida que o projeto avançava, surgiram várias questões que tornam este problema particularmente difícil de resolver e conduzem a uma importante reflexão sobre a utilização da aprendizagem profunda em geral e a sua relação com os especialistas humanos. O conjunto de dados, embora possa ser considerado muito grande para a arqueologia do Oriente Próximo com seus quase 5.000 sítios, dificilmente é suficiente para treinar um modelo tão grande quanto os de última geração que vemos em uso hoje e, talvez mais significativamente , contém muitos casos que são visíveis apenas em algumas imagens antigas. A primeira questão é comumente resolvida por meio da aprendizagem por transferência2. Esta técnica consiste em partir de um modelo, pré-treinado em um conjunto de dados grande e geral (por exemplo, imagenet3), e depois ajustá-lo em um conjunto de dados menor, mas mais específico, aproveitando as habilidades que aprendeu anteriormente para fazer a nova tarefa mais manejável. A segunda, no entanto, coloca em risco tanto o treinamento quanto a avaliação, pois o modelo é levado a fazer classificações erradas durante o treinamento e, mesmo que aprendesse representações robustas que ignoram exemplos ruins, teríamos dificuldade em detectar se é um erro. pelo modelo ou nas etiquetas.