O novo modelo de IA da DeepMind ajuda a decifrar; datar e localizar inscrições antigas

As técnicas de aprendizado de máquina estão fornecendo novas ferramentas que podem ajudar os arqueólogos a entender o passado – principalmente quando se trata de decifrar textos antigos. O exemplo mais recente é um modelo de IA criado pela DeepMind, subsidiária da Alphabet, que ajuda não apenas a restaurar o texto que está faltando nas antigas inscrições gregas, mas também oferece sugestões de quando o texto foi escrito (dentro de um período de 30 anos) e suas possíveis origens geográficas.

“As inscrições são realmente importantes porque são fontes diretas de evidência… escritas diretamente pelos próprios povos antigos”, disse Thea Sommerschield, historiadora e especialista em aprendizado de máquina que ajudou a criar o modelo, a jornalistas em uma coletiva de imprensa.

“É REALMENTE DIFÍCIL PARA UM HUMANO APROVEITAR TODOS OS DADOS EXISTENTES E RELEVANTES”

Devido à sua idade, esses textos são frequentemente danificados, tornando a restauração um desafio gratificante. E porque eles são frequentemente inscritos em material inorgânico como pedra ou metal, isso significa que métodos como a datação por radiocarbono não podem ser usados ​​para descobrir quando foram escritos. “Para resolver essas tarefas, os epígrafos procuram paralelos textuais e contextuais em inscrições semelhantes”, disse Sommerschield, que co-liderou o trabalho ao lado do cientista de pesquisa da DeepMind, Yannis Assael. “No entanto, é realmente difícil para um humano aproveitar todos os dados existentes e relevantes e descobrir padrões subjacentes.”

É aí que o aprendizado de máquina pode ajudar.

As inscrições gregas antigas são muitas vezes fragmentadas. O software Ithaca pode sugerir quais letras estão faltando. Imagem: Deep Mind

As inscrições gregas antigas são muitas vezes fragmentadas. O software Ithaca pode sugerir quais letras estão faltando. Imagem: Deep Mind

O novo software, chamado Ithaca, é treinado em um conjunto de dados de cerca de 78.608 inscrições gregas antigas, cada uma delas rotulada com metadados que descrevem onde e quando foi escrita (até onde os historiadores sabem). Como todos os sistemas de aprendizado de máquina, o Ithaca procura padrões nessas informações, codificando essas informações em modelos matemáticos complexos e usa essas inferências para sugerir texto, data e origens.

Em um artigo publicado na Nature que descreve Ithaca, os cientistas que criaram o modelo dizem que ele é 62% preciso ao restaurar letras em textos danificados. Ele pode atribuir as origens geográficas de uma inscrição a uma das 84 regiões do mundo antigo com 71% de precisão e pode datar um texto em, em média, 30 anos de seu ano conhecido de escrita.

Estas são estatísticas promissoras, mas é importante lembrar que Ithaca não é capaz de operar independentemente da experiência humana. Suas sugestões são baseadas em dados coletados por métodos arqueológicos tradicionais, e seus criadores o estão posicionando como simplesmente mais uma ferramenta em um conjunto mais amplo de métodos forenses, em vez de um historiador de IA totalmente automatizado. “O Ithaca foi projetado como uma ferramenta complementar para auxiliar os historiadores”, disse Sommerschield.

Ítaca é o primeiro modelo de atribuição geográfica e cronológica com restauração textual. Imagem: Deep Mind

Ítaca é o primeiro modelo de atribuição geográfica e cronológica com restauração textual. Imagem: Deep Mind

Eleanor Dickey, professora de clássicos da Universidade de Reading, especializada em sociolinguistas gregos e latinos antigos, disse ao The Verge que Ítaca foi um “desenvolvimento emocionante que pode melhorar nosso conhecimento do mundo antigo”. Mas, ela acrescentou que uma precisão de 62 por cento para restaurar o texto perdido não era tranquilizadoramente alta – “quando as pessoas confiam nele, elas precisam ter em mente que está errado cerca de um terço das vezes” – e que ela não tinha certeza de como o software se encaixaria nas metodologias acadêmicas existentes.

Por exemplo, a DeepMind destacou testes que mostraram que o modelo ajudou a melhorar a precisão dos historiadores que restauram o texto ausente em inscrições antigas de 25% para 72%. Mas Dickey observa que aqueles que estavam sendo testados eram estudantes, não epígrafes profissionais. Ela diz que os modelos de IA podem ser amplamente acessíveis, mas isso não significa que eles possam ou devam substituir o pequeno quadro de acadêmicos especializados que decifram textos.

“Ainda não está claro até que ponto o uso dessa ferramenta por editores genuinamente qualificados resultaria em uma melhoria nas edições geralmente disponíveis – mas será interessante descobrir”, disse Dickey. Ela acrescentou que estava procurando experimentar o modelo Ithaca por si mesma. O software, juntamente com seu código-fonte aberto, está disponível online para qualquer pessoa testar.

Ítaca e seu antecessor (chamado Pythia e lançado em 2019 ) já foram usados ​​para auxiliar debates arqueológicos recentes – inclusive ajudando a datar inscrições descobertas na Acrópole de Atenas. No entanto, o verdadeiro potencial do software ainda não foi visto.

Sommerschield enfatiza que o valor real de Ithaca pode estar em sua flexibilidade. Embora tenha sido treinado em inscrições gregas antigas, pode ser facilmente configurado para trabalhar com outros scripts antigos. “A arquitetura de Ítaca torna-a realmente aplicável a qualquer língua antiga, não apenas latim, mas maia, cuneiforme; realmente qualquer meio escrito – papiros, manuscritos”, disse ela. “Há muitas oportunidades.”

Fonte: The Verge

Deixe seu comentário