Uma equipa de investigadores do Massachusetts Institute of Technology (MIT) desenvolveu um sistema à base de Inteligência Artificial para ajudar linguistas a decifrar textos antigos.
De acordo com o CNET, investigadores do Laboratório de Ciências da Computação e Inteligência Artificial do MIT (CSAIL) estão a trabalhar para dar uma nova vida às “línguas mortas”, com a ajuda da Inteligência Artificial. O novo sistema é capaz de decifrar automaticamente línguas perdidas sem a necessidade de conhecimento avançado.
O estudo, liderado pela professora Regina Barzilay, baseia-se em perceções da linguística histórica, como o facto de as línguas só evoluírem de maneiras previsíveis.
Um determinado idioma raramente adiciona ou exclui totalmente um som. Em vez disso, é provável que ocorram substituições de som: a letra “p” pode mudar para um “b” em algumas palavras ao longo do tempo, por exemplo.
Juntamente com o seu aluno de doutoramento Jiaming Luo, Barzilay desenvolveu um algoritmo, à base de machine learning, que regista padrões de mudança de linguagem. O sistema pode, desta forma, segmentar palavras num idioma antigo e mapeá-las num idioma relacionado.
Segundo o comunicado do MIT, este projeto baseia-se num artigo, escrito no ano passado, que descrevia um programa, criado pelos investigadores, que decifrou as línguas mortas do ugarítico e do Linear B.
Muitos idiomas são considerados perdidos por não haver conhecimento suficiente sobre a sua gramática, vocabulário ou sintaxe. Este novo algoritmo consegue, até, avaliar a proximidade entre as duas línguas e, quando é testado em idiomas conhecidos, o sistema pode também identificar famílias de idiomas.
No futuro, a equipa quer expandir o seu trabalho para identificar o significado semântico das palavras, mesmo que ainda não sejam legíveis. Em última análise, os investigadores esperam ser capazes de “ressuscitar” línguas perdidas usando apenas alguns milhares de palavras.