segunda-feira, 8 de julho de 2019

Computação Ajudando a Decifrar a Língua da Civilização do Vale do Rio Indo de 4.000 Anos (Vídeo)




TED 2011 | Março 2011

Rajesh Rao é fascinado pela “mãe de todas as palavras cruzadas”: como decifrar a escrita de 4.000 anos do Indo (Vale do Rio Indus). Ele está empregando a computação moderna para tentar ler esta língua perdida, a chave para entender esta antiga civilização.

Este discurso foi apresentado em uma conferência oficial do TED e foi editada por nossos editores na página inicial. (Legendas em português e transcrição e links abaixo do vídeo)









Rajesh Rao · Neurocientista Computacional 

Rajesh Rao busca entender o cérebro humano através de modelagem computacional em duas frentes: desenvolver modelos de computação de nossas mentes e usando tecnologia para decifrar a escrita de 4.000 anos da civilização do Vale do Indo (Indus).




Translated by Isabel Villan
Reviewed by Fers Gruendling

Eu gostaria de começar com um exercício hipotético. Imagine que ele acontece 4.000 anos no futuro. A civilização como a conhecemos deixou de existir -- sem livros, sem aparelhos eletrônicos, sem Facebook ou Twiter. Todo conhecimento da língua e do alfabeto ingleses foi perdido. Agora imagine arqueólogos cavando nos escombros de uma de nossas cidades. O que eles poderiam encontrar? Bem, talvez alguns pedaços retangulares de plástico com símbolos estranhos. Talvez alguns pedaços circulares de metal. Talvez alguns recipientes cilíndricos com alguns símbolos. E talvez uma arqueóloga se torne uma celebridade instantânea quando ela decobre -- enterrada nas colinas de algum lugar na América do Norte -- grandes quantidades de versões destes mesmos símbolos. Agora, vamos perguntar a nós mesmos, o que tais artefatos poderiam dizer sobre nós para pessoas a 4.000 anos no futuro? 
Esta não é uma questão hipotética. De fato, é exatamente o tipo de questão que encaramos quando tentamos entender a civilização do Vale do Indo, que existiu 4.000 anos atrás. A civilização do Indo era, grosso modo, contemporânea às muito mais conhecidas civilizações egípcia e mesopotâmica, mas era realmente muito maior que qualquer uma dessas duas civilizações. Ela ocupou a área de aproximadamente um milhão de quilômetros quadrados, abrangendo o que é agora o Paquistão, o Noroeste da Índia e partes do Afeganistão e Irã. Considerando-se que era uma civilização tão vasta, você esperaria encontrar governantes realmente poderosos, reis, e monumentos gigantescos glorificando esses reis poderosos. De fato, o que arqueólogos encontraram não foi nada disso. Eles encontraram pequenos objetos como estes. 
Aqui está um exemplo de um desses objetos. Bem, obviamente isto é uma réplica. Mas, quem é esta pessoa? Um rei? Um deus? Um sacerdote? Ou, talvez, uma pessoa comum como você ou eu? Não sabemos. Mas o povo do Indo também deixou artefatos com escritos. Bem, não, não peças de plástico, mas selos de pedra, plaquetas de cobre, cerâmica e, surpreendentemente, uma grande placa de símbolos, que foi encontrada enterrada perto do portão de uma cidade. Não sabemos se ela diz Hollywood, ou mesmo Bollywood nessa questão. De verdade, não sabemos mesmo o que diz qualquer um desses objetos. E isso ocorre porque a escritura do Indo não foi decifrada. Não sabemos o que qualquer um desses símbolos significa. 
Os símbolos são mais comumente encontrados em selos. Aqui vocês veem um desses objetos. É um objeto quadrado com um animal em forma de unicórnio. Esta é uma magnífica peça de arte. Quão grande vocês acham que ela é? Talvez deste tamanho? Ou talvez deste? Bem, permitam-me mostrar-lhes. Aqui está uma réplica de um desses selos. Ele tem o tamanho de uma polegada por uma polegada -- bastante pequeno. Então, para que eles eram usados? Sabemos que estes eram usados para estampar etiquetas de argila que eram anexadas a fardos de mercadorias remetidas de um lugar para outro. Sabem aquelas tiras de embalagem que vocês têm nas caixas FedEx? Estes eram usados para fazer esse tipo de etiqueta de embalagem. Agora vocês podem imaginar o que estes objetos contêm em termos de textos. Talvez eles sejam o nome do remetente ou alguma informação sobre as mercadorias que estão sendo enviadas de um lugar para o outro -- nós não sabemos. Precisamos decifrar a escritura para responder esta questão. 
Decifrar a escritura não é apenas um quebra-cabeças intelectual; na verdade tornou-se uma questão profundamente entrelaçada com a política e a história cultural do Sul da Ásia. Na verdade, a escritura se tornou um campo de batalha de todo tipo entre três diferentes grupos de pessoas. Primeiramente, há um grupo de pessoas que são muito passionais na sua crença de que as escrituras do Indo não representam nenhuma língua. Essas pessoas acreditam que os símbolos são muito semelhantes ao tipo de símbolos que você encontra em sinais de trânsito ou os emblemas que você encontra em escudos. Há um segundo grupo de pessoas que acredita que a escritura do Indo representa uma língua indo-europeia. Se você olhar para um mapa da Índia hoje, verá que a maioria das línguas faladas no Norte da Índia pertence à família das línguas indo-europeias. Então, algumas pessoas acreditam que a escritura do Indo representa uma antiga língua indo-europeia como o sânscrito. 
Há um último grupo de pessoas que acredita que os povos do Indo eram os ancestrais das pessoas que vivem no Sul da Índia hoje. Estas pessoas acreditam que a escritura do Indo representa uma forma antiga da família de línguas dravídicas, que é a família de línguas faladas na maior parte do Sul da Índia hoje. E os proponentes desta teoria apontam para aquele pequeno bolsão de pessoas que falam dravídico no Norte, de fato, perto do Afeganistão, e dizem que, talvez, em alguma época no passado, as línguas dravídicas fossem faladas em toda a Índia e que isto sugere que talvez a civilização do Indo seja também dravidiana. 
Agora, qual dessas hipóteses pode ser verdadeira? Não sabemos, mas talvez se você decifrasse a escritura, seria capaz de responder esta questão. Mas, decifrar a escritura é uma tarefa muito desafiante. Primeiro, não há Pedra de Rosetta. Não me refiro ao software; refiro-me ao artefato antigo que contém no mesmo texto tanto um texto conhecido como um texto desconhecido. Não temos esse artefato para a escritura do Indo. E, além disso, nem mesmo sabemos qual língua eles falavam. E para tornar o assunto ainda pior, a maioria dos textos que temos são extremamente curtos. Como lhes mostrei, eles são geralmente encontrados nestes selos que são muito, muito pequenos. 
Então, considerados esses obstáculos formidáveis, uma pessoa pode questionar-se e mesmo preocupar-se se alguém algum dia será capaz de decifrar a escritura do Indo. Então, no restante de minha apresentação, eu gostaria de contar-lhes como aprendi a parar de me preocupar e a amar o desafio apresentado pela escritura do Indo. Sempre fui fascinado pela escritura do Indo desde que li sobre ela em um livro da escola de ensino médio E por que eu era fascinado? Bem, esta é a última e a maior escritura não decifrada no mundo antigo. Minha trajetória profissional levou-me a ser um neurocientista computacional então em meu trabalho diário, crio modelos computacionais do cérebro para tentar entender como o cérebro elabora predições, como o cérebro toma decisões, como o cérebro aprende e assim por diante. 
Mas, em 2007, meu caminho cruzou novamente com a escritura do Indo. Isto foi quando eu estava na Índia, e tive a maravilhosa oportunidade de encontrar-me com alguns cientistas indianos que estavam usando modelos computacionais para tentar analisar a escritura. E foi então que percebi que havia uma oportunidade de eu colaborar com esses cientistas, e me agarrei àquela oportunidade. E eu gostaria de descrever alguns dos resultados que encontramos. Ou melhor ainda, vamos todos decifrar coletivamente. Estão prontos? 
A primeira coisa que você precisa fazer quando tem uma escrita não decifrada é tentar descobrir a direção da escrita. Então, aqui estão dois textos que contêm alguns símbolos. Vocês podem me dizer se a direção da escrita é da direita para a esquerda ou da esquerda para a direita? Vou dar-lhes alguns segundos. OK. Da direita para a esquerda, quantos? OK. Ok. Da esquerda para a direita? Oh, é quase meio a meio. OK. Então a resposta é: se você olhar para o lado esquerdo dos dois textos, você notará que há um aglomerado de símbolos, e parece que, 4.000 anos atrás, quando os escribas estavam escrevendo da direita para a esquerda, eles ficaram sem espaço. Então eles tiveram que encaixar o símbolo. Um dos símbolos está abaixo do texto no topo. Isto sugere que a direção da escrita era provavelmente da direita para a esquerda. E esta é uma das primeiras coisas que sabemos, que o direcionamento é um aspecto chave de escritas linguísticas. E a escritura do Indo agora tem essa propriedade específica. 
Que outras propriedades da linguagem a escritura mostra? Línguas contêm padrões. Se eu lhe dou a letra Q e peço para você predizer a próxima letra, qual você acha que seria? A maioria disse U, o que está correto. Agora, se peço para você predizer mais uma letra, qual você acha que seria? Agora há várias possibilidades. Existe o E. Poderia ser I. Poderia ser A, mas certamente não B, C ou D, certo? A escritura Indo também exibe tipos semelhantes de padrões. Há muitos textos que começam com este símbolo em forma de diamante. E este, por sua vez, tende a ser seguido por este símbolo em forma de aspas. E isto é muito similar ao exemplo do Q e U. Este símbolo pode também ser seguido por estes símbolos em forma de peixe e alguns outros signos, mas nunca por estes outros signos abaixo. E além disso, há alguns signos que realmente preferem o final dos textos, como este signo em forma de jarra. E este signo, de fato, é o que mais frequentemente ocorre na escritura. 
Dados esses padrões, aqui vai nossa ideia. A ideia foi usar um computador para aprender esses padrões, e, então, colocamos no computador os textos existentes. E o computador aprendeu um modelo estatístico de quais símbolos tendem a ocorrer juntos e quais símbolos tendem a seguir uns aos outros. Dado o modelo computacional, podemos testar o modelo essencialmente questionando-o. Então poderíamos deliberadamente apagar alguns símbolos, e pedir-lhe para predizer os símbolos faltantes. Aqui estão alguns exemplos. Você pode considerar isto talvez como o mais antigo jogo da Roda da Fortuna. 
O que encontramos foi que o computador tinha sucesso em 75 por cento dos casos ao predizer o símbolo correto. No restante dos casos, tipicamente a segunda ou a terceira opções era a resposta correta. Há também um uso prático para este procedimento específico. Há muitos destes textos que estão danificados. Aqui está um exemplo de um desses textos. E podemos usar o modelo computacional agora para tentar completar este texto e fazer a melhor predição. Aqui está um exemplo de um símbolo que foi predito. E isso pode ser realmente útil à medida que tentamos decifrar a escritura, gerando mais dados que podemos analisar. 
Aqui, temos uma outra coisa que pode ser feita com o modelo computacional. Imaginem um macaco dedilhando um teclado. Penso que se poderia obter um conjunto errático de letras que se parece com este. Tal conjunto errático de letras é considerado como tendo uma entropia muito alta. Este é um termo da física e da teoria da informação. Mas, apenas imagine que é realmente um conjunto errático de letras. Qual de vocês alguma vez já derramou café no teclado? Você pode ter-se deparado com um teclado travado -- basicamente o mesmo símbolo sendo repetido indefinidamente. Este tipo de sequência é considerada como tendo uma entropia muito baixa porque não há nenhuma variação. A língua, por outro lado, têm um grau intermediário de entropia; não é nem muito rígida, nem muito errática. E a escritura do Indo? Aqui está um gráfico que esquematiza as entropias de um bloco de sequências. No topo encontra-se a sequência uniformemente errática, que é o conjunto errático de letras -- e, interessante, também encontramos a sequência do DNA do genoma humano e a música instrumental. E ambas são muito, muito flexíveis, e é por isso que se encontram na mais alta variação. Na parte mais baixa da escala, encontra-se a sequência rígida, a sequência de todos os A, e também se encontra um programa de computador, neste caso em linguagem Fortran, que obecede regras realmente estritas. Escritos linguísticos ocupam a variação mediana. 
E a escritura do Indo? Descobrimos que a escritura do Indo na verdade encaixa-se dentro da variação dos escritos linguísticos. Quando este resultado foi publicado pela primeira vez, levantou grande controvérsia. Houve pessoas que clamaram por justiça, e estas pessoas eram aquelas que acreditavam que a escritura do Indo não representa um idioma. Comecei a receber correspondência ameaçadora. Meus alunos disseram que eu deveria pensar seriamente em obter alguma proteção. Quem teria imaginado que decifrar poderia ser uma profissão perigosa? O que este resultado realmente mostra? Ele mostra que a escritura do Indo compartilha uma importante propriedade da língua. Então, como diz o velho adágio, se parece com um escrito linguístico e age como um escrito linguístico, então, talvez tenhamos um escrito linguístico em nossas mãos. Que outra evidência existe de que a escritura poderia realmente codificar uma língua? 
Bem, escritos linguísticos podem realmente codificar múltiplas línguas. Por exemplo, aqui está a uma sentença escrita em inglês e a mesma sentença escrita em holandês, usando as mesmas letras do alfabeto. Se você não conhece holandês e conhece somente inglês e eu lhe dou algumas palavras em holandês, você me dirá que essas palavras contêm alguns padrões muito incomuns. Algums coisas não estão certas, e você dirá que essas palavras são provavelmente não inglesas. A mesma coisa acontece no caso da escritura do Indo. O computador encontrou vários textos -- dois deles são mostrados aqui -- que têm padrões muito incomuns. Por exemplo, o primeiro texto: há um par desse signo em forma de jarra. Este é o signo que mais frequentemente ocorre na escritura do Indo, e é apenas neste texto que ele ocorre como um par. 
Por que isso se apresenta assim? Voltamos e observamos onde estes textos específicos foram encontrados, e acontece que eles foram encontrados muito, muito distantes do Vale do Indo. Foram encontrados no que é atualmente o Iraque e o Irã. E por que foram encontrados lá? O que não lhes contei é que o povo do Indo era muito, muito empreendedor. Eles costumavam comerciar com povos muito distantes de onde eles viviam. E assim, neste caso, eles estavam viajando pelo mar todo o caminho para a Mesopotâmia, atualmente Iraque. E o que parece ter acontecido aqui é que os comerciantes do Indo, os mercadores, estavam usando esta escrita pra grafar uma língua estrangeira. É exatamente como nosso exemplo de inglês e holandês. E isso explicaria por que temos estes padrões estranhos que são muito diferentes dos tipos de padrões que se observam nos textos que são encontrados dentro do Vale do Indo. Isto sugere que o mesmo escrito, a escritura do Indo, poderia ser usada para escrever diferentes línguas. Os resultados que temos até agora parecem apontar para a conclusão de que a escritura do Indo provavelmente representa uma língua. 
Se ela realmente representa uma língua, então, como lemos os símbolos? Este é o nosso próximo grande desafio. Vocês perceberam que muitos dos símbolos parecem desenhos de humanos, de insetos, de peixes, de pássaros. Muitos escritos antigos usam o princípio do rébus, que é usar gravuras para representar palavras. Então, como um exemplo, aqui está uma palavra. Vocês podem escrevê-la usando gravuras? Vou dar-lhes alguns segundos. Conseguiram? OK. Ótimo. Aqui está minha solução. Você poderia usar o desenho de uma abelha (bee > bi) seguido pelo desenho de uma folha (leaf > lif) -- e isto forma "crença" (belief > bilif), certo? Poderia haver outras soluções. No caso da escritura do Indo, o problema está invertido. Você tem que imaginar os sons de cada uma destas gravuras de modo que a sequência inteira faça sentido. Então, é como se isto fosse apenas um quebra-cabeças, a não ser pelo fato de que aqui está a mãe de todos os quebra-cabeças, porque o que está em jogo é muito alto se você solucioná-lo. 
Meus colegas, Iravatham Mahadevan e Asko Parpola, têm tido algum progresso neste problema específico. E, gostaria de apresentar-lhes um rápido exemplo do trabalho de Parpola. Aqui está um trecho realmente curto. Ele contém sete traços verticais seguidos deste signo em forma de peixe. E quero mencionar que estes selos eram usados para estampar etiquetas de argila que eram anexadas a fardos de mercadorias, então, é muito provavel que estas etiquetas, ao menos algumas delas, contenham nomes dos mercadores. E acontece que na Índia existe uma longa tradição de nomes serem baseados em horóscopos e constelações presentes à época do nascimento. Nas línguas dravídicas, a palavra para peixe é "meen" que soa exatamente igual à palavra para estrela. Então sete estrelas seriam representadas por "elu meen" que é a palavra dravídica para Big Dipper - conjunto de sete estrelas na constelação da Ursa Maior. Da mesma forma, há uma outra sequência de seis estrelas, e isso se traduz por "aru meen" que é o antigo nome dravídico para a constelação de Plêiades. Finalmente, há outras combinações, tal como este signo em forma de peixe com algo que parece um telhado no topo. E ele poderia ser traduzido como "mey meen" que é o antigo nome dravídico para o planeta Saturno. Então, isto foi muito excitante. Parece que estamos conseguindo alguma coisa. 
Mas isto prova que estes selos contêm nomes dravídicos baseados em planetas e constelações? Bem, não ainda. Então, não temos como validar estas leituras específicas, mas, se mais e mais dessas leituras começarem a fazer sentido e se sequências cada vez mais longas parecerem estar corretas, então sabemos que estamos no caminho certo. Hoje, podemos escrever uma palavra como TED em hieroglifos egípcios ou na escrita cuneiforme porque ambos foram decifrados no século XIX. Decifrar essas duas escritas possibilitou a essas duas civilizações falar de novo conosco diretamente Os Maias começaram a falar conosco no século XX, mas a civilização do Indo permanece silenciosa. 
Por que deveríamos nos importar? A civilização do Indo não pertence apenas aos indianos do Sul ou do Norte ou aos paquistaneses; ela pertence a todos nós. Esses são nossos ancestrais -- seus e meus. Eles foram silenciados por um acidente histórico infeliz. Se decifrássemos a escrita, tornaríamos possível para eles falar conosco novamente. O que eles nos diriam? O que descobriríamos sobre eles? Sobre nós? Mal posso esperar para descobrir. 
Obrigado. 
(Aplausos) 


Mais detalhes podem ser encontrados nesses links: 
http://indusresearch.wikidot.com/script
http://www.cs.washington.edu/homes/rao/indus.html
http://www.harappa.com/har/har0.html
http://a.harappa.com/articles





 


Reprodução da tradução Livre CC, desde que atribuídas as autorias, fontes e não seja comercial.
Fonte: TED
Tradução por David Britto, em 08 de julho de 2019.
Convido os leitores a, por favor, me avisarem de possíveis erros de tradução, gramática e digitação. 
Disponível no blog Estudos Vaiṣṇavas Studies e no Facebook