Header Ads

ÚLTIMAS NOTÍCIAS

O que determina o fim de uma frase?


Foto: Markus Spiske


✎ por Janaina de Aquino

Em língua portuguesa, quando queremos concluir uma ideia por meio da expressão escrita geralmente utilizamos o ponto final (.). Este sinal gráfico, presente em muitos outros idiomas, também é empregado na abreviação de palavras, por exemplo, em “Sr.” (senhor). Assim, ao ler o trecho da obra de Lima Barreto, Triste fim de Policarpo Quaresma¹:

Assistimos, então, à revolta pelos bastidores: soldados sem consciência de causa, oficiais interessados apenas em suas promoções, uma população que, sem entender muito o que acontecia, encara a situação como diversão.

um cérebro humano treinado é capaz de identificar que o período frásico foi finalizado logo após a palavra "diversão". Contivesse a passagem a abreviatura "Sr.", também saberia diferenciar a finalidade em questão, isto é, apenas de suprimir algumas letras. Este conhecimento permite que nosso cérebro prossiga a leitura até o próximo ponto, onde se espera a conclusão da ideia. A depender da língua, ele se adapta a novas associações. Em línguas como o alemão o ponto aparece na descrição de datas, onde “28.5” significa “28 de maio”; em inglês, esta mesma combinação numérica, conforme o contexto, é usada para separar as casas decimais (em português, usa-se a virgula).  Já em mandarim, vamos encontrar uma pequena bolinha no fim de alguma frase que, contudo, de longe lembra a função do ponto final, pois está mais relacionada à conclusão de um sentido:


Uma tarefa bastante simples, não? Aparentemente, sim. Espere até tentar ensiná-la para um computador. É como tentar explicar para uma criança algum fato sobre o qual ela ainda não tem conhecimento prévio necessário para compreender plenamente. E olha que computadores são e estão cada vez mais inteligentes. Em essência, monstros na arte de calcular. Um “simples” problema de estatística que nos tomariam 11 dias, sem pausa para se alimentar ou dormir, é executado por um computador em questão de segundos. Por que, então, ainda é tão difícil para eles entenderem onde começa e  termina uma frase qualquer?

Esta questão não é fácil. Na verdade, é um dos maiores desafios da computação linguística. Suponho que até aqui, talvez mesmo você não teria pensado sobre o assunto, afinal seu cérebro o automatizou. Ao lidar com máquinas é que percebemos a complexidade do cérebro e linguagem humanos. Como mencionei neste artigo, uma máquina terá dificuldade em entender sobre o que se trata o enunciado “Este não é um Shakespeare”. Trata-se de um autor que não está à altura de Shakespeare ou simplesmente de uma obra que é de outro autor que não Shakepeare? Para poder responder, a máquina precisa aprender o que é um livro e o que é um "Shakespeare". De fato, máquinas em geral ainda têm muito o que aprender – a parte boa é que aprendem rápido, a ruim são os obstáculos.

Como no exemplo da criança acima, quando precisamos repassar certo conhecimento para uma máquina munida de inteligência artificial, requer-se a escolha cuidadosa das palavras, dos códigos... caso contrário, o resultado fica bem aquém do esperado. Afinal, ela ainda é bastante dependente dos inputs que lhe damos, tal qual um ser humano em fase de crescimento. Por essa e outras razões, um cientista computacional evita dizer que algo é óbvio, simples. Neste ramo, os problemas mais “inofensivos” são justamente os que demandam maior esforço mental. Como os limites de um ponto final.

★★★

Diários de linguística é uma seção escrita por Janaina de Aquino para desenvolver e divagar, como forma de compreensão e assimilação, temas sobre língua e inteligência artificial com os quais se depara no curso de Computação Linguística na Universidade de Tübingen, Alemanha.


¹ Barreto, Lima. Triste fim de Policarpo Quaresma. São Paulo: Moderna, 1993.

Um comentário

Grace Adieu disse...

Bom dia, sempre impecáveis e muito interessantes os artigos deste blog. Assino a newsletter de vocês e sempre divulgo entre colegas e amigos.
Gostaria apenas de chamar atenção a um pequeno detalhe, que me deixou em dúvida. O texto reproduzido acima como sendo em Mandarim não seria em japonês? Pois identifiquei os três alfabetos que são utilizados nessa língua: Kanji (ideogramas), Hiragana e Katakana (partículas e flexões). Enquanto no chinês apenas os ideogramas são utilizados sem as partículas de flexão.
(Que fique claro que não falo nenhuma das duas línguas, mas estudei um pouco de japonês.)
Ou o texto aparece apenas como uma ilustração e eu interpretei errado?
Agradeço antecipadamente a atenção.