O que determina o fim de uma frase?
✎ por Janaina de Aquino
Em língua portuguesa, quando
queremos concluir uma ideia por meio da expressão escrita geralmente utilizamos
o ponto final (.). Este sinal gráfico, presente em muitos outros idiomas,
também é empregado na abreviação de palavras, por exemplo, em “Sr.” (senhor). Assim,
ao ler o trecho da obra de Lima Barreto, Triste fim de Policarpo Quaresma¹:
Assistimos, então, à revolta pelos bastidores: soldados sem consciência de causa, oficiais interessados apenas em suas promoções, uma população que, sem entender muito o que acontecia, encara a situação como diversão.
um cérebro humano treinado é capaz
de identificar que o período frásico foi finalizado logo após a palavra "diversão". Contivesse a passagem a abreviatura "Sr.", também saberia diferenciar a finalidade em questão, isto é, apenas de suprimir algumas letras. Este conhecimento permite que nosso cérebro prossiga a leitura até
o próximo ponto, onde se espera a conclusão da ideia. A depender da língua, ele
se adapta a novas associações. Em línguas como o alemão o ponto aparece na
descrição de datas, onde “28.5” significa “28 de maio”; em inglês, esta mesma
combinação numérica, conforme o contexto, é usada para separar as casas decimais (em português, usa-se a virgula). Já em mandarim, vamos encontrar uma pequena bolinha no fim de alguma frase que, contudo, de longe lembra a função do ponto
final, pois está mais relacionada à conclusão de um sentido:
Uma tarefa bastante simples, não?
Aparentemente, sim. Espere até tentar ensiná-la para um computador. É como
tentar explicar para uma criança algum fato sobre o qual ela ainda não tem
conhecimento prévio necessário para compreender plenamente. E olha que
computadores são e estão cada vez mais inteligentes. Em essência, monstros na
arte de calcular. Um “simples” problema de estatística que nos tomariam 11
dias, sem pausa para se alimentar ou dormir, é executado por um computador em
questão de segundos. Por que, então, ainda é tão difícil para eles entenderem
onde começa e termina uma frase qualquer?
Esta questão não é fácil. Na
verdade, é um dos maiores desafios da computação linguística. Suponho que até
aqui, talvez mesmo você não teria pensado sobre o assunto, afinal seu cérebro o
automatizou. Ao lidar com máquinas é que percebemos a complexidade do cérebro e
linguagem humanos. Como mencionei neste artigo, uma máquina terá dificuldade em
entender sobre o que se trata o enunciado “Este não é um Shakespeare”. Trata-se
de um autor que não está à altura de Shakespeare ou simplesmente de uma obra que é
de outro autor que não Shakepeare? Para poder responder, a máquina precisa
aprender o que é um livro e o que é um "Shakespeare". De fato, máquinas em geral ainda
têm muito o que aprender – a parte boa é que aprendem rápido, a ruim são os obstáculos.
Como no exemplo da criança acima,
quando precisamos repassar certo conhecimento para uma máquina munida de
inteligência artificial, requer-se a escolha cuidadosa das palavras, dos
códigos... caso contrário, o resultado fica bem aquém do esperado. Afinal, ela
ainda é bastante dependente dos inputs que lhe damos, tal qual um ser humano em
fase de crescimento. Por essa e outras razões, um cientista computacional evita
dizer que algo é óbvio, simples. Neste ramo, os problemas mais “inofensivos”
são justamente os que demandam maior esforço mental. Como os limites de um
ponto final.
★★★
Diários de linguística é uma seção
escrita por Janaina de Aquino para desenvolver e divagar, como forma de
compreensão e assimilação, temas sobre língua e inteligência artificial com os
quais se depara no curso de Computação Linguística na Universidade de Tübingen,
Alemanha.
¹ Barreto, Lima. Triste fim de Policarpo Quaresma. São Paulo: Moderna, 1993.
¹ Barreto, Lima. Triste fim de Policarpo Quaresma. São Paulo: Moderna, 1993.
Um comentário
Bom dia, sempre impecáveis e muito interessantes os artigos deste blog. Assino a newsletter de vocês e sempre divulgo entre colegas e amigos.
Gostaria apenas de chamar atenção a um pequeno detalhe, que me deixou em dúvida. O texto reproduzido acima como sendo em Mandarim não seria em japonês? Pois identifiquei os três alfabetos que são utilizados nessa língua: Kanji (ideogramas), Hiragana e Katakana (partículas e flexões). Enquanto no chinês apenas os ideogramas são utilizados sem as partículas de flexão.
(Que fique claro que não falo nenhuma das duas línguas, mas estudei um pouco de japonês.)
Ou o texto aparece apenas como uma ilustração e eu interpretei errado?
Agradeço antecipadamente a atenção.
Postar um comentário