
Um método que beneficia os usuários da informática acelerando o acesso aos dados e abreviando a busca pela informação correta. Ou seja, a exata informação que se quer em um tempo cada vez menor de busca.
É o que propõe o processamento da linguagem natural, técnica ainda pouco difundida no Brasil – os primeiros estudos no país começaram há 20 anos – que estuda tecnologias de apoio à leitura que permitam fazer filtros em bases e sentenças e assim facilitar a pesquisa na web.
Para Renata Vieira, professora do mestrado em Ciência da Computação com ênfase em Inteligência Computacional da PUC-RS, a expansão do uso da internet tem tornado fundamental o estudo da tecnologia, no sentido de auxiliar no volume de informação a ser absorvida e realizar um processamento mais eficaz da informação.
“Há dez anos era difícil conseguir um aluno de mestrado interessado nesta linha de pesquisa, era preciso colocar outros atrativos, não relacionado à língua, mas à web ou XML, e aos poucos introduzir a linguagem natural. Hoje eles já chegam dispostos a trabalhar diretamente com a linguagem”, explica Renata.
Como exemplos do uso da tecnologia, a professora cita a produção de sumários, a elaboração automática de resumos e os sistemas de tradução automática. Ou seja, é esse o conhecimento que está por trás da tecnologia do Google, que oferece tradução a 52 idiomas através de seu tradutor automático on-line.
Ainda este mês, o site lançou o text-to-speech [texto em fala, na tradução literal], um recurso de fala em voz alta que permite ouvir a pronúncia correta da palavra ou texto traduzido para 27 idiomas, incluindo o português do Brasil.
O termo língua natural é usado para distinguir as línguas faladas por seres humanos e usadas como instrumento de comunicação daquelas que são linguagens formais construídas. Como exemplo destas últimas, temos as linguagens de programação de computadores e as usadas pela lógica formal ou lógica matemática.
Enquanto os sistemas de geração de linguagem natural convertem informação de bancos de dados de computadores em linguagem normalmente compreensível ao ser humano, os sistemas de compreensão convertem ocorrências de linguagem humana em representações mais formais, mais facilmente manipuláveis por programas de computador.
Por não ser uma disciplina obrigatória no currículo das graduações em ciência da computação, ainda há um pequeno número de profissionais que se dedica ao estudo da área, sendo que a grande maioria está concentrada no Rio Grande do Sul.
Nesse sentido, o professor Aldebaro Klautau, professor da Universidade Federal do Pará – UFPA e pesquisador da área, que esteve em abril em Porto Alegre participando da Conferência Internacional sobre Processamento Computacional da Língua Portuguesa destaca a referência gaúcha no setor.
“A PUC-RS tem um trabalho de ponta na área, a maioria dos pesquisadores de processamento ainda está concentrada em São Paulo e Rio Grande do Sul. No Pará estamos desenvolvendo um programa de reconhecimento de voz, e acabamos contando com o que está sendo desenvolvido aqui”, explica Klautau.
De acordo com o professor, há uma colaboração com a UFPA e a PUC-RS formalizada através da disponibilização de recurso via web.
Entre os projetos desenvolvidos no Pará está um reconhecedor que transforma a voz em texto, voltado a auxiliar em serviços médicos. A ideia, segundo Klautau, é que os dados do paciente, falados pelo médico, sejam transcritos para um banco de dados, que irá cruzar as informações e fornecer um diagnóstico.
“Evoluímos do mouse para o teclado, e a tendência é interagirmos mais com a fala natural. Poderemos efetivamente conversar com as máquinas se estudarmos o português específico”, prevê o professor.
Ainda na PUC-RS, o Grupo de Processamento de Linguagem Natural – PLN, criado em 1990, busca voltar suas pesquisas para a língua portuguesa.
O PLN já produziu tecnologia para dicionários, analisadores sintáticos e morfológicos, corretores ortográficos, interfaces em língua natural e ferramentas voltadas ao ensino.
O grupo colabora atualmente, com maior ênfase, com outros grupos no país como o NILC (ICMC/USP), UFScar e PUC-Rio, através dos projetos PLN-BR e FAROL.
No exterior, os projetos atuais priorizam a cooperação com Portugal (apoio CNPq - Grices) com o DI/Universidade de Lisboa e a cooperação França/América do Sul (STIC-Amsud, com França, Uruguai, Argentina e Chile).