Publicado em Deixe um comentário

Investigadores da UMinho criam repositório de corpora



O serviço está a ser elogiado internacionalmente e distingue-se
pelo volume abrangido de palavras, de áreas do saber e de línguas – português,
inglês, russo, alemão, francês, espanhol e italiano. Mais: é acessível
gratuitamente, em
http://per-fide.ilch.uminho.pt/query.
Destina-se ao público em geral, em especial linguistas, tradutores ou
informáticos, e é apresentado este sábado, às 9h30, no anfiteatro B2 do campus
de Gualtar, em Braga, no âmbito dos XV Colóquios de Outono.

UNICEF, Vaticano e Organização Mundial do Trabalho entre 30
parceiros de referência

O trabalho foi desenvolvido durante três anos entre o CEHUM e o
Departamento de Informática da UMinho, e insere-se no Projeto Per-Fide,
cofinanciado pela FCT e FEDER. Tem 30 parceiros de referência, como a Organização
Mundial do Trabalho, UNICEF, Vaticano, Banco Central Europeu, Le Monde
Diplomatique, Biblioteca do Quebeque, Molwickpedia, Parlamento Europeu,
Presseurop e Turismo de Portugal. Estes parceiros forneceram grandes volumes de
textos de áreas técnico-científicas, jornalísticas, literárias, entre outras,
permitindo aos investigadores proceder a estudos linguísticos de uma ou mais
línguas e produzir material útil para o ensino das línguas, bem como para a
investigação em processamento de linguagem natural, em tradução, em
lexicografia e áreas afins, explica a professora coordenadora Sílvia Araújo.

“O projeto não é um repositório de textos tradicional.
Permite o desenvolvimento automático de ferramentas para sumarizar páginas,
traduzir textos e fazer estatísticas da língua”, continua o professor
Alberto Simões. Por exemplo, pode-se obter a tradução fidedigna de expressões
próprias, como “ask for the floor” (significa “pedir a
palavra”), quando sites comuns erradamente fazem a tradução literal
(“pedir o chão”). Os provérbios são outro caso similar. Por outro
lado, os linguistas podem realizar consultas úteis, como encontrar o verbo
“ser” em todas as situações nos textos recolhidos e, para complicar,
estudar inclusive o uso desse verbo com advérbios, por exemplo.

Todos os recursos produzidos permitem sistematizar e explicar
fenómenos inerentes ao funcionamento da(s) língua(s) que escapam a um mero
exercício de introspeção, sublinha Sílvia Araújo. O acervo permite passar de
uma língua para outra de forma espontânea, intuitiva, rápida. E vai mesmo
alargar em breve, com novos parceiros internacionais. A pesquisa também: há já
um doutoramento em curso que visa a compilação de um corpus multimédia de
interpretação simultânea. Pretende-se ainda desenvolver ferramentas com vista à
automatização do processo de extração de terminologia monolingue e bilingue.

__________________________________________

Gabinete de Comunicação, Informação e Imagem

Universidade do Minho

Tel.: (+351) 253601109 /25 /28 | 961766329

Fax: (+351) 253601105

E-mail: gcii@reitoria.uminho.pt

(Pub. Nov/2013)

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *