UM ‘CORPUS’ ANOTADO DE CONSTRUÇÕES COM VERBO-SUPORTE EM PORTUGUÊS

Auteurs

  • Amanda Pontes Rassi Universidade Federal de São Carlos - UFSCar Universidade do Algarve - UAlg
  • Jorge Baptista Universidade do Algarve - UAlg
  • Oto Araújo Vale Université Catholique de Louvain - UCL Universidade Federal de São Carlos - UFSCar

##plugins.pubIds.doi.readerDisplayName##:

https://doi.org/10.22409/gragoata.v20i38.33307

Mots-clés:

Teoria e análise linguística, Verbo-suporte, Nome predicativo, Léxico Gramática, Anotação de corpus.

Résumé

As construções com verbo‑suporte (CVS) são um tipo de construção nominal, em que o predicador central é o nome, chamado de nome predicativo (Npred), e este é auxiliado por um verbo, chamado verbo-suporte (Vsup). A abordagem utilizada para a descrição e formalização das CVS, neste artigo, é o Léxico‑Gramática. Tendo em vista as diferenças sintáticas e semânticas das CVS em relação a outros tipos de construções, o objetivo deste artigo é apresentar a metodologia e os resultados da construção de um corpus anotado com construções de Vsup e de Npred. Foi construída uma lista com 4.668 CVS, considerando‑se 45 variantes de Vsup e cerca de 3.200 Npred diferentes. A partir dessa lista de CVS, foram extraídas 121.198 frases do corpus PLN.Br Full, das quais foi anotada e revista manualmente uma amostra com 2.646 frases, que constituem o corpus de referência para o tratamento de CVS em Português. Esse corpus de referência poderá ser utilizado como golden standard para avaliar tarefas automáticas de identificação, extração ou classificação de CVS ou ainda para outras aplicações de Processamento Automático de Língua Natural (PLN).

##plugins.generic.usageStats.downloads##

##plugins.generic.usageStats.noStats##

Bibliographies de l'auteur

Amanda Pontes Rassi, Universidade Federal de São Carlos - UFSCar Universidade do Algarve - UAlg

Possui graduação em Letras pela Universidade Federal de Goiás (2005) e mestrado em Linguística pela Universidade Federal de Goiás (2008). Atualmente cursa Doutorado em Linguística pela Universidade Federal de São Carlos (2012-2015), tendo realizado estágio na Universidade do Algarve (UAlg) por meio do Programa Doutorado Sanduíche no Exterior (PDSE/ 2014). Tem experiência em Ensino de Língua Portuguesa nos níveis Fundamental, Médio e Superior, e também em anotação de corpus. Atua nas áreas de Lexicologia e Lexicografia, Sintaxe e Processamento de Línguas Naturais, com ênfase nos seguintes temas: descrição léxico-sintática, construções com verbo-suporte, nomes predicativos, nominalizações, construções causativas e provérbios.

Jorge Baptista, Universidade do Algarve - UAlg

Doutor em Linguistica - Sintaxe (Univ. Algarve, 2001). Mestre em Linguística Portuguesa Descritiva (Univ. Lisboa, Fac. Letras, 1995). Licenciado em Línguas e Literaturas Modernas-Estudos Portugueses (Univ. Lisboa, Fac. Letras, 1990). Prof. Associado de nomeação definitiva da Univ. Algarve (desde 2006), onde é docente desde 1992. Investigador convidado do L2F - Spoken Language Laboratory, do INESC-ID Lisboa http://www.l2f.inesc-id.pt.

Oto Araújo Vale, Université Catholique de Louvain - UCL Universidade Federal de São Carlos - UFSCar

Possui graduação (Maitrise) em Sciences du Langage - Universite de Paris VIII (1989), mestrado (DEA) em Sciences du Langage (DEA) - Universite de Paris VIII (1990) e doutorado em Linguística e Língua Portuguesa pela Universidade Estadual Paulista Júlio de Mesquita Filho (2002). Foi Professor Visitante na Universidade do Algarve no programa Erasmus Mundus, da Comunidade Europeia (2008). É Professor Associado do Departamento de Letras da Universidade Federal de São Carlos, onde atua na graduação e na pós-graduação. Tem experiência na área de Lingüística, com ênfase em Linguística Computacional, atuando principalmente nos seguintes temas: expressões cristalizadas, léxico-gramática, dicionários eletrônicos e linguistica de corpus.

##submission.downloads##

Publiée

2015-06-30

Numéro

Rubrique

Artigos de Linguagem