UM ‘CORPUS’ ANOTADO DE CONSTRUÇÕES COM VERBO-SUPORTE EM PORTUGUÊS

Autores

  • Amanda Pontes Rassi Universidade Federal de São Carlos - UFSCar Universidade do Algarve - UAlg
  • Jorge Baptista Universidade do Algarve - UAlg
  • Oto Araújo Vale Université Catholique de Louvain - UCL Universidade Federal de São Carlos - UFSCar

DOI:

https://doi.org/10.22409/gragoata.v20i38.33307

Palavras-chave:

Teoria e análise linguística, Verbo-suporte, Nome predicativo, Léxico Gramática, Anotação de corpus.

Resumo

As construções com verbo‑suporte (CVS) são um tipo de construção nominal, em que o predicador central é o nome, chamado de nome predicativo (Npred), e este é auxiliado por um verbo, chamado verbo-suporte (Vsup). A abordagem utilizada para a descrição e formalização das CVS, neste artigo, é o Léxico‑Gramática. Tendo em vista as diferenças sintáticas e semânticas das CVS em relação a outros tipos de construções, o objetivo deste artigo é apresentar a metodologia e os resultados da construção de um corpus anotado com construções de Vsup e de Npred. Foi construída uma lista com 4.668 CVS, considerando‑se 45 variantes de Vsup e cerca de 3.200 Npred diferentes. A partir dessa lista de CVS, foram extraídas 121.198 frases do corpus PLN.Br Full, das quais foi anotada e revista manualmente uma amostra com 2.646 frases, que constituem o corpus de referência para o tratamento de CVS em Português. Esse corpus de referência poderá ser utilizado como golden standard para avaliar tarefas automáticas de identificação, extração ou classificação de CVS ou ainda para outras aplicações de Processamento Automático de Língua Natural (PLN).

Downloads

Não há dados estatísticos.

Biografia do Autor

Amanda Pontes Rassi, Universidade Federal de São Carlos - UFSCar Universidade do Algarve - UAlg

Possui graduação em Letras pela Universidade Federal de Goiás (2005) e mestrado em Linguística pela Universidade Federal de Goiás (2008). Atualmente cursa Doutorado em Linguística pela Universidade Federal de São Carlos (2012-2015), tendo realizado estágio na Universidade do Algarve (UAlg) por meio do Programa Doutorado Sanduíche no Exterior (PDSE/ 2014). Tem experiência em Ensino de Língua Portuguesa nos níveis Fundamental, Médio e Superior, e também em anotação de corpus. Atua nas áreas de Lexicologia e Lexicografia, Sintaxe e Processamento de Línguas Naturais, com ênfase nos seguintes temas: descrição léxico-sintática, construções com verbo-suporte, nomes predicativos, nominalizações, construções causativas e provérbios.

Jorge Baptista, Universidade do Algarve - UAlg

Doutor em Linguistica - Sintaxe (Univ. Algarve, 2001). Mestre em Linguística Portuguesa Descritiva (Univ. Lisboa, Fac. Letras, 1995). Licenciado em Línguas e Literaturas Modernas-Estudos Portugueses (Univ. Lisboa, Fac. Letras, 1990). Prof. Associado de nomeação definitiva da Univ. Algarve (desde 2006), onde é docente desde 1992. Investigador convidado do L2F - Spoken Language Laboratory, do INESC-ID Lisboa http://www.l2f.inesc-id.pt.

Oto Araújo Vale, Université Catholique de Louvain - UCL Universidade Federal de São Carlos - UFSCar

Possui graduação (Maitrise) em Sciences du Langage - Universite de Paris VIII (1989), mestrado (DEA) em Sciences du Langage (DEA) - Universite de Paris VIII (1990) e doutorado em Linguística e Língua Portuguesa pela Universidade Estadual Paulista Júlio de Mesquita Filho (2002). Foi Professor Visitante na Universidade do Algarve no programa Erasmus Mundus, da Comunidade Europeia (2008). É Professor Associado do Departamento de Letras da Universidade Federal de São Carlos, onde atua na graduação e na pós-graduação. Tem experiência na área de Lingüística, com ênfase em Linguística Computacional, atuando principalmente nos seguintes temas: expressões cristalizadas, léxico-gramática, dicionários eletrônicos e linguistica de corpus.

Downloads

Publicado

2015-06-30

Como Citar

Rassi, A. P., Baptista, J., & Vale, O. A. (2015). UM ‘CORPUS’ ANOTADO DE CONSTRUÇÕES COM VERBO-SUPORTE EM PORTUGUÊS. Gragoatá, 20(38). https://doi.org/10.22409/gragoata.v20i38.33307

Edição

Seção

Artigos de Linguagem