UM ‘CORPUS’ ANOTADO DE CONSTRUÇÕES COM VERBO-SUPORTE EM PORTUGUÊS
DOI:
https://doi.org/10.22409/gragoata.v20i38.33307Palavras-chave:
Teoria e análise linguística, Verbo-suporte, Nome predicativo, Léxico Gramática, Anotação de corpus.Resumo
As construções com verbo‑suporte (CVS) são um tipo de construção nominal, em que o predicador central é o nome, chamado de nome predicativo (Npred), e este é auxiliado por um verbo, chamado verbo-suporte (Vsup). A abordagem utilizada para a descrição e formalização das CVS, neste artigo, é o Léxico‑Gramática. Tendo em vista as diferenças sintáticas e semânticas das CVS em relação a outros tipos de construções, o objetivo deste artigo é apresentar a metodologia e os resultados da construção de um corpus anotado com construções de Vsup e de Npred. Foi construída uma lista com 4.668 CVS, considerando‑se 45 variantes de Vsup e cerca de 3.200 Npred diferentes. A partir dessa lista de CVS, foram extraídas 121.198 frases do corpus PLN.Br Full, das quais foi anotada e revista manualmente uma amostra com 2.646 frases, que constituem o corpus de referência para o tratamento de CVS em Português. Esse corpus de referência poderá ser utilizado como golden standard para avaliar tarefas automáticas de identificação, extração ou classificação de CVS ou ainda para outras aplicações de Processamento Automático de Língua Natural (PLN).
Downloads
Downloads
Publicado
Como Citar
Edição
Seção
Licença
AUTORIZAÇÃO
Autores que publicam em Gragoatá concordam com os seguintes termos:
Os autores mantêm os direitos e cedem à revista o direito à primeira publicação, simultaneamente submetido a uma licença Creative Commons Atribuição 4.0 Internacional (CC BY 4.0), que permite o compartilhamento por terceiros com a devida menção ao autor e à primeira publicação pela Gragoatá.
Os autores podem entrar em acordos contratuais adicionais e separados para a distribuição não exclusiva da versão publicada da obra (por exemplo, postá-la em um repositório institucional ou publicá-la em um livro), com o reconhecimento de sua publicação inicial na Gragoatá.
A Gragoatá utiliza uma Licença Creative Commons - Atribuição CC BY 4.0 Internacional.