Please use this identifier to cite or link to this item: http://hdl.handle.net/10773/8883
Full metadata record
DC FieldValueLanguage
dc.contributor.authorMário Rodriguespt
dc.contributor.authorGonçalo Paiva Diaspt
dc.contributor.authorAntónio Teixeirapt
dc.date.accessioned2012-08-01T15:56:53Z-
dc.date.available2012-08-01T15:56:53Z-
dc.date.issued2011-12-
dc.identifier.issn1647-0818pt
dc.identifier.urihttp://hdl.handle.net/10773/8883-
dc.description.abstractOs cidadãos, empresas ou serviços públicos - os clientes - que procuram informações no contexto do Governo Eletrónico visam obter respostas objetivas às suas questões. Para isso é necessário que os sistemas de pesquisa consigam manipular a informação de modo a que seja disponibilizada de uma forma eficaz e adequada às necessidades de cada cliente. Uma vez que grande parte dos documentos do governo estão escritos em formatos não estruturados e em linguagem natural, é necessário desenvolver métodos para obter e estruturar este tipo de informação. A alternativa seria indexar pelo seu texto a grande quantidade de documentos existente, uma solução desadequada no contexto do Governo Eletrónico, uma vez que assim seriam retornados frequentemente muitos resultados a cada pesquisa. Este artigo apresenta um primeiro protótipo de uma aplicação que gera informação semântica a partir de textos escritos em Português. A informação semântica gerada corresponde a um domínio de conhecimento definido por um operador humano através de uma interface gráfica, de modo a que o sistema seja adaptável às diferentes áreas de atuação do Governo Eletrónico. O conteúdo é acessível através de uma interface em linguagem natural e através de uma interface de pesquisa que aceita entradas SPARQL. Deste modo é possível aos clientes aceder diretamente ou integrar este sistema com os seus próprios sistemas de informação. A aplicação está organizada em três grandes módulos: Representação do Conhecimento que permite definir domínio de conhecimento e sua semântica e criar exemplos semente, nos textos, de conceitos do domínio de conhecimento; Processamento de Linguagem Natural que permite obter estruturas sintáticas associadas às frases em linguagem natural; e Extração e Integração Semântica que utiliza os exemplos semente para treinar classificadores estatísticos a identificar nas estruturas sintáticas os conceitos do domínio de conhecimento, que utiliza os classificadores treinados para detetar esses conceitos em estruturas sintáticas de novas frases, e que contém as interfaces para pessoas e máquinas. Neste artigo apresentamos igualmente exemplos ilustrativos da utilização do sistema e os resultados de uma primeira avaliação de desempenho. O sistema funciona para o Português e foi construído reutilizando software do estado da arte, maioritariamente desenvolvido visando o Inglês. A sua modularidade permite alterar a língua base do sistema, de Português para outra, alterando o módulo de Processamento de Linguagem Natural e sem ser necessário alterar os restantes módulos da aplicação.pt
dc.language.isoporpt
dc.rightsopenAccesspor
dc.subjectextração de informaçãopt
dc.subjectgoverno eletrónicopt
dc.subjectsemânticapt
dc.subjectconhecimentopt
dc.titleCriação e acesso a informação semântica aplicada ao governo eletrónicopt
dc.typearticlept
dc.peerreviewedyespt
ua.distributioninternationalpt
degois.publication.firstPage55pt
degois.publication.issuenº 2pt
degois.publication.lastPage68pt
degois.publication.titleLinguaMÁTICApt
degois.publication.volumeVol. 3pt
Appears in Collections:ESTGA - Artigos

Files in This Item:
File Description SizeFormat 
2011 Linguamatica mjfr-gpd-ajst.pdf1.18 MBAdobe PDFView/Open


FacebookTwitterLinkedIn
Formato BibTex MendeleyEndnote Degois 

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.