A contribuição dos Tesauros à Web Semântica

Em 2017, a InnovaGestão concluiu a revisão e atualização do Tesauro da Justiça Militar da União (TesJMU), desenvolvido para o Superior Tribunal Militar, e deu início à revisão e atualização do Vocabulário Controlado do Sebrae (VCS). A construção de tesauros para facilitar a recuperação de informação em portais institucionais ou o desenvolvimento de taxonomias para website de comércio eletrônico tem si constituído, frequentemente, em objeto de trabalho da empresa.

Sempre que possível, a InnovaGestão prioriza a utilização de software livre no desenvolvimento de seus projetos. No TesJMU utilizou-se o Tematres, aplicação web para o desenvolvimento de tesauros, ontologias e outras para soluções para web semântica.

A web semântica é a extensão da www, planejada para que a imensa quantidade de dados disponíveis na web possa ser compreendida por pessoas e processada por máquinas e, assim, possibilitar o compartilhamento de conteúdo além dos limites de aplicações e websites.

A web semântica necessita de vocabulários que descrevem os conceitos de um domínio (geral ou específico), materializados em um conjunto de termos. Os termos de um vocabulário, juntamente com os seus relacionamentos, podem ser descritos por meio de ontologias e seus componentes (classes e propriedades).

O reuso de termos de vocabulários conhecidos e estabelecidos é fortemente recomendado por se tratar de ferramentas já consolidadas em um determinado domínio. Recomenda-se que novos termos sejam criados apenas no caso de os vocabulários já existentes não fornecerem os termos necessários. É uma prática comum incluir termos de diferentes vocabulários na criação de uma nova ontologia para descrever todos os conceitos relacionados a um conjunto específico de dados (BIZER; HEATH; BERNERSLEE, 2009).

O tesauro é um vocabulário controlado organizado em uma ordem preestabelecida e estruturado de modo que os relacionamentos de equivalência, de homografia, de hierarquia, e de associação entre termos sejam indicados. As finalidades primordiais de um tesauro são (a) facilitar a recuperação dos documentos e (b) alcançar a consistência na indexação dos documentos escritos ou registrados de outra forma e outros tipos, principalmente para sistemas de armazenamento e de recuperação de informação pós-coordenados (ANSI/NISO Z39.19, 2003). A sua utilização dá-se no contexto da estruturação e recuperação de informações em bases de dados e portais corporativos na web.

Já as ontologias como artefato (e não como Filosofia) são utilizadas em inteligência artificial, web semântica, engenharia de software e arquitetura da informação, como uma forma de representação de conhecimento sobre determinado assunto. Ontologias geralmente descrevem a) Indivíduos: os objetos básicos; b) Classes: conjuntos, coleções ou tipos de objetos; c) Atributos: propriedades, características ou parâmetros que os objetos podem ter e compartilhar; d) Relacionamentos: as formas como os objetos podem se relacionar com outros objetos (ALMEIDA, 2014).

Na concepção das linguagens documentárias o tesauro é o instrumento que possui maior familiaridade e relacionamento com as ontologias por serem linguagens de estruturas combinatórias, de caráter especializado, constituídos por termos providos de suas relações semânticas que possibilitam a representação temática do conteúdo de um documento, bem como sua posterior recuperação (BOCCATO; RAMALHO; FUJITA, 2008, p. 200).

As diferenças e semelhanças entre as ontologias e os tesauros já foram estudadas e mapeadas por diversos pesquisadores. Sales e Cafe (2008), há 10 anos, apresentaram as características semelhantes e diferentes entre os dois instrumentos imprescindíveis à comunicação técnica e científica.

Entre os diversos estudos, destaca-se o estudo de Medeiros e Campos (2011), que faz comparação entre as ontologias de fundamentação e os tesauros conceituais. Esses autores concluíram que “…um dos grandes fatores de diferenciação entre tesauros (conceituais) e ontologias (de fundamentação) é o entorno digital em que as últimas são desenvolvidas. O fato de as ontologias serem oriundas de um meio computacional, permite que a automatização conferida pelo meio lhe sustente a capacidade de, por exemplo, realizar inferências tendo por base as restrições impostas, percorrendo regras válidas acionadas por meio de complexos axiomas, respondendo questões propostas”.

Assim, embora sejam singulares e as ontologias estejam encapsuladas em maior aparato tecnológico, o mapeamento do conhecimento e a identificação dos termos e conceitos são etapas comuns necessárias à construção de tesauros e de ontologias.

Pesquisa sobre o reuso dos conhecimentos estruturados dos tesauros na construção de ontologias apontou que os relacionamentos semanticamente refinados na estrutura do tesauro podem ser bem aproveitados na criação de ontologias, embora a correlação não seja perfeita. O estudo traz insumos para maior entendimento sobre as semelhanças e diferenças estruturais entre tesauros e ontologias para o reúso do conhecimento. (MACULAN, AGANETTE, 2017).

O reuso dos termos dos tesauros na construção de ontologias poderá resultar em economia de tempo e esforço para as organizações. As mudanças da tecnologia não inviabilizarão a necessidade de tesauros e estes podem ser de muita utilidade na construção de ontologias.

Bibliografia

ALMEIDA, Maurício Barcellos. Uma abordagem integrada sobre ontologias: Ciência da Informação, Ciência da Computação e Filosofia. Perspectivas em Ciência da Informação, v.19, n.3, p.242-258, jul./set. 2014. Disponível em: < http://www.scielo.br/pdf/pci/v19n3/a13v19n3.pdf>. Acesso em: 25 jan. 2018.

AMERICAN NATIONAL STANDARDS INSTITUTE. Guidelines for the construction, format and management of monolingual thesauri. Bethesda, USA: American National Standards Institute, 2003. (ANSI Z39.19-2003). Disponível em <http://www.niso.org/standards/index.html>. Acesso em: 25. jan. 2018.

BIZER, Christina; HEATH, Tom; BERNERS-LEE, Tim. Linked Data: the story so far. International Journal on Semantic Web and Information Systems, v. 5, n. 3, p. 1-22, 2009. Disponível em: <http://eprints.soton.ac.uk/271285/1/bizer-heath-berners-lee-ijswis-linked-data.pdf>. Acesso em: 15 jan. 2018.

BOCCATO, V. R. C., RAMALHO, R. A. S., FUJITA, M. S. L. A contribuição dos tesauros na construção de ontologias como instrumento de organização e recuperação da informação em ambientes digitais. In: GARCIA MARCO, F. J. (Ed.). Avances y perspectivas en sistemas de información y documentación – IBERSID, 2008. Zaragoza: Universidad de Zaragoza, 2008, p. 199-209.

MACULAN, Benildes Coura Moreira dos Santos, AGANETTE, Elisângela Cristina Aganette. Desambiguação de relações em tesauros e o seu reúso em ontologias. Ciência da informação. v. 46, n. 1 (2017). P.102 – 119.

MEDEIROS, Jackson da Silva; CAMPOS, Maria Luiza de Almeida. Tesauro conceitual e ontologia de fundamentação: análise de elementos similares em seus modelos de representação de domínios. In: XII ENANCIB Encontro Nacional de Pesquisa em Ciência da Informação. Brasília, 23 a 26 out. 2011. Disponível em: <https://chasqueweb.ufrgs.br/~jacksonmedeiros/pubs/2011_enancib.pdf>. Acesso em: 25 jan. 2018.

SALES, Rodrigo de; CAFE, Lígia Maria Arruda Semelhanças e diferenças entre tesauros e ontologias. DataGramaZero, v. 9, n. 4, p. A02, 2008. Disponível em: <http://www.brapci.inf.br/index.php/article/view/0000005032/3b7356e56fd075dc40de6ee5daa96f82/>. Acesso em: 25 jan. 2018.