Base de Normas Jurídicas Brasileiras: uma iniciativa de Open Government Data

Hudson de Martim, João Alberto de Oliveira Lima, Lauro César Araujo

Resumo


As normas jurídicas, produzidas por meio do Processo Legislativo, são a base formal de regulação da convivência em sociedade. Por isso, são naturalmente redigidas de forma técnica com objetivo de serem interpretadas juridicamente. Neste trabalho, porém, apresenta-se uma série de transformações automáticas aplicadas ao arcabouço de leis federais de modo a estruturar a informação descrita nesses documentos com intuito de prepará-las para diferentes tipos de interpretações automáticas, como identificação de entidades nomeadas, definições, remissões, eventos de criação, alteração e encerramento de instituições jurídicas, recuperação da versão vigente de uma lei no tempo. Isso visa auxiliar atividades de informação que vão além da própria interpretação jurídica, e vão ao encontro da Open Government Data. O artigo descreve uma série de datasets contendo os resultados de transformações da base de normas jurídicas brasileira, que contemplam os textos articulados das normas em representação LexML, CoNLL-U, representações sintáticas de sentenças obtidas com a Google Natural Language Processing API, entre outras.

Palavras-chave


Norma Jurídica; Processamento de Linguagem Natural; LexML; CoNLL-U; Google Natural Language Processing API

Texto completo:

PDF

Referências


AUER, S. et al. Dbpedia: A nucleus for a web of open data. In: In 6th Int’l Semantic Web Conference, Busan, Korea. [S.l.]: Springer, 2007. p. 11–15.

BATISTA, A. H. et al. Extração automática de definições: um estudo de caso em textos legislativos. Universidade Católica de Brasília, 2011.

BICK, E. The parsing system palavras. Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework, University of Arhus, 2000.

BUCHHOLZ, S.; MARSI, E. Conll-x shared task on multilingual dependency parsing. In: ASSOCIATION FOR COMPUTATIONAL LINGUISTICS. Proceedings of the Tenth Conference on Computational Natural Language Learning. [S.l.], 2006. p. 149–164.

FREITAS, C.; ROCHA, P.; BICK, E. Um mundo novo na floresta sintática – o treebank do português. Calidoscópio, v. 6, n. 3, p. 142–148, 2008.

GRAY, J. Towards a genealogy of open data. 2014.

HOHFELD, W. N. Os conceitos jurídicos fundamentais aplicados na argumentação judicial. Tradução de Margarida Lima Rego. Avenida de Berna, Lisboa: Fundação Calouste Gulbenkian, 2008. 192 p.

LIMA, J. A. d. O. Apuração do texto original da lei geral de orçamento (Lei n. 4.320/64): um estudo de caso sobre a acurácia de bases de dados de legislação federal. Boletim de Direito Administrativo, NDJ, 2013.

NADKARNI, P. M.; OHNO-MACHADO, L.; CHAPMAN, W. W. Natural language processing: an introduction. Journal of the American Medical Informatics Association, BMJ Group BMA House, Tavistock Square, London, WC1H 9JR, v. 18, n. 5, p. 544–551, 2011.

NAKAMURA, M.; OGAWA, Y.; TOYAMA, K. Extraction of legal definitions from a japanese statutory corpus–toward construction of a legal term ontology. In: Proceedings of 2013 Law via the Internet Conference. [S.l.: s.n.], 2013. p. 11.

NIVRE, J. et al. Universal dependencies v1: A multilingual treebank collection. In: LREC. [S.l.: s.n.], 2016.

RIBEIRO, C. J. S.; PEREIRA, D. V. A publicação de dados governamentais abertos: proposta de revisão da classe sobre previdência social do vocabulário controlado do governo eletrônico. Transinformação, Pontifícia Universidade Católica de Campinas, v. 27, n. 1, 2015.

RINGGAARD, M.; GUPTA, R.; PEREIRA, F. C. N. SLING: A framework for frame semantic parsing. CoRR, abs/1710.07032, 2017. Disponível em:.

SANTOS NETO, A. L. dos et al. Tecnologias de dados abertos para interligar bibliotecas, arquivos e museus: um caso machadiano. Transinformação, SciELO Brasil, v. 25, n. 1, 2013.

VICTORINO, M. de C. et al. Uma proposta de ecossistema de big data para a análise de dados abertos governamentais conectados. Informação & Sociedade, Universidade Federal da Paraíba-Programa de Pós-Graduação em Ciência da Informação, v. 27, n. 1, 2017.






Revista Perspectivas em Ciência da Informação
Antonio Carlos, 6627 - Pampulha
31270- 901 - Belo Horizonte -MG
Brasil
Tel: 031) 3409-5227 






A revista Perspectivas em Ciência da Informação está licenciada com uma Licença Creative Commons - Atribuição 4.0 Internacional.
       IET          IBCT - SEER Portal Scielo Capes Periodicos UFMG        Sistema de Bibliotecas UFMG