Big Data no Judiciário: métodos de análise do Índice de Confiança na Justiça Brasileira

26/04/2017 | 4 min. de leitura

Na série de artigos Big Data no Judiciário, já apresentamos Análises Preditivas e Machine Learning, análise de dados na justiça, além da diferença entre BI e Analytics.

Hoje, eu, Joni Hoppen e o Tiago Melo, da Softplan, tratamos dos métodos de análise como continuidade do artigo anterior sobre Índice de Confiança na Justiça Brasileira.

A partir do novo dataset, o objetivo da análise passou a ser a análise de correlações individuais, causalidade e tendências através de outros métodos, destacadamente a clusterização e a árvore de decisão.

Métodos de análise aplicada

Clusterização – agrupamentos de registros por similaridade

Para a análise de clusterização, utilizamos mais uma vez a ferramenta Vortx Big Data, como no post original da nossa série de artigos. 

Os diferenciais mais importantes deste algoritmo em relação ao popular K-means (open source) são: 

• Capacidade de encontrar o número ideal de grupos homogêneos e suas proporções de forma automática por sua própria inteligência gerando a visualização Pareto para priorização.
• Detecção automática de outliers (registros que fogem da normalidade)
• Cálculo de nitidez ou qualidade dos padrões encontrados no conjunto de dados .
• Separação dos grupos a partir ponderando os níveis energia ou força sistêmica de cada uma das colunas, ou seja, alguns fatores podem influenciar mais e outros menos a formação do grupo.

Assim, o output do Vortx destacou dois grandes grupos, compreendendo 86% das observações. O maior deles, 60% das observações, pode ser caracterizado como de alto ICJ, com resultado médio de 5,2; e um segundo com ICJ médio 4,5.

Os fatores que diferenciam o grupo do alto resultado são:

  • Desemprego 20% menor;
  • 41% mais casos entrados no primeiro grau;
  • 17% mais casos baixados de conhecimento.

Árvore de decisão

Já o método de árvore de decisão é um algoritmo de classificação para representações do conhecimento a partir de inferências indutivas. Ele permite revelação de padrões e a predição dos comportamentos com base em séries históricas de dados. A árvore de decisão tem como característica ainda a facilidade para uma programação preditiva de relativa baixa complexidade, através de cláusulas if-else.

Nesta análise, classificamos os resultados do ICJ em 5 grupos, sendo o mais baixo deles com ICJ de 4,2 a 4,4 e os mais altos de 5,3 a 5,5 e 5,6 a 5,8. Estimamos o modelo no mesmo dataset mensal de 72 observações e 15 variáveis, na ferramenta Weka.

Para a análise de uma árvore de decisão, utilizamos a própria analogia de uma árvore, com folhas partindo de algum nó.

O primeiro nó de nossa árvore temos a quantidade de casos baixados na fase de execução. A baixa nesta fase processual é uma baixa finalística, que determina que uma parte efetivamente cumpra a sentença judicial. Portanto, faz sentido que esta variável seja um indicativo importante de percepção, em lugar de baixa de caso de conhecimento, por exemplo, que precede a fase de execução.

Os outros nós da árvore (variáveis significativas) são:

  • Taxa selic;
  • Mês de referência;
  • Índice de desemprego e
  • Casos nos juizados especiais.

As melhores pontuações caracterizam-se por:

  • Menos de 73 mil casos baixados na fase de execução por mês nos meses de janeiro a março
  • Mais de 73 mil baixados na fase de execução e taxa selic menor ou igual a 0,69;
  • Mais de 73 mil baixados na fase de execução, taxa selic entre 0,69 e 0,77, desemprego entre 10,4 e 11,3 e menos que 68.309 casos novos no juizado especial;
  • Mais de 73 mil baixados na fase de execução, taxa selic maior que 0,82, desemprego entre 10,4 e 11,3 e menos que 68.309 casos novos no juizado especial.

Conclusão da análise do ICJ e recomendações

Apesar de ter cumprido seu objetivo inicial exploratório de validar a aplicação de Analytics para a previsão do ICJ, concluímos que todos os modelos deixam evidente a latente necessidade de incorporação de novas variáveis (novos indicadores) relacionadas à uma série histórica temporal mais longa. O que é absolutamente natural no processo de inserção da cultura de Data Analytics no âmbito organizacional.

Esses resultados preliminares podem parecer um emaranhado de números sem sentido ou até mesmo um grupo de resultados contraditórios. Essa é uma percepção usual para análises de cunho exploratório que é o primeiro passo ou nível 2 maturidades de dados rumo jornada das gestões orientadas à dados. Abaixo sugerimos uma escala de maturidade de 0 a 5.

  1. Sem coleta de dados e consequentemente decisões empíricas individualizadas.
  2. Dados coletados sem uma arquitetura de informação orientada aos dados com decisões empíricas individualizadas.
  3. Dados sendo coletados com indicadores validados e orientados à cultura de dados com decisões sendo pautadas em sistemas de monitoramento com visualização compartilhada e decisões em colegiado.
  4. Dados coletados sistematicamente com alta qualidade de processamento em termos de velocidade, quantidade, veracidade e a geração automática de recortes disponíveis para análises preditivas. Decisões baseadas em probabilidades estatísticas robustas.
  5. Dados coletados com decisões sendo executadas de modo automático ou semi-automático por meio de mecanismos de inteligência artificial computacional e grande nível de transparência, precisão dentro de um modelo de gestão evolutivo PDCA.

O que os resultados nos indicam de forma categórica é que sim, Analytics e Big Data podem ser aplicados nos dados do judiciário. Neste caminho progressivo do nível de maturidade de gestão orientada à dados no judiciário brasileiro, a Softplan aliada ao seu ecossistema de negócio e tecnologia, vem se mantendo na vanguarda de inovação no país por meio expertise técnico/metodológica e de negócios.

Recomendações

Entre as variáveis a serem buscadas, destacamos a necessidade de monitoramento das seguintes variáveis:

• Mídia tradicional (IBOPE)
• Mídias sociais (Facebook, Twitter) baseada em processamento de linguagem natural e detecção de sentimento em tempo real em língua português brasileiro, preferencialmente geo-referenciada.
• Indicadores demográficos regionalizados.

Reflexões

Esses resultados podem parecer um emaranhado de números sem sentido ou até mesmo um grupo de resultados contraditórios. Essa é uma percepção usual para análises de cunho exploratório.

O que os resultados nos indicam de forma categórica é que sim, Analytics e Big Data podem ser aplicados nos dados do judiciário. E sim, a Softplan detém a expertise necessária tanto na área do negócio quanto na área da tecnologia.

*Artigo escrito em parceria pelos colunistas Tiago Melo e Joni Hoppen.

Seus comentários são sempre muito bem-vindos. Comente!

Este espaço destina-se às repercussões sobre notícias e artigos publicados no SAJ Digital. São de responsabilidade de seus autores. Não servem como abertura de chamados e atendimentos para o portal e-SAJ.

Leia também

Receba nossas novidades por e-mail:

Fale com o
especialista
Desenvolvido por: Linkedin Instagram