Histórico de eval do tagger LLM — Cadeira Vazia

Como o classificador LLM evolui ao longo do tempo

Esta página mostra a evolução do classificador LLM de temas de proposições, medida em execuções periódicas do eval rigoroso (sample estratificado de 50 PLs com codTema CEDI, F1 multi-label). A metodologia completa está descrita em /metodologia § tagging temático.

Resumo

Evolução do F1 ao longo do tempo

Linhas azul (F1 macro) e laranja (F1 micro) por execução do eval. Cada ponto linka para o report JSON daquela data.

Execuções

Data F1 macro F1 micro n Piores 3 classes Report
0.667 0.700 50 Cidades e Desenvolvimento Urbano (F1=0.00); Direito e Defesa do Consumidor (F1=0.00); Direito e Justiça (F1=0.29) ver

← Voltar para Metodologia (tagging temático)