Esta página mostra a evolução do classificador LLM de temas de proposições, medida em execuções periódicas do eval rigoroso (sample estratificado de 50 PLs com codTema CEDI, F1 multi-label). A metodologia completa está descrita em /metodologia § tagging temático.
Resumo
- Execuções registradas: 1 (de a )
- F1 macro variou de 0.667 a 0.667 no período.
- Última execução (2026-05-18): F1 macro = 0.667, F1 micro = 0.700, n = 50.
Evolução do F1 ao longo do tempo
Execuções
| Data | F1 macro | F1 micro | n | Piores 3 classes | Report |
|---|---|---|---|---|---|
| 0.667 | 0.700 | 50 | Cidades e Desenvolvimento Urbano (F1=0.00); Direito e Defesa do Consumidor (F1=0.00); Direito e Justiça (F1=0.29) | ver |