Když právník hledá relevantní judikaturu nebo potřebuje ověřit, jak soud rozhodl v konkrétní právní otázce, má v České republice dvě hlavní možnosti: Beck-online a ASPI. Obě databáze fungují na principu klíčových slov — zadáte hledaný výraz a procházíte desítky až stovky výsledků. Vitreon Legal tento přístup zásadně mění. Místo seznamu dokumentů dostanete přesnou odpověď s citací na konkrétní stránku a paragraf.
Ale jak víme, že naše odpovědi jsou skutečně přesné? Nestačí to jen tvrdit — je potřeba to měřit. Proto jsme náš systém otestovali na nezávislých, veřejně dostupných benchmarcích.
Co je SOTA a proč na něm záleží
SOTA(State of the Art) znamená “nejlepší publikovaný výsledek” na daném benchmarku. Když řekneme, že Vitreon dosahuje +36% nad SOTA, znamená to, že náš systém překonává dosud nejlepší publikovaný výsledek o 36 procentních bodů. To není marginální zlepšení — je to kvalitativní skok.
V kontextu právního výzkumu to znamená: odpovědi jsou přesnější, relevantní dokumenty se nacházejí spolehlivěji a citace jsou ověřitelnější.
Benchmark GaRAGe (ACL 2025)
GaRAGe (General-purpose RAG evaluation) je benchmark publikovaný na konferenci ACL 2025 společností Amazon Science. Hodnotí celý pipeline systémů pro Retrieval-Augmented Generation — tedy schopnost najít relevantní pasáže v dokumentech a na jejich základě vygenerovat správnou, podloženou odpověď.
Hlavní metrikou je RAF (Retrieval Accuracy Factor), který kombinuje přesnost vyhledávání s věrností odpovědi.
| Systém | RAF skóre | Rozdíl |
|---|---|---|
| Vitreon Legal | 0.824 | +36% nad SOTA |
| Publikovaný SOTA (ACL 2025) | 0.607 | baseline |
Jak funguje Vitreon retrieval pipeline
Klíčem k těmto výsledkům je vícestupňový vyhledávací pipeline, který kombinuje několik přístupů. Každý stupeň řeší jiný aspekt problému vyhledávání v právních dokumentech.
Stupeň 1: Hybridní vyhledávání
Každý dotaz prochází současně dvěma vyhledávacími systémy. BM25(lexikální vyhledávání) nachází přesné shody — čísla paragrafů, specifické právní termíny, spisové značky. Vektorové vyhledávání (sémantické) nachází obsahově podobné pasáže, i když jsou formulovány jinak než dotaz.
Výsledky obou systémů se spojí pomocí Reciprocal Rank Fusion (RRF)— algoritmu, který kombinuje rankingy z různých zdrojů a upřednostňuje dokumenty, které se umístily vysoko v obou systémech.
Stupeň 2: Asymetrické embeddingové modely
Pro vektorové vyhledávání používáme model Qwen3-Embedding-8Bs asymetrickým kódováním. To znamená, že dotazy a dokumenty se kódují odlišně — dotaz je optimalizován pro “hledání odpovědi”, zatímco dokument je optimalizován pro “poskytnutí odpovědi”. Tento přístup je zásadní pro právní texty, kde se otázka formuluje zcela jinak než odpověď v zákoně.
Stupeň 3: Cross-encoder reranking
Kandidátské pasáže z hybridního vyhledávání projdou cross-encoder modelem, který společně zakóduje dvojici (dotaz, pasáž) a vyhodnotí relevanci. Tento stupeň je výpočetně náročný, ale přináší rozhodující zpřesnění — v právním výzkumu může rozdíl mezi “podobnou” a “správnou” pasáží spočívat v jediné podmínce nebo kvalifikaci.
Stupeň 4: Podložená generace odpovědí
Nejlépe hodnocené pasáže se předají jazykovému modelu se striktní instrukcí: generovat odpověď výhradně z dodaného kontextu a každé tvrzení opatřit citací na zdrojový dokument, stránku a paragraf. Pokud odpověď v dokumentech není, systém to explicitně uvede — místo toho, aby si odpověď vymyslel.
Proč je to důležité pro český právní výzkum
Česká republika má jednu z nejrozsáhlejších sbírek judikatury v Evropě. Vitreon Legal indexuje více než 295 000 soudních rozhodnutí a 6 800+ zákonů a vyhlášek. Tradiční vyhledávání v takto rozsáhlém korpusu je časově náročné a závisí na tom, zda uživatel zvolí správná klíčová slova.
S Vitreon pipeline může právník položit otázku přirozeným jazykem — česky nebo anglicky — a získat podloženou odpověď s přesnými citacemi. Nemusí procházet stovky výsledků a hádat, které klíčové slovo použít. Systém rozumí právní terminologii nativně: “judikatura”, “občanský zákoník”, “soudní rozhodnutí”, “dovolání”.
Benchmark LEXam Open EN (ICLR 2026)
Kromě GaRAGe jsme testovali i na benchmarku LEXam, publikovaném na konferenci ICLR 2026. LEXam hodnotí schopnost AI systémů odpovídat na právní otázky z profesních zkoušek. Na variantě Open EN (anglické otevřené otázky) Vitreon dosahuje 0.691, což je +21% nad baseline Claude 3.7 Sonnet (0.572).
Tento výsledek ukazuje, že retrieval-augmented přístup (vyhledávání + generace) výrazně překonává čistý jazykový model i na úrovni profesních právních zkoušek.
ARLC 2026: 4. místo z 80 týmů
V únoru 2026 jsme se pod týmovým jménem “Neon Team” zúčastnili mezinárodní soutěže Agentic RAG Legal Challenge (ARLC 2026) v rámci Dubai AI Week. V warmup kole soutěžilo 340 týmů, top 80 postoupilo do finále. Na warmup kole jsme dosáhli skóre 0.920 (9. místo z 340, G sub-score 0.957), ve finále 0.719 (4. místo z 80).
Stejný retrieval pipeline, který dosáhl těchto soutěžních výsledků, nyní pohání produkční platformu Vitreon Legal. Podrobný popis soutěže najdete v článku How Vitreon Placed 4th in ARLC 2026 (anglicky).
100% pokrytí citací
Každá odpověď vygenerovaná Vitreon Legal obsahuje citace na přesnou stránku, paragraf a zdrojový dokument. To není statistický průměr — je to architektonická záruka systému. Jazykový model generuje odpovědi výhradně z nalezených pasáží a každé tvrzení musí být podložené.
Pro právníka to znamená: každou citaci si můžete okamžitě ověřit v původním dokumentu. Žádné halucinace. Žádná nepodložená tvrzení.
Jak začít
Vitreon Legal je dostupný na vitreon.app. Bezplatný plán zahrnuje 3 dotazy denně bez nutnosti platební karty. Stačí se registrovat pomocí Google účtu nebo emailu a začít vyhledávat v české judikatuře a legislativě.
Kompletní přehled benchmarkových výsledků najdete na stránce Benchmarks.