V dávných dobách, kdy bylo obyvatelstvo požehnaně negramotné, existoval institut člověka s bubnem nebo trubkou, který, kdykoli veřejná moc (dobově zvaná vrchnost) pocítila potřebu cokoli právně relevantního poddanému lidu intimovat, vyšel na prominentní místo v obci, tam svým nástrojem vzbudil pozornost davu a přečetl, co mělo být sděleno. Pro ty, kteří sdělení nemohli být přítomni, se písemná podoba zvěsti vyvěsila na vhodné místo, a tak vznikla úřední deska, právní zařízení, jež v prakticky nezměněné formě existuje dodnes.
Existuje, a funguje čím dál hůř. Jednak je nemyslitelné, aby si každý přečetl, co je tam umístěno, už jen kvůli mnohosti těchto desek, jednak se vrchnost prakticky přestala starat o to, aby se zpráva dostala k adresátům, a v mnoha případech, např. u vyhlašovaných dražeb, je to přímo nežádoucí: mezi kamarády se draží laciněji a hladčeji. Z úřední desky, zařízení kdysi užitečného, se stalo alibi.
To se mohlo změnit v době elektronické, jenže elektronické úřední desky jsou stejně nepřehledné jako ty dřevěné a nikdo je nečte a ani číst nemůže.
Sledování úředních desek soudů a státních zastupitelství jsme zařadili do našeho systému legal.pecina.cz: oficiální aplikace ministerstva spravedlnosti infoDeska je k ničemu, protože se v ní nedá vyhledávat ani podle jména osoby, ani podle jiných kriterií. My všechny dokumenty ukládáme na server a zároveň předvádíme do textové podoby, v cca 3 % případů, kdy jsou vystavovány skeny, pomocí OCR, takže se dá vyhledávat fulltextově a bez potíží.
Problémem je, že zatím zřejmě nebudeme schopni uložit celou historii, kterou infoDeska nabízí, neboť server, na němž náš systém běží, nám poskytuje sponsorsky společnost NETHOST, a jeho kapacita je pro daný účel nedostatečná. Protože je legal.pecina.cz bez reklam, nemáme ani žádné příjmy, ze kterých bychom případný nákup nebo pronájem hardwaru/prostředků v cloudu hradili.
Důležité upozornění!
Policie České republiky se zajímá o IP-adresy osob, které komentují tento blog. Ve vlastním zájmu zde proto nic nepopírejte, nezpochybňujte, neschvalujte, neospravedlňujte, nikoho a nic nehanobte, nepodporujte a nepropagujte, a pokud se přesto rozhodnete komentář přidat, pak se, prosím, ničemu nedivte.
Úřední deska
- Autor: Tomáš Pecina
- Kategorie: Právnické výpočty
- Počet zobrazení: 5798
Komentáře
Kdybych měl dost hardwaru, nahrál bych tam všechny dokumenty od r. 2009.
ceskatelevize.cz/.../...
Sněmovní komise k únikům ze spisů dokončila výslechy
www.ceskenoviny.cz/.../1520831
A co na to předseda Ústavního soudu ČR?
strana 61:
P. R.: ... Zrovna nedávno se ke mně v samoobsluze nějaký člověk živě hlásil: „Já začínal jako právník v Bílé labuti u vašeho tatínka. On mě učil krást ze spisů!“
T. N.: * Co že ho prosím učil?
P R.: Patrně šli spolu studovat spis na soud a nevýhodné listiny odstranili...
zdroj:
Pavel Rychetský, Tomáš Němeček: Diskrétní zóna. Praha: Vyšehrad, 2011.
Stačila by linka 100Mbit full duplex?
Tzn. data za jeden rok vyžadují cca 100 GB úložného prostoru.
Na rychlé úložiště nebo cache v RAM je náročný pouze fulltextový index. Ten v současné chvíli zabírá cca 7 KB na soubor, takže ročně by to bylo cca 2 GB.
Chtěl-li bych mít na serveru data za 10 let, tedy celý archiv infoDesky, potřeboval bych 1 TB diskového prostoru a 20 GB rychlé SSD nebo ještě lépe RAM na indexy. To není nedosažitelné, jen je to drahé: můj server má nyní 8 GB RAM a 300 GB HDD, bez SSD.
Slibuji, že pokud se nesejde dost peněz na nájem nového serveru, výtěžek na počest zmařeného projektu poctivě propiji.
Příliš se mi za této situace nechce jít do žádné "větší akce", protože by to znamenalo, že si pronajmu server a počínaje čtvrtým měsícem ho budu muset platit ze svého, cca 3-3,5 tisíce korun měsíčně. Lepší by bylo sehnat peníze na hardware, k tomu ale momentálně dost chybí. Velmi proto uvítám jakékoli další finanční příspěvky, číslo účtu sdělím e-mailem.
Sponsorům, dosavadním i potenciálním, děkuji.
Řeším teď hlavně, čím indexovat. Domníval jsem se, že si vystačím s fulltext indexem pgSQL, ale zjistil jsem, že vůbec nezvládá hledání frase (A <-> B), což je pro tuto aplikaci zcela zásadní: nejčastěji se v dokumentech bude hledat konkrétní osoba, takže jméno následované příjmením. To by nevyřešil ani extremně silný server, podle všeho se mi jeví, že to developeři pgSQL naprosto dokopali.
Alternativou je externí indexer; momentálně zkouším Sphinx. Až ho zprovozním, uvidím, jak je na tom s rychlostí. Podle toho se dá určit, zda je možné mít index na SSD nebo je potřeba držet mít dostatek RAM, aby mohl být celý v cachi.
Nevim, tak jak jste popisoval ulohu, melo by vyhrazene pasmo 10-15Mbit bohate stacit coz v dobe 100-500Mbit nic neznamena.
I tak Vam popreji sponzory sustici papirkama.
Servery jsou obecně dražší než desktopový (spotřební) hardware, ale taky několikanásobně déle vydrží. Můj současný je téměř 10 let starý, přesto bezproblémově provozovatelný; normální počítač by byl za tu dobu bezpečně ve šrotu, spíš dvakrát. Další náklady představuje zdvojení všech disků, protože bez RAIDu by server s podobnou aplikací provozoval jen šílenec.
Co se týká přenosového pásma, pokud chci mít data z úředních desek na serveru za několik měsíců a ne let, musím denně přenést cca 10 GB, a to jen v noci, abych zbytečně nezatěžoval zdrojový server. Zkuste si to, milý odborníče, pár dní z domácí xDSL linky, co tomu váš ISP řekne.
- servery nejsou o tom, ze se nepokazi, ale ze dodavatel umi komponentu vymenit po jistou dobu - obvykle 5 let
- co se tyce desktopu, bezne vydrzi 10 i 12 let 24x7, cena je jinde
- hw raid nevnimam, jako vyhodu(ten kdo data z toho zachranoval vi sve), napr. ZFS resi daleko vice
Co se tyce internetu:
- tak opravdu jsem necekal, ze jedete na necem xDSL v ceske verzi, jinak VDSL3 je trochu jine kafe, to mi i moje wifi dava 30/30 a muj provozovatel dostal zaplaceno a k provozu se nema co vyjadrovat. Patrne jste si spatne vybral ISP ci pri Vasem charakteru musite byt v opravdu nuzne lokalite
- mel jsem za to, ze data uz mate a stahujete jen denni prirustky, ne ze jste ve stavu downloadu
Je tu dale mozno mit svuj server/virtual u ruznych neziskovek, jen za naklady...
Vaše představa, jak provozovat server doma, je arci revoluční. Její technické důsledky raději nebudu komentovat, jen ve zkratce: bandwidth, latence.
ZFS na jednom disku je opravdu bezpečné řešení, asi tak, jako kdybyste na něm měl RAID. Pobavil jste, jen přidávejte!
Nemohu za to, ze podporujete pokracovatele telecomu(at je distribuce uctovana kymkoliv) a neumite si zaridit slusnou sluzbu. Pravda na telekomackych xDSL bych to take neprovozoval.
Kdo psal o RAIDu na jednom disku? To je nejaky smutny pokus o trolovani?
Kdo chce hleda reseni, kdo nechce hleda vymluvy...
Celé je to o tom, co si postavíte a z čeho. Supermarketový počítač to nepřežije dlouho. Nebo Intel procesor v zátěži s teplovodivou pastou místo napájeného chladiče.
Také jsem provozoval několik let doma webový server. Dokonce i na relativně pomalé lince (pod 1Mb/s upload). Běželo to velice slušně, je to otázkou také optimalizace výsledných HTML.
Kdybych měl veřejnou IP, pokračoval bych v tom dále. Ale síťaři vymysleli, jak rychle prošustrovat přes 4 miliardy veřejných IPv4 adres, aby naschvál nebylo dostatek Ipv4 adres. A pak vymysleli proces přechodu na IPv6 tak (stylem my jsme síťaři, a naše IPv6 prosadíte style fuhrer diktátor a ukážeme vám svou moc), že přechod neproběhne ani za nejbližších příštích 20 let. Což za situace, kdy v IPv4 je nainverstováno hodně moc biliard dolarů a Ipv6 nic ekonomicky významného nepřínáší není divu.
Miloslav Ponkrác
Je fascinující, kolik peněz, jakou dobu a jaké úsilí musí vynaložit stát, aby zplodil něco tak nefunkčního jako jsou ty jeho aplikace, a jak to pak uděláte Vy, pane Pecino, to prostě "čumím".
Děkuji tedy Vám i Vašim pomocníkům a kolegům.
Existuje-li jiná obdobná aplikace, jak v diskusi zmíněno, já jí neznal, moje chyba, ale budu šířit "světlo" dál mezi kolegy.
K Vaší charakteristice institutu "Úřední deska" není co dodat. Přesně tak to je. A z institutu právu sloužícímu , se stal institut právo popírající.
Ach jo.
L.Petříček
mmch, čím je krmené to Django? Předpokládám PostgreSQL.
Jak se vy(zne)užívá ouřední deska vysvětlil hezky DNA ve Stopařově průvodci.
Vladimír
Jedna db tabulka je slovník slov (word_id, word_text) a další tabulky i hledání už jsou jen práce s celočíselnými hodnotami.
Miloslav Ponkrác
MySQL stála od verze 4 za starou belu až do té doby, než ji vzal do rukou Oracle - až pak se začala trochu podobat použitelnému tvaru. U Sunu (předchozího vlastníka) jsem měl silný dojem, že nové vlastnosti jsou přidávány přesně manažerským způsobem a přesně plánovanými termíny. Takže přibývaly vlastnosti stylem: nová vlastnost tam je, má miliardu chyb - ale je to v termínu. Rozhraní nových věcí bylo vymyšleno horkou jehlou a implementaci také. Nebyl pro mě problém shodit databázový stroj či ho řadou SQL příkazů dostat do stavy, kdy zničil integritu databáze či rovnou nevratně celou databázi na disku.
Podle mého soudu dobrý fulltext uděláte jen sám vlastníma rukama - ať už v db tabulkách, nebo na souborech. Navíc si ho uděláte tak, jak to daný projekt potřebuje - a funguje to dobře.
Miloslav Ponkrác
ceska-justice.cz/.../...
zpravy.idnes.cz/.../...
zpravy.idnes.cz/.../...
RSS kanál komentářů k tomuto článku