Důležité upozornění!

Policie České republiky se zajímá o IP-adresy osob, které komentují tento blog. Ve vlastním zájmu zde proto nic nepopírejte, nezpochybňujte, neschvalujte, neospravedlňujte, nikoho a nic nehanobte, nepodporujte a nepropagujte, a pokud se přesto rozhodnete komentář přidat, pak se, prosím, ničemu nedivte.

Aniž bych se chtěl odchýlit od svého názoru na účelnost všelidové presidentské volby presentovaného v textu Chléb, hry a přímá volba, nedá mi, abych nepřipojil několik poznámek, jež mne napadly nad četbou rozhodnutí o odmítnutí nebo registraci kandidátních listin.

Za prvé jsou nedůvodné úvahy Martina Škopa a dalších nad tím, že by nestejný počet chybných podpisů na prvních a druhých vzorcích byl důkazem manipulace ministerstva při kontrole. Mathematická statistika a její methody jsou obecně použitelné jen tehdy, jsou-li splněny jejich předpoklady; tak tomu však v daném případě není, a to hned ze dvou důvodů. Jednak není zajištěna homogenita statistické populace na jednotlivých arších, jež měly každý jiný, občas zřejmě i velmi pohnutý osud, a za druhé, což je pro danou situaci důležitější, při ověřování podpisů na druhém zkušebním vzorku ministerstvo vyřazovalo i ty záznamy, které vykazovaly duplicitu s podpisy zjištěnými na prvním vzorku, kdežto u prvního vzorku tyto nově zjištěné chyby do výsledku již nezapočítalo (zda je to methodicky správné či chybné, ponechávám úvaze laskavého čtenáře). Právě tato nedůslednost a nestejný přístup k prvnímu a druhému vzorku, ve spojení s heterogenním rozložením tohoto druhu vad mezi archy, způsobily nerovnoměrnou percentuální chybovost u petičních archů Jany Bobošíkové, kde bylo ve druhém vzorku zjištěno přes 300 duplicit, zatímco v prvním byl jejich počet statisticky nevýznamný.

Dále mne zaujaly důvody, pro které byly podpisy odmítány. Uvedení jiné adresy než adresy trvalého pobytu bych chápal, protože neinstruovaný signatář logicky zapíše bydliště faktické, nikoli nutně úředně evidované. Nejde o takovou chybu, která by svědčila o fraudulentním jednání, přesto takový zápis porušuje zákon a příslušná osoba může být oprávněně vyřazena. Lex dura, sed lex.

Četné další podpisy byly vyřazeny proto, že signatář uvedl minulou adresu trvalého pobytu. To už je větší problém, který spíše než o chybě svědčí o tom, že kandidát a jeho aparát nejspíš vytvořili záznam na základě neaktuální, na černém trhu pořízené kopie centrální evidence obyvatel nebo jiné database obsahující záznamy o fysických osobách.

Jiné vysvětlení ani není možné v případě signatářů, kteří již v době svého údajného podpisu nebyli naživu. I když v některých případech půjde o dílo vtipálků, jež kandidáti jen opomněli vyškrtnout, četnost těchto případů je jasným indikátorem podvodu: mrtví lidé se ve slušně vedeném právním státě pod petice nepodepisují.

Že je postup pro eliminaci chybných podpisů děravý jako ementálský sýr, je celkem zřejmé, a není složité spočítat si, že při dostatečném počtu petičních archů lze potřebných 50 tisíc podpisů vygenerovat, zcela v souladu s nezdařilým zákonem, theoreticky dokonce i z podpisu jediného. To, že se neověřuje authenticita podpisu, ale jen existence signatáře, k podvodům tohoto druhu přímo vybízí.

Zarážející je ovšem tolerance veřejnosti k těmto podvodům: jako bychom všichni počítali s tím, že kdo chce zastávat v této zemi nejvyšší úřad, nesmí se nějakého toho podvůdku štítit: vždyť přece chce být presidentem Čechů, nebo ne? A to je, aspoň pro mne, na celé volební šarádě tím vůbec nejděsivějším.

Komentáře   

0 # Anonymní 2012-11-26 07:34
Nojo, tolerujeme, protože těch 50k podpisů je vopruz, který si na kandidáty, které nebudou navrhovat sami, vymysleli zákonodárci. Volba tím není rovná už předtím než přijde k volbám první volič (kandidát zákonodárců je určitým způsobem jaksi rovnější) a já jako volič v žádném případě neodsuzuju kandidáta, který se konkrétně toto pokusil odrbat..
Jo kdyby tuhle podmínku museli splnit všichni kandidáti....
0 # Tomáš Pecina 2012-11-26 07:45
Velmi přesně jste řekl, o čem píšu: vám nevadí, že by se stal vaším presidentem podvodník, který je ochoten zákonnou povinnost "odrbat". Mně ano.
0 # Tomáš Krystlík 2012-11-26 11:35
Vážený pane Pecino,

zamyslel jste se již někdy nad tím, z čeho pramení český sklon k podvádění, obcházení zákonů, proč to má novodobý český národ v krvi? Za to nemůže bolševická éra, to pochází již z doby obrození, zejména z 2. poloviny 19. století, kdy Češi začali pohlížet na rakouské mocnářství jako na cizí státní útvar, který je možné poškodit, okrást, podvést, nedodržovat jeho zákony. A to až po úroveň nejnižší, obecní. Že tím škodili automaticky i sami sobě, jim nedošlo. Za 1. republiky jednali stejně jako za monarchie, z návyku, ze setrvačnosti a jednají tak dodnes.
0 # gogo 2012-11-26 08:49
Mají prostě říct, že nejsou pokladníci ..
zpravy.idnes.cz/.../...
0 # Anonymní 2012-11-26 11:00
Jak by se dalo vygenerovat 50000 podpisu z jedineho, kdyz se overuji duplicity?
0 # Jiri Dobry 2012-11-26 11:54
Jednoduse. Date na peticni arch pouze "Novaka" ve spouste examplaru. Kazdy jiny, jmeno, adresa, narozeni. Ale na podpis si poridite razitko. Podpis nikdo neoveruje a kazdy z tech Novaku bude jiny a realne existujici.
Nebo jednoduseji bude na tom podpisovem razitku necitelny klikihak.
0 # Tomáš Pecina 2012-11-26 13:47
Jednoduše. Jedna osoba se podepíše 50000×8500-krát. Libovolný vzorek tak bude mít chybovost 8499/8500, takže z tohoto počtu započítají pouze 50000×8500/8500 = 50000 podpisů.
0 # Mormegil 2012-11-26 15:24
Druhý vzorek bude mít 100% chybovost (duplicity ve druhém vzorku se detekují i vůči prvnímu), takže výsledná chybovost bude ve skutečnosti 16999/17000. Což na podstatě nápadu nic nemění, jen těch podpisů budete muset mít ještě dvakrát tolik. :-)

Ovšem váš brilantní trik ministerstvo snadno pokoří, jelikož chybovost obou vzorků nebude průměrovat, ale sčítat, takže vám zůstane minus 424950000 podpisů plus oči pro pláč. A pak, že jsou hloupí.
0 # Jiri Dobry 2012-11-26 15:26
Tak to je jeste lepsi for nez me napadlo :-)
Uprimne pri 1 sekunde na podpis me to vychazi na 13.5 clovekroku nonstop prace.
0 # Tomáš Pecina 2012-11-26 15:33
Ad Mormegil: Ano, správná poznámka.

Ad Jiří Dobrý: Vy jste neslyšel o přístroji, kterým podepisuje listiny např. americký president?
0 # Jiri Dobry 2012-11-26 15:55
Autopen? To by byla stranda :-)
Jinak je to dusledek zjednoduseneho pocitani duplicit, ktere opdavdu nejdou ze vzorku interpolovat linearne.
Me spis pobavilo to ohromne mnozstvi, ktere je na tento trik nutne.
50000x8500 = 425 000 000. Na jeden papir cca 25 podpisu je celkem 17 000000 papiru. A4 kancelarska ma 80g/m2. A4 ma 0.06237m2.
Vysledek? Necelych 85 tun papiru.
0 # Anonymní 2012-11-26 17:17
Ony jsou ty duplicity vůbec zajímavý, u Bobo to dělá skokovej nárust z 81 na 377 mezi vzorky velikosti 8500 a 17000 čili extrapolací na celej soubor by to mohlo bejt i přes 10% vyřazených duplicit, kdyby se to zkontrolovalo celý sakumpikum. Ono taky kdo si má pamatovat, co všechno už podepsal, když to běží skoro rok ;-)
Takže pokud padne rozhodnutí volby odložit dokud se to nepřepočítá komplet, dočkáme se ještě mnohých překvapení. Druhá možná volba je pustit všechny bo věrohodnost kontroly je nulová.
A.J.
0 # gogo 2012-11-26 17:18
Materialisto!
0 # luke 2012-11-26 18:31
Tu extrapolaci duplicitnich podpisu nechapu, muze mi nekdo napsat jak se to spocita? Neni to jednoduse tak, ze ve dvakrat vetsim vzorku je ctyrikrat vic duplicit?
0 # Anonymní 2012-11-26 19:35
Ale ano, čtyřnásobek pravděpodobnosti záchytu čili dvojnásobné procento chybovosti při dvojnásobném vzorku, akorát ty výchozí hodnoty budou mít slušnou statistickou chybu, takže těžko říct jestli to bude spíš 6,5% (z vzorku 8500) nebo 7,4% (z vzorku 17000) nebo se to posune o něco výš či níž, těch deset procent je asi trochu přehnanej první nástřel. To je tim počítánim od boku, řádově to většinou sedí ;-) ale každopádně se dá při přepočítání celýho souboru očekávat, že u těch procent ohlášených pro druhej vzorek nezůstanem a půjde to cca ještě o 4% až 5% výš, dtto a podobně i u ostatních kandidátů, takže si Tomio tim požadavkem přepočítat vše zrovna moc nepomůže. Snad leda by se do hry vrátilo "minulé bydliště" třeba rovněž k březnu, jako se to bere u mrtvol. Kdybych dělal pro Fortunu, už to sjíždim podrobně podle jednotlivých druhů chyb a stanovuju kursy ..
A.J.
0 # Jiri Dobry 2012-11-26 11:53
Tento komentář byl odstraněn autorem.
0 # Anonymní 2012-11-26 13:12
V rozhodnutích MVČR se píše, že dotyčný zemřel před vznikem petice. Bohužel to tvrzení je naprosto nepřezkoumatelné, protože některé petice vznikaly ještě před oficiální mediálním vyhlášením kandidatury. Správně by tam mělo být, kdy podle MVČR petice vznikla a kdy dotyčný zemřel. Být kandidátem typu Dlouhého, zkusím toto napadat.

U minulé adresy trvalého pobytu může jít o důsledek vypisování údajů z neaktuálních databází, ale na druhé i důsledek automatizace (manželka se také občas podepisuje svým příjemním za svobodna) či z důvodu komplikovanosti různých adres důsledkem obdobného pochybení, proč tam lidé píší faktické bydliště. Např. moje minulé místo trvalého pobytu je mnou obvykle uváděnou doručovací adresou pro úřady i zasílání zakoupeného zakoupené zboží, faktické bydliště mám jinde (a budu jej brzy znovu měnit) a současný trvalý pobyt mám ještě úplně jinde.

U neexistujích osob půjde často o důsledek jednání náctiletých brigádníků plcených od podpisu, ale když MVČR nedokázalo ztotožnit Zemana se Zemanem, máme takřka jistotu, že podobným přehmatům došlo i zde.

AHL
0 # Anonymní 2012-11-26 14:14
Podle ministerstva /viz rozhodnutí, např. www.mvcr.cz/soubor/jana-bobosikova-pdf.aspx / se jako rozhodné datum používá platnost zákona o přímé volbě k 12. 3. 2012 což je skoro korektní. Nevim ale jaký lhůty se ale používaj k odstranění z titulu "minulá adresa", když datum podepsání neexistuje nebo se dle mv nezpracovávalo. Tam to spíš vypadá že čerství přestěhovalci maj smolu .. Pokud byla nalezena tatáž osoba, avšak prokazatelně s jinými údaji, např. jiná adresa nebo adresa v současné době již neaktuální, operátor označil záznam za neztotožněný.
A nevim co opravňovalo ouřad hledat duplicity mezi vzorky, o tom se snad v předepsaný kontrolní proceduře nic nepíše.
A.J.
0 # Anonymní 2012-11-26 14:51
Presne to same jsem prave take dohledal a poslal do vlakna nize. Podle zakona ma urad overit SPRAVNOST. Obcan je zase podle zakona uvest podpis "s uvedením adresy místa jeho trvalého pobytu".

Logicky spatne je tedy overovat spravnost adresy k okamziku kontroly, misto k okamziku podpisu kam to obcan popravde a radne vyplni. Stejne tak to bude se jmenem, ktere se take muze v mezidobi zmenit.
0 # gogo 2012-11-26 13:14
On to je totiž asi od počátku zprasek šitý horkou jehlou a bez použití obsahu mozkovny.
Většina lidí z mého okolí je zděšená hňupstvím jak zákonodárce, tak ministerstva. Nejčastejší reakce je proto "pustit všechny" a to ne kvůli toleranci k podvodům, ale kvůli tomu, že systém naprosto není připraven na rozumné zpracování a ověřování. Největší dohady se vedou o tom, zda jsou papaláši opravdu takoví blbci, anebo to udělali schválně.

Jeden rozhořčený hlas jsem ovšem zaslechl i ohledně neplatných hlasů. Tento člověk souhlasil s odpočtem tak, jak ho provedlo ministerstvo a odůvodnil to tím, že za podvod musí přijít spravedlivý trest - zde ve formě odečtení dvojnásobku průměru.

Už mi to začíná připomínat rozbory literárních děl, kde si každý taky najde "to své" .
0 # Anonymní 2012-11-26 13:21
"podvod musí přijít spravedlivý trest - zde ve formě odečtení dvojnásobku průměru."

Otázkou je, je pak zabráníte tomu, aby politická konkurence záměrně nepoškozovala protikandidáty tím, že jim tam bude naschvál psát neplatné podpisy. Pak by i kandidát s 50 000 platnými a skutečnými podpisy mohl být snad v minusu. Představte si třeba situace obdobnou vajíčkové kampani proti Paroubkovi.

AHL
0 # Tomáš Pecina 2012-11-26 13:49
Trest ve formě sankčních nezapočítaných hlasů je v přímém rozporu s dikcí Ústavy.
0 # Guy Peters 2012-11-26 18:34
Přejímka dvojím výběrem.

Nemyslím, že by to bylo protiústavní. Ústava hovoří o petici; sankci nevylučuje.
0 # Tomáš Pecina 2012-11-26 18:45
Navrhovat kandidáta je oprávněn každý občan České republiky, který dosáhl věku 18 let, podpoří-li jeho návrh petice podepsaná nejméně 50 000 občany České republiky oprávněnými volit prezidenta republiky.

Tam není pro sankci nejmenší prostor.
0 # Guy Peters 2012-11-26 18:53
Klíčová slova: „navrhovat kandidáta“. To neznamená, že MV musí navrženého kandidáta zaregistrovat, pokud zákon stanoví něco jiného.
0 # luke 2012-11-26 19:09
Ustava hlavne hovori o tom, ze kandidovat smi clovek s 50000 podpisy. To je nadrazene vsemu ostatnimu. Takze neni mozne vyradit cloveka, ktery ma 55000 platnych podpisu, z toho duvodu, ze ma navic 10000 neplatnych. Nebo dokonce jenom 2501 neplatnych, podle Henychovy logiky. Ten jeho postup je jednoduse protiustavni, protoze vyrazuje kandidaty, kteri podle ustavy maji jednoznacne pravo kandidovat.
0 # Guy Peters 2012-11-26 19:14
Tak znovu: „kandidovat“ <> „navrhovat kandidáta“.
0 # luke 2012-11-26 20:02
Ty vase uvahy o "navrhovani kandidata" vs "kandidovat" vs "registrace" jsou komicke, tim nebudu ztracet cas.

Hlavni je, ze zakon nestanovi "neco jineho", neco co by umoznovalo, ze kandidat s 50000 platnymi podpisy bude vyrazen:

"...odečte se od celkového počtu občanů podepsaných na petici počet občanů, který bude procentuálně odpovídat chybovosti v obou kontrolních vzorcích."

Jak se spocita chybovost v obou kontrolnich vzorcich? Vydelenim poctu chybnych podpisu v obou kontrolnich vzorcich celkovym poctem podpisu v obou kontrolnich vzorcich. Tecka. Ten zakon nema dva vyklady proboha! Natoz, aby ten Henychuv "vyklad" byl bliz doslovnemu zneni zakona a pouze postradal selsky rozum, coz je dokola omilany nesmysl.
0 # Tomáš Pecina 2012-11-26 20:19
Souhlasím. Právu občana navrhovat kandidáta koresponduje povinnost veřejné moci tuto kandidaturu umožnit. Prostor pro sankční zvyšování počtu hlasů nulový, prostor pro aplikaci statistických nebo stochastických method při ověřování velmi omezený.
0 # Anonymní 2012-11-26 21:33
úplně bych slovo "nejméně" (podepsaná nejméně 50 000 občany) nepodceňoval, znamená nepřekročitelnost spodní hranice, zatímco při průměrování by s velkou pravděpodobností u počtu podpisů, blížících se této hranici, došlo jejímu nedodržení
0 # Guy Peters 2012-11-26 22:40
Právu občana navrhovat kandidáta koresponduje povinnost veřejné moci tuto kandidaturu umožnit.
Kdepak. Umožnit navrhnout. Čtete tam něco, co tam vůbec není. Právní norma nezní: „Kandidovat je oprávněn každý občan České republiky, který dosáhl věku 18 let, podpoří-li jeho kandidaturu petice podepsaná nejméně 50 000 občany České republiky oprávněnými volit prezidenta republiky.“ Opravdu ne.
0 # gogo 2012-11-27 07:26
Zajímavý výklad.
Takže občan má právo navrhnout kandidáta,sežene-li 50 000 podpisů. Posbírá, přijde, doloží, navrhne, orgán mu poděkuje za námahu a kandidáta vyřadí.
Jsou podle Vás nějaká striktní pravidla a příčiny za kterých (a pouze za nich) je možno kandidáta vyřadit, nebo právo občana končí u práva navrhnout a další osud je v rukou pologramotů bez omezení?
0 # Guy Peters 2012-11-27 11:27
orgán mu poděkuje za námahu a kandidáta vyřadí.
Ano, protože mu to ukládá zákon.

Jsou podle Vás nějaká striktní pravidla a příčiny za kterých (a pouze za nich) je možno kandidáta vyřadit
Ano, ty, které popisuje zákon.
0 # gogo 2012-11-27 13:21
a copak je to za zákon?
www.youtube.com/watch?v=Lytg_FSX9kw
0 # Guy Peters 2012-11-27 16:38
Zákon o volbě presidenta republiky.
0 # Anonymní 2012-11-26 13:17
Z mnohých stran navrhovaný model, aby podpisy (nižší počet, ale jisté) sbíral rovnou stát prostřednictvím Czech POINTů, se mi jeví v důsledku dosavadního dění jako rozumný. Sice to nezabrání jejich nakupování, ale aspoň ti petenti budou skuteční.

AHL
0 # Anonymní 2012-11-26 14:02
K té neaktuální adrese - řeší zákon nějak to, že se občan jednoduše přestěhuej (změní adresu trvalého pobytu) v mezidobí mezi podpisem a jeho kontrolou? Jsou z registru kontrolovány pouze platné údaje o aktuální adrese, nebo i historie s tím, že u každého podpisu je evidován datum, ke kterému se platnost údajů (adresa, jméno) váží?
0 # Tomáš Pecina 2012-11-26 14:03
Vzhledem k tomu, že identifikovali řadu "minulých adres", pak patrně ano.
0 # Anonymní 2012-11-26 14:15
A minulá adresa znamená, že podpis je vyřazen? Podle zakona o volbe prezidenta § 25 odst. 5., ministerstvo overi spravnost udaju. Je nekde tato "spravnost" definovana? Jestlize u podpisu neni evidovan datum, ke kteremu se udaje vazi, tak predpokladam, ze jsou platne podpisy i s historickou adresou, pokud jiz probihal sber podpisu. Stejne tak se mohlo zmenit i jmeno...

Jako cloveka z QA by mne opravdu zajimala presna kriteria, jak overit "spravnost" :-)
0 # Tomáš Pecina 2012-11-26 14:22
Mně by daleko víc zajímalo, jak osvědčí, že vybírali podle zveřejněného algorithmu, když je zjevné, že tomu tak nebylo. Určitý druh podvodů bude prokazatelný obtížně, ale toto bychom dokázat měli být schopni.
0 # Anonymní 2012-11-26 14:45
Ale jiste, vsak o tom tu je fundovany clanek hned vedle. Dohledal jsem si to tedy a jestli je to opravu takto

"Pokud byla nalezena tatáž osoba, avšak prokazatelně s jinými údaji, např. jiná adresa nebo >>>adresa v současné době již neaktuální<<<, operátor označil záznam za neztotožněný."

tak byli podle meho neopravnene vyrazeni i vsichni, kteri zmenili trvaly pobyt pote co podepsali. Muj nazor je, ze pokud podepsal petici obcan a radne uvedl v te dobe platnou adresu trvaleho pobytu, nemel by jeho podpis byt zneplatnen kvuli tomu, ze si dovolil se prestehovat v mezidobi od podpisu ke kontrole udaju.
0 # Tomáš Pecina 2012-11-26 14:47
To je nesmyslný výklad, přece nemohu v době podpisu anticipovat, kde budu mít trvalý pobyt v době kontroly? Na druhou stranu je fakt, že jak jsme viděli, pouhá nesmyslnost určitého výkladu ministerstvu nebrání v jeho aplikaci.
0 # gogo 2012-11-26 14:53
"vybírali podle zveřejněného algorithmu"
on existuje skutečně závazný a veřejně přístupný algoritmus? A digitalizované archy je možné také zpracovat doma? (jako kdysi SETI@home)
0 # Anonymní 2012-11-26 14:56
To je vyklad ministerstva, jak si predstavuje "spravnost" adresy trvaleho pobytu. Viz www.mvcr.cz/soubor/jana-bobosikova-pdf.aspx str. 19. Pokud adresa neni v soucasne dobe aktualni = neplatny podpis. Ze mohla byt aktualni v dobe podpisu uz urednika nezajima.

Je videt, ze tenhle sber podpisu, kde obcan neni jednoznacne identifikovan (rodne cislo), ani neni uveden datum, ke kteremu se udaje vztahuji prinasi spoustu nejasnosti. Snad to opravdu priste pujde nejak rozumeji pres tu Ceskou postu...
0 # Anonymní 2012-11-26 18:16
Měl bych nápad:
Všechny ministerstva ČR či vláda dá k diskusi na blog pana Peciny veškeré připravované zákony.
Tím by byly vytvořeny zákony, které mají nohu a patu.
0 # Anonymní 2012-11-28 00:52
Lepší by bylo žádné nové zákony nepřipravovat. Aspoň deset let.
Milan
0 # Jiri Dobry 2012-11-27 13:04
Schvalne jsem si dal praci a zkusil extrapolovat tu cast chyby zpusoubenou duplicitou zaznamu.

Pocet odhalenych duplikatu roste zhruba kvadratiticky s velikosti vzorku. Pocet moznych kombinaci 2 porovnavanych vzorku je (n*(n-1))/2 (kombinacni cislo pro k=2) . Pri rovnomernem rozdeleni vzorku kontrolou 1/2 zvorku odhalim priblizne 1/4 duplikatu.

Prevedeno do cisel priklad Bobosikova (56191 podpisu):

Vzorek 1 a 2 dohromady jak to spocetlo ministerstvo (celkem 17000) kontrolovanych ma 337 duplicit prepocteno na celou mnozinu je to ((56191*56190)/(17000*16999))*331 = 3682 duplikatu.

Pro vzorek cislo jedna (8500) je to 81 duplicit.

Prepocteno na celek je to ((56191*56190)/(8500*8499))*81 = 3540 duplikatu.

Skoro to odpovida (3682 versus 3540 je mala odchylka). Kdyz k tomu pripoctu "Kacery Donaldy" Bobo by nemela sanci stejne jako zbyvajici Okamura a Dlouhy.
0 # Jiri Dobry 2012-11-27 13:08
preklep 331 opravit na 337. Vysledek je spravny
0 # jonáš 2012-11-27 15:31
Otázka je, nakolik ty duplicity druhýho vzorku zahrnujou "vnitřní" duplicity vzorku prvního, a jestli by se tedy pro "sloučený vzorek" 17 tis. podpisů neměla ta čísla (81+337) sečíst, pak by to vycházelo ještě cca o pětinu výš. Tak jak ten popis metodiky chápu, tak by se to sečíst mělo.
0 # Jiri Dobry 2012-11-27 16:30
Mate pravdu, melo by se to secist
((56191*56190)/(17000*16999))*(337+81) = 4567

To uz tak hezky nevychazi.
0 # Jiri Dobry 2012-11-27 17:53
A navic pocitam pouze duplicity. Mel bych pocitat zvlast i ty podepsane 3x, 4x atd. Pro ty vychazi jiny vzorec.
0 # jonáš 2012-11-27 23:26
To sice vychází, ale projeví se to imho stejnou závislostí jako duplicita prostá, tedy že procento záchytu roste s délkou vzorku. Ty složitý koeficienty (56191*56190*..)/(17000*16999*..) se přece měněj jen nepatrně a úplně stačí vzít n/v (délka souboru lomeno délka vzorku).
0 # Jiri Dobry 2012-11-28 08:35
n/v nestaci. Uz pro prostou dulicitu je to rozdil.

n/v = 56191/17000 = 3.305 -> 1114 duplicit

a spravne

((56191*56190)/(17000*16999)) = 10.926 -> 4567 duplicit

To rozhodne neni zanedbatelny rozdil
0 # jonáš 2012-11-29 00:47
Pokud vás zajímá absolutní počet, tak samozřejmě (n/v)^2 a dostanete až na tisíciny stejnej koeficient .. já jsem ale zatim přepočítával už přímo procento chybovosti a tam se to bez tý mocniny obejde. No jak je to doopravdy se zřejmě nedozvíme, přepočítat to celý zákon nedovoluje ;-)

Komentovat články mohou pouze registrovaní uživatelé; prosím, zaregistrujte se (v pravém sloupci dole)