2. Ve škole bylo \(15\) studentů a známky z matematiky byly: \(55\), \(60\), \(62\), \(65\), \(67\), \(70\), \(72\), \(75\), \(78\), \(80\), \(82\), \(85\), \(88\), \(90\), \(95\). Určete \(80\). percentil známek.
3. Z měření teplot v \(12\) dnech byla naměřena tato data (°C): \(14\), \(16\), \(18\), \(20\), \(21\), \(23\), \(25\), \(26\), \(27\), \(29\), \(30\), \(32\). Určete medián a \(25\). percentil.
Výsledky: medián je \(24\) °C, \(25\). percentil je \(18{,}5\) °C.
4. Firma zjistila, že doba dodání balíčku v minutách je následující: \(10\), \(12\), \(15\), \(18\), \(20\), \(22\), \(25\), \(30\), \(35\), \(40\). Určete \(90\). percentil a vysvětlete jeho význam.
7. Z následujících dat určete \(60.\) percentil a interpretujte jeho význam: \(100\), \(110\), \(120\), \(130\), \(140\), \(150\), \(160\), \(170\), \(180\), \(190\), \(200\).
To znamená, že \(85\,\%\) studentů mělo známku \(74\) nebo nižší.
11. Ve třídě je \(30\) studentů, jejich výška (v cm) je uspořádána vzestupně. \(20.\) percentil výšky je \(155\) cm. Vypočítejte, kolik studentů má výšku nižší než nebo rovnou \(155\) cm. Dále vysvětlete, jak se percentil používá v tomto kontextu.
Řešení příkladu:
Nejprve si připomeneme, co znamená \(20.\) percentil. Pokud máme uspořádanou řadu hodnot vzestupně, pak \(20.\) percentil je hodnota, pod kterou leží \(20\,\%\) dat.
Máme \(n = 30\) studentů, takže počet studentů, kteří mají výšku nižší nebo rovnou \(20.\) percentilu, je:
\(p = 20\,\% = 0{,}20\)
Počet studentů pod \(20.\) percentilem tedy je \(n \times p = 30 \times 0{,}20 = 6\).
Tedy \(6\) studentů má výšku nižší než nebo rovnou \(155\) cm.
Percentil slouží k tomu, abychom mohli rozdělit data do procentních podílů a zjistit tak, jaká hodnota odpovídá určitému kvantilu populace. V našem případě \(20\,\%\) studentů je nižších nebo stejně vysokých jako \(155\) cm.
12. Ve vzorku \(50\) naměřených hodnot teplot je \(25.\) percentil roven \(12^\circ C\) a \(75.\) percentil je \(22^\circ C\). Určete, jaká je interkvartilová šířka a co nám tato hodnota říká o rozložení teplot ve vzorku.
Řešení příkladu:
Interkvartilová šířka (\(IQR\)) se vypočítá jako rozdíl \(75.\) a \(25.\) percentilu, tedy
\(IQR = Q_3 – Q_1\)
Kde \(Q_1\) je \(25.\) percentil a \(Q_3\) je \(75.\) percentil.
Dosadíme hodnoty:
\(IQR = 22 – 12 = 10\ ^\circ C\)
Interkvartilová šířka nám říká, v jakém rozsahu leží prostředních \(50\,\%\) dat. Čím menší je \(IQR\), tím jsou data koncentrovanější kolem mediánu, naopak větší \(IQR\) značí větší rozptýlení dat ve střední části.
13. Město zveřejnilo, že \(90.\) percentil denních příjmů obyvatel je \(2000\,Kč\). Pokud znáte počet obyvatel města \(10\,000\), kolik obyvatel má denní příjem vyšší než \(2000\,Kč\)? Jak lze tuto informaci využít při plánování sociálních programů?
Řešení příkladu:
\(90.\) percentil znamená, že \(90\,\%\) hodnot je pod touto hranicí a \(10\,\%\) nad ní.
Počet obyvatel s příjmem vyšším než \(2000\,Kč\) je tedy:
Tato informace umožňuje sociálním plánovačům identifikovat část populace s relativně vyššími příjmy, a tím lépe cílit podpůrné programy na nižší příjmové skupiny.
14. V testu matematiky získalo \(40\) studentů skóre od \(0\) do \(100\). \(60.\) percentil výsledků je \(75\) bodů. Vypočítejte, kolik studentů získalo méně než nebo rovno \(75\) bodů. Vysvětlete, proč se v některých případech percentil může nerovnat hodnotě výsledku některého konkrétního studenta.
Řešení příkladu:
\(60.\) percentil znamená, že \(60\,\%\) dat je menších nebo rovných této hodnotě. Počet studentů je \(n = 40\), takže počet studentů s výsledkem \(\leq 75\) je:
\(40 \times 0{,}60 = 24\)
V některých situacích hodnota percentilu nemusí odpovídat přesně výsledku konkrétního studenta, protože percentily se obvykle určují interpolací mezi hodnotami v datové řadě, pokud je počet hodnot sudý nebo pokud přesný kvantil nesedí na hodnotě v souboru dat.
15. Analyzujte soubor příjmů \(100\) domácností, kde \(30.\) percentil příjmu je \(18\,000\,Kč\) a \(80.\) percentil je \(35\,000\,Kč\). Vypočítejte, kolik domácností má příjem mezi těmito percentily. Popište, co tato informace znamená.
Řešení příkladu:
Počet domácností je \(100\).
Procento domácností mezi \(30.\) a \(80.\) percentilem je \(80\,\% – 30\,\% = 50\,\%\).
Počet domácností v tomto rozmezí je tedy:
\(100 \times 0{,}50 = 50\) domácností.
Tato informace nám říká, že polovina domácností má příjmy mezi \(18\,000\,Kč\) a \(35\,000\,Kč\), tedy v této střední části rozdělení příjmů.
16. V měření rychlosti aut na dálnici bylo zaznamenáno \( 200 \) hodnot. \( 95. \) percentil rychlosti je \( 130 \) km/h. Vypočítejte, kolik aut jede rychlostí vyšší než \( 130 \) km/h. Proč je tento percentil důležitý pro bezpečnostní analýzy?
Řešení příkladu:
\( 95. \) percentil znamená, že \( 95 \,\% \) rychlostí je pod touto hodnotou a \( 5 \,\% \) nad ní.
Počet aut jedoucích rychlostí vyšší než \( 130 \) km/h je:
Percentil je důležitý, protože umožňuje identifikovat extrémní hodnoty v datech, které mohou představovat riziko (například nadměrné rychlosti, jež mohou způsobit nehody).
17. Ve vzorku \( 60 \) naměřených hodnot jsou hodnoty uspořádány vzestupně. Pokud \( 40. \) percentil odpovídá hodnotě \( 23 \), určete, který prvek ve vzorku má hodnotu \( 23 \). Použijte metodu výpočtu pozice percentilu.
Řešení příkladu:
Pozice percentilu \( P_k \) ve vzorku s \( n \) hodnotami se určí vzorcem:
\( L = p \times (n + 1) \), kde \( p \) je desetinný tvar percentilu (např. \( 0{,}40 \) pro \( 40. \) percentil).
Pozice \( 24{,}4 \) znamená, že \( 40. \) percentil je mezi \( 24. \) a \( 25. \) prvkem. Konkrétně jde o hodnotu, která je \( 0{,}4 \) (40 %) vzdálena mezi \( 24. \) a \( 25. \) prvkem.
Pokud je \( 40. \) percentil \( 23 \), pak \( 23 \) odpovídá této interpolované hodnotě mezi \( 24. \) a \( 25. \) prvkem.
18. V souboru \( 80 \) hodnot má \( 10. \) percentil hodnotu \( 5 \) a \( 50. \) percentil (medián) hodnotu \( 12 \). Vypočítejte, kolik hodnot je menších než \( 5 \), mezi \( 5 \) a \( 12 \) a větších než \( 12 \).
Řešení příkladu:
\( 10. \) percentil znamená, že \( 10 \,\% \) hodnot je menších nebo rovných \( 5 \), což je:
\( 0{,}10 \times 80 = 8 \) hodnot.
\( 50. \) percentil znamená, že \( 50 \,\% \) hodnot je menších nebo rovných \( 12 \), tedy
\( 0{,}50 \times 80 = 40 \) hodnot.
Počet hodnot mezi \( 5 \) a \( 12 \) je tedy rozdíl mezi \( 50. \) a \( 10. \) percentilem:
\( 40 – 8 = 32 \) hodnot.
Počet hodnot větších než \( 12 \) je:
\( 80 – 40 = 40 \) hodnot.
19. Při zkoumání výsledků testů \( 70 \) studentů bylo zjištěno, že \( 85. \) percentil odpovídá \( 90 \) bodům. Určete, kolik studentů získalo více než \( 90 \) bodů, a vysvětlete, proč jsou percentily vhodné pro hodnocení rozložení výsledků.
Řešení příkladu:
\( 85. \) percentil znamená, že \( 85 \,\% \) studentů získalo méně nebo rovno \( 90 \) bodům.
Počet studentů, kteří mají více než \( 90 \) bodů, je:
Percentily jsou vhodné k hodnocení rozložení, protože ukazují relativní postavení jednotlivých hodnot ve skupině a pomáhají identifikovat, kolik procent hodnot je pod danou hranicí.
20. V souboru \( 120 \) naměřených hodnot je \( 50. \) percentil \( 100 \) a \( 90. \) percentil \( 160 \). Vypočítejte, kolik hodnot leží mezi \( 100 \) a \( 160 \) a popište, jak tato informace pomáhá při analýze dat.
Řešení příkladu:
\( 50. \) percentil znamená, že \( 50 \,\% \) hodnot je menších nebo rovno \( 100 \).
\( 90. \) percentil znamená, že \( 90 \,\% \) hodnot je menších nebo rovno \( 160 \).
Rozdíl mezi \( 90. \) a \( 50. \) percentilem je \( 40 \,\% \) hodnot, které leží mezi \( 100 \) a \( 160 \).
Tato informace pomáhá určit rozsah středních \( 40 \,\% \) dat, což je důležité například pro identifikaci běžných hodnot a extrémů v datech.
21. V souboru \( 90 \) hodnot je \( 70. \) percentil roven \( 45 \). Určete, kolik hodnot ve vzorku je větších než \( 45 \). Vysvětlete, jakým způsobem se percentil určuje, pokud počet hodnot není dělitelný přesně.
Řešení příkladu:
\( 70. \) percentil znamená, že \( 70\,\% \) hodnot je menších nebo rovných hodnotě \( 45 \).
Počet hodnot ve vzorku je \( 90 \).
Počet hodnot menších nebo rovných \( 45 \) je:
\( 0{,}70 \times 90 = 63 \)
Počet hodnot větších než \( 45 \) je tedy:
\( 90 – 63 = 27 \)
Percentily se určují tak, že hodnoty se nejprve uspořádají vzestupně, poté se vypočítá pozice percentilu pomocí vzorce
\( L = p \times (n + 1) \), kde \( p \) je desetinný zlomek percentilu a \( n \) je počet hodnot.
Pokud \( L \) není celé číslo, použije se interpolace mezi hodnotami na pozicích před a za číslem \( L \). Tím získáme přesnou hodnotu percentilu i v případě, že pozice není přímo přiřazena žádnému konkrétnímu prvku.
22. Měření hladiny cukru v krvi u \( 50 \) pacientů dává \( 25. \) percentil \( 4{,}5 \) mmol/l a \( 75. \) percentil \( 6{,}0 \) mmol/l. Vypočítejte interkvartilovou šířku a vysvětlete, co vypovídá o rozložení hodnot v souboru.
Řešení příkladu:
Interkvartilová šířka (IQR) je rozdíl \( 75. \) a \( 25. \) percentilu:
IQR ukazuje rozsah, ve kterém leží prostředních \( 50\,\% \) hodnot, tedy jak je soubor koncentrován nebo rozptýlen ve své střední části.
Menší IQR znamená větší koncentraci hodnot kolem mediánu, větší IQR značí větší variabilitu hodnot.
23. Výsledky rychlosti běhu \( 120 \) závodníků mají \( 95. \) percentil roven \( 12{,}8 \) s. Určete, kolik závodníků běželo rychleji než tato hodnota, a vysvětlete význam percentilu ve sportovní statistice.
Řešení příkladu:
\( 95. \) percentil znamená, že \( 95\,\% \) hodnot je menších nebo rovných \( 12{,}8 \) s.
Počet závodníků je \( 120 \).
Počet závodníků s lepším časem než \( 12{,}8 \) s je:
Percentil ve sportovní statistice slouží k určení, jak si závodník vede vzhledem k ostatním, například kolik procent závodníků bylo pomalejších.
24. U souboru \( 200 \) měření je \( 40. \) percentil \( 25 \). Vypočítejte pozici tohoto percentilu ve vzorku a popište postup, jak se hodnota percentilu určuje, pokud pozice není celé číslo.
Řešení příkladu:
Vzorec pro pozici percentilu je:
\( L = p \times (n + 1) \), kde \( p = 0{,}40 \), \( n = 200 \)
Dosadíme:
\( L = 0{,}40 \times 201 = 80{,}4 \)
Pozice není celé číslo, proto se hodnota percentilu určuje interpolací mezi \( 80. \) a \( 81. \) hodnotou uspořádaného vzorku.
Interpolace znamená, že hodnotu percentilu vypočteme jako vážený průměr těchto dvou hodnot, kde váha je zlomková část pozice \( (0{,}4) \). Pokud je \( 80. \) hodnota \( x_{80} \) a \( 81. \) hodnota \( x_{81} \), pak platí
25. Ve skupině \( 75 \) pacientů je \( 85. \) percentil krevního tlaku \( 140 \) mmHg. Kolik pacientů má krevní tlak vyšší než \( 140 \) mmHg? Jak by se dal tento údaj využít v medicíně?
Řešení příkladu:
\( 85. \) percentil znamená, že \( 85\,\% \) pacientů má krevní tlak menší nebo roven \( 140 \) mmHg.
Počet pacientů je \( 75 \).
Počet pacientů s vyšším krevním tlakem než \( 140 \) mmHg je:
Tento údaj umožňuje identifikovat pacienty s vyšším rizikem hypertenze a cílit na ně speciální léčbu nebo preventivní opatření.
26. U souboru \(150\) měření je \(10.\) percentil \(3{,}1\). Určete pozici tohoto percentilu a popište, kolik dat leží pod touto hodnotou.
Řešení příkladu:
Pozice \(10.\) percentilu se vypočítá podle vzorce:
\( L = p \times (n + 1) \), kde \( p = 0{,}10 \), \( n = 150 \)
Dosadíme:
\( L = 0{,}10 \times 151 = 15{,}1 \)
Tedy \(10.\) percentil leží mezi \(15.\) a \(16.\) hodnotou uspořádaného vzorku.
Pod touto hodnotou je \(10 \%\) dat, což znamená, že přibližně \(15\) datových hodnot je menších nebo rovných \(3{,}1\).
27. Výsledky testu znalostí u \(100\) studentů mají \(30.\) percentil \(55\) bodů a \(70.\) percentil \(85\) bodů. Kolik studentů získalo body mezi těmito percentily? Jaký význam má tato informace pro analýzu výsledků?
Řešení příkladu:
Rozdíl mezi \(70.\) a \(30.\) percentilem je:
\( 70\% – 30\% = 40\% \)
Počet studentů mezi těmito percentily je tedy:
\( 100 \times 0{,}40 = 40 \)
Tato informace říká, že \(40 \%\) studentů má výsledky v rozmezí \(55\) až \(85\) bodů, což pomáhá pochopit rozložení a koncentraci výsledků kolem středních hodnot.
28. Ve vzorku \(60\) měření je \(50.\) percentil (medián) \(10\) a \(90.\) percentil \(18\). Určete rozsah mezi mediánem a \(90.\) percentilem a vysvětlete, co tento rozsah znamená.
Řešení příkladu:
Rozsah mezi mediánem a \(90.\) percentilem je:
\( 18 – 10 = 8 \)
Tento rozsah ukazuje variabilitu horních \(40 \%\) dat, tedy jak moc jsou hodnoty od mediánu vyšší až do \(90.\) percentilu rozptýleny.
29. Výsledky měření teploty v laboratoři mají \(20.\) percentil \(22\,^\circ\mathrm{C}\) a \(80.\) percentil \(30\,^\circ\mathrm{C}\). Určete, jaké procento hodnot leží mimo tento interval a vysvětlete význam této informace.
Řešení příkladu:
Procento hodnot mezi \(20.\) a \(80.\) percentilem je:
\( 80\% – 20\% = 60\% \)
Procento hodnot mimo tento interval je tedy:
\( 100\% – 60\% = 40\% \)
Tato informace ukazuje, kolik měření je extrémnějších, tedy nižších než \(22\,^\circ\mathrm{C}\) nebo vyšších než \(30\,^\circ\mathrm{C}\), což je důležité pro detekci odlehlých hodnot a kontroly kvality.
30. V datovém souboru \(80\) hodnot je \(60.\) percentil \(75\). Vysvětlete, jak by se hodnota percentilu změnila, kdyby se do souboru přidalo \(20\) nových hodnot výrazně větších než \(75\).
Řešení příkladu:
\(60.\) percentil určuje hodnotu, pod kterou leží \(60 \%\) hodnot.
Přidáním \(20\) nových hodnot, které jsou výrazně větší než \(75\), se celkový počet hodnot zvětší na \(100\).
Pořadí původní hodnoty \(75\) se posune, protože \(60 \%\) z \(100\) je \(60.\) pozice, zatímco předtím to bylo \(60 \%\) z \(80\) = \(48.\) pozice.
Nový \(60.\) percentil bude tedy hodnota na \(60.\) pozici, což je pravděpodobně větší hodnota než \(75\), protože došlo k přidání větších čísel na konec řady.
Tím pádem se hodnota \(60.\) percentilu zvýší, protože větší data posouvají percentil směrem nahoru.
31. V souboru \(100\) výsledků měření je \(85.\) percentil roven \(78\). Určete, jaký podíl hodnot je větší než \(78\) a vysvětlete, jak změna hodnot v horní části dat ovlivní tuto hodnotu percentilu.
Řešení příkladu:
Nejprve si připomeňme, co znamená percentil. \(85.\) percentil je hodnota, pod kterou leží \(85\,\%\) všech dat v souboru. To znamená, že \(85\,\%\) hodnot je menších nebo rovno hodnotě \(78\).
Tedy zbývajících \(15\,\%\) hodnot musí být větších než \(78\). V procentech tedy podíl hodnot větších než \(78\) je \(15\,\%\).
V absolutním vyjádření, pokud je celkový počet hodnot \(100\), je počet hodnot větších než \(78\) roven \(100 \times 0{,}15 = 15\).
Teď se podíváme, jak by se hodnota \(85.\) percentilu mohla změnit, pokud by se hodnoty v horní části dat změnily.
Představme si, že horních \(15\) hodnot, které jsou nyní větší než \(78\), zvýšíme, například přidáme extrémně vysoké hodnoty. Percentil je založen na pořadí hodnot v uspořádaném seznamu, nikoli přímo na velikosti hodnot. Takže pokud se změní jen velikost těchto hodnot, ale jejich pořadí zůstane stejné, hodnota \(85.\) percentilu (hodnota na \(85.\) pozici) se nezmění.
Pokud ale změníme počet hodnot nebo přidáme nové hodnoty, může se hodnota percentilu změnit, protože pozice percentilu závisí na počtu dat.
Stručně řečeno, hodnota \(85.\) percentilu závisí na pořadí dat, ne na jejich absolutních hodnotách. Zvýšení hodnot nad tímto percentilem nemá vliv na samotný percentil, pokud se nezmění počet dat nebo pořadí hodnot.
32. Data ze \(60\) měření mají \(30.\) percentil \(12\) a \(70.\) percentil \(20\). Určete rozsah mezi těmito percentily a vysvětlete, co o rozložení dat vypovídá tento rozsah.
Řešení příkladu:
Rozsah mezi \(30.\) a \(70.\) percentilem lze vypočítat odečtením hodnot těchto percentilů:
\(20 – 12 = 8\).
Tento rozsah představuje interval, ve kterém leží prostředních \(40\,\%\) hodnot datového souboru, protože rozdíl mezi \(70.\) a \(30.\) percentilem je právě \(40\,\%\).
Interpretace tohoto intervalu je velmi důležitá pro pochopení variability dat v jejich střední části.
Malý rozsah naznačuje, že většina hodnot v této oblasti je velmi blízko u sebe, tedy data jsou koncentrovaná a mají nízkou variabilitu v tomto intervalu.
Naopak velký rozsah by znamenal, že hodnoty jsou rozptýlené více do šířky, což signalizuje vyšší rozptyl a různorodost v datech v tomto středním intervalu.
Tento rozsah se často používá jako míra variability, protože je méně citlivý na extrémní hodnoty než celkový rozsah dat.
33. V souboru \(90\) dat je \(50.\) percentil roven \(100\). Vysvětlete, jak se změní hodnota tohoto percentilu, pokud se z dat odstraní všech \(10\) nejmenších hodnot.
Řešení příkladu:
\(50.\) percentil je medián, což je hodnota, která rozděluje data na dvě stejně velké části, tedy \(50\,\%\) hodnot je pod touto hodnotou a \(50\,\%\) nad ní.
Nejprve zjistíme pozici mediánu v původním souboru \(90\) hodnot. Medián se nachází mezi \(45.\) a \(46.\) hodnotou v seřazeném souboru.
Hodnota mediánu je tedy průměrem těchto dvou hodnot, což je \(100\).
Nyní odstraníme \(10\) nejmenších hodnot, tedy ty s nejnižšími hodnotami, což znamená, že zbyde \(80\) hodnot (\(90 – 10 = 80\)).
Medián v tomto novém souboru bude průměrem \(40.\) a \(41.\) hodnoty v seřazeném souboru, protože medián se vždy nachází uprostřed souboru.
Protože jsme odstranili nejmenší hodnoty, nová \(40.\) a \(41.\) hodnota budou alespoň tak velké jako původní \(50.\) percentil, případně větší.
To znamená, že hodnota mediánu se nezmenší a pravděpodobně se zvýší, protože jsme odstranili spodní část datového souboru.
Závěr je, že odstranění nejmenších hodnot způsobí posun mediánu směrem nahoru, protože se zmenší počet nízkých hodnot, což mění rozdělení dat směrem k vyšším hodnotám.
34. Výsledky testu mají \(75.\) percentil roven \(90\) bodů. Určete, kolik studentů z \(120\) dosáhlo méně než \(90\) bodů. Vysvětlete, co znamená pojem percentil pro hodnocení výsledků testu.
Řešení příkladu:
\(75.\) percentil znamená, že \(75\,\%\) studentů dosáhlo výsledku menšího nebo rovného \(90\) bodům.
Celkový počet studentů je \(120\).
Počet studentů, kteří mají méně než nebo právě \(90\) bodů, spočítáme jako:
\(0{,}75 \times 120 = 90\)
Tedy \(90\) studentů dosáhlo méně než nebo právě \(90\) bodů.
Percentil slouží jako kvantitativní měřítko relativní pozice jednotlivých výsledků v rámci celého souboru.
Když je výsledek studenta na \(75.\) percentilu, znamená to, že \(75\,\%\) ostatních studentů dosáhlo horšího nebo stejného výsledku, což je užitečné pro hodnocení relativního úspěchu v testu.
Je to důležitý nástroj, protože umožňuje srovnání výsledků různých studentů bez ohledu na rozdíly v obtížnosti testu nebo celkových výsledcích.
35. Soubor \(150\) hodnot má \(40.\) percentil roven \(60\) a \(90.\) percentil roven \(100\). Určete, jaká je délka intervalu mezi těmito percentily a co může tento interval vypovídat o rozložení dat.
Řešení příkladu:
Délka intervalu mezi \(40.\) a \(90.\) percentilem se spočítá odečtením hodnot percentilů:
\(100 – 60 = 40\).
Tento interval pokrývá prostředních \(50\,\%\) dat v souboru, tedy data mezi \(40.\) a \(90.\) procentem hodnot.
Vysvětleme, co to znamená. Tento interval ukazuje variabilitu dat v horní polovině datového souboru.
Pokud je délka intervalu velká (v tomto případě \(40\)), znamená to, že data jsou v této části poměrně rozptýlená a hodnoty se mezi sebou značně liší.
Naopak, pokud by interval byl menší, například \(10\) nebo \(5\), znamenalo by to, že hodnoty jsou v této části koncentrované a rozdíly mezi nimi jsou malé.
Tento rozsah nám tedy dává představu o rozptýlení dat v horní polovině a pomáhá pochopit, jak jsou data rozložena mimo střed.
Pro úplnost je dobré uvést, že tento interval je robustnější než celkový rozsah, protože není ovlivněn extrémními hodnotami.
36. V datovém souboru je \(20\). percentil roven \(15\) a \(80\). percentil roven \(65\). Vypočítejte interkvartilový rozsah a vysvětlete rozdíl mezi interkvartilovým rozsahem a intervalem mezi \(20\). a \(80\). percentilem.
Řešení příkladu:
Interkvartilový rozsah (IQR) je rozdíl mezi \(75\). percentilem a \(25\). percentilem, což představuje středních \(50\) % dat.
Zadané percentily jsou \(20\). percentil = \(15\) a \(80\). percentil = \(65\).
Nejdříve vypočítáme rozdíl mezi \(20\). a \(80\). percentilem:
\(65 – 15 = 50\).
Interkvartilový rozsah není stejný jako rozdíl mezi \(20\). a \(80\). percentilem. IQR by se vypočítal, kdybychom měli hodnoty \(25\). a \(75\). percentilu.
Protože \(20\). a \(80\). percentil zahrnuje větší rozsah (\(60\) % dat), rozdíl mezi nimi je obecně větší než IQR, který zahrnuje pouze středních \(50\) % dat.
Interkvartilový rozsah je užitečný k měření variability v jádru dat, zatímco interval mezi \(20\). a \(80\). percentilem zachycuje širší oblast dat a může obsahovat větší rozptýlení.
Pokud bychom chtěli spočítat přesný IQR, potřebovali bychom hodnoty \(25\). a \(75\). percentilu, které by byly mezi \(20\). a \(80\). percentilem, ale přesné hodnoty nejsou v zadání.
Celkově je důležité rozlišovat, že různé intervaly percentilů slouží k různým účelům při analýze rozptýlení dat.
37. Z dat \(200\) hodnot je \(60\). percentil roven \(45\). Pokud by se do souboru přidalo \(50\) hodnot, které jsou všechny menší než \(30\), jak by to ovlivnilo hodnotu \(60\). percentilu?
Řešení příkladu:
Původní soubor má \(200\) hodnot, \(60\). percentil leží na pozici \(0{,}60 \times 200 = 120\).
Tedy \(120\). hodnota v seřazeném seznamu je \(45\).
Po přidání \(50\) hodnot menších než \(30\) se počet hodnot zvýší na \(250\).
Nová pozice \(60\). percentilu bude \(0{,}60 \times 250 = 150\).
Protože jsme přidali \(50\) velmi malých hodnot, všechny tyto budou na začátku uspořádaného seznamu.
Nová hodnota na pozici \(150\) původně odpovídala hodnotě na pozici \(100\) v původním souboru (\(150 – 50 = 100\)), protože \(50\) menších hodnot posunulo pozice původních hodnot o \(50\) nahoru.
Tato hodnota je tedy pravděpodobně menší než \(45\), protože pozice \(100\) byla dříve pod \(60\). percentilem.
Z toho vyplývá, že hodnota \(60\). percentilu se sníží, protože se do souboru přidaly malé hodnoty, které posunou percentily směrem dolů.
Celkově tedy přidání hodnot menších než současný percentil posune percentil dolů, protože se zvětší počet hodnot menších než původní percentil.
38. V souboru \(120\) dat je \(25\). percentil roven \(10\) a \(75\). percentil roven \(40\). Vypočítejte medián intervalu mezi těmito percentily a vysvětlete, proč je tento medián důležitý pro pochopení rozložení dat.
Řešení příkladu:
Nejprve spočítáme medián intervalu mezi \(25\). a \(75\). percentilem jako aritmetický průměr těchto hodnot:
\(\frac{10 + 40}{2} = 25\).
Tento medián intervalu je střední hodnota mezi dolním a horním kvartilem a představuje „střed“ rozptýlení v této části dat.
Význam tohoto mediánu spočívá v tom, že nám poskytuje informaci o tom, jak jsou data distribuována v centrální části rozdělení, kterou pokrývá interkvartilový rozsah.
Pokud je medián intervalu blízký mediánu celého souboru, znamená to, že data jsou relativně symetrická v této části.
Pokud by byl medián intervalu výrazně odlišný od celkového mediánu, naznačuje to asymetrii nebo zkreslení dat, což může být důležité pro statistickou analýzu a modelování.
39. V souboru \(50\) dat je \(10\). percentil roven \(5\) a medián \(15\). Vysvětlete, co znamenají tyto percentily pro rozložení dat a jak by se interpretace změnila, pokud by byl medián větší než \(25\).
Řešení příkladu:
\(10\). percentil rovná se \(5\) znamená, že \(10\) % datových hodnot je menších nebo rovno \(5\). To ukazuje, že spodních desetina dat je koncentrována nízko, tedy existuje část dat, která je poměrně malá.
Medián \(15\) znamená, že polovina dat je pod hodnotou \(15\) a polovina nad ní, což představuje střední hodnotu souboru.
Tato kombinace hodnot znamená, že data jsou rozprostřena mezi nízkými hodnotami (\(10\). percentil = \(5\)) a střední hodnotou \(15\).
Pokud by se medián zvýšil na hodnotu větší než \(25\), například na \(30\), znamenalo by to, že střední hodnota dat se posunula směrem vzhůru, což by indikovalo, že většina dat má vyšší hodnoty než původní medián \(15\).
Tím by se změnila interpretace rozložení, protože data by byla více nakloněna k vyšším hodnotám, mohlo by dojít ke zkreslení rozložení nebo změně vzorku populace.
Tato situace může nastat například v důsledku změny měřeného jevu, přidání nových hodnot nebo chyb v datech, a je důležité ji při analýze brát v úvahu.
40. Výsledky průzkumu ukazují \(95\). percentil \(120\) a \(5\). percentil \(30\). Vypočítejte rozsah mezi těmito percentily a diskutujte, jaký význam má tento rozsah pro analýzu extrémních hodnot ve statistice.
Řešení příkladu:
Rozsah mezi \(95\). a \(5\). percentilem vypočítáme odečtením hodnot těchto percentilů:
\(120 – 30 = 90\).
Tento rozsah pokrývá \(90\) % všech dat, což znamená, že \(90\) % hodnot se nachází mezi \(30\) a \(120\).
Tento interval poskytuje velmi robustní informaci o rozptýlení většiny dat, protože nezahrnuje extrémní hodnoty, které leží pod \(5\). a nad \(95\). percentilem.
Analýza tohoto rozsahu je užitečná pro identifikaci a pochopení variability ve většině souboru, zároveň však umožňuje odhalit extrémní hodnoty, které mohou být buď chybami, odlehlými pozorováními, nebo významnými výjimkami.
Význam tohoto rozsahu spočívá v jeho schopnosti poskytovat statistiku, která není ovlivněna extrémy, čímž napomáhá spolehlivější interpretaci dat a lepšímu rozhodování.
41. V souboru \(150\) hodnot je \(70.\) percentil roven \(55\). Pokud by se přidalo \(30\) hodnot, které jsou všechny mezi \(50\) a \(60\), jak by se změnila hodnota \(70.\) percentilu? Vysvětlete a vypočítejte.
Řešení příkladu:
Nejdříve určíme původní pozici \(70.\) percentilu v souboru s \(150\) hodnotami:
\( k = 0{,}70 \times 150 = 105 \).
Tedy \(105.\) hodnota v uspořádaném seznamu je \(55\).
Po přidání \(30\) hodnot mezi \(50\) a \(60\) bude nový soubor mít \(180\) hodnot.
Nová pozice \(70.\) percentilu bude:
\( k‘ = 0{,}70 \times 180 = 126 \).
Přidané hodnoty se nacházejí v intervalu mezi \(50\) a \(60\), což zahrnuje i původní hodnotu \(55\).
To znamená, že hodnota na pozici \(126\) bude pravděpodobně mezi \(50\) a \(60\), ale vzhledem k přidaným hodnotám se může posunout.
Posun pozice o \(21\) \((126 – 105 = 21)\) znamená, že nová \(70.\) percentilová hodnota odpovídá původní hodnotě na pozici \(105 – 21 = 84\), protože přidané hodnoty posunuly pořadí o \(21\) míst vpřed.
Pozice \(84\) byla původně menší než pozice \(105\), takže hodnota na pozici \(126\) bude pravděpodobně menší než \(55\), tedy se sníží.
Závěr: Přidání hodnot mezi \(50\) a \(60\), které obsahují i hodnotu \(55\), způsobí, že \(70.\) percentil se posune směrem dolů, protože více hodnot se vyskytuje pod původní percentilovou hodnotou.
Konkrétní numerické určení by vyžadovalo znalost hodnot na pozici \(84\), ale obecně platí, že hodnota \(70.\) percentilu klesne.
42. V datovém souboru je \(90.\) percentil roven \(180\) a \(10.\) percentil roven \(40\). Vypočítejte rozsah mezi těmito percentily a vysvětlete, jaký význam má tento rozsah pro popis variability dat.
Řešení příkladu:
Rozsah mezi \(90.\) a \(10.\) percentilem spočítáme odečtením těchto hodnot:
\( 180 – 40 = 140 \).
Tento rozsah zahrnuje středních \(80 \%\) dat, což znamená, že většina hodnot leží v intervalu od \(40\) do \(180\).
Význam tohoto rozsahu spočívá v poskytnutí informace o variabilitě dat, aniž by byla ovlivněna extrémními hodnotami v dolních a horních \(10 \%\).
Na rozdíl od celkového rozsahu dat, který může být zkreslen extrémními hodnotami, tento rozsah představuje robustnější měřítko rozptýlení.
Využívá se často při analýze rozložení dat, aby bylo možné vyhodnotit, jak široce jsou hodnoty rozprostřeny v centrální části souboru dat.
Tato informace je důležitá například pro rozhodování ve statistických modelech, kde je nutné zohlednit stabilní rozptyl dat bez vlivu odlehlých hodnot.
43. V datovém souboru je \(50.\) percentil (medián) \(75\), \(25.\) percentil je \(50\) a \(75.\) percentil je \(90\). Vypočítejte šíři interkvartilového rozsahu a popište jeho význam při popisu rozložení dat.
Řešení příkladu:
Interkvartilový rozsah (IQR) je definován jako rozdíl mezi \(75.\) a \(25.\) percentilem:
\( IQR = 90 – 50 = 40 \).
IQR představuje šíři středu dat, kde je koncentrováno \(50 \%\) všech hodnot.
Tento rozsah je užitečný k posouzení variability bez vlivu extrémních hodnot, protože ignoruje spodních a horních \(25 \%\) dat.
Pokud je IQR velký, znamená to, že střední část dat je rozprostřena na širokém rozsahu hodnot, což značí větší rozptyl.
Naopak malý IQR ukazuje na menší variabilitu ve středních hodnotách, tedy data jsou více soustředěná.
Tato informace je důležitá při statistické analýze, například při identifikaci symetrie nebo šikmosti datového rozložení.
IQR také pomáhá odhalit odlehlé hodnoty, protože hodnoty mimo rozsah \( 25.\ \text{percentil} – 1{,}5 \times IQR \) a \( 75.\ \text{percentil} + 1{,}5 \times IQR \) mohou být považovány za extrémy.
44. V souboru \(100\) hodnot je \(30.\) percentil \(40\), \(50.\) percentil (medián) \(60\) a \(70.\) percentil \(80\). Vypočítejte, jak se změní medián, pokud do souboru přidáme \(20\) hodnot menších než \(35\). Uveďte důkladné zdůvodnění.
Řešení příkladu:
Původní soubor má \(100\) hodnot, medián leží na pozici:
\( k = \frac{100+1}{2} = 50{,}5 \), tedy mezi \(50.\) a \(51.\) hodnotou.
Po přidání \(20\) hodnot menších než \(35\) se počet hodnot zvýší na \(120\).
Nová pozice mediánu je:
\( k‘ = \frac{120+1}{2} = 60{,}5 \), tedy mezi \(60.\) a \(61.\) hodnotou.
Přidané hodnoty jsou menší než \(35\), tedy budou na začátku uspořádaného seznamu.
Tím se posunou všechny původní hodnoty na pozicích \(1\) až \(100\) o \(20\) míst výše.
Nový medián bude odpovídat původní hodnotě na pozicích \( 60{,}5 – 20 = 40{,}5 \), tedy mezi \(40.\) a \(41.\) hodnotou původního souboru.
Pozice \(40.\) hodnoty je pod původním mediánem \(60\), proto nový medián bude menší než původní medián \(60\).
Závěr: Přidání menších hodnot způsobí snížení mediánu, protože více hodnot nyní leží pod původním mediánem.
45. V souboru \(250\) dat je \(85.\) percentil \(120\). Po přidání \(50\) hodnot větších než \(130\) zjistěte, zda se hodnota \(85.\) percentilu zvýší, sníží, nebo zůstane stejná. Vysvětlete podrobně.
Řešení příkladu:
Nejprve určíme pozici \(85.\) percentilu v původním souboru:
\( k = 0{,}85 \times 250 = 212{,}5 \), tedy mezi \(212.\) a \(213.\) hodnotou.
Po přidání \(50\) hodnot větších než \(130\) bude nový soubor mít \(300\) hodnot.
Nová pozice \(85.\) percentilu je:
\( k‘ = 0{,}85 \times 300 = 255 \).
Přidané hodnoty jsou všechny větší než \(130\), tedy jsou umístěny na konci souboru.
Pozice \(255\) v novém uspořádání je tedy \(45\) míst za původní pozicí \(210 – 213\).
Toto znamená, že \(85.\) percentil se posune na hodnotu, která je na vyšší pozici než předtím.
Protože přidané hodnoty jsou větší než původní \(85.\) percentil \(120\), jejich přidání způsobí posun \(85.\) percentilu směrem nahoru nebo alespoň zachování na stejné hodnotě, ale vzhledem k posunu pozice lze očekávat zvýšení.
Závěr: Hodnota \(85.\) percentilu se pravděpodobně zvýší.
46. V souboru \(180\) hodnot je \(40.\) percentil \(35\), \(60.\) percentil \(55\). Vypočítejte hodnotu \(50.\) percentilu (mediánu) za předpokladu, že data jsou rovnoměrně rozložena mezi \(40.\) a \(60.\) percentilem. Uveďte postup.
Řešení příkladu:
Víme, že \(40.\) percentil je \(35\) a \(60.\) percentil je \(55\). Data mezi těmito percentily jsou rovnoměrně rozložena.
Rozdíl mezi \(60.\) a \(40.\) percentilem je \(20\) percentních bodů.
Hodnotový rozdíl mezi těmito percentily je:
\( 55 – 35 = 20 \).
\(50.\) percentil leží uprostřed mezi \(40.\) a \(60.\) percentilem, tedy ve vzdálenosti \(10\) percentních bodů od \(40.\) percentilu.
Podle rovnoměrného rozložení hodnot spočítáme hodnotu \(50.\) percentilu jako:
Toto je příklad lineární interpolace mezi dvěma percentily za předpokladu rovnoměrného rozložení.
47. V souboru \(200\) hodnot je \(20.\) percentil \(25\) a \(80.\) percentil \(95\). Vypočítejte hodnotu \(50.\) percentilu (mediánu), jestliže data mezi \(20.\) a \(80.\) percentilem rostou kvadraticky podle vzorce \( y = a x^2 + b \). Vysvětlete postup.
Řešení příkladu:
Označíme \( x \) jako percentilové pozice mezi \(20\,\%\) a \(80\,\%\) (tedy od \(0\) do \(60\)), a \( y \) jako hodnoty odpovídající těmto percentilům.
Tento výpočet ukazuje, jak lze použít kvadratickou interpolaci pro odhad hodnot percentilů mezi známými body.
48. V souboru \(120\) hodnot je \(10.\) percentil \(15\) a \(90.\) percentil \(105\). Pokud jsou hodnoty symetricky rozloženy kolem mediánu, jaká je hodnota mediánu? Vysvětlete a vypočítejte.
Řešení příkladu:
Symetrické rozložení kolem mediánu znamená, že medián leží uprostřed mezi \(10.\) a \(90.\) percentilem.
Vypočítáme medián jako průměr hodnot \(10.\) a \(90.\) percentilu:
Toto platí za předpokladu symetrie rozložení dat, kdy vzdálenosti mediánu od \(10.\) a \(90.\) percentilu jsou stejné.
49. V datovém souboru je \(95.\) percentil \(140\) a \(5.\) percentil \(20\). Určete hodnotu, která odpovídá \(50.\) percentilu, pokud předpokládáme lineární rozdělení dat mezi \(5.\) a \(95.\) percentilem. Popište postup.
Řešení příkladu:
Mezi \(5.\) a \(95.\) percentilem je interval \(90\) percentních bodů.
Hodnotový rozdíl je:
\( 140 – 20 = 120 \).
\(50.\) percentil je \(45\) percentních bodů od \(5.\) percentilu (protože \(50 – 5 = 45\)).
Za předpokladu lineárního rozdělení dat vypočítáme hodnotu \(50.\) percentilu:
Tento postup je příkladem lineární interpolace mezi dvěma známými percentily.
50. V souboru \(300\) hodnot je \(25.\) percentil \(50\) a \(75.\) percentil \(110\). Vypočítejte robustní odhad směrodatné odchylky, pokud platí, že směrodatná odchylka je přibližně \( \frac{IQR}{1{,}35} \). Vysvětlete význam této metody.
Řešení příkladu:
Nejprve spočítáme interkvartilový rozsah (IQR):
\( IQR = 110 – 50 = 60 \).
Podle zadání platí, že směrodatná odchylka se přibližně rovná \( \frac{IQR}{1{,}35} \).
Tato metoda používá robustní odhad variability dat, který není citlivý na extrémní hodnoty, protože IQR zachycuje rozmezí mezi \(25.\) a \(75.\) percentilem.
Výsledek: odhad směrodatné odchylky je přibližně \(44{,}44\).
51. V souboru \(150\) hodnot je \(30.\) percentil \(40\) a \(70.\) percentil \(90\). Předpokládejte, že hodnoty mezi těmito percentily rostou lineárně. Vypočítejte hodnotu \(55.\) percentilu a vysvětlete postup.
Řešení příkladu:
Rozdíl mezi percentily je \(70 – 30 = 40\) procentních bodů, rozdíl mezi hodnotami je \(90 – 40 = 50\).
Hledáme hodnotu \(55.\) percentilu, což je o \(55 – 30 = 25\) procentních bodů vzdálené od \(30.\) percentilu.
Přičteme k hodnotě \(30.\) percentilu: \(40 + 31{,}25 = 71{,}25\).
Hodnota \(55.\) percentilu je tedy přibližně \(71{,}25\).
52. Soubor obsahuje \(250\) měření, kde \(15.\) percentil je \(22\) a \(85.\) percentil je \(78\). Určete odhad mediánu (\(50.\) percentilu) za předpokladu rovnoměrného rozdělení mezi \(15.\) a \(85.\) percentilem. Uveďte podrobný postup.
Řešení příkladu:
Rozdíl mezi percentily je \(85 – 15 = 70\) procentních bodů, rozdíl hodnot je \(78 – 22 = 56\).
Medián je \(50.\) percentil, což je o \(50 – 15 = 35\) procentních bodů od \(15.\) percentilu.
53. Mějme \(100\) hodnot se \(40.\) percentilem \(10\) a \(90.\) percentilem \(70\). Data mezi těmito percentily jsou rovnoměrně rozložena. Vypočítejte hodnotu \(75.\) percentilu.
Řešení:
Rozdíl mezi percentily je \(90 – 40 = 50\) procentních bodů, rozdíl hodnot je \(70 – 10 = 60\).
Hodnota \(75.\) percentilu je o \(75 – 40 = 35\) procentních bodů od \(40.\) percentilu.
54. Ve vzorku \(180\) hodnot je \(20.\) percentil \(30\) a \(60.\) percentil \(90\). Data mezi těmito percentily rostou exponenciálně podle vzorce \( y = c \cdot e^{kx} \), kde \( x \) je procentní bod počítaný od \(20.\) percentilu. Určete hodnotu \(40.\) percentilu.
Řešení:
Označíme \( x=0 \) pro \(20.\) percentil (hodnota \(30\)) a \( x=40 \) pro \(60.\) percentil (hodnota \(90\)).
Hodnota \(40.\) percentilu je přibližně \(51{,}96\).
55. V datasetu \(220\) měření je \(25.\) percentil \(48\) a \(75.\) percentil \(92\). Určete hodnotu \(60.\) percentilu za předpokladu, že data mezi těmito percentily rostou podle lineární funkce. Uveďte podrobný výpočet.
Řešení:
Rozdíl mezi percentily je \(75 – 25 = 50\) procentních bodů, rozdíl hodnot je \(92 – 48 = 44\).
Hodnota \(60.\) percentilu je o \(60 – 25 = 35\) procentních bodů od \(25.\) percentilu.
Hodnota \(60.\) percentilu je tedy přibližně \(78{,}8\).
56. Ve skupině \(130\) studentů je \(10.\) percentil skóre \(12\) a \(90.\) percentil skóre \(48\). Určete, jaká hodnota odpovídá \(75.\) percentilu, pokud předpokládáme, že mezi \(10.\) a \(90.\) percentilem jsou data rozložena rovnoměrně.
Řešení:
Interval mezi percentily je \(90 – 10 = 80\) procentních bodů, rozdíl hodnot je \(48 – 12 = 36\).
\(75.\) percentil je vzdálený \(75 – 10 = 65\) procentních bodů od \(10.\) percentilu.
Hodnota \(75.\) percentilu je tedy přibližně \(41{,}25\).
57. Mějme dataset \(160\) hodnot, kde \(35.\) percentil je \(25\) a \(85.\) percentil je \(85\). Určete hodnotu \(65.\) percentilu, pokud se hodnoty mezi \(35.\) a \(85.\) percentilem řídí lineární závislostí.
Řešení:
Rozdíl mezi percentily je \(85 – 35 = 50\), rozdíl hodnot je \(85 – 25 = 60\).
Hodnota \(65.\) percentilu je vzdálená \(65 – 35 = 30\) procentních bodů od \(35.\) percentilu.
58. V datovém souboru \(300\) hodnot je \(50.\) percentil \(100\) a \(90.\) percentil \(160\). Předpokládejte, že mezi těmito percentily platí lineární vztah. Určete hodnotu \(70.\) percentilu.
Řešení:
Rozdíl mezi percentily je \(90 – 50 = 40\), rozdíl hodnot je \(160 – 100 = 60\).
\(70.\) percentil je vzdálený \(70 – 50 = 20\) procentních bodů od \(50.\) percentilu.
59. Dataset obsahuje \(140\) hodnot, kde \(5.\) percentil je \(8\) a \(75.\) percentil je \(44\). Předpokládejte, že data mezi těmito percentily rostou podle exponenciálního modelu \( y = a \cdot b^x \), kde \(x\) je procentní bod od \(5.\) percentilu. Určete hodnotu \(50.\) percentilu.
Řešení:
Nastavíme \(x=0\) pro \(5.\) percentil (hodnota \(8\)), \(x=70\) pro \(75.\) percentil (hodnota \(44\)).
Hodnota \(50.\) percentilu je přibližně \(23{,}92\).
60. V souboru \(200\) hodnot je \(10.\) percentil \(15\) a \(50.\) percentil \(35\). Určete hodnotu \(30.\) percentilu, pokud předpokládáme, že data mezi \(10.\) a \(50.\) percentilem rostou lineárně.
Řešení:
Rozdíl mezi percentily je \(50 – 10 = 40\), rozdíl hodnot je \(35 – 15 = 20\).
Hodnota \(30.\) percentilu je vzdálená \(30 – 10 = 20\) procentních bodů od \(10.\) percentilu.
61. Ve vzorku \(180\) hodnot je \(20.\) percentil \(50\) a \(80.\) percentil \(130\). Mezi těmito percentily platí, že hodnoty rostou kvadratickou funkcí \( y = ax^2 + bx + c \), kde \( x \) je počet procentních bodů od \(20.\) percentilu. Určete hodnotu \(50.\) percentilu.
Řešení příkladu:
Označíme \( x = 0 \) pro \(20.\) percentil s hodnotou \(50\) a \( x = 60 \) pro \(80.\) percentil s hodnotou \(130\). Hledáme hodnotu \(50.\) percentilu, což odpovídá \( x = 30 \) (protože \(50\) je o \(30\) procentních bodů více než \(20\)).
Máme tři neznámé \(a, b, c\) a potřebujeme tři rovnice. Pro první použijeme hodnotu na \(x=0\):
\( y(0) = c = 50 \)
Dále známe hodnotu na \(x=60\):
\( y(60) = a \cdot 60^2 + b \cdot 60 + c = 130 \)
Pro třetí rovnici předpokládáme, že první derivace v bodě \(x=0\) je nulová (místní minimum):
\( y'(x) = 2ax + b \Rightarrow y'(0) = b = 0 \)
Dosadíme \(b = 0\) a \(c = 50\) do rovnice pro \(x=60\):
\( a \cdot 3600 + 50 = 130 \Rightarrow a \cdot 3600 = 80 \Rightarrow a = \frac{80}{3600} = \frac{2}{90} \approx 0{,}02222 \)
Hodnota \(50.\) percentilu je tedy přibližně \(70\).
62. V datovém souboru \(150\) hodnot je \(10.\) percentil \(15\) a \(60.\) percentil \(45\). Mezi těmito percentily předpokládejme, že hodnota roste podle logaritmické funkce \( y = A \ln (x + 1) + B \), kde \(x\) je počet procentních bodů od \(10.\) percentilu. Vypočítejte hodnotu \(40.\) percentilu.
Řešení příkladu:
Nastavíme \( x=0 \) pro \(10.\) percentil s hodnotou \(15\) a \( x=50 \) pro \(60.\) percentil s hodnotou \(45\).
Rovnice:
\( y(0) = A \ln(1) + B = B = 15 \)
\( y(50) = A \ln(51) + 15 = 45 \Rightarrow A \ln(51) = 30 \Rightarrow A = \frac{30}{\ln 51} \)
Vypočítáme \( \ln 51 \approx 3{,}9318 \), takže \( A \approx \frac{30}{3{,}9318} = 7{,}63 \).
Hledáme hodnotu pro \( x=30 \) (jelikož \(40.\) percentil je o \(30\) procentních bodů od \(10.\) percentilu):
Hodnota \(40.\) percentilu je přibližně \(41{,}19\).
63. Soubor \(200\) hodnot obsahuje \(30.\) percentil s hodnotou \(20\) a \(90.\) percentil s hodnotou \(80\). Předpokládejme, že mezi těmito percentily je růst hodnot popsán exponenciální funkcí \( y = k \cdot 2^{mx} \), kde \(x\) je počet procentních bodů od \(30.\) percentilu. Určete hodnotu \(60.\) percentilu.
Řešení příkladu:
Nastavíme \( x=0 \) pro \(30.\) percentil s hodnotou \(20\) a \( x=60 \) pro \(90.\) percentil s hodnotou \(80\).
64. Mějme \(120\) hodnot, kde \(15.\) percentil je \(5\) a \(85.\) percentil je \(35\). Mezi těmito percentily předpokládejme lineární růst hodnot. Vypočítejte hodnotu \(70.\) percentilu a počet hodnot menších než tato hodnota.
Řešení příkladu:
Rozdíl mezi percentily je \(85 – 15 = 70\), rozdíl hodnot je \(35 – 5 = 30\).
Hodnota \(70.\) percentilu je o \(70 – 15 = 55\) procentních bodů od \(15.\) percentilu.
Hodnota \(70.\) percentilu je tedy přibližně \(28{,}57\).
Počet hodnot menších než \(70.\) percentil je \(0{,}7 \times 120 = 84\).
65. Ve vzorku \(160\) hodnot je 40. percentil \(12\) a 90. percentil \(48\). Mezi těmito percentily rostou hodnoty podle kubické funkce \( y = a x^3 + b x^2 + c x + d \), kde \(x\) je počet procentních bodů od 40. percentilu. Určete hodnotu 60. percentilu za předpokladu, že \(y(0) = 12\), \(y(50) = 48\), \(y'(0) = 0\) a \(y'(50) = 0\).
Řešení příkladu:
Máme 4 neznámé \(a,b,c,d\) a 4 rovnice:
\( y(0) = d = 12 \)
\( y(50) = a \cdot 50^3 + b \cdot 50^2 + c \cdot 50 + 12 = 48 \)
\( y'(x) = 3 a x^2 + 2 b x + c \)
\( y'(0) = c = 0 \)
\( y'(50) = 3 a \cdot 50^2 + 2 b \cdot 50 + 0 = 0 \)
Z rovnic víme, že \(c=0\) a \(d=12\).
Druhá rovnice:
\( 125000 a + 2500 b + 0 + 12 = 48 \Rightarrow 125000 a + 2500 b = 36 \)
Čtvrtá rovnice:
\( 3 a \cdot 2500 + 100 b = 0 \Rightarrow 7500 a + 100 b = 0 \Rightarrow 75 a + b = 0 \Rightarrow b = -75 a \)
Dosadíme do druhé rovnice:
\( 125000 a + 2500 (-75 a) = 36 \Rightarrow 125000 a – 187500 a = 36 \Rightarrow -62500 a = 36 \Rightarrow a = -\frac{36}{62500} = -0{,}000576 \)
\( b = -75 \times (-0{,}000576) = 0{,}0432 \)
Hledáme hodnotu \(y(20)\) (60. percentil je o 20 procentních bodů od 40.):
66. V datovém souboru o \(100\) hodnotách je \(25.\) percentil \(10\) a \(75.\) percentil \(30\). Mezi těmito percentily jsou hodnoty rozloženy podle lineární funkce, ale datový soubor je symetrický kolem mediánu. Určete hodnotu mediánu a hodnotu \(40.\) percentilu.
Řešení příkladu:
Symetrie kolem mediánu znamená, že medián je uprostřed mezi \(25.\) a \(75.\) percentilem, tedy
medián \(= \frac{10 + 30}{2} = 20\).
Rozdíl mezi percentily je \(75 – 25 = 50\), rozdíl hodnot je \(30 – 10 = 20\).
Hodnota \(40.\) percentilu je o \(40 – 25 = 15\) procentních bodů od \(25.\) percentilu.
67. Ve vzorku \(90\) hodnot je \(5.\) percentil \(4\), \(50.\) percentil \(25\) a \(95.\) percentil \(46\). Předpokládejme, že hodnoty mezi \(5.\) a \(50.\) percentilem rostou lineárně a mezi \(50.\) a \(95.\) percentilem exponenciálně podle \(y = M e^{nx}\), kde \(x\) je počet procentních bodů od \(50.\) percentilu. Určete hodnotu \(75.\) percentilu.
Řešení příkladu:
Nejprve vypočítáme hodnotu na \(50.\) percentilu, která je \(25\) (dána).
Hodnoty mezi \(50.\) a \(95.\) percentilem odpovídají \(x=0\) (\(50.\) percentile) a \(x=45\) (\(95.\) percentile).
Hodnota \(75.\) percentilu je přibližně \(35{,}1\).
68. Datový soubor obsahuje \(500\) hodnot. \(1.\) percentil je \(10\) a \(99.\) percentil je \(90\). Předpokládejte, že data rostou podle lineární funkce mezi těmito percentily. Určete hodnotu \(25.\) percentilu a počet hodnot menších než tato hodnota.
Řešení příkladu:
Rozdíl mezi percentily je \(99 – 1 = 98\), rozdíl hodnot je \(90 – 10 = 80\).
Hodnota \(25.\) percentilu je o \(25 – 1 = 24\) procentních bodů od \(1.\) percentilu.
Počet hodnot menších než \(25.\) percentil je \(0{,}25 \times 500 = 125\).
69. V souboru \(250\) hodnot je \(60.\) percentil \(55\) a \(90.\) percentil \(80\). Mezi těmito percentily platí, že hodnota roste lineárně. Určete hodnotu \(75.\) percentilu a počet hodnot menších než tato hodnota.
Řešení příkladu:
Rozdíl mezi percentily je \(90 – 60 = 30\), rozdíl hodnot je \(80 – 55 = 25\).
Hodnota \(75.\) percentilu je o \(75 – 60 = 15\) procentních bodů od \(60.\) percentilu.
Počet hodnot menších než \(75.\) percentil je \(0{,}75 \times 250 = 187{,}5 \approx 188\).
70. Datový soubor o \(400\) hodnotách má \(10.\) percentil \(15\) a \(70.\) percentil \(65\). Předpokládá se, že mezi těmito percentily hodnota roste kvadraticky podle vzorce \(y = a x^2 + b x + c\), kde \(x\) je procentní bod mezi \(10.\) a \(70.\) percentilem. Určete hodnotu \(50.\) percentilu.
Řešení příkladu:
Nejprve si upravíme proměnnou \(x\) tak, aby \(x=0\) odpovídalo \(10.\) percentilu a \(x=60\) odpovídalo \(70.\) percentilu.
Máme 3 neznámé \(a,b,c\) a 3 rovnice:
\(y(0) = c = 15\) (hodnota \(10.\) percentilu)
\(y(60) = a \cdot 60^2 + b \cdot 60 + c = 65\)
Navíc použijeme střední bod mezi percentily, tj. \(40.\) percentil, který budeme počítat:
Nejdříve najdeme \(a\) a \(b\) z první a druhé rovnice. Z první rovnice víme, že \(c = 15\).
Druhá rovnice:
\(3600 a + 60 b + 15 = 65 \Rightarrow 3600 a + 60 b = 50\)
Použijeme ještě třetí rovnici pro \(x=40\):
\(y(40) = a \cdot 40^2 + b \cdot 40 + 15\)
Pro nyní budeme počítat hodnotu \(y(40)\) po vyřešení soustavy.
Pro vyřešení soustavy použijeme substituci. Z rovnice \(3600 a + 60 b = 50\) vyjádříme \(b\):
\(y(40) = a \cdot 1600 + \left(\frac{5}{6} – 60 a\right) \cdot 40 + 15 = 1600 a + \frac{200}{6} – 2400 a + 15 = -800 a + \frac{200}{6} + 15\)
Pro další krok musíme určit \(a\). Zvolme hodnotu \(a\) tak, aby byla parabola smysluplná. Pokud bychom chtěli například minimalizovat hodnotu mezi percentily, \(a\) by měl být kladný. Pro výpočet použijeme vhodnou hodnotu \(a = 0{,}01\) (příklad pro ilustraci).
Hodnota \(50.\) percentilu je přibližně \(40{,}33\).
71. Ve statistickém souboru o \( 200 \) hodnotách je \( 20. \) percentil \( 15 \) a \( 80. \) percentil \( 55 \). Předpokládáme, že data mezi těmito percentily rostou podle kubické funkce \( y = a x^3 + b x^2 + c x + d \), kde \( x \) je procentní bod posunutý tak, že \( x = 0 \) odpovídá \( 20. \) percentilu a \( x = 60 \) odpovídá \( 80. \) percentilu. Určete hodnotu \( 50. \) percentilu.
Řešení příkladu:
Nejprve definujeme proměnnou \( x \) tak, aby \( x = 0 \) odpovídalo \( 20. \) percentilu a \( x = 60 \) odpovídalo \( 80. \) percentilu. Percentil \( 50 \) tedy odpovídá \( x = 50 – 20 = 30 \).
Máme funkci \( y = a x^3 + b x^2 + c x + d \) s neznámými \( a, b, c, d \). Z dostupných dat máme hodnoty:
72. Mějme data o velikosti \(120\), kde \(25.\) percentil je \(40\) a \(75.\) percentil \(70\). Vypočítejte aproximaci mediánu pomocí lineární interpolace mezi těmito percentily.
Řešení příkladu:
Nejprve si všimneme, že \(25.\) percentil je hodnota na pozici \(0{,}25 \times 120 = 30\). \(75.\) percentil je na pozici \(0{,}75 \times 120 = 90\). Medián (\(50.\) percentil) je tedy na pozici \(0{,}5 \times 120 = 60\).
Mezi \(25.\) a \(75.\) percentilem se pozice pohybuje od \(30\) do \(90\), medián je uprostřed, tedy na pozici \(60\), což je přesně uprostřed mezi \(30\) a \(90\).
Lineární interpolace mezi hodnotami \(40\) (\(25.\) percentil) a \(70\) (\(75.\) percentil) pro pozici \(60\):
Hodnota mediánu (\(50.\) percentilu) je přibližně \(55\).
73. Data o velikosti \(150\) mají \(10.\) percentil \(20\) a \(90.\) percentil \(80\). Pomocí lineární aproximace spočítejte hodnotu \(50.\) percentilu.
Řešení příkladu:
\(10.\) percentil je na pozici \(0{,}10 \times 150 = 15\) a má hodnotu \(20\).
\(90.\) percentil je na pozici \(0{,}90 \times 150 = 135\) a má hodnotu \(80\).
\(50.\) percentil je na pozici \(0{,}50 \times 150 = 75\).
Hodnota \(60.\) percentilu je přibližně \(68{,}57\).
75. Z datového souboru o \(250\) hodnotách je \(5.\) percentil \(10\) a \(95.\) percentil \(90\). Vypočítejte hodnotu \(25.\) percentilu předpokládající lineární závislost mezi percentily.
Řešení příkladu:
\(5.\) percentil je na pozici \(0{,}05 \times 250 = 12{,}5\) a má hodnotu \(10\).
\(95.\) percentil je na pozici \(0{,}95 \times 250 = 237{,}5\) a má hodnotu \(90\).
\(25.\) percentil je na pozici \(0{,}25 \times 250 = 62{,}5\).
Hodnota \(25.\) percentilu je přibližně \(27{,}78\).
76. Data o velikosti \( 100 \) mají \( 30. \) percentil \( 45 \) a \( 70. \) percentil \( 75 \). Vypočítejte hodnotu \( 55. \) percentilu pomocí lineární interpolace.
Řešení příkladu:
\( 30. \) percentil je na pozici \( 0{,}30 \times 100 = 30 \) a má hodnotu \( 45 \).
\( 70. \) percentil je na pozici \( 0{,}70 \times 100 = 70 \) a má hodnotu \( 75 \).
\( 55. \) percentil je na pozici \( 0{,}55 \times 100 = 55 \).
80. V datovém souboru o velikosti \( 90 \) je \( 20. \) percentil \( 35 \) a \( 80. \) percentil \( 85 \). Určete hodnotu \( 65. \) percentilu pomocí lineární interpolace.
Řešení příkladu:
\( 20. \) percentil je na pozici \( 0{,}20 \times 90 = 18 \) s hodnotou \( 35 \).
\( 80. \) percentil je na pozici \( 0{,}80 \times 90 = 72 \) s hodnotou \( 85 \).
\( 65. \) percentil je na pozici \( 0{,}65 \times 90 = 58{,}5 \).
Hodnota \( 65. \) percentilu je přibližně \( 72{,}5 \).
81. Ve vzorku \(1000\) měření je \(20\). percentil \(150\) a \(80\). percentil \(350\). Vypočítejte hodnotu \(50\). percentilu pomocí lineární interpolace.
Řešení příkladu:
Pozice percentilů ve vzorku:
\(20\). percentil odpovídá hodnotě \(150\), \(80\). percentil hodnotě \(350\).
Chceme nalézt hodnotu \(50\). percentilu, která leží mezi \(20\). a \(80\). percentilem.
Nejprve určíme poměr vzdálenosti \(50\). percentilu mezi \(20\). a \(80\). percentilem:
91. Ve vzorku \( 1200 \) měření je \( 25. \) percentil \( 160 \) a \( 75. \) percentil \( 280 \). Vypočítejte hodnotu \( 60. \) percentilu použitím lineární interpolace mezi těmito dvěma percentily.
Řešení příkladu:
Máme \( P_{25} = 160 \) a \( P_{75} = 280 \).
Chceme najít \( P_{60} \), který leží mezi \( P_{25} \) a \( P_{75} \).
Nejprve spočítáme relativní pozici \( 60. \) percentilu mezi \( 25. \) a \( 75. \) percentilem:
Výsledkem je, že hodnota \( 60. \) percentilu je \( 244 \).
92. Ve třídě je \( 50 \) žáků, jejich výsledky testu jsou seřazeny podle velikosti. Vypočítejte, který žák odpovídá \( 40. \) percentilu a jaká je jeho pozice v pořadí.
Řešení příkladu:
Počet žáků \( n = 50 \).
Pozice odpovídající \( 40. \) percentilu spočítáme podle vzorce:
\( L = \frac{p}{100} \times (n + 1) \), kde \( p = 40 \).
Znamená to, že \( 40. \) percentil je mezi \( 20. \) a \( 21. \) žákem v pořadí.
Pokud známe hodnoty \( 20. \) a \( 21. \) žáka, můžeme interpolovat přesnou hodnotu \( 40. \) percentilu.
Tento výpočet ukazuje, že žák na pozici \( 20{,}4 \) odpovídá \( 40. \) percentilu.
93. Ve statistickém souboru je \( 10. \) percentil roven \( 30 \) a \( 90. \) percentil \( 110 \). Určete hodnotu \( 50. \) percentilu předpokládající rovnoměrné rozložení mezi těmito percentily.
Řešení příkladu:
Máme \( P_{10} = 30 \) a \( P_{90} = 110 \).
Chceme vypočítat \( P_{50} \) lineární interpolací mezi \( P_{10} \) a \( P_{90} \).
Poměr pozice \( 50. \) percentilu mezi \( 10. \) a \( 90. \) percentilem je: