1. Vědec analyzuje vztah mezi délkou reklamy (v minutách) a počtem nových zákazníků. Výsledky z \(5\) měření jsou: \((1, 12), (2, 15), (3, 19), (4, 22), (5, 27)\). Určete regresní koeficient a vyjádřete lineární regresi.
Řešení příkladu:
Označme si nezávislou proměnnou \( x \) jako délku reklamy a závislou proměnnou \( y \) jako počet zákazníků. Zadány jsou dvojice \((x_i, y_i)\). Potřebujeme určit směrnici regresní přímky, tedy regresní koeficient \( \beta_1 \), podle vzorce:
\[
\beta_1 = \frac{n\sum x_i y_i – \sum x_i \sum y_i}{n\sum x_i^2 – (\sum x_i)^2}
\]
Nejprve spočítáme jednotlivé součty:
\[
\sum x_i = 1 + 2 + 3 + 4 + 5 = 15
\]
\[
\sum y_i = 12 + 15 + 19 + 22 + 27 = 95
\]
\[
\sum x_i y_i = 1 \cdot 12 + 2 \cdot 15 + 3 \cdot 19 + 4 \cdot 22 + 5 \cdot 27 = 12 + 30 + 57 + 88 + 135 = 322
\]
\[
\sum x_i^2 = 1^2 + 2^2 + 3^2 + 4^2 + 5^2 = 1 + 4 + 9 + 16 + 25 = 55
\]
Po dosazení do vzorce:
\[
\beta_1 = \frac{5 \cdot 322 – 15 \cdot 95}{5 \cdot 55 – 15^2} = \frac{1610 – 1425}{275 – 225} = \frac{185}{50} = 3.7
\]
Nyní dopočítáme absolutní člen \( \beta_0 \) ze vzorce:
\[
\beta_0 = \bar{y} – \beta_1 \bar{x}
\]
\[
\bar{x} = \frac{\sum x_i}{n} = \frac{15}{5} = 3, \quad \bar{y} = \frac{\sum y_i}{n} = \frac{95}{5} = 19
\]
\[
\beta_0 = 19 – 3.7 \cdot 3 = 19 – 11.1 = 7.9
\]
Regresní přímka tedy je:
\[
y = 7.9 + 3.7x
\]
Regresní koeficient je \( \beta_1 = 3.7 \), což znamená, že za každou další minutu reklamy přibude v průměru \(3.7\) nového zákazníka.
2. V průzkumu bylo zjištěno, že plat zaměstnanců souvisí s počtem let praxe. Pro \(6\) zaměstnanců jsou naměřené hodnoty: \((1, 24000), (2, 26000), (3, 28000), (4, 31000), (5, 33000), (6, 35500)\). Vypočítejte regresní koeficient a sestrojte regresní přímku.
3. V tabulce jsou zadané hodnoty dvou veličin: počet hodin samostudia \( X \) a dosažené skóre v testu \( Y \). Vypočítej regresní koeficient lineární regrese pro tuto dvojici dat:
Nejprve si připomeneme, co znamená regresní koeficient. Jde o číslo, které vyjadřuje, o kolik se v průměru změní proměnná \( Y \), pokud se proměnná \( X \) zvýší o 1. Jinými slovy, ukazuje nám směr a velikost vztahu mezi těmito dvěma veličinami.
Regresní koeficient pro lineární regresi se značí obvykle jako \( b \) a vypočítává se podle vzorce:
Výsledný regresní koeficient je \( b = 5 \). To znamená, že za každou další hodinu samostudia se očekává zvýšení skóre v testu o přibližně \(5\) bodů.
4. V tabulce jsou zaznamenány hodnoty: počet prodaných reklamních balíčků \( X \) a celkové tržby v tisících Kč \( Y \). Urči regresní koeficient pro tuto dvojici proměnných:
Regresní koeficient je \( b = 275 \). To znamená, že za každé další cvičení týdně spálí člověk v průměru o \(275\) kalorií více.
8. Vědci sledovali vztah mezi počtem hodin studia \((X)\) a výsledným skóre testu \((Y)\) u \(5\) studentů. Data jsou: Student \(A: (2\) hodiny, \(65\) bodů\()\), Student \(B: (4\) hodiny, \(75\) bodů\()\), Student \(C: (3\) hodiny, \(70\) bodů\()\), Student \(D: (5\) hodin, \(80\) bodů\()\), Student \(E: (1\) hodina, \(60\) bodů\()\). Vypočítejte regresní koeficient a interpretujte jeho význam.
Řešení příkladu:
Nejprve zapíšeme hodnoty proměnných \( X \) (hodiny studia) a \( Y \) (skóre testu):
\( X = \{2, 4, 3, 5, 1\} \), \( Y = \{65, 75, 70, 80, 60\} \).
\[
b = \frac{S_{XY}}{S_{XX}} = \frac{50}{10} = 5.
\]
Interpretace: Koeficient \( b = 5 \) znamená, že s každou další hodinou studia se průměrné skóre testu zvyšuje o \(5\) bodů.
Pro doplnění můžeme spočítat i průsečík s osou y \( a \), kde platí:
\[
a = \bar{Y} – b \bar{X} = 70 – 5 \times 3 = 70 – 15 = 55.
\]
Regresní přímka je tedy rovnice:
\[
\hat{Y} = 55 + 5X,
\]
což dále potvrzuje lineární vztah mezi studijními hodinami a výsledkem testu.
9. Firma zkoumá vztah mezi reklamním rozpočtem \((\)v tisících Kč\()\) a počtem nových zákazníků za měsíc. Data za posledních \(6\) měsíců jsou: \((10, 50), (12, 55), (8, 45), (15, 65), (11, 53), (9, 48)\). Vypočtěte regresní koeficient a interpretujte jeho význam.
Řešení příkladu:
Nejprve si zapíšeme hodnoty \( X \) a \( Y \):
\( X = \{10, 12, 8, 15, 11, 9\} \), \( Y = \{50, 55, 45, 65, 53, 48\} \).
\[
b = \frac{S_{XY}}{S_{XX}} = \frac{86{,}67}{30{,}84} \approx 2{,}81.
\]
Interpretace: Koeficient \( b \approx 2{,}81 \) znamená, že každých \(1 000\) Kč navíc v reklamním rozpočtu přinese přibližně \(2,81\) nových zákazníků.
Pro doplnění vypočítáme průsečík s osou y \( a \):
\[
a = \bar{Y} – b \bar{X} = 52{,}67 – 2{,}81 \times 10{,}83 \approx 52{,}67 – 30{,}43 = 22{,}24.
\]
Regresní přímka je tedy:
\[
\hat{Y} = 22{,}24 + 2{,}81X.
\]
Tato rovnice ukazuje, jak lze předpovědět počet nových zákazníků na základě investice do reklamy.
10. V automobilovém průmyslu se zkoumá vztah mezi hmotností vozu (v tunách) a spotřebou paliva (v litrech na \(100\) km). Naměřené hodnoty jsou: \((1,2 t, 6,5 l)\), \((1,5 t, 7,8 l)\), \((1,0 t, 5,9 l)\), \((1,8 t, 8,5 l)\), \((1,3 t, 6,8 l)\). Vypočítejte regresní koeficient a vysvětlete, co znamená v kontextu spotřeby paliva.
Řešení příkladu:
Zadání obsahuje hodnoty \( X \) (hmotnost v tunách) a \( Y \) (spotřeba v litrech):
\( X = \{1{,}2, 1{,}5, 1{,}0, 1{,}8, 1{,}3\} \), \( Y = \{6{,}5, 7{,}8, 5{,}9, 8{,}5, 6{,}8\} \).
Nakonec regresní koeficient (Pearsonův korelační koeficient):
\[
r = \frac{\mathrm{cov}(x,y)}{\sqrt{\mathrm{var}(x)} \sqrt{\mathrm{var}(y)}} = \frac{52{,}5}{\sqrt{21} \times \sqrt{130{,}5}} = \frac{52{,}5}{4{,}583 \times 11{,}424} = \frac{52{,}5}{52{,}35} \approx 1{,}003
\]
Vzhledem k zaokrouhlení můžeme konstatovat, že \( r \approx 1 \), což indikuje téměř dokonalou pozitivní lineární závislost mezi počtem hodin studia a výsledným skóre testu.
12. Byl měřen vztah mezi teplotou \((°C)\) a spotřebou elektřiny \((kWh)\) v domácnosti za \(7\) dní. Naměřené hodnoty jsou:
Korelační koeficient:
\[
r = \frac{1266{,}67}{\sqrt{291{,}67} \times \sqrt{5688{,}96}} = \frac{1266{,}67}{17{,}08 \times 75{,}42} = \frac{1266{,}67}{1287{,}96} \approx 0{,}984
\]
Koeficient blízko \(1\) znamená silnou pozitivní lineární závislost mezi délkou cvičení a spálenými kaloriemi.
14. Ve studii byla měřena výška studentů a jejich skóre na matematickém testu. Data jsou: \((170\) cm, \(75\) bodů\()\), \((165\) cm, \(70\) bodů\()\), \((180\) cm, \(85\) bodů\()\), \((175\) cm, \(78\) bodů\()\), \((160\) cm, \(65\) bodů\()\). Vypočítejte regresní koeficient a interpretujte jeho význam.
Řešení příkladu:
Nejprve si označíme jednotlivé hodnoty pro snadnější výpočty:
Hodnota regresního koeficientu \( r \approx 0.994 \) znamená velmi silnou pozitivní lineární závislost mezi výškou studentů a jejich skóre na matematickém testu. Jinými slovy, čím vyšší je student, tím lepší pravděpodobně dosahuje výsledky v testu.
15. Byl sledován počet hodin studia a výsledné známky studentů. Data: \((2\) hodiny, \(60 %), (4\) hodiny, \(70 %), (6\) hodin, \(75 %), (8\) hodin, \(85 %), (10\) hodin, \(90 %\)\()\)
. Vypočítejte regresní koeficient a vysvětlete jeho význam.
Řešení příkladu:
Označíme si hodnoty:
\( x \): počet hodin studia \(= 2, 4, 6, 8, 10\) \( y \): procentuální známka \(= 60, 70, 75, 85, 90\)
Hodnota \( r \approx 0.993 \) svědčí o velmi silné pozitivní lineární závislosti mezi počtem hodin studia a výslednými známkami. Vyšší počet hodin studia vede k lepším známkám.
16. V průzkumu bylo zjištěno, že počet prodaných kusů (\(x\)) a tržby v tisících Kč (\(y\)) mají následující hodnoty: (\(100\), \(150\)), (\(200\), \(300\)), (\(150\), \(225\)), (\(250\), \(350\)), (\(300\), \(400\)). Vypočítejte regresní koeficient a jeho význam.
Řešení příkladu:
Označíme:
\( x \): počet prodaných kusů = \(100\), \(200\), \(150\), \(250\), \(300\) \( y \): tržby (tis. Kč) = \(150\), \(300\), \(225\), \(350\), \(400\)
Hodnota \( r \approx 0.997 \) ukazuje velmi silnou pozitivní lineární závislost mezi počtem prodaných kusů a tržbami. To znamená, že čím více kusů prodáme, tím vyšší jsou tržby.
17. V experimentu bylo změřeno, jak teplota v °C (\(x\)) ovlivňuje rychlost reakce v mol/s (\(y\)). Data jsou: (\(20\), \(0.5\)), (\(25\), \(0.8\)), (\(30\), \(1.2\)), (\(35\), \(1.5\)), (\(40\), \(1.8\)). Vypočítejte regresní koeficient a popište, co znamená.
Řešení příkladu:
Označení hodnot:
\( x \): teplota (°C) = \(20\), \(25\), \(30\), \(35\), \(40\) \( y \): rychlost reakce (mol/s) = \(0.5\), \(0.8\), \(1.2\), \(1.5\), \(1.8\)
Hodnota \( r \approx 0.999 \) naznačuje téměř dokonalou pozitivní lineární závislost mezi teplotou a rychlostí reakce, tedy s rostoucí teplotou se rychlost reakce zvyšuje prakticky lineárně.
18. V tabulce jsou uvedeny hodnoty proměnných \(X\) a \(Y\):
\(X: 2, 4, 6, 8, 10\)
\(Y: 3, 7, 11, 15, 19\)
Vypočtěte regresní koeficient (koeficient korelace) mezi \(X\) a \(Y\).
Hodnota \(r \approx 0.822\) ukazuje na silnou pozitivní korelaci mezi \(X\) a \(Y\), avšak není perfektní.
23. V tabulce jsou uvedena data o počtu hodin studia (\( x \)) a dosažených bodech v testu (\( y \)) pro 6 studentů: (\( 2 \), \( 55 \)), (\( 3 \), \( 60 \)), (\( 5 \), \( 65 \)), (\( 7 \), \( 70 \)), (\( 9 \), \( 80 \)), (\( 10 \), \( 85 \)). Vypočítejte regresní koeficient mezi počtem hodin studia a dosaženými body.
Řešení příkladu:
Nejprve si zapíšeme data do dvou seznamů: \( x = [2, 3, 5, 7, 9, 10] \) a \( y = [55, 60, 65, 70, 80, 85] \).
Pro výpočet regresního koeficientu použijeme vzorec pro Pearsonův korelační koeficient \( r \):
Regresní koeficient \( r \approx 0.96 \) znamená silnou pozitivní korelaci mezi proměnnými, což indikuje, že jak se zvyšuje \( x \), zvyšuje se i \( y \).
25. Mějme data o teplotě vzduchu \( x = [12, 15, 20, 22, 25, 30] \) a spotřebě vody \( y = [50, 52, 55, 60, 62, 70] \). Spočítejte regresní koeficient a vysvětlete výsledek.
Regresní koeficient \( r \approx 0.98 \) indikuje velmi silnou pozitivní korelaci mezi teplotou a spotřebou vody – s rostoucí teplotou roste i spotřeba vody.
26. Pro data \( x = [3, 5, 7, 9, 11] \) a \( y = [8, 7, 6, 5, 4] \) spočítejte regresní koeficient a interpretujte jeho význam.
Řešení příkladu:
Budeme opět používat vzorec pro Pearsonův korelační koeficient:
Regresní koeficient \( r = -1 \) znamená dokonalou negativní korelaci mezi proměnnými – když hodnota \( x \) roste, hodnota \( y \) přesně klesá.
27. Mějme data o počtu hodin tréninku za týden \( x = [2, 4, 6, 8, 10] \) a počtu dosažených bodů ve sportovní soutěži \( y = [20, 40, 55, 65, 80] \). Vypočítejte regresní koeficient a popište vztah mezi proměnnými.
Řešení příkladu:
Postupujeme podle vzorce pro Pearsonův korelační koeficient:
Regresní koeficient \( r \approx 0.99 \) indikuje velmi silnou pozitivní korelaci mezi počtem hodin tréninku a dosaženými body, tedy čím více hodin tréninku, tím lepší výsledky v soutěži.
28. V tabulce jsou uvedena průměrné měsíční teploty (°C) a spotřeba zmrzliny (v tisících porcí) v letních měsících v jednom městě. Určete regresní koeficient mezi teplotou a spotřebou zmrzliny.
Řešení příkladu:
Nejprve si připomeneme, že regresní koeficient \(r\) (Pearsonův korelační koeficient) mezi dvěma veličinami \(X\) a \(Y\) se vypočítá podle vzorce:
\[
r = \frac{ \sum (x_i – \overline{x})(y_i – \overline{y}) }{ \sqrt{\sum (x_i – \overline{x})^2 \cdot \sum (y_i – \overline{y})^2} }
\]
kde \(x_i, y_i\) jsou jednotlivé hodnoty proměnných, \(\overline{x}\) a \(\overline{y}\) jejich průměry.
4) Dosadíme do vzorce:
\[
r = \frac{189}{\sqrt{62.8 \cdot 570}} = \frac{189}{\sqrt{3580}} = \frac{189}{59.83} \approx 3.16
\]
Taková hodnota není možná, protože korelační koeficient musí být mezi -1 a 1. Proto zkontrolujeme výpočet.
Chyba je v součtu součinu odchylek. Přepočítáme přesně:
\[
(-4.8)(-14) = 67.2, \quad (-2.8)(-9) = 25.2, \quad 0.2 \cdot 1 = 0.2, \quad 2.2 \cdot 6 = 13.2, \quad 5.2 \cdot 16 = 83.2
\]
\[
\sum (x_i – \overline{x})(y_i – \overline{y}) = 67.2 + 25.2 + 0.2 + 13.2 + 83.2 = 189
\]
Tady je vše správně, problém je v druhém součtu.
Zkusíme znovu spočítat druhý součet:
\[
\sqrt{62.8 \cdot 570} = \sqrt{3580} \approx 59.83
\]
Vše správně.
Chyba tedy byla v tom, že výpočet \(r\) má být:
\[
r = \frac{189}{59.83} \approx 3.16
\]
což není možné. To znamená, že jsme nesprávně zapsali vzorec pro korelaci. Správný vzorec je:
\[
r = \frac{ \sum (x_i – \overline{x})(y_i – \overline{y}) }{ \sqrt{\sum (x_i – \overline{x})^2} \cdot \sqrt{\sum (y_i – \overline{y})^2} }
\]
což je:
\[
r = \frac{189}{\sqrt{62.8} \cdot \sqrt{570}} = \frac{189}{7.93 \cdot 23.87} = \frac{189}{189.27} \approx 0.9986
\]
Tedy regresní koeficient je přibližně \(0.999\), což znamená téměř dokonalou kladnou lineární závislost mezi teplotou a spotřebou zmrzliny.
29. Měříme počet hodin studia (\(X\)) a výsledné známky ze zkoušky (\(Y\)) u \(6\) studentů: \((2, 55)\), \((3, 60)\), \((4, 65)\), \((5, 70)\), \((6, 72)\), \((7, 80)\). Vypočítejte regresní koeficient.
Dosadíme do vzorce:
\[
r = \frac{82}{\sqrt{17.5 \cdot 400}} = \frac{82}{\sqrt{7000}} = \frac{82}{83.67} \approx 0.98
\]
Regresní koeficient je tedy přibližně \(0.98\), což znamená velmi silnou kladnou lineární závislost mezi počtem hodin studia a známkou.
30. Data o věku pracovníků (\(X\) v letech) a jejich produktivitě (\(Y\) v počtu vyrobených jednotek) jsou: \((22, 150)\), \((25, 160)\), \((28, 170)\), \((30, 175)\), \((35, 180)\). Vypočítejte regresní koeficient.
Regresní koeficient tedy ukazuje na silnou pozitivní korelaci mezi věkem a produktivitou.
31. Měříme počet kilometrů ujetých autem za den (\(X\)) a spotřebu paliva (\(Y\) v litrech): (\(50\), \(4.5\)), (\(60\), \(5.0\)), (\(70\), \(5.5\)), (\(80\), \(6.0\)), (\(90\), \(6.5\)). Vypočítejte regresní koeficient mezi počtem ujetých kilometrů a spotřebou paliva.
Regresní koeficient \(1.0\) znamená perfektní pozitivní lineární závislost mezi počtem ujetých kilometrů a spotřebou paliva.
32. V tabulce jsou uvedeny hodnoty dvou proměnných \(X\) a \(Y\), které představují počet hodin studia (\(X\)) a dosažené body v testu (\(Y\)) u 6 studentů:
\(X\) (hodiny)
\(Y\) (body)
\(2\)
\(65\)
\(3\)
\(70\)
\(5\)
\(75\)
\(7\)
\(80\)
\(9\)
\(85\)
\(10\)
\(90\)
Vypočtěte regresní koeficient (Pearsonův korelační koeficient) mezi proměnnými \(X\) a \(Y\).
Řešení příkladu:
Nejprve si shrneme potřebná data a vypočítáme průměry:
Korelace je přesně \(1\), což značí dokonalou lineární závislost mezi délkou a hmotností ryb v daných datech.
34. Máme následující data o výšce (v cm) a váze (v kg) pěti osob:
výška \(X = (160, 165, 170, 175, 180)\), váha \(Y = (55, 60, 65, 70, 75)\).
Spočítejte regresní koeficient \(r\) a interpretujte jeho význam.
Regresní koeficient \(r\) je definován jako
\[
r = \frac{\mathrm{cov}(X,Y)}{s_X s_Y} = \frac{62.5}{7.906 \times 7.906} = \frac{62.5}{62.5} = 1.
\]
Hodnota \(r=1\) značí perfektní pozitivní lineární závislost mezi výškou a váhou v tomto datasetu, tedy jak roste výška, roste i váha přesně lineárně.
35. Máme data o počtu hodin studia \(X = (2, 4, 6, 8, 10)\) a výsledcích testu \(Y = (50, 55, 65, 70, 85)\). Spočítejte regresní koeficient a posuďte sílu lineární závislosti.
Hodnota \(r \approx 0.982\) znamená velmi silnou pozitivní lineární závislost mezi počtem hodin studia a výsledky testu.
36. Byly naměřeny hodnoty teploty \(X = (10, 12, 15, 18, 20)\) a spotřeby energie \(Y = (200, 190, 170, 150, 140)\). Vypočítejte regresní koeficient a zhodnoťte závislost mezi teplotou a spotřebou energie.
Hodnota \(r = -1\) značí perfektní negativní lineární závislost: jak teplota roste, spotřeba energie klesá přesně lineárně.
37. V následujícím měření máme data o počtu prodaných kusů \(X = (30, 40, 50, 60, 70)\) a výnosech \(Y = (300, 420, 500, 620, 700)\). Spočítejte regresní koeficient a interpretujte jeho význam.
Hodnota \(r \approx 0.988\) značí velmi silnou pozitivní lineární závislost mezi počtem prodaných kusů a výnosy.
38. Změřili jsme délku stínu \(X = (1, 2, 3, 4, 5)\) a výšku stromu \(Y = (3, 6, 9, 12, 15)\). Určete regresní koeficient a posuďte vztah mezi délkou stínu a výškou stromu.
Hodnota \(r=1\) ukazuje perfektní pozitivní lineární závislost mezi délkou stínu a výškou stromu, což odpovídá přímo úměrnému vztahu.
39. Ve skupině \(6\) studentů byly změřeny jejich hodiny učení za týden a následně jejich skóre testu. Data jsou: \((3 \text{ hodiny}, 50 \text{ bodů})\), \((5 \text{ hodiny}, 65 \text{ bodů})\), \((2 \text{ hodiny}, 45 \text{ bodů})\), \((7 \text{ hodiny}, 80 \text{ bodů})\), \((4 \text{ hodiny}, 60 \text{ bodů})\), \((6 \text{ hodiny}, 75 \text{ bodů})\). Vypočtěte regresní koeficient (Pearsonův korelační koeficient) mezi hodinami učení a skóre testu.
Řešení příkladu:
Nejprve si označíme data jako páry \((x_i, y_i)\), kde \(x_i\) je počet hodin učení a \(y_i\) skóre testu:
Hodnota \(r \approx 0{,}995\) znamená velmi silnou kladnou lineární závislost mezi počtem hodin učení a skóre testu.
40. Byla provedena studie vztahu mezi teplotou (v °C) a spotřebou energie (v kWh) v \(5\) domácnostech: \((15, 300)\), \((20, 250)\), \((10, 350)\), \((25, 200)\), \((5, 400)\). Určete regresní koeficient a interpretujte jeho význam.
Řešení příkladu:
Označíme data jako \((x_i, y_i)\): teplota \(x_i\), spotřeba energie \(y_i\): \((15, 300)\), \((20, 250)\), \((10, 350)\), \((25, 200)\), \((5, 400)\).
Regresní koeficient \(r = -1\) znamená dokonalou lineární zápornou korelaci – s rostoucí teplotou spotřeba energie klesá lineárně.
41. Data o počtu hodin cvičení za týden a úrovni stresu (na stupnici 1–10) u \(7\) lidí jsou: \((1, 9)\), \((3, 7)\), \((2, 8)\), \((5, 4)\), \((4, 5)\), \((6, 3)\), \((7, 2)\). Vypočítejte regresní koeficient mezi cvičením a stresem.
Řešení příkladu:
Označíme \((x_i, y_i)\): hodiny cvičení \(x_i\), úroveň stresu \(y_i\).
Koeficient \(r \approx -0{,}995\) ukazuje velmi silnou negativní lineární korelaci mezi cvičením a stresem, tedy více cvičení znamená nižší stres.
42. V následující tabulce jsou zaznamenány hodnoty proměnných \(X\) a \(Y\), které reprezentují počet hodin studia a dosažené body v testu u 6 studentů:
\(X = [2, 4, 6, 8, 10, 12]\), \(Y = [55, 60, 65, 70, 75, 80]\). Vypočítejte regresní koeficient a vysvětlete jeho význam.
Řešení příkladu:
Nejprve si připomeňme, že regresní koeficient (označovaný také jako koeficient determinace nebo Pearsonův korelační koeficient) měří sílu a směr lineární závislosti mezi dvěma proměnnými.
Výpočet zahrnuje výpočet průměrů, rozptylů a kovariance.
Regresní koeficient \(r\) je dán vztahem:
\[
r = \frac{\mathrm{Cov}(X,Y)}{\sqrt{\mathrm{Var}(X)} \sqrt{\mathrm{Var}(Y)}} = \frac{29.17}{\sqrt{11.67} \times \sqrt{72.92}}
\]
\[
\sqrt{11.67} \approx 3.42, \quad \sqrt{72.92} \approx 8.54
\]
\[
r \approx \frac{29.17}{3.42 \times 8.54} = \frac{29.17}{29.21} \approx 0.9986
\]
Tento regresní koeficient je velmi blízký \(1\), což znamená téměř dokonalou pozitivní lineární závislost mezi počtem hodin studia a dosaženými body v testu. Jinými slovy, čím více student studuje, tím vyšší body dosahuje, a vztah mezi těmito dvěma veličinami je téměř lineární.
43. Data o teplotě vzduchu \(X\) a prodeji zmrzliny \(Y\) byla zaznamenána takto: \(X = [15, 18, 20, 22, 25, 28]\), \(Y = [120, 150, 160, 180, 200, 220]\). Vypočítejte regresní koeficient a interpretujte jeho hodnotu.
Výpočet regresního koeficientu:
\[
r = \frac{\mathrm{Cov}(X,Y)}{\sqrt{\mathrm{Var}(X)} \sqrt{\mathrm{Var}(Y)}} = \frac{141.12}{\sqrt{18.39} \times \sqrt{1060.74}}
\]
\[
\sqrt{18.39} \approx 4.29, \quad \sqrt{1060.74} \approx 32.56
\]
\[
r = \frac{141.12}{4.29 \times 32.56} = \frac{141.12}{139.65} \approx 1.01
\]
Hodnota \(1.01\) mírně překračuje maximální možnou hodnotu korelačního koeficientu, což je pravděpodobně způsobeno zaokrouhlováním v mezi krocích. Správně by tedy mělo platit
\[
r \approx 1
\]
což znamená téměř dokonalou pozitivní lineární závislost.
Interpretace: S rostoucí teplotou vzduchu roste i prodej zmrzliny velmi silně lineárním způsobem. Korelační koeficient blízký jedné potvrzuje, že teplota je velmi silným prediktorem prodeje zmrzliny.
44. V tabulce jsou uvedeny hodnoty proměnných \(X\) a \(Y\):
48. V tabulce jsou uvedeny údaje o počtu hodin studia (x) a výsledné známce z testu \(y\) u \(6\) studentů: \((2, 3)\), \((3, 5)\), \((5, 7)\), \((7, 10)\), \((8, 12)\), \((10, 15)\). Vypočítejte regresní koeficient a interpretujte výsledek.
Interpretace: Hodnota \(r \approx 0{,}9962\) značí velmi silnou pozitivní lineární závislost mezi počtem hodin studia a známkou z testu, tedy čím více student studoval, tím lepší známku (vyšší hodnotu) dosáhl.
49. Mějme data o počtu prodaných produktů (x) a výnosech v tisících Kč \((y): (1, 50), (2, 55), (3, 60), (4, 65), (5, 80)\). Vypočítejte regresní koeficient a zhodnoťte závislost.
Řešení příkladu:
Data: \((1, 50), (2, 55), (3, 60), (4, 65), (5, 80)\), počet dat \(n = 5\).
Interpretace: Regresní koeficient \(r \approx 0{,}9613\) ukazuje na velmi silnou pozitivní lineární závislost mezi počtem prodaných produktů a výnosem, což znamená, že výnosy rostou s počtem prodaných produktů.
50. V tabulce jsou údaje o reklamní investici v tisících Kč \((x)\) a počtu nových zákazníků \((y): (5, 50), (7, 65), (8, 72), (10, 80), (12, 95), (15, 110)\). Vypočítejte regresní koeficient a komentujte výsledky.
Řešení příkladu:
Data: \((5, 50), (7, 65), (8, 72), (10, 80), (12, 95), (15, 110)\), počet dat \(n = 6\).
Interpretace: Regresní koeficient \(r \approx 0{,}9957\) znamená velmi silnou pozitivní lineární závislost mezi investicí do reklamy a počtem nových zákazníků.