Jako zdroj semestrální práce jsme si vybrali internetovou stránku www.sreality.cz, na které jsme si našli 29 bytů v Praze 9 na Černém Mostě s nejvyšší cenou 3 150 mil. Kč.
Tři znaky, které jsme sledovali = cenu (mil. Kč), plochu (m2) a obytné místnosti.
Zvolená závislá proměnná = cena bytů
nezávislá proměnná = plocha a místnosti
Lineární mode (slide č.4)
Výstup lineárního regresního modelu ukazuje výsledky popisu vztahu mezi cenou a dvěma nezávisle proměnnými.
Rovnice modelu je: Cena = 0,804471 + 0,0323651 * plocha - 0,20692 * místnosti
Podle koeficientu determinace, který nám vyšel 86,3007 % je model kvalitní.
F-test modelu (slide č.5)
Výstup lineárního regresního modelu ukazuje výsledky popisu vztahu mezi cenou a dvěma nezávisle proměnnými. Rovnice vybavená modelu je
Výsledek F-testu = F>F0,95 => Zamítáme H0
T-test (slide č.6)
Výsledky T-testu:
(plocha) Tx1 => Zamítáme H0
(místnosti) Tx2 => Nezamítáme H0
Interpretace výsledků:
S 95% pravděpodobností lze tvrdit, že proměnná x1 je statisticky významná při tvorbě modelu
S 95% pravděpodobností lze tvrdit, že proměnná x2 není statisticky významná při tvorbě model
Posouzení existence multikolinearity (slide č.7)
Absolutní hodnota korelačních koeficientů je větší (je velmi silná závislost) a tudíž se Multikolinearita projevila!
Interpretace hodnot (slide č.8)
Koeficient β0 - Počáteční cena bez metrů a místností
Koeficient β1 - Pokud se počet metrů čtverečních zvýší o jednotku, cena se zvýší o 0,0323651 mil. Kč
Koeficient β2 - Pokud se počet místností zvýší o jednotku, cena se sníží o - 0,020692 mil.Kč
Zjednodušený model (slide č.9)
Na x souřadnici je cena (mil.Kč)
Na y souřadnici je plocha (m2)
(popsat graf) ???
??? GRAF
Vzhledem k tomu, že nám vyšla regresní přímka, můžeme říci, že se zvyšujícím X se nám zvyšuje i Y. Nemáme žádné extrémně odlehlé hodnoty, avšak tyto hodnoty nejsou centralizovány k přímce, což nám znovu ukazuje špatnou kvalitu modelu. ???
Zjednodušený model (slide č.10)
Odhad ceny bytu, pokud by měl podlahovou plochu 55 m2
Cena = 0,653491 + 0,0261828 * plocha
Porovnání modelů:
- Původní model:R2adj = 85,286 %
- Po vyřazení MÍSTNOSTÍ:R2adj = 84,528 %
Bodový a intervalový odhad (slide č.11)
Intervalový odhad: CENA náhodně vybraného bytu s 55m2 se bude s 95% pravděpodobností pohybovat v intervalu od 1,6617do2,52539.
Interval spolehlivosti: Střední hodnota ceny bytu s 55 m2 se bude s 95% případů pohybovat v intervalu od 2,00973do2,17736,