STATYSTYKA WYKŁAD
~ PODSTAWOWE ROZKŁADY ZMIENNYCH LOSOWYCH ~
Podstawowe rozkłady zmiennej losowej skokowej
Rozkład dwupunktowy
Wprowadzenie
Przykładowy wykres funkcji prawdopodobieństwa rozkładu zero-jedynkowego
Rozkład dwumianowy
Wprowadzenie
Uwagi
Przykład
Przykładowy wykres funkcji prawdopodobieństwa rozkładu dwumianowego
Rozkład Poissona
Wprowadzenie
Przykładowe wykresy
Podstawowe rozkłady zmiennej losowej ciągłej
Rozkład jednostajny
Wprowadzenie
Przykładowy wykres
Rozkład normalny
Wprowadzenie
Przykładowe wykresy funkcji gęstości rozkładu normalnego
Własności funkcji gęstości rozkładu normalnego
Przykłady wykresów rozkładu normalnego
Wnioski z przykładu
Przykład innego rozkładu
Rozkład normalny standaryzowany
Wykres funkcji gęstości rozkładu normalnego standaryzowanego
Obliczanie prawdopodobieństwa w rozkładzie normalnym standaryzowanym
Fragment tablicy rozkładu normalnego standaryzowanego
Przykłady prawdopodobieństwa z wykresami
Obliczanie kwantyli w rozkładzie normalnym standaryzowanym
Prawdopodobieństwa w dowolnym rozkładzie normalnym N(μ , σ)
Przykład zastosowania
Rozkład chi-kwadrat
Wprowadzenie
Przykładowy wykres
Rozkład Studenta
Wprowadzenie
Przykładowy wykres
Podstawowe rozkłady zmiennej losowej skokowej
W teorii rachunku prawdopodobieństwa najczęściej rozpatrywanymi rozkładami zmiennej losowej skokowej są˛:
Rozkład dwupunktowy
wprowadzenie
Mówimy, że zmienne losowa X ma rozkład dwupunktowy, jeśli może przyjmować jedynie dwie wartości, oznaczone dalej umownie jako x1 oraz x2, z prawdopodobieństwami odpowiednio: P(X = x1) = p P(X = x2) = q przy czym p + q = 1.
W przypadku szczególnym, gdy x1 = 1, x2 = 0, mówimy, że X ma rozkład
zero - jedynkowy z parametrem p.
Parametr p nazywamy prawdopodobieństwem sukcesu.
Gdy X ma rozkład zero-jedynkowy, wówczas:
E(X) = p D2(X) = pq
Przykładowy wykres funkcji prawdopodobieństwa rozkładu
zero-jedynkowego
Na osi odciętych zaznaczone są˛ dwie realizacje zmiennej zero-jedynkowej, tj. 0 i 1, natomiast pionowe odcinki reprezentują prawdopodobieństwa wystąpienia tych realizacji,
tj. q = 1 - p oraz p.
Rozkład dwumianowy
Wprowadzenie
Mówimy, że zmienna losowa X ma rozkład dwumianowy z parametrami n i p, jeśli jej funkcja rozkładu prawdopodobieństwa wyraża się wzorem:
$\mathbf{\text{P\ }}\left( \mathbf{X = x} \right)\mathbf{= \ }\left( \frac{\mathbf{n}}{\mathbf{x}}\mathbf{\ } \right)\mathbf{p}^{\mathbf{x}}\mathbf{q}^{\mathbf{n - x}}$ dla x = 0,1,…..,n
gdzie:
n ∈ N, p ∈ (0, 1), q = 1 - p
p jest tzw. prawdopodobieństwem sukcesu,
$\left( \frac{\mathbf{n}}{\mathbf{x}}\mathbf{\ } \right)\mathbf{= \ }\frac{\mathbf{n!}}{\mathbf{x!}\left( \mathbf{\ n - x} \right)\mathbf{!}}\mathbf{\ }$jest symbolem Newtona (wykrzyknik oznacza silnię).
W rozkładzie dwumianowym:
E(X) = np D2(X) = npq
Uwagi
W przypadku zmiennej o rozkładzie dwumianowym zakłada się, że mamy do czynienia z eksperymentem losowym polegającym na wykonaniu ciągu tzw. doświadczeń Bernoulliego.
Nazwa doświadczeń pochodzi od nazwiska trzeciego ze znanej rodziny matematyków – Jakuba Bernoulliego.
Doświadczenia Bernoulliego to ciąg n identycznych doświadczeń losowych, spełniających trzy warunki:
Są dwa możliwe wyniki każdego doświadczenia, nazywane odpowiednio sukcesem i porażka˛.
Prawdopodobieństwo sukcesu, oznaczane symbolem p, jest w każdym doświadczeniu stałe.
Doświadczenia są˛ niezależne, co oznacza, że wynik jednego do świadczenia nie ma wpływu na wyniki pozostałych doświadczeń.
Przykład
Przykład zastosowań rozkładu dwumianowego
Przypuśćmy, ˙ze pewna fabryka produkuje pralki, wśród których 5% to pralki wadliwe.
Z partii produkcji wybrano losowo, ze zwracaniem 20 pralek i poddano je szczegółowej kontroli jakości.
Jakie jest prawdopodobieństwo, ˙ze w wybranej próbie pralek:
dokładnie dwie pralki są wybrakowane
co najwyżej dwie pralki mają wady
żadna pralka nie jest wadliwa
Jaka jest oczekiwana liczba pralek wadliwych w losowej próbie 20 pralek?
Rozwiązanie.
Zauważymy, ˙ze wybór pralek do kontroli jakości jest losowy i niezależny. Ponadto, prawdopodobieństwo wylosowania wadliwej pralki jest w każdym losowaniu takie samo, równe p = 0,05, natomiast liczba losowań wynosi n = 20.
Opisany eksperyment spełnia warunki doświadczeń Bernoulliego, w których ”sukcesem” jest wylosowanie wadliwej pralki.
Liczba wybrakowanych pralek (tj. liczba sukcesów) w próbie 20 sztuk jest zatem zmienna˛ losowa˛ (oznaczmy ja˛ przez X) o rozkładzie dwumianowym z parametrami n=20, p=0,05.
Ad.1. Prawdopodobieństwo, że dokładnie dwie pralki w wylosowanej próbie 20 sztuk są˛ wadliwe wynosi:
$$\text{P\ }\left( X = 2 \right) = \ \left( \frac{20}{2} \right)\left( 0,05 \right)^{2}\left( 0,95 \right)^{18} = \ \frac{20!}{2!18!}\left( 0,05 \right)^{2}\left( 0,95 \right)^{18}\ \approx 0,189$$
Ad.2. Prawdopodobieństwo, że co najwyżej dwie pralki w próbie 20 sztuk są˛ wadliwe wynosi:
$\text{P\ }\left( \ X \leq 2 \right) = P\ \left( \ X = 0 \right) + P\left( \ X = 1 \right) + P\left( \ X = 2 \right) = \ \left( \frac{20}{0} \right)\left( 0,05 \right)^{0}\left( 0,95 \right)^{20} + \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \left( \frac{20}{1} \right)\left( 0,05 \right)^{01}\left( 0,95 \right)^{19} + \ \left( \frac{20}{2} \right)\left( 0,05 \right)^{2}\left( 0,95 \right)^{18}\ \approx 0,925$
Ad.3. Prawdopodobieństwo, że w próbie nie będzie wadliwych pralek, wynosi:
$$\text{P\ }\left( \ X = 0 \right) = \ \left( \frac{20}{0} \right)\left( 0,05 \right)^{0}\left( 0,95 \right)^{20}\ \approx 0,358$$
Oczekiwana liczba wybrakowanych pralek w 20-elementowej próbie jest równa:
E(X) = np = 20 • 0,05 = 1
Uzyskany wynik można interpretować´ następująco. Średnia liczba wadliwych pralek przypadających na każdą˛ 20-elementowa˛ próbę˛ (tj. próbę˛, która˛ potencjalnie można wylosować wynosi 1.
Przykładowe wykresy funkcji prawdopodobieństwa rozkładu dwumianowego
Objaśnienia do wykresu – analogiczne, jak w przypadku wykresu rozkładu
3 . Rozkład Poissona
Wprowadzenie
Mówimy, że zmienna X ma rozkład Poissona z parametrem λ> 0, jeśli jej funkcja rozkładu prawdopodobieństwa wyraża się wzorem:
$$\text{P\ }\left( \ X = x \right) = \ \frac{\lambda^{x}}{x!}e^{- x}\ \ \ \ \ dla\ x = 0,1,2,\ldots\ldots$$
Rozkład Poissona jest rozkładem granicznym rozkładu dwumianowego, tzn. jeśli w rozkładzie dwumianowym n -> ∞ 1 i jednocześnie p -> 0 w taki sposób, że np = const, to prawdopodobieństwo P(X = x) można wyznaczać z powyższego wzoru, przyjmując λ = |np.|
W rozkładzie Poissona: E(X) = λ , D2(X) = λ
Przykładowe wykresy
Aproksymacja rozkładu dwumianowego rozkładem Poissona
Wykresy funkcji prawdopodobieństwa rozkładu dwumianowego z parametrami n = 100, p = 0,01 i rozkładu Poissona z parametrem λ = np = 1
Uwaga: Na wykresie przedstawiono prawdopodobieństwa dla x = 0,1,…….,20, z pominięciem pozostałych możliwych realizacji x = 21,……, 100, ze względu na prawdopodobieństwa bliskie 0. Zauważymy, ˙ze prawdopodobieństwa wyznaczone z rozkładu Poissona w tym przypadku dobrze przybliżają˛ prawdopodobieństwa z
rozkładu dwumianowego.
Podstawowe rozkłady zmiennej losowej ciągłej
Do podstawowych rozkładów zmiennej losowej ciągłej zaliczamy:
Rozkład jednostajny
Wprowadzenie
Mówimy, że zmiennej losowa ciągła X ma rozkład jednostajny na przedziale [a, b], jeśli jej funkcja gęstości wyraża się wzorem
$$\text{f\ }\left( \text{\ x} \right) = \ \left\{ \begin{matrix}
\frac{1}{b - a}\ \ \ \ \ dla\ x \in \left\lbrack a,b \right\rbrack \\
0\ \ \ \ \ \ \ \ \ dla\ pozostalych\ x\ \\
\end{matrix} \right.\ $$
W rozkładzie jednostajnym:
$$\text{E\ }\left( X \right) = \ \frac{b - a}{2}\ \ \ \ \ \ ,\ D^{2}\left( X \right) = \ \frac{1}{12}\left( b - a \right)^{2}$$
Przykładowy wykres
Przykładowy wykres funkcji gęstości rozkładu jednostajnego
Rozkład normalny
Wprowadzenie
Mówimy, że zmienna losowa ciągła X ma rozkład normalny z parametrami μ i σ jeśli jej funkcja gęstości wyraża się wzorem:
$$\text{f\ }\left( X \right) = \ \frac{1}{\sigma\sqrt{2\pi}}e^{- \ \frac{\left( \ x - \ \mu\ \right)^{2}}{{2\sigma}^{2}}\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ dla\ \ x\ \in R}$$
Gdzie μ i σ są˛ dowolnymi parametrami liczbowymi, takimi że μ ∈2 R i σ > 0.
W rozkładzie normalnym: E(X) = μ D2(X) = σ2
Jeśli zmienna losowa X ma rozkład normalny, wówczas mówimy, że jest normalną zmienną, losową.
Jej rozkład oznaczamy w skrócie symbolem N (μ ,σ).
Przykładowe wykresy funkcji gęstości rozkładu normalnego
Własności funkcji gęstości rozkładu normalnego
Funkcja gęstości przyjmuje zawsze wartości nieujemne, a całkowite pole pod krzywa˛ gęstości jest równe 1 (są˛ to własności funkcji gęstości dowolnej zmiennej ciągłej).
Wartość E(X) = μ określa wartość´ przeciętna˛ zmiennej X.
Krzywa gęstości normalnej zmiennej losowej X jest symetryczna względem prostej prostopadłej przechodzącej przez punkt x = μ. Z tego wynika, że pola pod krzywa˛ gęstości na lewo i na prawo od punktu μ sa˛ równe $\frac{1}{2}$
Interpretację ostatniej własności oprzemy na przykładzie.
Załóżmy, ˙ze iloraz inteligencji w populacji dorosłej części ludzkości ma rozkład zbliżony do normalnego ze średnia˛ _ = 100. Z tego wynika, ze połowa ludzkości jest mądrzejsza od osoby przeciętnie mądrej (czego nie można powiedzieć o drugiej połowie).
Przykłady wykresów rozkładu normalnego
Załóżmy, że na koniec każdego miesiąca obserwujemy stopę˛ zwrotu z akcji XYZ. Na podstawie 12 danych zebranych w ciągu roku rysujemy histogram rozkładu.
Ten sam histogram z licznościami względnymi na osi rzędnych. Krzywa reprezentuje tu funkcję gęstości rozkładu normalnego z wartościami parametrów μ i σ równymi odpowiednio ´średniej i odchyleniu standardowemu stóp zwrotu w badanym zbiorze. Dopasowanie krzywej rozkładu normalnego jest bardzo słabe.
Gdyby obserwacje˛ stóp zwrotu prowadzić´ np. w połowie każdego miesiąca, wówczas zebrane wyniki byłyby inne. Poniżej przykładowy histogram.
Ten sam histogram z licznościami względnymi na osi rzędnych. Dopasowanie krzywej rozkładu normalnego nadal słabe.
Przypuśćmy teraz, że obserwacji stóp zwrotu dokonujemy z większą częstotliwością np. w wybranym dniu każdego tygodnia. Otrzymamy większa˛ liczbę˛ danych. Poniżej przykładowy histogram dla kilkudziesięciu obserwacji.
Ten sam histogram z licznościami względnymi na osi rzędnych. Dopasowanie krzywej rozkładu normalnego nieco lepsze.
Jeśli obserwacje przeprowadzać będziemy w innym dniu tygodnia, wówczas uzyskamy inny zbiór danych. Poniżej – przykładowy histogram.
Ten sam histogram z licznościami względnymi na osi rzędnych oraz krzywa gęstości rozkładu normalnego.
Prowadzać obserwacje˛ z bardzo duża˛ częstotliwością˛, np. kilka razy dziennie przez cały rok, zbierzemy kilkaset lub nawet kila tysięcy wyników obserwacji. Poniżej – ich przykładowy histogram.
Ten sam histogram z licznościami względnymi na osi rzędnych. W tym przypadku dopasowanie krzywej gęstości rozkładu normalnego jest wyraźne.
Wnioski z przykładu
Jeśli rozkład liczebności względnych jest dobrze reprezentowany przez funkcje gęstości rozkładu normalnego, wówczas mówimy, ˙ze cecha ma rozkład normalny (lub zbliżony do normalnego).
Krzywa gęstości aproksymuje rozkład częstości względnych cechy normalnej w przypadku, gdy wartości tej cechy rejestrujemy z dużą˛ częstotliwością˛ (jak w przedstawionym przykładzie) lub w dużej zbiorowości jednostek.
Nie każda cecha ciągła ma rozkład normalny. Istnieją˛ także inne możliwe rozkłady zmiennych ciągłych – zob. następny slajd.
Przykład innego rozkładu
Krzywa gęstości rozkładu z prawostronna˛ asymetria˛
Rozkład normalny standaryzowany
Rozkład normalny z parametrami μ = 0, σ = 1 nazywamy rozkładem normalnym standaryzowanym (lub zamiennie – standardowym) i oznaczamy w skrócie N(0, 1) .
Zmienna˛ o takim rozkładzie oznaczać´ będziemy dalej (dla odróżnienia) przez U, natomiast funkcję gęstości i dystrybuantę tej zmiennej – symbolami odpowiednio ⌀(x) i ⌀(x).
Zauważymy, że gęstość zmiennej U ma postać:
$$\mathbf{\varnothing = \ }\frac{\mathbf{1}}{\sqrt{\mathbf{2\pi}}}\mathbf{e}^{\mathbf{- \ }\frac{\mathbf{x}^{\mathbf{2}}}{\mathbf{2}}\mathbf{\text{\ \ }}}\ \ \ \ \ dla\ x\ \in R$$
W odniesieniu do dystrybuanty rozkładu N(0,1) prawdziwa jest następująca równość: ⌀(x) = 1 - ⌀(x).
Wykres funkcji gęstości rozkładu normalnego standaryzowanego
Obliczanie prawdopodobieństw w rozkładzie normalnym standaryzowanym
Prawdopodobieństwo, że ciągła zmienna losowa przyjmie wartość z zadanego przedziału liczbowego, reprezentowane jest przez pole pod jej krzywa˛ gęstości w badanym przedziale, przy czym całkowite pole pod krzywa˛ wynosi 1.
Załóżmy, że U ma rozkład N(0,1). Chcemy obliczyć dystrybuantę ⌀(x) = P(U < x), gdzie x – zadana wartość.
Prawdopodobieństwo to jest równe polu pod krzywa˛ gęstości rozkładu N(0, 1) na przedziale (- ∞ , x). Obliczenie takiego pola ”na piechotę” jest jednak stosunkowo trudne.
W celu znalezienia ⌀(x) = P(U < x) korzysta się często z tablic statystycznych, zawierających obliczone prawdopodobieństwa dla różnych x – zob. następny slajd
Fragment tablicy rozkładu normalnego standaryzowanego
Przykłady prawdopodobieństw z wykresami
Prawdopodobieństwo P(U < x) w rozkładzie N(0, 1) Np. dla x = 1; 37 mamy bezpośrednio z tablicy: P(U<1; 37)=0; 9147
Prawdopodobieństwo P(U ≥ x) w rozkładzie N(0, 1)
Dla x = 1, 37 mamy: P(U≥1, 37)= 1 - P(U < 1, 37) = 1 - 0, 9147 = 0, 0853
Prawdopodobieństwo P(|U| < x) w rozkładzie N(0,1)
P(|U| < 1, 37) = P(-1,37 < U < 1,37) =P(U<1,37) - P(U<-1 37)=
= ⌀ (1,37) - ⌀ (-1,37)= ⌀ (1,37) - (1- ⌀ (1,37)) = 0,9147 - (1 – 0,9147)=0,8294
Reguła 3 sigm w rozkładzie N(0, 1)
P(|U| < 3• σ) = P(|U| < 3) = P(-3 < U < 3) = P(U<3) - P(U< -3)=
= ⌀(3) - ⌀ (-3) =⌀ (3) - (1 - ⌀ (3)) = 0,9987 - (1 – 0,9987) = 0,9974
Prawdopodobieństwo P(x < U < y) w rozkładzie N(0, 1)
Obliczymy prawdopodobieństwo P(x < U < y) dla zadanych wartości x, y.
Niech x = 0, y = 1,43. Mamy wówczas:
P(0 < U < 1,43) =P(U<1,43) - P(U<0)= ⌀ (1,43) - ⌀ (0) = 0,9236 – 0,5 = 0,4236:
l) Obliczanie kwantyli w rozkładzie normalnym standaryzowanym
1. Na podstawie tablic rozkładu normalnego standaryzowanego możemy także łatwo odczytać, dla jakiego u zachodzi równość:
p = P(U < u)
gdzie p jest zadana˛ liczba˛ z przedziału (0,1).
2. Punkt u spełniający powyższa˛ równość´ nazywamy kwantylem rozkładu normalnego standaryzowanego rzędu p.
3. Przykładowo, znajdziemy kwantyl rzędu 0,9 dla rozkładu normalnego standaryzowanego.
4. Z definicji, jest to taka˛ wartość´ u, dla której P(U<u)=0,9. Na podstawie danych w tablicy wnioskujemy, iż szukany kwantyl jest równy: u ≈ 1, 28
Ilustracja graficzna
Równość P(U<u)=0; 9 zachodzi dla u ≈ 1, 28
Wyznaczanie kwantyli dla rozkładu N(0, 1) – c.d.
Znajdziemy, jakiego rzędu jest kwantyl u rozkładu N(0,1), spełniający równość:
P(|U| <u)=1 - α dla zadanego α = 0, 05. Następnie znajdziemy ten kwantyl.
Mamy:
1 − ∝ = P(|U|<u) = P(U<u) − P(U< −u) = P(U<u) − (1−P(U<u)) = 2P(U<u) − 1
Oznaczając p = P(U<u), otrzymujemy:
$$\mathbf{2}\mathbf{p - 1 = 1 - \ \propto \ \ \ ,\ stad\ \ p = 1 - \ }\frac{\mathbf{\propto}}{\mathbf{2}}$$
Wynika z tego, ˙ze u jest kwantylem rzędu:
$$p\mathbf{= 1 - \ }\frac{\mathbf{\propto}}{\mathbf{2}}\mathbf{= 1 - \ }\frac{\mathbf{0,05}}{\mathbf{2}}\mathbf{= 0,975}$$
Na podstawie tablicy otrzymujemy natychmiast: u ≈ 1, 96.
Prawdopodobieństwa w dowolnym rozkładzie normalnym N(μ , σ)
Jeśli zmienna losowa X ma rozkład normalny N(μ , σ) o wartościach parametrów μ i σ innych niż 0 i 1, wówczas obliczanie odpowiednich prawdopodobieństw z wykorzystaniem dostępnych tablic statystycznych wymaga zastosowania tzw. twierdzenia o standaryzacji.
Tw. o standaryzacji: jeśli zmienna losowa X ma rozkład N(μ , σ) to zmienna losowa: $U\ = \ \frac{X - \ \mu}{\sigma}$ ma rozkład normalny standaryzowany N(0, 1).
W ramach ilustracji, obliczymy prawdopodobieństwo F(8) = P(X < 8), zakładając, ze X ma rozkład N(10, 2).
$\mathbf{F}\left( \mathbf{8} \right)\mathbf{= P}\left( \mathbf{X < 8} \right)\mathbf{= P}\left( \frac{\mathbf{X - 10}}{\mathbf{2}}\mathbf{< \ }\frac{\mathbf{8 - 10}}{\mathbf{2}} \right)\mathbf{= P}\left( \mathbf{U < \ - 1} \right)\mathbf{= \ \varnothing}\left( \mathbf{- 1} \right)\mathbf{=}$
= 1 − ⌀(1)=0, 8413
Ilustracja graficzna
Prawdopodobieństwo F(8) = P(X < 8) w rozkładzie N(10,2)
Zmienna X po standaryzacji $\frac{\mathbf{X - 10}}{\mathbf{2}}\mathbf{\ }$ma rozkład N(0,1). Zaznaczone pola są˛ równe
Przykład zastosowania
Wiadomo, że zysk (w zł) z pewnego przedsięwzięcia ma rozkład normalny N(80,45).
Obliczyć´ prawdopodobieństwo, że inwestując w dane przedsięwzięcie, poniesiemy stratę.
Rozwiązanie. Zysk z przedsięwzięcia jest zmienna˛ losowa˛. Oznaczmy ja˛ symbolem X. Prawdopodobieństwo, że inwestor poniesie stratę oznacza prawdopodobieństwo, że zysk będzie ujemny.
Skorzystamy z tw. o standaryzacji i tablic statystycznych:
$$\text{P\ }\left( X < 0 \right) = P\left( \frac{X - 80}{45} < \ \frac{0 - 80}{45} \right) = P\left( U < \ - 1,75 \right) = \ \varnothing\left( - 1,78 \right) = 1 - \ \varnothing\left( 1,78 \right) = 1 - 0,9625 = 0,0375$$
Rozkład chi-kwadrat
Wprowadzenie
Mówimy, ˙ze zmienna losowa Z ma rozkład chi-kwadrat o k stopniach swobody, jeśli jest suma˛ kwadratów k niezależnych zmiennych losowych o rozkładzie normalnym standaryzowanym, czyli:
$$\mathbf{Z = \ }\sum_{\mathbf{i = 1}}^{\mathbf{k}}\mathbf{U}_{\mathbf{1}}^{\mathbf{2}}$$
gdzie U1,U2,…..,Uk są˛ niezależnymi zmiennymi losowymi, każda o rozkładzie N(0,1).
W rozkładzie chi-kwadrat: E(Z) = k, D2(Z) = 2k.
Rozkłady chi-kwadrat (podobnie, jak dalej przedstawione rozkłady Studenta) są˛ często wykorzystywane w procedurach wnioskowania statystycznego.
Przykładowy wykres funkcji gęstości rozkładu chi-kwadrat
Rozkład Studenta
Wprowadzenie
Mówimy, że zmienna losowa t ma rozkład Studenta o k stopniach swobody, jeśli określoną wzorem:
$$\mathbf{t = \ }\frac{\mathbf{U}}{\sqrt{\mathbf{Z}}}\sqrt{\mathbf{k}}$$
gdzie U i Z są˛ niezależnymi zmiennymi losowymi, przy czym U ma rozkład N(0,1), natomiast Z – rozkład chi-kwadrat o k stopniach swobody.
Rozkłady tego typu po raz pierwszy wyprowadził WilliamGosset (przełom XVIII i XIX wieku) publikujący pod pseudonimem Student. Stąd wywodzi się˛ ich nazwa. Zmienna losowa jest tu oznaczana wyjątkowo mała litera˛ t (od ostatniej litery nazwiska autora).
W rozkładzie Studenta: $\mathbf{E}\left( \mathbf{t} \right)\mathbf{= \ 0,\ \ \ }\mathbf{D}^{\mathbf{e}}\left( \mathbf{t} \right)\mathbf{=}\frac{\mathbf{\text{\ k}}}{\mathbf{k - 2\ }}\ \ \ o\ ile\ k > 2$
Przykładowy wykres funkcji gęstości rozkładu Studenta