Gęstość rozkładu sumy zmiennych losowych. Rozkład sumy dwóch losowych zmiennych niezależnych. Przybliżenia dla rozkładu sumy

Definicja. Zmienne losowe Х 1 , Х 2 , …, Х n są nazywane niezależnymi, jeśli dla dowolnych x 1 , x 2 , …, x n zdarzenia są niezależne

(ω: X 1 (ω)< x},{ω: Х 2 (ω) < x},…, {ω: Х n (ω) < x n }.

Z definicji wynika wprost, że dla niezależnych zmiennych losowych X 1, X 2, …, X n funkcja dystrybucyjna n-wymiarowa zmienna losowa X = X 1, X 2, …, X n jest równy iloczynowi funkcji dystrybucji zmiennych losowych X 1, X 2, …, X n

F(x 1 , x2, …, x n) = F(x 1)F(x2)…F(x n). (1)

Rozróżnijmy równość (1) n razy do x 1 , x2, …, x n, dostajemy

p(x 1 , x2, …, x n) = p(x 1)p(x2)…p(x n). (2)

Można podać inną definicję niezależności zmiennych losowych.

Jeśli prawo rozkładu jednej zmiennej losowej nie zależy od tego, jakie możliwe wartości przyjęły inne zmienne losowe, to takie zmienne losowe nazywane są niezależnymi w agregacie.

Na przykład kupowane są dwa losy na loterię w różnych edycjach. Zostawiać X– wysokość wygranych za pierwszy los, Y– kwota wygranych za drugi los. zmienne losowe X oraz Y- niezależne, gdyż wygrana jednego losu nie wpłynie na prawo dystrybucji drugiego. Ale jeśli bilety mają ten sam numer, to X oraz Y- zależne.

Dwie zmienne losowe nazywane są niezależnymi, jeśli prawo rozkładu jednej z nich nie zmienia się w zależności od tego, jakie możliwe wartości przyjęła druga zmienna.

Twierdzenie 1(sploty) lub „twierdzenie o gęstości sumy 2 zmiennych losowych”.

Zostawiać X = (X 1;X 2) jest niezależną ciągłą dwuwymiarową zmienną losową, Y = X 1+ X 2. Następnie gęstość rozkładu

Dowód. Można wykazać, że jeśli , to

gdzie X = (X 1 , X 2 , …, X n). A następnie, jeśli X = (X 1 , X 2), to funkcja dystrybucji Y = X 1 + X 2 można zdefiniować w następujący sposób (rys. 1) -

Zgodnie z definicją funkcją jest gęstość rozkładu zmiennej losowej Y = X 1 + X 2 , czyli

py (t) = co miało zostać udowodnione.

Wyprowadźmy wzór na znalezienie rozkładu prawdopodobieństwa sumy dwóch niezależnych dyskretnych zmiennych losowych.

Twierdzenie 2. Zostawiać X 1 , X 2 – niezależne dyskretne zmienne losowe,

Dowód. Wyobraź sobie wydarzenie X = {X 1 +X 2 = x) jako suma niezgodnych zdarzeń

X = å( X 1 = x i ; X 2 = xx i).

Jak X 1 , X 2 - wtedy niezależny P(X 1 = x i ; X 2 = xx i) = P(X 1 = x i) P(X 2 = x-x i), to

P(X) = P(å( X 1 = x i ; X 2 = x – x i)) = å( P(X 1 = x ja) P(X 2 = x-x i))

co było do okazania

Przykład 1 Zostawiać X 1 , X 2 - niezależne zmienne losowe o rozkładzie normalnym z parametrami N(0;1); X 1 , X 2 ~ N(0;1).

Znajdźmy gęstość rozkładu ich sumy (oznaczamy X 1 = x, Y = X 1 +X 2)


Łatwo zauważyć, że całka jest gęstością rozkładu normalnej zmiennej losowej z parametrami a= , , tj. całka wynosi 1.

Funkcjonować py(t) jest gęstością rozkładu normalnego o parametrach a = 0, s = . Zatem suma niezależnych zmiennych losowych normalnych z parametrami (0,1) ma rozkład normalny z parametrami (0,), tj. Y = X 1 + X 2 ~ N(0;).

Przykład 2. Niech więc będą podane dwie dyskretne niezależne zmienne losowe o rozkładzie Poissona

gdzie k, m, n = 0, 1, 2, …,¥.

Według Twierdzenia 2 mamy:

Przykład 3 Zostawiać X 1, X 2-niezależne zmienne losowe o rozkładzie wykładniczym. Znajdźmy gęstość Y= X 1 +X 2 .

Oznaczać x = x 1. Od X 1, X 2 są niezależnymi zmiennymi losowymi, wtedy używamy „twierdzenia o splocie”

Można wykazać, że jeśli suma ( ja mieć rozkład wykładniczy z parametrem l), wtedy Y= ma dystrybucję zwaną dystrybucją Erlanga ( n- 1) zamówienie. Prawo to uzyskano modelując działanie central telefonicznych w pierwszych pracach z teorii kolejek.

W statystyce matematycznej prawa rozkładu są często używane dla zmiennych losowych, które są funkcjami niezależnych normalnych zmiennych losowych. Rozważmy trzy prawa najczęściej spotykane w modelowaniu zjawisk losowych.

Twierdzenie 3. Jeśli zmienne losowe są niezależne X 1, ..., X n, wtedy funkcje tych zmiennych losowych są również niezależne Y 1 = f 1 (X 1), ...,T n = f n(X n).

Dystrybucja Pearsona(od 2 -dystrybucja). Zostawiać X 1, ..., X n są niezależnymi normalnymi zmiennymi losowymi z parametrami a= 0, s = 1. Skomponuj zmienną losową

Zatem,

Można wykazać, że gęstość dla x > 0 ma postać , gdzie k n jest pewnym współczynnikiem spełnienia warunku. Jak n ® ¥, rozkład Pearsona dąży do rozkładu normalnego.

Niech Х 1 , Х 2 , …, Хn ~ N(a,s), potem zmienne losowe ~ N(0,1). Dlatego zmienna losowa ma rozkład c 2 z n stopniami swobody.

Rozkład Pearsona jest stabelaryzowany i używany w różnych zastosowaniach statystyki matematycznej (na przykład podczas testowania hipotezy, że prawo rozkładu jest niesprzeczne).

Decydent może skorzystać z ubezpieczenia, aby złagodzić negatywny wpływ finansowy niektórych rodzajów zdarzeń losowych.

Ale ta dyskusja jest bardzo ogólna, ponieważ decydent może oznaczać zarówno osobę poszukującą ochrony przed uszkodzeniem mienia, oszczędności lub dochodów, jak i organizację poszukującą ochrony przed tym samym rodzajem szkód.

W rzeczywistości taką organizacją może być firma ubezpieczeniowa, która szuka sposobów na zabezpieczenie się przed stratami finansowymi spowodowanymi zbyt dużą liczbą zdarzeń ubezpieczeniowych, które wystąpiły u klienta indywidualnego lub jego portfela ubezpieczeniowego. Ta ochrona nazywa się reasekuracja.

Rozważ jeden z dwóch modeli (mianowicie indywidualny model ryzyka) szeroko stosowany przy ustalaniu stawek i rezerw ubezpieczeniowych, a także w reasekuracji.

Oznacz przez S kwota przypadkowych strat firmy ubezpieczeniowej dla części jego ryzyk. W tym przypadku S jest zmienną losową, dla której musimy określić rozkład prawdopodobieństwa. Historycznie, dla rozkładów r.v. S były dwa zestawy postulatów. Indywidualny model ryzyka definiuje: S w następujący sposób:

gdzie r.w. oznacza szkody spowodowane przez przedmiot ubezpieczenia o numerze i, a n oznacza całkowitą liczbę przedmiotów ubezpieczenia.

Zazwyczaj przyjmuje się, że są to niezależne zmienne losowe, gdyż w tym przypadku obliczenia matematyczne są prostsze i nie jest wymagana informacja o charakterze zależności między nimi. Drugim modelem jest model ryzyka kolektywnego.

Rozważany model poszczególnych ryzyk nie odzwierciedla zmian wartości pieniądza w czasie. Ma to na celu uproszczenie modelu, dlatego tytuł artykułu odnosi się do krótkiego przedziału czasowego.

Rozważymy tylko modele zamknięte, tj. te, w których liczba przedmiotów ubezpieczenia n we wzorze (1.1) jest znana i ustalona na samym początku rozpatrywanego przedziału czasu. Jeżeli wprowadzimy założenia dotyczące występowania migracji z lub do systemu ubezpieczeniowego, to otrzymujemy model otwarty.

Zmienne losowe opisujące poszczególne wypłaty

W pierwszej kolejności przypomnijmy główne przepisy dotyczące ubezpieczeń na życie.

W przypadku ubezpieczenia na wypadek śmierci na okres jednego roku ubezpieczyciel zobowiązuje się do zapłaty kwoty b, jeżeli ubezpieczający umrze w ciągu roku od dnia zawarcia umowy ubezpieczenia i nic nie płaci, jeżeli ubezpieczający żyje w tym roku.

Prawdopodobieństwo wystąpienia zdarzenia ubezpieczeniowego w określonym roku oznacza się .

Zmienna losowa opisująca składki ubezpieczeniowe ma rozkład, który można określić za pomocą funkcji prawdopodobieństwa

(2.1)

lub odpowiednia funkcja dystrybucji

(2.2)

Ze wzoru (2.1) oraz z definicji momentów otrzymujemy

(2.4)

Te wzory można również uzyskać, pisząc X jak

gdzie jest stałą wartością płaconą w przypadku śmierci i jest zmienną losową, która przyjmuje wartość 1 w przypadku śmierci i 0 w przeciwnym razie.

Tak więc i oraz średnią wartość i wariancję r.v. są równe i odpowiednio, a średnia wartość i wariancja r.v. są równe i , co pokrywa się z powyższymi wzorami.

Zmienna losowa o rozstępie (0,1) jest szeroko stosowana w modelach aktuarialnych.

W podręcznikach do teorii prawdopodobieństwa nazywa się to wskaźnik, Bernoulli losowo wartość lub zmienna losowa dwumianowa w projekcie pojedynczego testu.

Zadzwonimy do niej wskaźnik ze względu na zwięzłość, a także dlatego, że wskazuje początek lub nie początek danego zdarzenia.

Przejdźmy do poszukiwań bardziej ogólnych modeli, w których wartość składki ubezpieczeniowej jest również zmienną losową iw rozważanym przedziale czasowym może wystąpić kilka zdarzeń ubezpieczeniowych.

Ubezpieczenia zdrowotne, ubezpieczenia komunikacyjne i majątkowe oraz ubezpieczenia od odpowiedzialności cywilnej od razu dostarczają wielu przykładów. Uogólniając wzór (2.5), ustawiamy

gdzie jest zmienną losową opisującą wypłaty ubezpieczenia w rozpatrywanym przedziale czasowym, r.v. oznacza całkowitą kwotę płatności w tym przedziale, a r.v. jest wskaźnikiem zdarzenia, że ​​miało miejsce co najmniej jedno zdarzenie objęte ubezpieczeniem.

Będąc wskaźnikiem takiego zdarzenia, r.v. naprawia obecność () lub brak () zdarzeń ubezpieczeniowych w tym przedziale czasowym, ale nie liczby zdarzeń ubezpieczeniowych w tym przedziale czasowym.

Prawdopodobieństwo będzie nadal oznaczane przez .

Omówmy kilka przykładów i wyznaczmy rozkłady zmiennych losowych w jakimś modelu.

Rozważmy najpierw ubezpieczenie na wypadek śmierci na okres jednego roku, z dodatkowym świadczeniem, jeśli śmierć jest nieszczęśliwa.

Dla jednoznaczności załóżmy, że jeżeli śmierć nastąpiła w wyniku nieszczęśliwego wypadku, to kwota wypłaty wyniesie 50 000. Jeżeli zgon nastąpi z innych przyczyn, kwota wypłaty wyniesie 25 000.

Załóżmy, że dla osoby w określonym wieku, stanie zdrowia i wykonywanym zawodzie prawdopodobieństwo zgonu w wyniku wypadku w ciągu roku wynosi 0,0005, a z innych przyczyn 0,0020. W formie formuły wygląda to tak:

Sumując wszystkie możliwe wartości , otrzymujemy

,

Rozkład warunkowy do. w. warunek ma formę

Rozważmy teraz ubezpieczenie od kolizji samochodu (odszkodowanie wypłacone właścicielowi samochodu za szkody wyrządzone jego samochodowi) z bezwarunkową franszyzą w wysokości 250 i maksymalną wypłatą 2000.

Dla jasności przyjmujemy, że prawdopodobieństwo wystąpienia jednego zdarzenia ubezpieczeniowego w rozpatrywanym okresie dla osoby wynosi 0,15, a prawdopodobieństwo wystąpienia więcej niż jednej kolizji jest równe zeru:

, .

W celu uproszczenia rozkładu r.v. .

Porzucimy to założenie w następnym rozdziale po rozważeniu rozkładu sumy kilku szkód ubezpieczeniowych.

Ponieważ jest to wartość wypłat ubezpieczyciela, a nie szkoda wyrządzona samochodowi, możemy rozważyć dwie cechy, i.

Po pierwsze, zdarzenie obejmuje te kolizje, w których szkoda jest mniejsza niż bezwarunkowa franszyza, która wynosi 250.

Po drugie, rozkład r.v. będzie miał „skrzep” masy probabilistycznej w punkcie maksymalnej kwoty wypłat ubezpieczenia, która jest równa 2000.

Załóżmy, że skoncentrowana w tym punkcie masa probabilistyczna wynosi 0,1. Załóżmy dalej, że wartość składek ubezpieczeniowych w przedziale od 0 do 2000 można modelować rozkładem ciągłym z funkcją gęstości proporcjonalną do (W praktyce krzywa ciągła wybrana do reprezentowania rozkładu składek jest wynikiem badań składek w poprzednim okresie.)

Podsumowując te założenia dotyczące warunkowego rozkładu r.v. pod warunkiem otrzymujemy rozkład typu mieszanego, który ma dodatnią gęstość w zakresie od 0 do 2000 i pewną „skrzepę” masy probabilistycznej w punkcie 2000. Ilustruje to wykres na ryc. 2.2.1.

Funkcja rozkładu tego rozkładu warunkowego wygląda tak:

Rys.2.1. Funkcja dystrybucji r.v. B pod warunkiem I = 1

Obliczamy matematyczne oczekiwanie i wariancję w rozważanym przykładzie z ubezpieczeniem samochodu na dwa sposoby.

Najpierw wypiszemy rozkład r.v. i użyj go do obliczenia i . Oznaczanie przez funkcję dystrybucji r.v. , mamy

Do x<0

To jest dystrybucja mieszana. Jak pokazano na ryc. 2.2, ma zarówno część dyskretną („kępkę” masy probabilistycznej w punkcie 2000), jak i część ciągłą. Taka dystrybuanta odpowiada kombinacji funkcji prawdopodobieństwa

Ryż. 2.2. Funkcja dystrybucji r.v. X=IB

i funkcje gęstości

W szczególności i . Więc .

Istnieje szereg formuł, które wiążą momenty zmiennych losowych z warunkowymi oczekiwaniami matematycznymi. Dla oczekiwań matematycznych i dla wariancji wzory te mają postać

(2.10)

(2.11)

Zakłada się, że wyrażenia po lewej stronie tych równości są obliczane bezpośrednio z rozkładu r.v. . Przy obliczaniu wyrażeń po prawej stronie, a mianowicie i , stosuje się warunkowy rozkład r.v. przy stałej wartości r.v. .

Wyrażenia te są zatem funkcjami r.v. , a ich momenty możemy obliczyć korzystając z rozkładu r.v. .

Rozkłady warunkowe są używane w wielu modelach aktuarialnych, co pozwala na bezpośrednie zastosowanie powyższych formuł. W naszym modelu. Biorąc pod uwagę r.v. jak i r.v. jak , dostajemy

(2.12)

, (2.14)

, (2.15)

i rozważ warunkowe oczekiwania matematyczne

(2.16)

(2.17)

Wzory (2.16) i (2.17) są zdefiniowane jako funkcja r.v. , który można zapisać w postaci następującej formuły:

Ponieważ w , to (2.21)

Bo mamy i (2.22)

Wzory (2.21) i (2.22) można łączyć: (2.23)

Tak więc (2.24)

Zastępując (2.21), (2.20) i (2.24) (2.12) i (2.13) otrzymujemy

Zastosujmy otrzymane wzory do obliczeń i na przykładzie ubezpieczenia komunikacyjnego (rys. 2.2). Ponieważ funkcja gęstości r.v. W stanie wyraża się wzorem

oraz P(B=2000|I=1)= 0,1, mamy

Wreszcie, zakładając q= 0,15, ze wzorów (2.25) i (2.26) otrzymujemy następujące równości:

Aby opisać inną sytuację ubezpieczeniową, możemy zaoferować inne modele dla r.v. .

Przykład: model liczby zgonów w wyniku wypadków lotniczych

Jako przykład rozważmy model liczby zgonów w wyniku wypadków lotniczych w okresie jednego roku działalności linii lotniczej.

Możemy zacząć od zmiennej losowej opisującej liczbę zgonów na jeden lot, a następnie zsumować te zmienne losowe dla wszystkich lotów w ciągu roku.

W przypadku jednego lotu wydarzenie wskaże początek katastrofy lotniczej. Liczba zgonów, które pociągnęła za sobą ta katastrofa, będzie reprezentowana przez iloczyn dwóch zmiennych losowych oraz , gdzie jest współczynnikiem obciążenia samolotu, czyli liczbą osób na pokładzie w momencie katastrofy, a jest odsetkiem zgonów wśród osób na deska.

Liczbę zgonów przedstawia się w ten sposób, ponieważ oddzielne statystyki dla i są bardziej dostępne niż statystyki dla r.v. . Tak więc, chociaż proporcja zgonów wśród osób na pokładzie i liczba osób na pokładzie są prawdopodobnie ze sobą powiązane, jako pierwsze przybliżenie można przyjąć, że r.v. i niezależny.

Sumy niezależnych zmiennych losowych

W modelu ryzyka indywidualnego wypłaty ubezpieczeniowe dokonywane przez zakład ubezpieczeń są prezentowane jako suma wypłat na rzecz wielu osób.

Przypomnij sobie dwie metody wyznaczania rozkładu sumy niezależnych zmiennych losowych. Rozważmy najpierw sumę dwóch zmiennych losowych, których przestrzeń próbki jest pokazana na ryc. 3.1.

Ryż. 2.3.1. Wydarzenie

Linia i obszar pod tą linią reprezentują zdarzenie. Dlatego funkcja dystrybucji r.v. S ma formę (3.1)

Dla dwóch dyskretnych nieujemnych zmiennych losowych możemy użyć wzoru na całkowite prawdopodobieństwo i zapisać (3.1) jako

Jeśli X oraz Y są niezależne, ostatnią sumę można przepisać jako

(3.3)

Funkcję prawdopodobieństwa odpowiadającą tej funkcji rozkładu można znaleźć za pomocą wzoru

(3.4)

Dla ciągłych nieujemnych zmiennych losowych wzory odpowiadające wzorom (3.2), (3.3) i (3.4) mają postać

Gdy jedna lub obie zmienne losowe X oraz Y mają rozkład mieszany (co jest typowe dla poszczególnych modeli ryzyka), formuły są podobne, ale bardziej uciążliwe. W przypadku zmiennych losowych, które również mogą przyjmować wartości ujemne, sumy i całki w powyższych wzorach są brane po wszystkich wartościach y od do .

W teorii prawdopodobieństwa działanie we wzorach (3.3) i (3.6) nazywa się splotem dwóch funkcji dystrybucji i jest oznaczane przez . Operację splotu można również zdefiniować dla pary funkcji prawdopodobieństwa lub gęstości za pomocą wzorów (3.4) i (3.7).

Aby określić rozkład sumy więcej niż dwóch zmiennych losowych, możemy użyć iteracji procesu splotu. Do , gdzie są niezależnymi zmiennymi losowymi, oznacza dystrybuantę r.v. i jest dystrybuantą r.v. , dostaniemy

Przykład 3.1 ilustruje tę procedurę dla trzech dyskretnych zmiennych losowych.

Przykład 3.1. Zmienne losowe i są niezależne i mają rozkłady zdefiniowane w kolumnach (1), (2) i (3) poniższej tabeli.

Wypiszmy funkcję prawdopodobieństwa i dystrybuantę r.v.

Decyzja. W tabeli zastosowano notację przedstawioną przed przykładem:

Kolumny (1)-(3) zawierają dostępne informacje.

Kolumnę (4) otrzymuje się z kolumn (1) i (2) przy użyciu (3.4).

Kolumnę (5) otrzymuje się z kolumn (3) i (4) stosując (3.4).

Definicja kolumny (5) uzupełnia wyznaczanie funkcji prawdopodobieństwa dla r.v. . Jego funkcją dystrybucji w kolumnie (8) jest zbiór sum cząstkowych kolumny (5), zaczynając od góry.

Dla jasności uwzględniliśmy kolumnę (6), funkcję dystrybucji dla kolumny (1), kolumny (7), którą można uzyskać bezpośrednio z kolumn (1) i (6) za pomocą (2.3.3) i kolumny (8 ) wyznaczono podobnie dla kolumn (3) i (7). Kolumnę (5) można wyznaczyć z kolumny (8) przez kolejne odejmowanie.

Przejdźmy do rozważenia dwóch przykładów z ciągłymi zmiennymi losowymi.

Przykład 3.2. Niech r.v. ma rozkład równomierny na przedziale (0,2) i niech r.v. nie zależy od r.v. i ma równomierny rozkład na przedziale (0,3). Zdefiniujmy dystrybuantę r.v.

Decyzja. Ponieważ rozkłady r.v. i ciągłej używamy wzoru (3.6):

Następnie

Przestrzeń próbna r.v. i jest zilustrowany na ryc. 3.2. Prostokątny obszar zawiera wszystkie możliwe wartości pary i . Interesujące nas wydarzenie, , jest przedstawione na rysunku dla pięciu wartości s.

Dla każdej wartości linia przecina oś Y w punkcie s i linię w punkcie. Wartości funkcji dla tych pięciu przypadków opisuje następujący wzór:

Ryż. 3.2. Splot dwóch rozkładów jednostajnych

Przykład 3.3. Rozważmy trzy niezależne r.v. . Dla r.v. ma rozkład wykładniczy i . Znajdźmy funkcję gęstości r.v. przez zastosowanie operacji splotu.

Decyzja. Mamy

Stosując wzór (3.7) trzy razy, otrzymujemy

Inna metoda wyznaczania rozkładu sumy niezależnych zmiennych losowych opiera się na jednoznaczności funkcji generującej moment, która dla r.v. zależy od stosunku .

Jeśli to matematyczne oczekiwanie jest skończone dla wszystkich? t z pewnego otwartego przedziału zawierającego początek, jest to jedyna funkcja tworząca momentów rozkładu r.v. w tym sensie, że nie ma innej funkcji niż , która byłaby funkcją generującą momentów rozkładu r.v. .

Ta wyjątkowość może być wykorzystana w następujący sposób: dla sumy

Jeśli są niezależne, to oczekiwanie iloczynu we wzorze (3.8) jest równe ..., więc

Znalezienie wyraźnego wyrażenia dla jedynego rozkładu odpowiadającego funkcji tworzącej momentów (3.9) uzupełniłoby znalezienie rozkładu r.v. . Jeżeli nie można tego jednoznacznie określić, to można go wyszukać metodami numerycznymi.

Przykład 3.4. Rozważ zmienne losowe z przykładu 3.3. Zdefiniujmy funkcję gęstości r.v. , wykorzystując funkcję tworzącą momentów w.p. .

Decyzja. Według równości (3.9), który można zapisać jako stosując metodę rozkładu na proste frakcje. Rozwiązaniem jest . Ale jest funkcją tworzącą momenty rozkładu wykładniczego z parametrem , tak że funkcja gęstości r.v. ma formę

Przykład 3.5. W badaniu procesów losowych wprowadzono odwrotny rozkład Gaussa. Jest używany jako rozkład r.v. W, wysokość składek ubezpieczeniowych. Funkcja gęstości i funkcja tworząca momenty odwrotnego rozkładu Gaussa dane są wzorami

Znajdźmy rozkład r.v. , gdzie w.w. są niezależne i mają takie same odwrotne rozkłady Gaussa.

Decyzja. Korzystając ze wzoru (3.9), otrzymujemy następujące wyrażenie na funkcję tworzącą momenty w.w. :

Funkcja tworząca momentów odpowiada unikalnemu rozkładowi i można zauważyć, że ma odwrotny rozkład Gaussa z parametrami i .

Przybliżenia dla rozkładu sumy

Centralne twierdzenie graniczne podaje metodę znajdowania wartości liczbowych dla rozkładu sumy niezależnych zmiennych losowych. Zwykle twierdzenie to formułuje się dla sumy niezależnych i identycznie rozłożonych zmiennych losowych, gdzie .

Dla dowolnego n rozkład r.v. gdzie = , ma matematyczne oczekiwanie 0 i wariancję 1. Jak wiadomo, ciąg takich rozkładów (dla n= 1, 2, ...) dąży do standardowego rozkładu normalnego. Kiedy n duże, twierdzenie to stosuje się do przybliżenia rozkładu r.v. rozkład normalny ze średnią μ i dyspersja. Podobnie rozkład sumy n zmienne losowe są aproksymowane rozkładem normalnym ze średnią i wariancją.

Skuteczność takiego przybliżenia zależy nie tylko od liczby członów, ale także od zbliżenia rozkładu członów do normalnego. Wiele podstawowych kursów statystycznych stwierdza, że ​​n musi wynosić co najmniej 30, aby przybliżenie było rozsądne.

Jednak jeden z programów do generowania zmiennych losowych o rozkładzie normalnym wykorzystywanych w modelowaniu symulacyjnym implementuje normalną zmienną losową jako średnią z 12 niezależnych zmiennych losowych równomiernie rozłożonych w przedziale (0,1).

W wielu indywidualnych modelach ryzyka zmienne losowe zawarte w sumach nie są równomiernie rozłożone. Zostanie to zilustrowane przykładami w następnej sekcji.

Centralne twierdzenie graniczne rozciąga się również na sekwencje zmiennych losowych o nierównym rozkładzie.

Aby zilustrować niektóre zastosowania indywidualnego modelu ryzyka, w celu uzyskania rozwiązań numerycznych użyjemy aproksymacji normalnej rozkładu sumy niezależnych zmiennych losowych. Jeśli , następnie

i dalej, jeśli r.v. niezależny, więc

Do aplikacji, o której mowa, potrzebujemy tylko:

  • znaleźć średnie i wariancje zmiennych losowych symulujących poszczególne straty,
  • zsumuj je, aby uzyskać średnią i wariancję strat zakładu ubezpieczeń jako całości,
  • użyj normalnego przybliżenia.

Poniżej ilustrujemy tę sekwencję działań.

Wnioski o ubezpieczenie

Ta sekcja ilustruje użycie normalnego przybliżenia na czterech przykładach.

Przykład 5.1. Zakład ubezpieczeń na życie oferuje roczne ubezpieczenie na wypadek śmierci z wypłatą 1 i 2 jednostek osobom, których prawdopodobieństwo zgonu wynosi 0,02 lub 0,01. Poniższa tabela przedstawia liczbę osób nk w każdej z czterech klas utworzonych zgodnie z wpłatą b k i prawdopodobieństwo zdarzenia ubezpieczeniowego qk:

k q k b k nk
1 0,02 1 500
2 0,02 2 500
3 0,10 1 300
4 0,10 2 500

Ubezpieczyciel chce pobrać od tej grupy 1800 osób kwotę równą 95 percentylowi rozkładu całości składek ubezpieczeniowych dla tej grupy. Ponadto chce, aby udział każdej osoby w tej kwocie był proporcjonalny do oczekiwanej wypłaty ubezpieczenia tej osoby.

Udział osoby z numerem , której średnia opłata jest równa , powinien wynosić . Z wymogu 95. percentyla wynika, że ​​. Wartość nadwyżki, , jest premią za ryzyko i jest nazywana względną premią za ryzyko. Obliczmy .

Decyzja. Wartość jest określona przez relację = 0,95, gdzie S = X 1 + X 2 + ... + X 1800 . To stwierdzenie prawdopodobieństwa jest równoważne z poniższym:

Zgodnie z tym, co zostało powiedziane o centralnym twierdzeniu granicznym w rozdz. 4 przybliżamy rozkład r.v. standardowy rozkład normalny i używamy jego 95 percentyla, z którego otrzymujemy:

Dla czterech klas, na które podzieleni są ubezpieczający, otrzymujemy następujące wyniki:

k q k b k Średnia b k q k Wariancja b 2 k q k (1-q k) nk
1 0,02 1 0,02 0,0196 500
2 0,02 2 0,04 0,0784 500
3 0,10 1 0,10 0,0900 300
4 0,10 2 0,20 0,3600 500

Zatem,

Dlatego względna premia za ryzyko wynosi

Przykład 5.2. Klienci ubezpieczyciela samochodowego dzielą się na dwie klasy:

Klasa Numer w klasie

Prawdopodobieństwo wystąpienia

zdarzenie ubezpieczeniowe

Dystrybucja płatności ubezpieczeniowych,

obcięte parametry wykładnicze

dystrybucja

k L
1 500 0,10 1 2,5
2 2000 0,05 2 5,0

Obcięty rozkład wykładniczy jest zdefiniowany przez funkcję dystrybucji

Jest to rozkład typu mieszanego z funkcją gęstości , i „kępa” masy probabilistycznej w punkcie L. Wykres tej funkcji rozkładu pokazano na rysunku 5.1.

Ryż. 5.1. Obcięty rozkład wykładniczy

Tak jak poprzednio prawdopodobieństwo, że łączna kwota wypłat ubezpieczenia przekroczy kwotę pobraną od ubezpieczających powinno wynosić 0,05. Założymy, że względna premia za ryzyko powinna być taka sama w każdej z dwóch rozważanych klas. Obliczmy .

Decyzja. Ten przykład jest bardzo podobny do poprzedniego. Jedyna różnica polega na tym, że wartości składek ubezpieczeniowych są teraz zmiennymi losowymi.

Najpierw otrzymamy wyrażenia dla momentów obciętego rozkładu wykładniczego. Będzie to etap przygotowawczy do zastosowania formuł (2.25) i (2.26):

Wykorzystując podane w warunku wartości parametrów i stosując wzory (2.25) i (2.26) otrzymujemy następujące wyniki:

k q k µk σ 2k Średnia q k μ k Dyspersja μ 2 k q k (1-q k)+σ 2 k q k nk
1 0,10 0,9139 0,5828 0,09179 0,13411 500
2 0,05 0,5000 0,2498 0,02500 0,02436 2000

Więc, S, łączna kwota wypłat ubezpieczenia, ma chwile

Warunek definicji pozostaje taki sam jak w przykładzie 5.1, a mianowicie

Używając ponownie przybliżenia rozkładu normalnego, otrzymujemy

Przykład 5.3. W portfelu towarzystwa ubezpieczeniowego znajduje się 16 000 umów ubezpieczenia na wypadek śmierci na okres jednego roku zgodnie z poniższą tabelą:

Prawdopodobieństwo zdarzenia ubezpieczeniowego q dla każdego z 16 000 klientów (przyjmuje się, że zdarzenia te są od siebie niezależne) wynosi 0,02. Firma chce ustalić własny wskaźnik retencji. Dla każdego ubezpieczającego poziom zatrzymania własnego to wartość, poniżej której ta firma (spółka cedentująca) dokonuje płatności samodzielnie, a wypłaty przekraczające tę wartość są objęte umową reasekuracyjną przez inną firmę (reasekuratora).

Na przykład, jeśli wskaźnik retencji własnej wynosi 200 000, to firma rezerwuje ochronę do 20 000 dla każdego ubezpieczonego i wykupuje reasekurację, aby pokryć różnicę między składką a kwotą 20 000 dla każdego z 4500 ubezpieczających, których składki ubezpieczeniowe przekraczają 20 000 .

Spółka jako kryterium decyzyjne przyjmuje minimalizację prawdopodobieństwa, że ​​odszkodowania pozostawione we własnym zakresie, powiększone o kwotę zapłaconą z tytułu reasekuracji, przekroczą kwotę 8 250 000. Koszt reasekuracji na jednostkę ubezpieczenia wynosi 0,025 (tj. 125% oczekiwanych wartość składek ubezpieczeniowych na jednostkę 0,02).

Uważamy, że rozważany portfel jest zamknięty: nowe umowy ubezpieczenia zawarte w bieżącym roku nie będą brane pod uwagę w opisywanym procesie decyzyjnym.

Częściowe rozwiązanie. Zróbmy najpierw wszystkie obliczenia, wybierając jako jednostkę wypłaty 10 000. Jako ilustrację załóżmy, że c. w. S to kwota wpłat pozostałych do samodzielnego potrącenia, ma następującą postać:

Do tych wypłat z ubezpieczenia pozostawionych na własnym potrąceniu S, suma składek reasekuracyjnych jest dodawana. W sumie całkowita kwota ubezpieczenia według tego schematu wynosi

Pozostała kwota na własne odliczenie wynosi

Tak więc całkowita wartość reasekuracji wynosi 35 000-24 000 = 11 000, a koszt reasekuracji wynosi

Stąd przy poziomie retencji własnej równym 2, składki ubezpieczeniowe pozostałe na retencji własnej plus koszty reasekuracji wynoszą . Kryterium decyzyjne opiera się na prawdopodobieństwie, że ta suma przekroczy 825,

Korzystając z rozkładu normalnego, otrzymujemy, że ta wartość jest w przybliżeniu równa 0,0062.

Średnie wartości wypłat ubezpieczeniowych w przypadku ubezpieczenia nadwyżki szkody, jako jednego z rodzajów reasekuracji, można aproksymować stosując rozkład normalny jako rozkład całkowitych wypłat ubezpieczeniowych.

Niech suma wypłat ubezpieczeniowych X ma rozkład normalny ze średnią i wariancją

Przykład 5.4. Rozważmy portfel ubezpieczeniowy, jak w przykładzie 5.3. Znajdźmy matematyczne oczekiwanie wysokości wypłat ubezpieczenia z tytułu umowy ubezpieczenia nadwyżki szkody, jeżeli:

(a) nie ma indywidualnej reasekuracji, a bezwarunkowy udział własny ustalono na 7 500 000

(b) na indywidualnych umowach ubezpieczenia ustanowiono potrącenie osobiste w wysokości 20 000, a bezwarunkowy udział własny dla portfela wynosi 5 300 000.

Decyzja.

(a) W przypadku braku indywidualnej reasekuracji i przejścia do 10 000 jako waluty

zastosowanie wzoru (5.2) daje

co stanowi sumę 43 770 w oryginalnych jednostkach.

(b) Na Rysunku 5.3 otrzymujemy średnią i wariancję całkowitych składek dla indywidualnego udziału własnego z 20 000 na odpowiednio 480 i 784, stosując 10 000 jako jednostkę. Zatem =28.

zastosowanie wzoru (5.2) daje

co jest sumą 4140 w oryginalnych jednostkach.

W praktyce często konieczne staje się znalezienie prawa rozkładu dla sumy zmiennych losowych.

Niech będzie system (XbX2) dwie ciągłe s. w. i ich suma

Znajdźmy gęstość rozkładu c. w. U. Zgodnie z ogólnym rozwiązaniem z poprzedniego akapitu znajdujemy obszar płaszczyzny, gdzie x + x 2 (rys. 9.4.1):

Różniczkując to wyrażenie względem y, otrzymujemy ap. zmienna losowa Y \u003d X + X 2:

Ponieważ funkcja φ (x b x 2) = Xj + x 2 jest symetryczna względem swoich argumentów, to

Jeśli z. w. X oraz X 2 są niezależne, to wzory (9.4.2) i (9.4.3) przyjmują postać:


W przypadku, gdy niezależny c. w. x x oraz X 2, porozmawiaj o składzie praw dystrybucyjnych. Produkować kompozycja dwa prawa rozkładu - oznacza to znalezienie prawa rozkładu dla sumy dwóch niezależnych c. c., rozpowszechniane zgodnie z tymi przepisami. Notacja symboliczna służy do oznaczenia składu praw dystrybucji

który jest zasadniczo oznaczony wzorami (9.4.4) lub (9.4.5).

Przykład 1. Rozważana jest praca dwóch urządzeń technicznych (TD). Po pierwsze, JT działa po swojej awarii (awaria) jest włączone do działania JT 2. Czas pracy KW KW 2 - x x oraz X 2 - są niezależne i rozłożone zgodnie z prawami wykładniczymi o parametrach A,1 i X 2 . Dlatego czas Y bezawaryjną pracę TU, składającą się z TU! a TU 2 zostanie określona przez formułę

Wymagane jest znalezienie p.r. zmienna losowa Tak, czyli złożenie dwóch praw wykładniczych z parametrami i X 2 .

Decyzja. Ze wzoru (9.4.4) otrzymujemy (y > 0)


Jeśli istnieje złożenie dwóch praw wykładniczych o tych samych parametrach (?c = X 2 = Y), to w wyrażeniu (9.4.8) otrzymujemy niepewność typu 0/0, rozszerzając ją, otrzymujemy:

Porównując to wyrażenie z wyrażeniem (6.4.8), jesteśmy przekonani, że złożenie dwóch identycznych praw wykładniczych (?c = X 2 = x) to prawo Erlanga drugiego rzędu (9.4.9). Przy komponowaniu dwóch praw wykładniczych o różnych parametrach x x i A-2 dostają uogólnione prawo Erlanga drugiego rzędu (9.4.8). ?

Zadanie 1. Prawo rozkładu różnicy dwóch s. w. System z. w. (X i X 2) ma przegub R.p./(x x x 2). Znajdź sprzedawcę ich różnice Y=X - X 2 .

Decyzja. Dla systemu z w. (Xb-X2) itp. będzie / (x b - x 2), czyli zastąpiliśmy różnicę sumą. Dlatego a.r. zmienna losowa U będzie miała postać (patrz (9.4.2), (9.4.3)):

Jeśli z. w. X x IX 2 niezależny, więc

Przykład 2. Znajdź f.r. różnica dwóch niezależnych s o rozkładzie wykładniczym. w. z parametrami x x oraz X 2 .

Decyzja. Zgodnie ze wzorem (9.4.11) otrzymujemy

Ryż. 9.4.2 Ryż. 9.4.3

Rysunek 9.4.2 pokazuje p. g(y). Jeśli weźmiemy pod uwagę różnicę dwóch niezależnych s o rozkładzie wykładniczym. w. o tych samych parametrach (A-i= X 2 = ALE,), następnie g(y) \u003d / 2 - już znajomy

Prawo Laplace'a (ryc. 9.4.3). ?

Przykład 3. Znajdź prawo rozkładu dla sumy dwóch niezależnych c. w. X oraz X 2, dystrybuowane zgodnie z prawem Poissona z parametrami x oraz 2 .

Decyzja. Znajdź prawdopodobieństwo zdarzenia (Xx + X 2 = t) (t = 0, 1,



Dlatego s. w. Y= X x + X 2 rozłożone zgodnie z prawem Poissona z parametrem a x2) - a x + a 2. ?

Przykład 4. Znajdź prawo rozkładu dla sumy dwóch niezależnych c. w. x x oraz X 2, rozłożone zgodnie z prawami dwumianowymi z parametrami p x ri p 2 , p odpowiednio.

Decyzja. Wyobraź sobie. w. x x jak:

gdzie X 1) - wskaźnik zdarzenia ALE wu "th doświadczenie:

Zakres dystrybucji z. w. X,- ma postać


Podobną reprezentację zrobimy dla s. w. X 2: gdzie X] 2) - wskaźnik zdarzenia ALE w y"-tym doświadczeniu:


Stąd,

gdzie jest X? 1)+(2), jeśli wskaźnik zdarzenia ALE:

W ten sposób pokazaliśmy, że w. Kwota teścia (u + n 2) wskaźniki zdarzeń ALE, stąd wynika, że ​​s. w. ^rozkładany zgodnie z prawem dwumianowym z parametrami ( n x + n 2), s.

Zwróć uwagę, że jeśli prawdopodobieństwa R w różnych seriach eksperymentów są różne, to w wyniku dodania dwóch niezależnych s. c., rozłożone zgodnie z prawami dwumianowymi, okazuje się, że c. c., rozdzielone nie zgodnie z prawem dwumianowym. ?

Przykłady 3 i 4 można łatwo uogólnić na dowolną liczbę terminów. Komponując prawa Poissona z parametrami a b 2 , ..., w Prawo Poissona jest ponownie uzyskiwane z parametrem a (t) \u003d a x + a 2 + ... + oraz T.

Komponując prawa dwumianowe z parametrami (n r); (ja 2 , R) , (n t, p) ponownie otrzymujemy prawo dwumianowe z parametrami („(”), R), gdzie n (t) \u003d u + n 2 + ... + itp.

Udowodniliśmy ważne własności prawa Poissona i prawa dwumianowego: „własność stabilności”. Prawo dystrybucji nazywa się zrównoważony, jeśli z połączenia dwóch praw tego samego typu powstaje prawo tego samego typu (różnią się tylko parametry tego prawa). W podrozdziale 9.7 pokażemy, że prawo normalne ma tę samą właściwość stabilności.

TEMAT 3

pojęcie funkcji dystrybucji

matematyczne oczekiwanie i wariancja

rozkład równomierny (prostokątny)

rozkład normalny (Gaussowski)

Dystrybucja

t- Dystrybucja studencka

F- dystrybucja

rozkład sumy dwóch losowych zmiennych niezależnych

przykład: rozkład sumy dwóch niezależnych

równomiernie rozłożone ilości

transformacja zmiennej losowej

przykład: rozkład fali harmonicznej

z losową fazą

centralne twierdzenie graniczne

momenty zmiennej losowej i ich własności

CEL CYKLU

WYKŁADY:

ZGŁOŚ WSTĘPNE INFORMACJE O NAJWAŻNIEJSZYCH FUNKCJACH DYSTRYBUCJI I ICH WŁAŚCIWOŚCIACH

FUNKCJE DYSTRYBUCJI

Zostawiać x(k) jest jakąś zmienną losową. Następnie dla dowolnej ustalonej wartości x zdarzenie losowe x(k) x zdefiniowany jako zbiór wszystkich możliwych wyników k takie, że x(k) x. W zakresie pierwotnej miary prawdopodobieństwa podanej na przestrzeni próbki, funkcja dystrybucyjnaP(x) definiowane jako prawdopodobieństwo przypisane do zbioru punktów k x(k) x. Zauważ, że zbiór punktów k zaspokojenie nierówności x(k) x, jest podzbiorem zbioru punktów spełniających nierówność x(k). Formalnie

To oczywiste, że

Jeżeli zakres wartości zmiennej losowej jest ciągły, co założono poniżej, to gęstości prawdopodobieństwa(jednowymiarowy) p(x) jest określona przez relację różniczkową

(4)

Stąd,

(6)

Aby móc rozpatrywać przypadki dyskretne, konieczne jest dopuszczenie obecności funkcji delta w składzie gęstości prawdopodobieństwa.

WARTOŚĆ OCZEKIWANA

Niech zmienna losowa x(k) przyjmuje wartości z zakresu od -  do + . Oznaczać(Inaczej, wartość oczekiwana lub wartość oczekiwana) x(k) obliczana jest za pomocą odpowiedniego przejścia do limitu w sumie iloczynów wartości x(k) o prawdopodobieństwie wystąpienia tych zdarzeń:

(8)

gdzie mi- matematyczne oczekiwanie wyrażenia w nawiasach kwadratowych przez indeks k. Matematyczne oczekiwanie rzeczywistej jednowartościowej funkcji ciągłej definiuje się podobnie g(x) ze zmiennej losowej x(k)

(9)

gdzie p(x)- gęstość prawdopodobieństwa zmiennej losowej x(k). W szczególności biorąc g(x)=x, dostajemy średni kwadrat x(k) :

(10)

Dyspersjax(k) zdefiniowany jako średni kwadrat różnicy x(k) i jego średnia wartość,

czyli w tym przypadku g(x)= oraz

A-priorytetowe, odchylenie standardowe zmienna losowa x(k), oznaczone , jest dodatnią wartością pierwiastka kwadratowego z wariancji. Odchylenie standardowe jest mierzone w tych samych jednostkach co średnia.

NAJWAŻNIEJSZE FUNKCJE DYSTRYBUCJI

ROZKŁAD JEDNOLITY (PROSTOKĄTNY).

Załóżmy, że eksperyment polega na losowym wyborze punktu z przedziału [ a, b] , w tym jego punkty końcowe. W tym przykładzie jako wartość zmiennej losowej x(k) możesz wziąć wartość liczbową wybranego punktu. Odpowiednia funkcja rozkładu ma postać

Dlatego gęstość prawdopodobieństwa dana jest wzorem

W tym przykładzie obliczenie średniej i wariancji za pomocą wzorów (9) i (11) daje

ROZKŁAD NORMALNY (GAUSSAŃSKI)

, - średnia arytmetyczna, - RMS.

Wartość z odpowiadająca prawdopodobieństwu P(z)=1-, tj.

CHI - DYSTRYBUCJA KWADRATOWA

Zostawiać - n niezależnych zmiennych losowych, z których każda ma rozkład normalny o zerowej średniej i jednostkowej wariancji.

Zmienna losowa chi-kwadrat o n stopniach swobody.

gęstości prawdopodobieństwa .

DF: 100 - punkty procentowe - rozkłady oznaczono , tj.

średnia i wariancja są równe

t - PRZYJAZDY STUDENCKIE

y, z są niezależnymi zmiennymi losowymi; y - ma - rozkład, z - rozkład normalny z zerową średnią i jednostkową wariancją.

wartość - ma t- Rozkład Studenta z n stopniami swobody

DF: 100 - punkt procentowy t - wskazano rozkład

Średnia i wariancja są równe

F - DYSTRYBUCJA

Niezależne zmienne losowe; ma — rozkład ze stopniami swobody; rozkład ze stopniami swobody. Wartość losowa:

,

F jest rozproszoną zmienną losową zi stopniami swobody.

,

DF: 100 - punkt procentowy:

Średnia i wariancja są równe:

PODZIAŁ KWOTY

DWIE ZMIENNE LOSOWE

Zostawiać x(k) oraz y(k) są zmiennymi losowymi o łącznej gęstości prawdopodobieństwa p(x,y). Znajdź gęstość prawdopodobieństwa sumy zmiennych losowych

Na stałe x mamy y=z–x. Więc

Na stałe z wartości x uruchom przedział od – do +. Więc

(37)

stąd widać, że aby obliczyć pożądaną gęstość sumy, trzeba znać pierwotną gęstość prawdopodobieństwa łącznego. Jeśli x(k) oraz y(k) są niezależnymi zmiennymi losowymi o gęstościach i odpowiednio wtedy i

(38)

PRZYKŁAD: SUMA DWÓCH NIEZALEŻNYCH, JEDNOLITYCH ROZŁOŻONYCH ZMIENNYCH LOSOWYCH.

Niech dwie losowe zmienne niezależne mają gęstości postaci

W innych sprawach Znajdźmy gęstość prawdopodobieństwa p(z) ich sumy z= x+y.

Gęstości prawdopodobieństwa dla czyli dla Stąd, x mniej niż z. Ponadto nie jest równe zero dla Wzoru (38), stwierdzamy, że

Ilustracja:

Gęstość prawdopodobieństwa sumy dwóch niezależnych zmiennych losowych o rozkładzie jednostajnym.

KONWERSJA LOSOWA

WARTOŚCI

Zostawiać x(t)- zmienna losowa z gęstością prawdopodobieństwa p(x), Odpuść sobie g(x) jest jednowartościową rzeczywistą ciągłą funkcją x. Rozważmy najpierw przypadek, w którym funkcja odwrotna x(g) jest również jednowartościową funkcją ciągłą g. Gęstości prawdopodobieństwa p(g), odpowiadające zmiennej losowej g(x(k)) = g(k), można wyznaczyć z gęstości prawdopodobieństwa p(x) zmienna losowa x(k) i pochodna dg/dx przy założeniu, że pochodna istnieje i jest różna od zera, a mianowicie:

(12)

Dlatego w limicie dg/dx#0

(13)

Używając tego wzoru, następuje po jego prawej stronie zamiast zmiennej x zastąp odpowiednią wartość g.

Rozważmy teraz przypadek, gdy funkcja odwrotna x(g) jest ważna n-wartościowana funkcja g, gdzie n jest liczbą całkowitą i wszystkie wartości n są jednakowo prawdopodobne. Następnie

(14)

PRZYKŁAD:

ROZKŁAD FUNKCJI HARMONICZNYCH.

Funkcja harmoniczna o stałej amplitudzie X i częstotliwość f będzie zmienną losową, jeśli jej początkowy kąt fazowy = (k)- wartość losowa. W szczególności niech t stały i równy t o i niech harmoniczna zmienna losowa ma postać

Udawajmy, że (k) ma jednolitą gęstość prawdopodobieństwa p() uprzejmy

Znajdź gęstość prawdopodobieństwa p(x) zmienna losowa x(k).

W tym przykładzie funkcja bezpośrednia x() jednoznacznie, a funkcja odwrotna (x) dwuznaczny.

Wykorzystajmy powyższą ogólną metodę do rozwiązania jednego problemu, a mianowicie znalezienia prawa rozkładu dla sumy dwóch zmiennych losowych. Istnieje układ dwóch zmiennych losowych (X,Y) o gęstości rozkładu f(x,y). Rozważ sumę zmiennych losowych X i Y: i znajdź prawo rozkładu wartości Z. Aby to zrobić, konstruujemy linię na płaszczyźnie xOy, której równanie jest (ryc. 7). Jest to linia prosta, która odcina odcinki równe z na osiach. Linia prosta dzieli płaszczyznę xy na dwie części; po prawej i powyżej; w lewo i poniżej.

Region D w tym przypadku to lewa dolna część płaszczyzny xOy, zacieniona na ryc. 7. Zgodnie ze wzorem (16) mamy:

Różniczkując to wyrażenie względem zmiennej z zawartej w górnej granicy całki wewnętrznej, otrzymujemy:

Jest to ogólny wzór na gęstość rozkładu sumy dwóch zmiennych losowych.

Ze względu na symetrię problemu względem X i Y możemy napisać inną wersję tego samego wzoru:

który jest odpowiednikiem pierwszego i może być używany zamiast tego.

Przykład składu praw normalnych. Rozważmy dwie niezależne zmienne losowe X i Y, podlegające normalnym prawom:

Wymagane jest zestawienie tych praw, tj. znalezienie prawa rozkładu wielkości: .

Stosujemy ogólną formułę na budowę praw dystrybucji:

Jeśli otworzymy nawiasy w wykładniku całki i przyniesiemy podobne wyrazy, otrzymamy:

Podstawiając te wyrażenia do formuły, z którą już się spotkaliśmy

po przekształceniach otrzymujemy:

a to nic innego jak normalne prawo z centrum dyspersji

i odchylenie standardowe

Do tego samego wniosku można dojść znacznie łatwiej za pomocą następującego rozumowania jakościowego.

Bez otwierania nawiasów i bez dokonywania przekształceń w całce (17) od razu dochodzimy do wniosku, że wykładnik jest trójmianem kwadratowym względem x postaci

gdzie wartość z nie jest w ogóle zawarta we współczynniku A, współczynnik B jest zawarty w pierwszym stopniu, a współczynnik C jest podnoszony do kwadratu. Mając to na uwadze i stosując wzór (18), dochodzimy do wniosku, że g(z) jest funkcją wykładniczą, której wykładnikiem jest trójmian kwadratowy względem zi gęstości rozkładu; tego rodzaju odpowiada normalnemu prawu. Tak więc my; dochodzimy do czysto jakościowego wniosku: prawo rozkładu z musi być normalne. Aby znaleźć parametry tego prawa - i - posługujemy się twierdzeniem o dodawaniu oczekiwań matematycznych oraz twierdzeniu o dodawaniu wariancji. Przez twierdzenie o dodawaniu oczekiwań matematycznych. Na podstawie twierdzenia o dodawaniu dyspersji, stąd wzór (20).

Przechodząc od odchyleń średniokwadratowych do prawdopodobnych odchyleń proporcjonalnych do nich, otrzymamy: .

W ten sposób doszliśmy do następującej zasady: gdy układa się prawa normalne, ponownie uzyskuje się prawo normalne, a matematyczne oczekiwania i wariancje (lub prawdopodobne odchylenia podniesione do kwadratu) są sumowane.

Regułę składu dla praw normalnych można uogólnić na przypadek dowolnej liczby niezależnych zmiennych losowych.

Jeśli istnieje n niezależnych zmiennych losowych: podlegają normalnym prawom ze środkami dyspersji i odchyleniami standardowymi, to wartość podlega również normalnemu prawu z parametrami

Zamiast wzoru (22) można zastosować wzór równoważny:

Jeżeli układ zmiennych losowych (X, Y) jest rozłożony zgodnie z prawem normalnym, ale wielkości X, Y są zależne, to łatwo jest udowodnić, podobnie jak poprzednio, na podstawie ogólnego wzoru (6.3.1), że prawo rozkładu ilości jest również prawem normalnym. Centra rozproszenia są nadal dodawane algebraicznie, ale dla odchyleń standardowych reguła staje się bardziej skomplikowana: , gdzie r jest współczynnikiem korelacji wartości X i Y.

Po dodaniu kilku zależnych zmiennych losowych, które w całości są zgodne z prawem normalnym, rozkład sumy również okazuje się normalny z parametrami

lub prawdopodobne odchylenia

gdzie jest współczynnikiem korelacji wielkości X i , X j , a sumowanie rozciąga się na wszystkie różne kombinacje parami wielkości.

Widzieliśmy bardzo ważną właściwość prawa normalnego: gdy połączy się prawa normalne, znowu otrzymuje się prawo normalne. Jest to tak zwana „właściwość stabilności”. Mówi się, że prawo dystrybucji jest stabilne, jeśli składając dwa prawa tego typu, ponownie uzyskuje się prawo tego samego typu. Wykazaliśmy powyżej, że normalne prawo jest stabilne. Bardzo niewiele praw dystrybucji ma właściwość stabilności. Prawo jednorodnej gęstości jest niestabilne: składając dwa prawa o jednorodnej gęstości w sekcjach od 0 do 1, otrzymaliśmy prawo Simpsona.

Stabilność prawa normalnego jest jednym z podstawowych warunków jego szerokiego zastosowania w praktyce. Jednak właściwość stabilności, oprócz normalnej, posiadają również inne prawa dystrybucji. Cechą prawa normalnego jest to, że gdy składa się wystarczająco duża liczba praktycznie dowolnych praw rozkładu, okazuje się, że całkowite prawo jest arbitralnie bliskie normalnemu, niezależnie od tego, jakie były prawa rozkładu wyrazów. Można to zilustrować, na przykład, komponując trzy prawa o jednorodnej gęstości w odcinkach od 0 do 1. Otrzymane prawo rozkładu g(z) pokazano na ryc. 8. Jak widać z rysunku, wykres funkcji g(z) jest bardzo podobny do wykresu prawa normalnego.

Mieć pytania?

Zgłoś literówkę

Tekst do wysłania do naszych redaktorów: