Fördelningstäthet av summan av stokastiska variabler. Fördelning av summan av två slumpmässigt oberoende variabler. Uppskattningar för summafördelning

Definition. Slumpvariabler Х 1 , Х 2 , …, Х n kallas oberoende om händelserna för någon x 1, x 2 , …, x n är oberoende

(ω: X 1 (ω)< x},{ω: Х 2 (ω) < x},…, {ω: Х n (ω) < x n }.

Det följer direkt av definitionen att för oberoende slumpvariabler X 1, X 2, …, X n distributionsfunktion n-dimensionell slumpvariabel X = X 1, X 2, …, X när lika med produkten av fördelningsfunktioner av slumpvariabler X 1, X 2, …, X n

F(x 1 , x2, …, x n) = F(x 1)F(x2)…F(x n). (1)

Låt oss skilja på jämlikhet (1) n gånger av x 1 , x2, …, x n, vi får

sid(x 1 , x2, …, x n) = sid(x 1)sid(x2)…sid(x n). (2)

En annan definition av slumpvariablernas oberoende kan ges.

Om fördelningen av en slumpvariabel inte beror på vilka möjliga värden andra slumpvariabler har tagit, kallas sådana slumpvariabler oberoende i aggregatet.

Till exempel köps två lotter av olika upplagor. Låt vara X– mängden vinster för den första lotten, Y– vinstbeloppet för den andra lotten. slumpmässiga variabler X och Y- oberoende, eftersom vinsten av en biljett inte kommer att påverka lagen för distribution av den andra. Men om biljetterna är av samma sak, då X och Y- beroende.

Två slumpvariabler kallas oberoende om distributionslagen för en av dem inte ändras beroende på vilka möjliga värden den andra variabeln har tagit.

Sats 1(faltningar) eller "satsen om densiteten av summan av 2 stokastiska variabler".

Låt vara X = (X 1;X 2) är en oberoende kontinuerlig tvådimensionell slumpvariabel, Y = X 1+ X 2. Sedan distributionstätheten

Bevis. Det kan visas att om , då

var X = (X 1 , X 2 , …, X n). Sedan om X = (X 1 , X 2), sedan distributionsfunktionen Y = X 1 + X 2 kan definieras enligt följande (Fig. 1) –

I enlighet med definitionen är funktionen fördelningsdensiteten för stokastisk variabel Y = X 1 + X 2, d.v.s.

py (t) = som skulle bevisas.

Låt oss härleda en formel för att hitta sannolikhetsfördelningen av summan av två oberoende diskreta slumpvariabler.

Sats 2. Låt vara X 1 , X 2 – oberoende diskreta slumpvariabler,

Bevis. Föreställ dig en händelse Yxa = {X 1 +X 2 = x) som en summa av oförenliga händelser

Yxa = å( X 1 = x jag; X 2 = xx i).

Som X 1 , X 2 - oberoende då P(X 1 = x jag; X 2 = xx i) = P(X 1 = x i) P(X 2 = x-x Jag då

P(Yxa) = P(å( X 1 = x jag; X 2 = x – x i)) = å( P(X 1 = x i) P(X 2 = x-x i))

Q.E.D.

Exempel 1 Låt vara X 1 , X 2 - oberoende slumpvariabler med normalfördelning med parametrar N(0;1); X 1 , X 2 ~ N(0;1).

Låt oss hitta fördelningsdensiteten för deras summa (vi betecknar X 1 = x, Y = X 1 +X 2)


Det är lätt att se att integranden är fördelningsdensiteten för en normal slumpvariabel med parametrar a= , , dvs. integralen är 1.

Fungera py(t) är densiteten för normalfördelningen med parametrarna a = 0, s = . Alltså har summan av oberoende normala slumpvariabler med parametrar (0,1) en normalfördelning med parametrar (0,), d.v.s. Y = X 1 + X 2 ~ N(0;).

Exempel 2. Låt då två diskreta oberoende slumpvariabler med Poissonfördelning ges

var k, m, n = 0, 1, 2, …,¥.

Genom sats 2 har vi:

Exempel 3 Låt vara X 1, X 2 - oberoende stokastiska variabler med exponentiell fördelning . Låt oss hitta densiteten Y= X 1 +X 2 .

Beteckna x = x 1. Sedan X 1, X 2 är oberoende slumpvariabler, då använder vi "faltningssatsen"

Det kan visas att om summan ( Х i har en exponentialfördelning med parametern l), då Y= har en distribution som kallas Erlang-distributionen ( n- 1) beställning. Denna lag erhölls genom att modellera driften av telefonväxlar i de första verken om teorin om köning.

I matematisk statistik används ofta distributionslagar för slumpvariabler som är funktioner av oberoende normala slumpvariabler. Låt oss betrakta tre lagar som oftast förekommer vid modellering av slumpmässiga fenomen.

Sats 3. Om slumpvariabler är oberoende X 1, ..., X n, då är funktionerna för dessa slumpvariabler också oberoende Y 1 = f 1 (X 1), ...,Y n = f n(X n).

Pearson distribution(från 2 -distribution). Låt vara X 1, ..., X när oberoende normala slumpvariabler med parametrar a= 0, s = 1. Komponera en slumpvariabel

Således,

Det kan visas att densiteten för x > 0 har formen , där k n är någon koefficient för att villkoret ska uppfyllas. Som n ® ¥ tenderar Pearson-fördelningen till normalfördelningen.

Låt Х 1 , Х 2 , …, Хn ~ N(a,s), sedan slumpvariabler ~ N(0,1). Därför har den slumpmässiga variabeln en c 2 -fördelning med n frihetsgrader.

Pearson-fördelningen är tabellerad och används i olika tillämpningar av matematisk statistik (till exempel när man testar hypotesen att distributionslagen är konsekvent).

Beslutsfattaren kan använda försäkringar för att mildra de negativa ekonomiska konsekvenserna av vissa typer av slumpmässiga händelser.

Men den här diskussionen är väldigt generell, eftersom en beslutsfattare kan betyda både en individ som söker skydd mot skada på egendom, besparingar eller inkomster, och en organisation som söker skydd mot samma typ av skada.

Faktum är att en sådan organisation kan vara ett försäkringsbolag som letar efter sätt att skydda sig mot ekonomiska förluster på grund av för många försäkringshändelser som har inträffat med en enskild kund eller med dess försäkringsbestånd. Detta skydd kallas återförsäkring.

Tänk på en av två modeller (nämligen individuell riskmodell) används i stor utsträckning för att fastställa försäkringsräntor och reserver, såväl som i återförsäkring.

Beteckna med S beloppet av försäkringsbolagets oavsiktliga förluster för någon del av dess risker. I detta fall Sär en stokastisk variabel för vilken vi måste bestämma sannolikhetsfördelningen. Historiskt sett har för distributioner av r.v. S det fanns två uppsättningar av postulat. Den individuella riskmodellen definierar S på följande sätt:

där r.v. betyder skador som orsakas av försäkringsobjektet med numret jag, a n betecknar det totala antalet försäkringsobjekt.

Det antas vanligtvis att de är oberoende slumpvariabler, eftersom matematiska beräkningar i det här fallet är enklare och information om arten av sambandet mellan dem inte krävs. Den andra modellen är den kollektiva riskmodellen.

Den övervägda modellen för individuella risker återspeglar inte förändringar i pengars värde över tiden. Detta görs för att förenkla modellen, varför artikelns titel refererar till ett kort tidsintervall.

Vi kommer endast att överväga slutna modeller, dvs. de där antalet försäkringsobjekt n i formel (1.1) är känd och fixerad i början av det betraktade tidsintervallet. Om vi ​​inför antaganden om förekomsten av migration från eller till försäkringssystemet så får vi en öppen modell.

Slumpvariabler som beskriver individuella utbetalningar

Låt oss först påminna om de viktigaste bestämmelserna om livförsäkring.

Vid dödsfallsförsäkring för en period av ett år åtar sig försäkringsgivaren att betala beloppet b, om försäkringstagaren avlider inom ett år från dagen för försäkringsavtalets ingående, och inte betalar något om försäkringstagaren lever detta år.

Sannolikheten för att ett försäkringsfall inträffar under det angivna året betecknas med .

Slumpvariabeln som beskriver försäkringsutbetalningar har en fördelning som kan specificeras antingen av sannolikhetsfunktionen

(2.1)

eller motsvarande distributionsfunktion

(2.2)

Från formel (2.1) och från definitionen av moment får vi

(2.4)

Dessa formler kan också erhållas genom att skriva X som

där är ett konstant värde som betalas vid dödsfall, och är en slumpvariabel som tar värdet 1 vid dödsfall och 0 annars.

Alltså och och medelvärdet och variansen för r.v. är lika och respektive, och medelvärdet och variansen av r.v. är lika med och , vilket sammanfaller med formlerna ovan.

En slumpvariabel med intervall (0,1) används ofta i försäkringstekniska modeller.

I läroböcker om sannolikhetsteori kallas det indikator, Bernoulli slumpmässigt värde eller binomisk slumpvariabel i den enda testdesignen.

Vi kommer att ringa henne indikator av korthetsskäl, och även för att det indikerar början, eller inte, av händelsen i fråga.

Låt oss övergå till sökandet efter mer generella modeller där värdet av försäkringsersättningen också är en slumpmässig variabel och flera försäkringshändelser kan inträffa under det betraktade tidsintervallet.

Sjukförsäkring, bil- och annan egendomsförsäkring och ansvarsförsäkring ger omedelbart många exempel. Generaliseringsformel (2.5) sätter vi

där är en slumpvariabel som beskriver försäkringsutbetalningar i det betraktade tidsintervallet, r.v. anger det totala beloppet av betalningar i detta intervall och r.v. är en indikator för händelsen att minst ett försäkringsfall har inträffat.

Att vara en indikator på en sådan händelse, r.v. fixar närvaron () eller brist () försäkrade händelser i detta tidsintervall, men inte antalet försäkrade händelser i det.

Sannolikhet kommer att fortsätta att betecknas med .

Låt oss diskutera flera exempel och bestämma fördelningen av slumpvariabler och i någon modell.

Låt oss först överväga dödsfallsförsäkring för ett år, med en extra förmån om dödsfallet är en olycka.

För visshetens skull, låt oss anta att om dödsfallet inträffade som ett resultat av en olycka, så kommer betalningsbeloppet att vara 50 000. Om döden inträffar på grund av andra orsaker kommer betalningsbeloppet att vara 25 000.

Låt oss anta att för en person i en given ålder, hälsotillstånd och yrke är sannolikheten att dö till följd av en olycka under året 0,0005 och sannolikheten att dö av andra orsaker är 0,0020. I formelform ser det ut så här:

Genom att summera alla möjliga värden på får vi

,

Villkorlig fördelning c. i. skick har formen

Låt oss nu överväga en bilkollisionsförsäkring (ersättning som betalas till ägaren av bilen för skador på hans bil) med en ovillkorlig självrisk på 250 och en maximal utbetalning på 2000.

För tydlighetens skull antar vi att sannolikheten för att en försäkrad händelse inträffar under den betraktade tidsperioden för en individ är 0,15, och sannolikheten för att mer än en kollision ska inträffa är lika med noll:

, .

Det orealistiska antagandet att inte mer än ett försäkringsfall kan inträffa under en period görs för att förenkla fördelningen av r.v. .

Vi kommer att släppa detta antagande i nästa avsnitt efter att vi har övervägt fördelningen av summan av flera försäkringsskador.

Eftersom är värdet av försäkringsgivarens betalningar, och inte skadan på bilen, kan vi överväga två egenskaper, och.

För det första inkluderar händelsen de kollisioner där skadan är mindre än den ovillkorliga självrisken, som är 250.

För det andra fördelningen av r.v. kommer att ha en "propp" av den probabilistiska massan vid punkten för det maximala beloppet för försäkringsbetalningar, vilket är lika med 2000.

Antag att den probabilistiska massan koncentrerad vid denna punkt är 0,1. Antag vidare att värdet av försäkringsbetalningar i intervallet från 0 till 2000 kan modelleras genom en kontinuerlig fördelning med en täthetsfunktion proportionell mot (I praktiken är den kontinuerliga kurvan som väljs för att representera premiernas fördelning ett resultat av studier av premierna under föregående period.)

Sammanfattning av dessa antaganden om den villkorliga fördelningen av r.v. under villkoret kommer vi fram till en fördelning av blandad typ som har en positiv densitet i intervallet från 0 till 2000 och någon "koagel" av den probabilistiska massan vid punkten 2000. Detta illustreras av grafen i fig. 2.2.1.

Distributionsfunktionen för denna villkorliga fördelning ser ut så här:

Fig.2.1. Fördelningsfunktion av r.v. B under villkoret I = 1

Vi beräknar den matematiska förväntan och variansen i det övervägda exemplet med bilförsäkring på två sätt.

Först skriver vi ut fördelningen av r.v. och använd den för att beräkna och . Betecknar genom fördelningsfunktionen hos r.v. , vi har

För x<0

Detta är en blandad distribution. Såsom visas i fig. 2.2 har den både en diskret ("klump" av probabilistisk massa vid punkt 2000) och en kontinuerlig del. En sådan fördelningsfunktion motsvarar en kombination av sannolikhetsfunktionen

Ris. 2.2. Fördelningsfunktion av r.v. X=IB

och densitetsfunktioner

I synnerhet och . Så .

Det finns ett antal formler som relaterar momenten för slumpvariabler med villkorliga matematiska förväntningar. För den matematiska förväntan och för variansen har dessa formler formen

(2.10)

(2.11)

Det förutsätts att uttrycken på vänster sida av dessa jämlikheter är beräknade direkt från fördelningen av r.v. . Vid beräkning av uttrycken på högersidan, nämligen och , används den villkorliga fördelningen av r.v. vid ett fast värde av r.v. .

Dessa uttryck är därför funktioner av r.v. , och vi kan beräkna deras moment med hjälp av fördelningen av r.v. .

Villkorsfördelningar används i många försäkringstekniska modeller och detta gör att formlerna ovan kan tillämpas direkt. I vår modell. Med tanke på r.v. som och r.v. som vi får

(2.12)

, (2.14)

, (2.15)

och överväga villkorade matematiska förväntningar

(2.16)

(2.17)

Formlerna (2.16) och (2.17) definieras som en funktion av r.v. , som kan skrivas som följande formel:

Sedan kl, då (2.21)

För vi har och (2.22)

Formler (2.21) och (2.22) kan kombineras: (2.23)

Alltså (2,24)

Genom att ersätta (2.21), (2.20) och (2.24) i (2.12) och (2.13) får vi

Låt oss tillämpa de mottagna formlerna för beräkning och i ett exempel på bilförsäkring (fig. 2.2). Eftersom densitetsfunktionen hos r.v. I tillståndet uttrycks av formeln

och P(B=2000|I=1)= 0,1, vi har

Slutligen, förutsatt q= 0,15, från formlerna (2,25) och (2,26) får vi följande likheter:

För att beskriva en annan försäkringssituation kan vi erbjuda andra modeller för r.v. .

Exempel: modell för antalet dödsfall till följd av flygolyckor

Som ett exempel, ta en modell för antalet dödsfall till följd av flygolyckor under en ettårsperiod av ett flygbolags verksamhet.

Vi kan börja med en slumpvariabel som beskriver antalet dödsfall för en flygning och sedan summera dessa slumpvariabler över alla flygningar under ett år.

För en flygning kommer händelsen att indikera början av en flygkrasch. Antalet dödsfall som denna katastrof innebar kommer att representeras av produkten av två slumpvariabler och , var är flygplanets lastfaktor, det vill säga antalet personer ombord vid tidpunkten för kraschen, och är andelen dödsfall bland personer på styrelse.

Antalet dödsfall presenteras på detta sätt, eftersom separat statistik för och är mer tillgänglig än statistik för r.v. . Så även om andelen dödsfall bland personer ombord och antalet personer ombord troligen hänger ihop, kan man som en första uppskattning anta att r.v. och oberoende.

Summor av oberoende slumpvariabler

I individriskmodellen presenteras försäkringsutbetalningar som görs av ett försäkringsbolag som summan av utbetalningar till många individer.

Kom ihåg två metoder för att bestämma fördelningen av summan av oberoende slumpvariabler. Betrakta först summan av två slumpvariabler, vars urvalsutrymme visas i fig. 3.1.

Ris. 2.3.1. Händelse

Linjen och området under denna linje representerar en händelse. Därför är fördelningsfunktionen för r.v. S har formen (3.1)

För två diskreta icke-negativa slumpvariabler kan vi använda totalsannolikhetsformeln och skriva (3.1) som

Om en X och Yär oberoende kan den sista summan skrivas om som

(3.3)

Sannolikhetsfunktionen som motsvarar denna fördelningsfunktion kan hittas av formeln

(3.4)

För kontinuerliga icke-negativa slumpvariabler har formlerna som motsvarar formlerna (3.2), (3.3) och (3.4) formen

När antingen en eller båda slumpvariablerna X och Y har en blandad typfördelning (vilket är typiskt för individuella riskmodeller), formlerna är likartade, men mer besvärliga. För slumpvariabler som också kan ta negativa värden, tas summorna och integralerna i formlerna ovan över alla värden på y från till .

I sannolikhetsteorin kallas operationen i formlerna (3.3) och (3.6) faltningen av två fördelningsfunktioner och och betecknas med . Faltningsoperationen kan också definieras för ett par sannolikhets- eller densitetsfunktioner med formlerna (3.4) och (3.7).

För att bestämma fördelningen av summan av fler än två slumpvariabler kan vi använda iterationer av faltningsprocessen. För , där är oberoende slumpvariabler, betecknar fördelningsfunktionen för r.v., och är fördelningsfunktionen för r.v. , vi får

Exempel 3.1 illustrerar denna procedur för tre diskreta slumpvariabler.

Exempel 3.1. Slumpvariabler , och är oberoende och har fördelningar definierade av kolumnerna (1), (2) och (3) i tabellen nedan.

Låt oss skriva ut sannolikhetsfunktionen och fördelningsfunktionen för r.v.

Beslut. Tabellen använder notationen som introducerades före exemplet:

Kolumnerna (1)-(3) innehåller tillgänglig information.

Kolumn (4) erhålls från kolumnerna (1) och (2) med användning av (3.4).

Kolumn (5) erhålls från kolumnerna (3) och (4) med användning av (3.4).

Definitionen av kolumn (5) fullbordar bestämningen av sannolikhetsfunktionen för r.v. . Dess fördelningsfunktion i kolumn (8) är uppsättningen av delsummor för kolumn (5), med början från toppen.

För tydlighetens skull har vi inkluderat kolumn (6), fördelningsfunktionen för kolumn (1), kolumn (7), som kan erhållas direkt från kolumner (1) och (6) med (2.3.3) och kolumn (8) bestäms av på liknande sätt för kolumnerna (3) och (7). Kolumn (5) kan bestämmas från kolumn (8) genom successiv subtraktion.

Låt oss övergå till övervägandet av två exempel med kontinuerliga slumpvariabler.

Exempel 3.2. Låt r.v. har en enhetlig fördelning på intervallet (0,2), och låt r.v. är inte beroende av r.v. och har en enhetlig fördelning på intervallet (0,3). Låt oss definiera fördelningsfunktionen för r.v.

Beslut. Eftersom utdelningarna av r.v. och kontinuerligt använder vi formel (3.6):

Sedan

Provutrymme av r.v. och illustreras i fig. 3.2. Det rektangulära området innehåller alla möjliga värden för paret och . Händelsen av intresse för oss, , visas i figuren för fem värden s.

För varje värde skär linjen axeln Y vid punkten s och en linje vid en punkt. Funktionsvärdena för dessa fem fall beskrivs med följande formel:

Ris. 3.2. Konvolution av två enhetliga fördelningar

Exempel 3.3. Låt oss betrakta tre oberoende r.v. . För r.v. har en exponentialfördelning och . Låt oss hitta densitetsfunktionen för r.v. genom att tillämpa faltningsoperationen.

Beslut. Vi har

Genom att använda formeln (3.7) tre gånger får vi

En annan metod för att bestämma fördelningen av summan av oberoende stokastiska variabler är baserad på unikheten hos den momentgenererande funktionen, som för r.v. bestäms av förhållandet .

Om denna matematiska förväntning är begränsad för alla t från något öppet intervall som innehåller origo, då är den enda genererande funktionen av fördelningsmomenten för r.v. i den meningen att det inte finns någon annan funktion än , som skulle vara den genererande funktionen av fördelningsmomenten för r.v. .

Denna unikhet kan användas på följande sätt: för summan

Om de är oberoende, så är förväntan på produkten i formel (3.8) lika med ..., alltså

Att hitta ett explicit uttryck för den enda fördelningen som motsvarar momentens genererande funktion (3.9) skulle slutföra upptäckten av fördelningen av r.v. . Om det inte är möjligt att specificera det explicit, kan det sökas efter med numeriska metoder.

Exempel 3.4. Betrakta de slumpmässiga variablerna från exempel 3.3. Låt oss definiera densitetsfunktionen för r.v. med användning av genereringsfunktionen för momenten för r.v. .

Beslut. Enligt jämställdhet (3.9) som kan skrivas som använda metoden för nedbrytning till enkla fraktioner. Lösningen är . Men är den genererande funktionen av momenten för den exponentiella fördelningen med parametern , så att densitetsfunktionen för r.v. har formen

Exempel 3.5. I studien av slumpmässiga processer introducerades den omvända Gaussiska fördelningen. Den används som en fördelning av r.v. , försäkringsbeloppet. Densitetsfunktionen och genereringsfunktionen för momenten i den inversa Gaussfördelningen ges av formlerna

Låt oss hitta fördelningen av r.v. , där r.v. är oberoende och har samma inversa Gaussfördelningar.

Beslut. Med formeln (3.9) får vi följande uttryck för genereringsfunktionen för r.v.-momenten. :

Momentens genererande funktion motsvarar en unik fördelning, och det kan ses att den har en omvänd Gauss-fördelning med parametrar och .

Uppskattningar för summafördelning

Den centrala gränssatsen ger en metod för att hitta numeriska värden för fördelningen av summan av oberoende slumpvariabler. Vanligtvis formuleras denna sats för summan av oberoende och identiskt fördelade stokastiska variabler, där .

För varje n gäller fördelningen av r.v. där = , har matematisk förväntan 0 och varians 1. Som bekant är sekvensen av sådana distributioner (för n= 1, 2, ...) tenderar till standardnormalfördelningen. När n stor, tillämpas denna sats för att approximera fördelningen av r.v. normalfördelning med medelvärde μ och dispersion. Likaså fördelningen av summan n slumpvariabler approximeras av en normalfördelning med medelvärde och varians.

Effektiviteten av en sådan approximation beror inte bara på antalet termer, utan också på närheten av fördelningen av termer till den normala. Många elementära statistikkurser säger att n måste vara minst 30 för att approximationen ska vara rimlig.

Ett av programmen för att generera normalfördelade slumpvariabler som används i simuleringsmodellering implementerar emellertid en normal slumpvariabel som ett genomsnitt av 12 oberoende slumpvariabler likformigt fördelade över intervallet (0,1).

I många individuella riskmodeller är de slumpvariabler som ingår i summorna inte jämnt fördelade. Detta kommer att illustreras med exempel i nästa avsnitt.

Den centrala gränssatsen sträcker sig också till sekvenser av ojämnt fördelade slumpvariabler.

För att illustrera några tillämpningar av den individuella riskmodellen kommer vi att använda en normal approximation av fördelningen av summan av oberoende stokastiska variabler för att få numeriska lösningar. Om en , då

och vidare, om r.v. oberoende alltså

För den aktuella applikationen behöver vi endast:

  • hitta medelvärden och varianser för slumpvariabler som simulerar individuella förluster,
  • summera dem för att få genomsnittet och variansen av förluster för försäkringsbolaget som helhet,
  • använd den normala uppskattningen.

Nedan illustrerar vi denna sekvens av åtgärder.

Ansökningar om försäkring

Detta avsnitt illustrerar användningen av den normala approximationen med fyra exempel.

Exempel 5.1. Ett livförsäkringsbolag erbjuder ett ettårigt dödsfallsförsäkringsavtal med betalningar på 1 och 2 enheter till personer vars sannolikhet för dödsfall är 0,02 eller 0,01. Tabellen nedan visar antalet personer nk i var och en av de fyra klasser som bildats i enlighet med betalningen b k och sannolikheten för ett försäkringsfall qk:

k q k b k nk
1 0,02 1 500
2 0,02 2 500
3 0,10 1 300
4 0,10 2 500

Försäkringsbolaget vill från denna grupp om 1800 individer ta ut ett belopp motsvarande 95:e percentilen av fördelningen av de totala försäkringsersättningarna för denna grupp. Dessutom vill hon att varje persons andel av det beloppet ska stå i proportion till personens förväntade försäkringsutbetalning.

Andelen av personen med numret, vars genomsnittliga betalning är lika med, bör vara . Av kravet på 95:e percentilen följer att . Övervärdet, , är riskpremien, och kallas den relativa riskpremien. Låt oss räkna ut.

Beslut. Värdet bestäms av förhållandet = 0,95, där S = X 1 + X 2 + ... + X 1800 . Detta sannolikhetsuttalande motsvarar följande:

I enlighet med vad som sades om centralgränssatsen i Sec. 4, uppskattar vi fördelningen av r.v. standard normalfördelning och använd dess 95:e percentil, från vilken vi får:

För de fyra klasser som försäkringstagarna är indelade i får vi följande resultat:

k q k b k Medel b k q k Varians b 2 k q k (1-q k) nk
1 0,02 1 0,02 0,0196 500
2 0,02 2 0,04 0,0784 500
3 0,10 1 0,10 0,0900 300
4 0,10 2 0,20 0,3600 500

Således,

Därför är den relativa riskpremien

Exempel 5.2. Kunderna till ett bilförsäkringsbolag är indelade i två klasser:

Klass Antal i klassen

Sannolikhet för att inträffa

försäkringsfall

Fördelning av försäkringsbetalningar,

trunkerade exponentiella parametrar

distribution

k L
1 500 0,10 1 2,5
2 2000 0,05 2 5,0

Den trunkerade exponentialfördelningen definieras av fördelningsfunktionen

Detta är en blandad typfördelning med en densitetsfunktion och en "klump" av probabilistisk massa vid en punkt L. Grafen för denna fördelningsfunktion visas i figur 5.1.

Ris. 5.1. Trunkerad exponentialfördelning

Liksom tidigare bör sannolikheten för att det totala beloppet av försäkringsutbetalningarna överstiger det belopp som inkasseras från försäkringstagarna vara lika med 0,05. Vi kommer att anta att den relativa riskpremien bör vara densamma i var och en av de två klasserna som övervägs. Låt oss räkna ut.

Beslut. Detta exempel är mycket likt det föregående. Den enda skillnaden är att värdena på försäkringsbetalningar nu är slumpvariabler.

Först kommer vi att få uttryck för momenten av den trunkerade exponentialfördelningen. Detta kommer att vara ett förberedande steg för att tillämpa formlerna (2.25) och (2.26):

Genom att använda parametervärdena som anges i villkoret och använda formlerna (2.25) och (2.26) får vi följande resultat:

k q k µk σ 2 k Medel q k μ k Dispersion μ 2 k q k (1-q k)+σ 2 k q k nk
1 0,10 0,9139 0,5828 0,09179 0,13411 500
2 0,05 0,5000 0,2498 0,02500 0,02436 2000

Så, S, det totala beloppet av försäkringsbetalningar, har ögonblick

Villkoret för definitionen förblir detsamma som i exempel 5.1, nämligen,

Om vi ​​återigen använder normalfördelningsapproximationen får vi

Exempel 5.3. Försäkringsbolagets portfölj inkluderar 16 000 dödsfallsförsäkringsavtal för en period av ett år enligt följande tabell:

Sannolikheten för ett försäkringsfall q för var och en av 16 000 klienter (dessa händelser antas vara ömsesidigt oberoende) är 0,02. Företaget vill sätta sin egen retentionsgrad. För varje försäkringstagare är nivån på eget bibehållande det värde under vilket detta företag (upplåtande företag) gör utbetalningar självständigt, och utbetalningar som överstiger detta värde täcks enligt återförsäkringsavtalet av ett annat företag (återförsäkrare).

Till exempel, om den egna behållningsgraden är 200 000, så reserverar företaget täckning upp till 20 000 för varje försäkrad och köper återförsäkring för att täcka skillnaden mellan premien och beloppet på 20 000 för var och en av de 4 500 försäkringstagare vars försäkringspremier överstiger 20 000 .

Bolaget väljer som beslutskriterium en minimering av sannolikheten för att försäkringsskador som lämnas på eget avdrag, plus det belopp som betalas för återförsäkring, överstiger beloppet 8 250 000. Återförsäkringskostnader 0,025 per täckningsenhet (dvs. 125 % av det förväntade beloppet för återförsäkring). värde av försäkringsersättningar per enhet 0,02).

Vi anser att portföljen som är under övervägande är stängd: nya försäkringsavtal som ingås under innevarande år kommer inte att beaktas i den beskrivna beslutsprocessen.

Partiell lösning. Låt oss göra alla beräkningar först och välja 10 000 som utbetalningsenhet. Som en illustration, anta att c. i. Sär mängden betalningar kvar på eget avdrag, har följande form:

Till dessa försäkringar utbetalningar kvar på ditt eget avdrag S, tillkommer beloppet för återförsäkringspremier. Totalt är det totala täckningsbeloppet enligt detta system

Det belopp som finns kvar på eget avdrag är lika med

Det totala återförsäkrade värdet är alltså 35 000-24 000=11 000 och kostnaden för återförsäkring är

På den egna retentionsnivån lika med 2 är alltså de försäkringsersättningar som lämnas på eget retention plus kostnaden för återförsäkring . Beslutskriteriet baseras på sannolikheten att denna summa överstiger 825,

Med normalfördelningen får vi att detta värde är ungefär lika med 0,0062.

De genomsnittliga värdena för försäkringsutbetalningar vid förlustöverskottsförsäkring, som en av återförsäkringstyperna, kan approximeras med normalfördelningen som fördelningen av totala försäkringsutbetalningar.

Låt de totala försäkringsutbetalningarna X ha en normalfördelning med medelvärde och varians

Exempel 5.4. Låt oss betrakta en försäkringsportfölj, som i ett exempel 5.3. Låt oss ta reda på den matematiska förväntningen på försäkringsbeloppet enligt försäkringsavtalet för överskottet av olönsamhet, om

(a) det finns ingen individuell återförsäkring och den ovillkorliga självrisken är satt till 7 500 000

(b) ett personligt innehåll på 20 000 fastställs på individuella försäkringsavtal och den ovillkorliga självrisken för portföljen är 5 300 000.

Beslut.

(a) I avsaknad av individuell återförsäkring och vid övergången till 10 000 som valuta

att tillämpa formel (5.2) ger

vilket är summan av 43 770 i de ursprungliga enheterna.

(b) I Bilaga 5.3 får vi medelvärdet och variansen av totala premier för en individuell självrisk på 20 000 till 480 respektive 784, med 10 000 som en enhet. Alltså =28.

att tillämpa formel (5.2) ger

vilket är summan av 4140 i de ursprungliga enheterna.

I praktiken blir det ofta nödvändigt att hitta fördelningslagen för summan av stokastiska variabler.

Låt det finnas ett system (X b X 2) två sammanhängande s. i. och deras summa

Låt oss hitta distributionstätheten c. i. U. I enlighet med den allmänna lösningen i föregående stycke, finner vi området för planet där x + x 2 (Fig. 9.4.1):

Genom att differentiera detta uttryck med avseende på y får vi en ap. slumpvariabel Y \u003d X + X 2:

Eftersom funktionen φ (x b x 2) = Xj + x 2 är symmetrisk med avseende på dess argument, då

Om med. i. X och X 2 är oberoende, då har formlerna (9.4.2) och (9.4.3) formen:


I det fall då oberoende c. i. x x och X 2, prata om distributionslagarnas sammansättning. Producera sammansättning två distributionslagar - detta innebär att hitta distributionslagen för summan av två oberoende c. c., fördelade enligt dessa lagar. Den symboliska notationen används för att beteckna sammansättningen av distributionslagar

som i huvudsak betecknas med formlerna (9.4.4) eller (9.4.5).

Exempel 1. Arbetet med två tekniska enheter (TD) beaktas. Först fungerar TU efter att dess fel (misslyckande) ingår i driften av TU 2. Drifttid TU TU TU 2 - x x och X 2 - är oberoende och fördelade enligt exponentiella lagar med parametrarna A,1 och X 2 . Därför tiden Y problemfri drift av TU, bestående av TU! och TU 2 kommer att bestämmas av formeln

Det krävs att man hittar en p.r. slumpvariabel Y, dvs sammansättningen av två exponentiella lagar med parametrar och X 2 .

Beslut. Med formeln (9.4.4) får vi (y > 0)


Om det finns en sammansättning av två exponentiella lagar med samma parametrar (?c = X 2 = Y), då erhålls i uttrycket (9.4.8) en osäkerhet av typen 0/0, vilket expanderar vilket vi får:

Genom att jämföra detta uttryck med uttryck (6.4.8), är vi övertygade om att sammansättningen av två identiska exponentiallagar (?c = X 2 = x)är andra ordningens Erlang-lag (9.4.9). När man komponerar två exponentiallagar med olika parametrar x x och A-2 får andra ordningens generaliserade Erlang-lag (9.4.8). ?

Uppgift 1. Lagen för fördelningen av skillnaden mellan två s. i. System med. i. (X och X 2) har ett led r.p./(x x x 2). Hitta en p.r. deras olikheter Y=X - X 2 .

Beslut. För systemet med i. (X b - X 2) etc. kommer att vara / (x b - x 2), dvs vi ersatte mellanskillnaden med summan. Därför har a.r. slumpvariabel U kommer att ha formen (se (9.4.2), (9.4.3)):

Om en med. i. X x iX 2 oberoende alltså

Exempel 2. Hitta en f.r. skillnaden mellan två oberoende exponentiellt fördelade s. i. med parametrar x x och X 2 .

Beslut. Enligt formeln (9.4.11) får vi

Ris. 9.4.2 Ris. 9.4.3

Figur 9.4.2 visar en sid. g(y). Om vi ​​betraktar skillnaden mellan två oberoende exponentiellt fördelade s. i. med samma inställningar (A-i= X 2 = MEN,), sedan g(y) \u003d / 2 - redan bekant

Laplaces lag (Fig. 9.4.3). ?

Exempel 3. Hitta fördelningslagen för summan av två oberoende c. i. X och X 2, distribueras enligt Poisson-lagen med parametrar yxa och en 2 .

Beslut. Hitta sannolikheten för en händelse (X x + X 2 = t) (t = 0, 1,



Därför, s. i. Y= X x + X 2 fördelas enligt Poisson-lagen med parametern a x2) - a x + a 2. ?

Exempel 4. Hitta fördelningslagen för summan av två oberoende c. i. x x och X 2, fördelade enligt binomiallagar med parametrar p x ri p 2, sid respektive.

Beslut. Föreställ dig med. i. x x som:

var X 1) - händelseindikator MEN upplevelsen:

Distributionsområde med. i. X,- har formen


Vi kommer att göra en liknande framställning för s. i. X 2: där X] 2) - händelseindikator MEN i y"-e erfarenheten:


Därav,

var är X? 1)+(2) om händelseindikatorn MEN:

Det har vi alltså visat i. Svärfars belopp (u + n 2) händelseindikatorer MEN, hvaraf följer att s. i. ^fördelad enligt binomiallagen med parametrar ( n x + n 2), sid.

Observera att om sannolikheterna R i olika serier av experiment är olika, då som ett resultat av att lägga till två oberoende s. c., fördelat enligt binomiallagar, visar det sig c. c., fördelade inte enligt binomiallagen. ?

Exemplen 3 och 4 är lätta att generalisera till ett godtyckligt antal termer. När man komponerar Poissons lagar med parametrar a b a 2 , ..., ett t Poissons lag erhålls återigen med parametern a (t) \u003d a x + a 2 + ... + och t.

Vid sammansättning av binomiallagar med parametrar (n r); (i 2, R) , (n t, p)återigen får vi den binomala lagen med parametrar ("("), R), var n (t) \u003d u + n 2 + ... + etc.

Vi har bevisat viktiga egenskaper hos Poissons lag och binomiallagen: "stabilitetsegenskapen". Fördelningslagen heter hållbar, om sammansättningen av två lagar av samma typ resulterar i en lag av samma typ (endast parametrarna i denna lag skiljer sig åt). I underavsnitt 9.7 kommer vi att visa att normallagen har samma stabilitetsegenskap.

TEMA 3

begreppet fördelningsfunktion

matematiska förväntningar och varians

enhetlig (rektangulär) fördelning

normal (gaussisk) fördelning

Distribution

t- Elevens fördelning

F- distribution

fördelningen av summan av två slumpmässigt oberoende variabler

exempel: fördelning av summan av två oberoende

jämnt fördelade kvantiteter

slumpvariabel transformation

exempel: fördelning av en harmonisk våg

med slumpmässig fas

Centrala gränsvärdessatsen

moment av en slumpvariabel och deras egenskaper

SYFTE MED CYKELN

FÖREDRAG:

RAPPORTERA INLEDANDE INFORMATION OM DE VIKTIGASTE DISTRIBUTIONSFUNKTIONERNA OCH DERAS EGENSKAPER

DISTRIBUTIONSFUNKTIONER

Låt vara x(k)är någon slumpvariabel. Sedan för ett fast värde x en slumpmässig händelse x(k) x definieras som en uppsättning av alla möjliga resultat k Så att x(k) x. När det gäller det ursprungliga sannolikhetsmåttet som ges på urvalsutrymmet, distributionsfunktionP(x) definieras som sannolikheten som tilldelas en uppsättning punkter k x(k) x. Observera att uppsättningen av punkter k att tillfredsställa ojämlikheten x(k) x, är en delmängd av den uppsättning punkter som uppfyller ojämlikheten x(k). Formellt

Det är uppenbart

Om intervallet för värden för den slumpmässiga variabeln är kontinuerligt, vilket antas nedan, då sannolikhetstäthet(en-dimensionell) p(x) bestäms av differentialrelationen

(4)

Därav,

(6)

För att kunna överväga diskreta fall är det nödvändigt att medge närvaron av deltafunktioner i sammansättningen av sannolikhetstätheten.

FÖRVÄNTAT VÄRDE

Låt den slumpmässiga variabeln x(k) tar värden från intervallet från -  till + . Betyda(annat, förväntat värde eller förväntat värde) x(k) beräknas med hjälp av motsvarande passage till gränsen i summan av produkter av värden x(k) om sannolikheten för att dessa händelser inträffar:

(8)

var E- matematisk förväntan på uttrycket inom hakparenteser efter index k. Den matematiska förväntningen på en verklig enkelvärdig kontinuerlig funktion definieras på liknande sätt g(x) från en slumpvariabel x(k)

(9)

var p(x)- sannolikhetstäthet för en slumpvariabel x(k). I synnerhet att ta g(x)=x, vi får medelkvadrat x(k) :

(10)

Dispersionx(k) definieras som medelkvadraten på skillnaden x(k) och dess medelvärde,

dvs i detta fall g(x)= och

A-priory, standardavvikelse slumpvariabel x(k), betecknas , är det positiva värdet av kvadratroten av variansen. Standardavvikelsen mäts i samma enheter som medelvärdet.

VIKTIGASTE DISTRIBUTIONSFUNKTIONER

ENHETLIG (REKTANGULÄR) DISTRIBUTION.

Låt oss anta att experimentet består av ett slumpmässigt urval av en punkt från intervallet [ a,b] , inklusive dess slutpunkter. I det här exemplet, som värdet av en slumpvariabel x(k) du kan ta det numeriska värdet för den valda punkten. Motsvarande distributionsfunktion har formen

Därför ges sannolikhetstätheten av formeln

I det här exemplet ger beräkningen av medelvärdet och variansen med formlerna (9) och (11).

NORMAL (GAUSSIAN) DISTRIBUTION

, - aritmetiskt medelvärde, - RMS.

Värdet på z som motsvarar sannolikheten P(z)=1-, dvs.

CHI - KVADRAT DISTRIBUTION

Låt vara - n oberoende slumpvariabler, som var och en har en normalfördelning med noll medelvärde och enhetsvarians.

Chi-kvadratad slumpvariabel med n frihetsgrader.

sannolikhetstäthet .

DF: 100 - procentenheter - fördelningar betecknas med , d.v.s.

medelvärde och varians är lika

t - STUDENT DISTRIBUTIONER

y, z är oberoende slumpvariabler; y - har - fördelning, z - normalfördelad med noll medelvärde och enhetsvarians.

värde - har t- Elevens fördelning med n frihetsgrader

DF: 100 - procentenhet t - fördelning anges

Medelvärde och varians är lika

F - DISTRIBUTION

Oberoende slumpvariabler; har - fördelning med frihetsgrader; fördelning med frihetsgrader. Slumpmässigt värde:

,

F är en fördelad stokastisk variabel med och frihetsgrader.

,

DF: 100 - procentenhet:

Medelvärdet och variansen är lika:

FÖRDELNING AV BELOPPET

TVÅ Slumpmässiga VARIABLER

Låt vara x(k) och y(k)är slumpvariabler som har en gemensam sannolikhetstäthet p(x,y). Hitta sannolikhetstätheten för summan av slumpvariabler

På en fast x vi har y=z–x.

På en fast z värden x kör intervallet från – till +. Så

(37)

varifrån det kan ses att för att beräkna den önskade densiteten av summan måste man känna till den ursprungliga ledsannolikhetstätheten. Om en x(k) och y(k)är oberoende slumpvariabler som har densiteter och respektive då och

(38)

EXEMPEL: SUMMAN AV TVÅ OBEROENDE, ENHETLIGT DISTRIBUERADE Slumpmässiga VARIABLER.

Låt två slumpmässigt oberoende variabler ha densiteter av formen

I andra fall Låt oss hitta sannolikhetstätheten p(z) för deras summa z= x+ y.

Sannolikhetstäthet för dvs för Därav, x mindre än z. Dessutom är inte lika med noll för Med formel (38), finner vi att

Illustration:

Sannolikhetstätheten för summan av två oberoende, enhetligt fördelade stokastiska variabler.

Slumpmässig OMVANDLING

VÄRDEN

Låt vara x(t)- stokastisk variabel med sannolikhetstäthet p(x), släpp det g(x)är en envärdig reell kontinuerlig funktion av x. Tänk först på fallet när den inversa funktionen x(g)är också en envärdig kontinuerlig funktion av g. Sannolikhetstäthet p(g), motsvarande en slumpvariabel g(x(k)) = g(k), kan bestämmas från sannolikhetstätheten p(x) slumpvariabel x(k) och derivat dg/dx under antagandet att derivatan existerar och skiljer sig från noll, nämligen:

(12)

Därför i gränsen dg/dx#0

(13)

Med den här formeln följer den på sin högra sida istället för en variabel x ersätt lämpligt värde g.

Betrakta nu fallet när den inversa funktionen x(g)är giltig n-värderad funktion av g, var när ett heltal och alla n värden är lika sannolika. Sedan

(14)

EXEMPEL:

DISTRIBUTION AV DEN HARMONISKA FUNKTIONEN.

Harmonisk funktion med fast amplitud X och frekvens f kommer att vara en slumpvariabel om dess initiala fasvinkel = (k)- slumpmässigt värde. I synnerhet låt t fast och lika t o, och låt den harmoniska slumpvariabeln ha formen

Låt oss låtsas som det (k) har en enhetlig sannolikhetstäthet p() snäll

Hitta sannolikhetstätheten p(x) slumpvariabel x(k).

I det här exemplet, den direkta funktionen x() entydigt, och den omvända funktionen (x) tvetydig.

Låt oss använda ovanstående generella metod för att lösa ett problem, nämligen att hitta fördelningslagen för summan av två stokastiska variabler. Det finns ett system med två stokastiska variabler (X,Y) med fördelningsdensitet f(x,y). Betrakta summan av slumpvariablerna X och Y: och hitta fördelningen av värdet Z. För att göra detta konstruerar vi en linje på xOy-planet, vars ekvation är (Fig. 7). Detta är en rak linje som skär av segment lika med z på axlarna. Den räta linjen delar xy-planet i två delar; till höger och ovanför den; vänster och under.

Region D i detta fall är den nedre vänstra delen av xOy-planet, skuggat i fig. 7. Enligt formel (16) har vi:

Genom att differentiera detta uttryck med avseende på variabeln z som ingår i den övre gränsen för den inre integralen får vi:

Detta är den allmänna formeln för fördelningsdensiteten av summan av två slumpvariabler.

Av skäl för symmetri av problemet med avseende på X och Y, kan vi skriva en annan version av samma formel:

som motsvarar den första och kan användas istället.

Ett exempel på sammansättningen av normala lagar. Betrakta två oberoende slumpvariabler X och Y, med förbehåll för normala lagar:

Det krävs att man tar fram en sammansättning av dessa lagar, det vill säga att hitta distributionslagen för kvantiteten: .

Vi tillämpar den allmänna formeln för sammansättningen av distributionslagar:

Om vi ​​öppnar parenteserna i integrandens exponent och tar med liknande termer får vi:

Att ersätta dessa uttryck med formeln vi redan har stött på

efter transformationer får vi:

och detta är inget annat än en normal lag med ett spridningscentrum

och standardavvikelse

Samma slutsats kan mycket lättare nås med hjälp av följande kvalitativa resonemang.

Utan att öppna parenteser och utan att göra transformationer i integranden (17) kommer vi omedelbart till slutsatsen att exponenten är ett kvadrattrinomial med avseende på x i formen

där värdet av z inte alls ingår i koefficienten A, är koefficienten B inkluderad i första graden, och koefficienten C kvadreras. Med detta i åtanke och med formeln (18), drar vi slutsatsen att g(z) är en exponentiell funktion vars exponent är ett kvadrattrinomial med avseende på z, och fördelningsdensiteten; av detta slag motsvarar normallagen. Alltså vi; vi kommer till en rent kvalitativ slutsats: lagen för distribution av z måste vara normal. För att hitta parametrarna för denna lag - och - använder vi satsen om addition av matematiska förväntningar och satsen om addition av varianser. Genom additionssatsen för matematiska förväntningar. Genom dispersionsadditionsteoremet, eller varifrån formel (20) följer.

Om vi ​​går från rot-medelkvadratavvikelser till sannolika avvikelser som är proportionella mot dem kommer vi att få: .

Sålunda har vi kommit till följande regel: när normala lagar är sammansatta erhålls återigen en normallag och de matematiska förväntningarna och varianserna (eller kvadrerade sannolika avvikelser) summeras.

Sammansättningsregeln för normala lagar kan generaliseras till fallet med ett godtyckligt antal oberoende slumpvariabler.

Om det finns n oberoende slumpvariabler: föremål för normala lagar med spridningscentra och standardavvikelser, så är värdet också föremål för normallagen med parametrar

Istället för formel (22) kan en ekvivalent formel användas:

Om systemet av slumpvariabler (X, Y) är fördelat enligt normallagen, men storheterna X, Y är beroende, så är det lätt att bevisa, precis som tidigare, baserat på den allmänna formeln (6.3.1), att kvantitetens fördelningslag också är en normallag. Spridningscentra läggs fortfarande till algebraiskt, men för standardavvikelser blir regeln mer komplicerad: , där r är korrelationskoefficienten för X- och Y-värden.

När man adderar flera beroende stokastiska variabler som i sin helhet följer normallagen, visar sig summans fördelningslag vara normal med parametrar

eller troliga avvikelser

där är korrelationskoefficienten för storheterna Xi, Xj, och summeringen sträcker sig till alla olika parvisa kombinationer av kvantiteter.

Vi har sett en mycket viktig egenskap hos normallagen: när normala lagar kombineras får man återigen en normallag. Detta är den så kallade "stabilitetsegenskapen". En distributionslag sägs vara stabil om man genom att sammansätta två lagar av denna typ återigen erhåller en lag av samma typ. Vi har visat ovan att normallagen är stabil. Mycket få distributionslagar har egenskapen stabilitet. Lagen om enhetlig densitet är instabil: när vi komponerade två lagar för enhetlig densitet i sektioner från 0 till 1, fick vi Simpsons lag.

En normallags stabilitet är en av de väsentliga förutsättningarna för dess breda tillämpning i praktiken. Fastighetsegenskapen, förutom den normala, innehas emellertid också av vissa andra distributionslagar. Ett kännetecken för normallagen är att när ett tillräckligt stort antal praktiskt taget godtyckliga fördelningslagar är sammansatta visar sig den totala lagen vara godtyckligt nära den normala, oavsett vad termernas fördelningslagar var. Detta kan t.ex. illustreras genom att sammansätta tre lagar med enhetlig densitet i sektioner från 0 till 1. Den resulterande fördelningslagen g(z) visas i fig. 8. Som framgår av ritningen är grafen för funktionen g (z) mycket lik normallagens graf.

Har frågor?

Rapportera ett stavfel

Text som ska skickas till våra redaktioner: