Varbūtības statistikas pētījumu metodes. Varbūtības un statistiskās metodes ekonomisko sistēmu modelēšanai. Nejaušo lielumu skaitliskās īpašības

3.5.1. Varbūtības-statistiskā pētījuma metode.

Daudzos gadījumos ir nepieciešams pētīt ne tikai deterministiskos, bet arī nejaušos varbūtības (statistiskos) procesus. Šie procesi tiek aplūkoti, pamatojoties uz varbūtību teoriju.

Gadījuma lieluma x kopa veido primāro matemātisko materiālu. Kopa tiek saprasta kā viendabīgu notikumu kopums. Kopu, kas satur visdažādākos masu parādības variantus, sauc par vispārējo populāciju vai liels paraugs N. Parasti tiek pētīta tikai daļa iedzīvotāju, saukti izvēles populācija vai neliela izlase.

Varbūtība P(x) notikumiem X ko sauc par lietu skaita attiecību N(x), kas noved pie kāda notikuma rašanās X, uz kopējo iespējamo gadījumu skaitu N:

P(x)=N(x)/N.

Varbūtību teorija pēta gadījuma lielumu teorētiskos sadalījumus un to raksturlielumus.

Matemātikas statistika nodarbojas ar empīrisko notikumu apstrādes un analīzes veidiem.

Šīs divas radniecīgās zinātnes veido vienotu matemātisko masu nejaušības procesu teoriju, ko plaši izmanto zinātnisko pētījumu analīzei.

Iespējamības un matemātiskās statistikas metodes ļoti bieži tiek izmantotas uzticamības, izdzīvošanas un drošības teorijā, kas tiek plaši izmantota dažādās zinātnes un tehnikas nozarēs.

3.5.2. Statistiskās modelēšanas vai statistiskās pārbaudes metode (Monte Carlo metode).

Šī metode ir skaitliska metode sarežģītu problēmu risināšanai, un tās pamatā ir nejaušu skaitļu izmantošana, kas simulē varbūtības procesus. Šīs metodes risināšanas rezultāti ļauj empīriski noteikt pētāmo procesu atkarības.

Problēmu risināšana, izmantojot Montekarlo metodi, ir efektīva tikai ar ātrgaitas datoru izmantošanu. Lai atrisinātu problēmas, izmantojot Montekarlo metodi, jums ir jābūt statistiskai rindai, jāzina tās sadalījuma likums, vidējā vērtība un matemātiskā cerība t(x), standarta novirze.

Izmantojot šo metodi, var iegūt patvaļīgi norādītu risinājuma precizitāti, t.i.

-> t(x)

3.5.3. Sistēmas analīzes metode.

Sistēmas analīze tiek saprasta kā paņēmienu un metožu kopums sarežģītu sistēmu izpētei, kas ir komplekss mijiedarbojošu elementu kopums. Sistēmas elementu mijiedarbību raksturo tiešie un atgriezeniskās saites savienojumi.

Sistēmas analīzes būtība ir identificēt šos savienojumus un noteikt to ietekmi uz visas sistēmas uzvedību kopumā. Vispilnīgāko un padziļināto sistēmu analīzi var veikt, izmantojot kibernētikas metodes, kas ir zinātne par sarežģītām dinamiskām sistēmām, kas spēj uztvert, uzglabāt un apstrādāt informāciju optimizācijas un kontroles nolūkos.

Sistēmas analīze sastāv no četriem posmiem.

Pirmais posms ir problēmas formulēšana: tiek noteikts pētījuma objekts, mērķi un uzdevumi, kā arī objekta izpētes un vadīšanas kritēriji.

Otrajā posmā tiek noteiktas pētāmās sistēmas robežas un noteikta tās struktūra. Visi ar mērķi saistītie objekti un procesi tiek iedalīti divās klasēs – pati pētāmā sistēma un ārējā vide. Atšķirt slēgts Un atvērts sistēmas. Pētot slēgtās sistēmas, tiek atstāta novārtā ārējās vides ietekme uz to uzvedību. Tad tiek identificēti atsevišķi sistēmas komponenti - tās elementi, un tiek noteikta to mijiedarbība ar ārējo vidi.

Trešais sistēmas analīzes posms ir pētāmās sistēmas matemātiskā modeļa sastādīšana. Pirmkārt, sistēma tiek parametrizēta, ar noteiktu parametru palīdzību aprakstīti galvenie sistēmas elementi un elementārā ietekme uz to. Tajā pašā laikā tiek izdalīti parametri, kas raksturo nepārtrauktus un diskrētus, deterministiskos un varbūtības procesus. Atkarībā no procesu īpašībām tiek izmantots viens vai otrs matemātiskais aparāts.

Sistēmu analīzes trešā posma rezultātā tiek veidoti pilni sistēmas matemātiskie modeļi, kas aprakstīti formālā, piemēram, algoritmiskā valodā.

Ceturtajā posmā tiek analizēts iegūtais matemātiskais modelis, atrasti tā ekstremālie apstākļi, lai optimizētu procesus un vadības sistēmas, un formulētu secinājumus. Optimizācija tiek novērtēta pēc optimizācijas kritērija, kas šajā gadījumā ņem galējās vērtības (minimums, maksimums, minimums).

Parasti tiek atlasīts viens kritērijs, bet citiem tiek noteiktas maksimālās pieļaujamās vērtības. Dažreiz tiek izmantoti jaukti kritēriji, kas ir primāro parametru funkcija.

Pamatojoties uz izvēlēto optimizācijas kritēriju, tiek sastādīta optimizācijas kritērija atkarība no pētāmā objekta (procesa) modeļa parametriem.

Ir zināmas dažādas matemātiskās metodes pētāmo modeļu optimizēšanai: lineārās, nelineārās vai dinamiskās programmēšanas metodes; uz rindu teoriju balstītas varbūtības-statistiskās metodes; spēļu teorija, kas procesu attīstību uzskata par nejaušām situācijām.

Jautājumi zināšanu paškontrolei

Teorētiskā pētījuma metodoloģija.

Zinātniskā pētījuma teorētiskās izstrādes posma galvenās sadaļas.

Modeļu veidi un pētāmā objekta modelēšanas veidi.

Analītiskās izpētes metodes.

Pētījumu analītiskās metodes, izmantojot eksperimentu.

Varbūtības analītiskā pētījuma metode.

Statiskās modelēšanas metodes (Monte Karlo metode).

Sistēmas analīzes metode.

Statistikas metodes

Statistikas metodes- statistiskās datu analīzes metodes. Ir lietišķās statistikas metodes, kuras var izmantot visās zinātniskās pētniecības jomās un jebkurās tautsaimniecības nozarēs, un citas statistikas metodes, kuru pielietojamība ir ierobežota vienā vai citā jomā. Tas attiecas uz tādām metodēm kā statistiskā pieņemšanas kontrole, tehnoloģisko procesu statistiskā kontrole, uzticamība un testēšana, kā arī eksperimentu plānošana.

Statistikas metožu klasifikācija

Statistiskās datu analīzes metodes tiek izmantotas gandrīz visās cilvēka darbības jomās. Tos izmanto ikreiz, kad nepieciešams iegūt un pamatot jebkādus spriedumus par grupu (objektiem vai subjektiem) ar zināmu iekšēju neviendabīgumu.

Datu analīzes statistisko metožu jomā ieteicams nošķirt trīs zinātnisko un lietišķo darbību veidus (atbilstoši to metožu specifiskuma pakāpei, kas saistītas ar iedziļināšanos konkrētās problēmās):

a) vispārējas nozīmes metožu izstrāde un izpēte, neņemot vērā pielietojuma jomas specifiku;

b) reālu parādību un procesu statistisko modeļu izstrāde un izpēte atbilstoši konkrētas darbības jomas vajadzībām;

c) statistikas metožu un modeļu izmantošana konkrētu datu statistiskai analīzei.

Lietišķā statistika

Datu veida un to ģenerēšanas mehānisma apraksts ir jebkura statistikas pētījuma sākums. Datu aprakstīšanai tiek izmantotas gan deterministiskās, gan varbūtības metodes. Izmantojot deterministiskās metodes, ir iespējams analizēt tikai tos datus, kas ir pieejami pētniekam. Piemēram, ar viņu palīdzību tika iegūtas tabulas, kuras, pamatojoties uz uzņēmumu un organizāciju iesniegtajiem statistikas pārskatiem, aprēķināja oficiālās valsts statistikas iestādes. Iegūtos rezultātus var pārnest uz plašāku populāciju un izmantot prognozēšanai un kontrolei, tikai pamatojoties uz varbūtības statistisko modelēšanu. Tāpēc matemātiskajā statistikā bieži tiek iekļautas tikai metodes, kuru pamatā ir varbūtību teorija.

Mēs neuzskatām par iespējamu pretstatīt deterministiskās un varbūtības-statistikas metodes. Mēs tos uzskatām par secīgiem statistiskās analīzes posmiem. Pirmajā posmā ir nepieciešams analizēt pieejamos datus un parādīt tos viegli lasāmā formā, izmantojot tabulas un diagrammas. Pēc tam statistiskos datus ieteicams analizēt, pamatojoties uz noteiktiem varbūtības un statistikas modeļiem. Ņemiet vērā, ka iespēju dziļāk ieskatīties reālas parādības vai procesa būtībā nodrošina adekvāta matemātiskā modeļa izstrāde.

Vienkāršākajā situācijā statistikas dati ir pētāmo objektu dažu raksturīgo raksturlielumu vērtības. Vērtības var būt kvantitatīvās vai norādīt kategoriju, kurā objektu var klasificēt. Otrajā gadījumā viņi runā par kvalitatīvu zīmi.

Mērot pēc vairākiem kvantitatīviem vai kvalitatīviem raksturlielumiem, mēs iegūstam vektoru kā statistikas datus par objektu. To var uzskatīt par jauna veida datiem. Šajā gadījumā paraugs sastāv no vektoru kopas. Ir daļa koordinātu - skaitļi, bet daļa - kvalitatīvie (kategorizētie) dati, tad mēs runājam par dažāda veida datu vektoru.

Viens izlases elements, tas ir, viena dimensija, var būt funkcija kopumā. Piemēram, aprakstot indikatora dinamiku, tas ir, tā izmaiņas laika gaitā, ir pacienta elektrokardiogramma vai motora vārpstas sitiena amplitūda. Vai laikrinda, kas apraksta konkrēta uzņēmuma darbības dinamiku. Tad paraugs sastāv no pazīmju kopas.

Parauga elementi var būt arī citi matemātiski objekti. Piemēram, binārās attiecības. Līdz ar to, apsekojot ekspertus, viņi nereti izmanto ekspertīzes objektu sakārtošanu (ranžēšanu) - preču paraugus, investīciju projektus, vadības lēmumu iespējas. Atkarībā no ekspertu pētījuma noteikumiem izlases elementi var būt dažāda veida binārās attiecības (kārtojums, sadalīšana, pielaide), kopas, izplūdušās kopas utt.

Tātad izlases elementu matemātiskais raksturs dažādās lietišķās statistikas problēmās var būt ļoti atšķirīgs. Tomēr var izdalīt divas statistikas datu klases - skaitlisko un neskaitlisko. Attiecīgi lietišķā statistika ir sadalīta divās daļās - skaitliskā statistika un neskaitliskā statistika.

Skaitliskā statistika ir skaitļi, vektori, funkcijas. Tos var saskaitīt un reizināt ar koeficientiem. Tāpēc skaitliskā statistikā liela nozīme ir dažādām summām. Matemātiskais aparāts izlases nejaušo elementu summu analīzei ir lielo skaitļu (klasiskie) likumi un centrālās robežu teorēmas.

Neskaitliskie statistikas dati ir kategorizēti dati, dažāda veida pazīmju vektori, binārās attiecības, kopas, izplūdušās kopas utt. Tos nevar saskaitīt un reizināt ar koeficientiem. Tāpēc nav jēgas runāt par neskaitliskās statistikas summām. Tie ir neskaitlisku matemātisko telpu (kopu) elementi. Matemātiskais aparāts neskaitlisko statistikas datu analīzei ir balstīts uz attālumu starp elementiem (kā arī tuvuma mēru, atšķirības indikatoru) izmantošanu šādās telpās. Ar attālumu palīdzību tiek noteikti empīriskie un teorētiskie vidējie lielumi, pierādīti lielo skaitļu likumi, konstruēti neparametriskie varbūtības sadalījuma blīvuma aprēķini, risinātas diagnostikas problēmas un klasteru analīze utt. (sk.).

Lietišķajos pētījumos tiek izmantoti dažāda veida statistikas dati. Tas jo īpaši ir saistīts ar to iegūšanas metodēm. Piemēram, ja kādu tehnisko ierīču testēšana turpinās līdz noteiktam brīdim, tad iegūstam t.s. cenzēti dati, kas sastāv no skaitļu kopas — vairāku ierīču darbības ilgums pirms atteices, un informācija, ka pārējās ierīces turpināja darboties testa beigās. Cenzēti dati bieži tiek izmantoti tehnisko ierīču uzticamības novērtēšanā un uzraudzībā.

Parasti statistiskās metodes pirmo trīs veidu datu analīzei tiek aplūkotas atsevišķi. Šo ierobežojumu rada iepriekš minētais fakts, ka matemātiskais aparāts datu, kas nav skaitļi, analīzei būtiski atšķiras no datiem skaitļu, vektoru un funkciju formā.

Varbūtības-statistiskā modelēšana

Pielietojot statistikas metodes konkrētās zināšanu jomās un tautsaimniecības nozarēs, mēs iegūstam tādas zinātnes un praktiskās disciplīnas kā "statistikas metodes rūpniecībā", "statistikas metodes medicīnā" u.c. No šī viedokļa ekonometrija ir "statistika". metodes ekonomikā”. Šīs b) grupas disciplīnas parasti balstās uz varbūtības-statistikas modeļiem, kas veidoti atbilstoši pielietojuma jomas īpašībām. Ļoti pamācoši ir salīdzināt dažādās jomās izmantotos varbūtības-statistiskos modeļus, atklāt to līdzības un vienlaikus atzīmēt dažas atšķirības. Līdz ar to var saskatīt problēmu izklāstu un to risināšanai izmantoto statistikas metožu līdzību tādās jomās kā zinātniskie medicīniskie pētījumi, specifiskie socioloģiskie pētījumi un mārketinga pētījumi jeb, īsi sakot, medicīnā, socioloģijā un mārketingā. Tie bieži tiek grupēti kopā ar nosaukumu "izlases pētījumi".

Atšķirība starp izlases pētījumiem un ekspertu pētījumiem izpaužas, pirmkārt, apsekoto objektu vai subjektu skaitā - izlases pētījumos parasti runā par simtiem, bet ekspertu pētījumos - par desmitiem. Taču ekspertu pētījumu tehnoloģija ir daudz sarežģītāka. Vēl izteiktāka specifika izpaužas demogrāfiskajos vai loģistikas modeļos, apstrādājot naratīvu (teksta, hronikas) informāciju vai pētot faktoru savstarpējo ietekmi.

Tehnisko ierīču un tehnoloģiju uzticamības un drošības jautājumi, rindu teorija ir detalizēti aplūkoti daudzos zinātniskos darbos.

Konkrētu datu statistiskā analīze

Statistikas metožu un modeļu pielietošana konkrētu datu statistiskai analīzei ir cieši saistīta ar attiecīgās jomas problēmām. Trešā no identificētajiem zinātniskās un lietišķās darbības veidiem rezultāti atrodas disciplīnu krustpunktā. Tos var uzskatīt par statistikas metožu praktiskā pielietojuma piemēriem. Bet nav mazāk iemeslu tos attiecināt uz atbilstošo cilvēka darbības jomu.

Piemēram, šķīstošās kafijas patērētāju aptaujas rezultāti dabiski tiek attiecināti uz mārketingu (to viņi dara, lasot lekcijas par mārketinga pētījumiem). Cenu pieauguma dinamikas izpēte, izmantojot inflācijas indeksus, kas aprēķināti no neatkarīgi apkopotas informācijas, ir interese galvenokārt no ekonomikas un tautsaimniecības vadības viedokļa (gan makrolīmenī, gan atsevišķu organizāciju līmenī).

Attīstības perspektīvas

Statistikas metožu teorija ir vērsta uz reālu problēmu risināšanu. Tāpēc tajā pastāvīgi rodas jauni matemātisko problēmu formulējumi statistikas datu analīzei, tiek izstrādātas un pamatotas jaunas metodes. Pamatojumu bieži veic ar matemātiskiem līdzekļiem, tas ir, pierādot teorēmas. Liela loma ir metodiskajam komponentam – kā precīzi uzstādīt problēmas, kādus pieņēmumus pieņemt turpmākās matemātiskās izpētes nolūkos. Liela nozīme ir mūsdienu informācijas tehnoloģijām, jo ​​īpaši datoreksperimentiem.

Steidzams uzdevums ir analizēt statistikas metožu vēsturi, lai identificētu attīstības tendences un izmantotu tās prognozēšanai.

Literatūra

2. Naylor T. Mašīnu simulācijas eksperimenti ar ekonomisko sistēmu modeļiem. - M.: Mir, 1975. - 500 lpp.

3. Krāmers G. Statistikas matemātiskās metodes. - M.: Mir, 1948 (1. izd.), 1975 (2. izd.). - 648 lpp.

4. Boļševs L. N., Smirnovs N. V. Matemātiskās statistikas tabulas. - M.: Nauka, 1965. (1. izd.), 1968. (2. izd.), 1983. (3. izd.).

5. Smirnovs N. V., Dunin-Barkovsky I. V. Varbūtību teorijas un matemātiskās statistikas kurss tehniskajiem lietojumiem. Ed. 3., stereotipiski. - M.: Nauka, 1969. - 512 lpp.

6. Normens Drapers, Harijs Smits Lietišķā regresijas analīze. Vairākkārtēja regresija = Lietišķā regresijas analīze. - 3. izdevums. - M.: “Dialektika”, 2007. - Lpp. 912. - ISBN 0-471-17082-8

Skatīt arī

Wikimedia fonds. 2010. gads.

  • Jat-Kha
  • Amalgama (nozīmējums)

Skatiet, kas ir “statistikas metodes” citās vārdnīcās:

    STATISTISKĀS METODES- STATISTISKĀS METODES zinātniskas metodes masu parādību aprakstīšanai un izpētei, kas ļauj izteikt kvantitatīvu (skaitlisku) izteiksmi. Vārdam “statistika” (no Igal. stato valsts) ir kopīga sakne ar vārdu “valsts”. Sākotnēji tas...... Filozofiskā enciklopēdija

    STATISTISKĀS METODES -- zinātniskas masu parādību aprakstīšanas un izpētes metodes, kas ļauj izteikt kvantitatīvu (skaitlisku) izteiksmi. Vārdam “statistika” (no itāļu valodas stato – valsts) ir kopīga sakne ar vārdu “valsts”. Sākotnēji tas bija saistīts ar vadības zinātni un... Filozofiskā enciklopēdija

    Statistikas metodes- (ekoloģijā un biocenoloģijā) variāciju statistikas metodes, kas ļauj pētīt kopumu (piemēram, fitocenozi, populāciju, produktivitāti) pēc tā daļējiem agregātiem (piemēram, pēc reģistrācijas vietās iegūtajiem datiem) un novērtēt precizitātes pakāpe.... Ekoloģiskā vārdnīca

    statistikas metodes- (psiholoģijā) (no latīņu statusa stāvokļa) noteiktas lietišķās matemātiskās statistikas metodes, ko psiholoģijā izmanto galvenokārt eksperimentālo rezultātu apstrādei. S. m izmantošanas galvenais mērķis ir palielināt secinājumu derīgumu ... ... Lieliska psiholoģiskā enciklopēdija

    Statistikas metodes- 20.2. Statistikas metodes Konkrētas statistikas metodes, ko izmanto, lai organizētu, regulētu un pārbaudītu darbības, ietver, bet neaprobežojas ar: a) eksperimentu plānošanu un faktoru analīzi; b) dispersijas analīze un... Normatīvās un tehniskās dokumentācijas terminu vārdnīca-uzziņu grāmata

    STATISTISKĀS METODES- daudzumu izpētes metodes. masu sabiedrību aspekti. parādības un procesi. S.m. ļauj digitālā izteiksmē raksturot sabiedrībā notiekošās pārmaiņas. procesus, pētīt dažādus. sociāli ekonomiskās formas. modeļi, izmaiņas ... ... Lauksaimniecības enciklopēdiskā vārdnīca

    STATISTISKĀS METODES- dažas lietišķās matemātiskās statistikas metodes, ko izmanto eksperimentālo rezultātu apstrādei. Ir izstrādātas vairākas statistikas metodes speciāli psiholoģisko testu kvalitātes pārbaudei, izmantošanai profesionālajā... ... Profesionālā izglītība. Vārdnīca

    STATISTISKĀS METODES- (inženierpsiholoģijā) (no latīņu valodas statusa) dažas lietišķās statistikas metodes, ko izmanto inženierpsiholoģijā eksperimentālo rezultātu apstrādei. S. m izmantošanas galvenais mērķis ir palielināt secinājumu derīgumu ... ... Enciklopēdiskā psiholoģijas un pedagoģijas vārdnīca

1. daļa. Lietišķās statistikas pamatojums

1.2.3. Lēmumu pieņemšanas varbūtības-statistisko metožu būtība

Kā lēmumu pieņemšanā tiek izmantotas varbūtību teorijas un matemātiskās statistikas pieejas, idejas un rezultāti?

Pamats ir reālas parādības vai procesa varbūtības modelis, t.i. matemātisks modelis, kurā objektīvās attiecības tiek izteiktas ar varbūtību teoriju. Varbūtības galvenokārt tiek izmantotas, lai aprakstītu nenoteiktības, kas jāņem vērā, pieņemot lēmumus. Tas attiecas gan uz nevēlamām iespējām (riskiem), gan pievilcīgām (“laimīgā iespēja”). Dažreiz nejaušība tiek apzināti ieviesta situācijā, piemēram, izlozējot, nejauši izvēloties vienības kontrolei, veicot loterijas vai veicot patērētāju aptaujas.

Varbūtību teorija ļauj izmantot vienu varbūtību, lai aprēķinātu citas pētnieku interesējošās varbūtības. Piemēram, izmantojot varbūtību iegūt ģerboni, var aprēķināt varbūtību, ka ar 10 monētu mešanām jūs iegūsit vismaz 3 ģerboņus. Šāds aprēķins ir balstīts uz varbūtības modeli, saskaņā ar kuru monētu mešanu apraksta ar neatkarīgu izmēģinājumu modeli, turklāt ģerbonis un jaucējzīmes ir vienlīdz iespējamas, un tāpēc katra notikuma iespējamība ir vienāda līdz ½. Sarežģītāks modelis ir tāds, kurā monētas mētāšanas vietā tiek apsvērta ražošanas vienības kvalitātes pārbaude. Atbilstošais varbūtības modelis ir balstīts uz pieņēmumu, ka dažādu ražošanas vienību kvalitātes kontroli apraksta neatkarīga testēšanas shēma. Atšķirībā no monētu mešanas modeļa, ir nepieciešams ieviest jaunu parametru - varbūtību R ka prece ir bojāta. Modelis tiks pilnībā aprakstīts, ja pieņemsim, ka visām ražošanas vienībām ir vienāda iespējamība, ka tās būs bojātas. Ja pēdējais pieņēmums ir nepareizs, tad modeļa parametru skaits palielinās. Piemēram, varat pieņemt, ka katrai ražošanas vienībai ir sava defekta iespējamība.

Apspriedīsim kvalitātes kontroles modeli ar defektu iespējamību, kas ir kopīga visām ražošanas vienībām R. Lai, analizējot modeli, “tiktu līdz ciparam”, tas ir jānomaina R uz kādu konkrētu vērtību. Lai to izdarītu, ir nepieciešams iziet ārpus varbūtības modeļa un pievērsties datiem, kas iegūti kvalitātes kontroles laikā. Matemātiskā statistika atrisina apgriezto problēmu saistībā ar varbūtību teoriju. Tās mērķis ir, balstoties uz novērojumu (mērījumu, analīžu, testu, eksperimentu) rezultātiem, iegūt secinājumus par varbūtībām, kas ir varbūtības modeļa pamatā. Piemēram, pamatojoties uz defektīvu produktu rašanās biežumu pārbaudes laikā, var izdarīt secinājumus par defektu iespējamību (sk. Bernulli teorēmu iepriekš). Pamatojoties uz Čebiševa nevienlīdzību, tika izdarīti secinājumi par bojātu produktu rašanās biežuma atbilstību hipotēzei, ka defektu iespējamība iegūst noteiktu vērtību.

Tādējādi matemātiskās statistikas pielietojuma pamatā ir parādības vai procesa varbūtības modelis. Tiek izmantotas divas paralēlas jēdzienu sērijas - tās, kas saistītas ar teoriju (varbūtības modelis) un tās, kas saistītas ar praksi (novērojumu rezultātu izlase). Piemēram, teorētiskā varbūtība atbilst izlasē atrastajai frekvencei. Matemātiskā gaida (teorētiskā rinda) atbilst izlases vidējam aritmētiskajam (praktiskajai rindai). Parasti izlases raksturlielumi ir teorētisko raksturlielumu aprēķini. Tajā pašā laikā lielumi, kas saistīti ar teorētisko sēriju “ir pētnieku galvās”, attiecas uz ideju pasauli (pēc sengrieķu filozofa Platona domām), un nav pieejami tiešai mērīšanai. Pētniekiem ir tikai izlases dati, ar kuriem viņi mēģina noteikt teorētiskā varbūtības modeļa īpašības, kas viņus interesē.

Kāpēc mums ir vajadzīgs varbūtības modelis? Fakts ir tāds, ka tikai ar tās palīdzību no konkrēta parauga analīzes iegūtās īpašības var pārnest uz citiem paraugiem, kā arī uz visu tā saukto vispārējo populāciju. Termins "populācija" tiek lietots, atsaucoties uz lielu, bet ierobežotu pētāmo vienību kolekciju. Piemēram, par visu Krievijas iedzīvotāju kopumu vai visu Maskavas šķīstošās kafijas patērētāju kopumu. Mārketinga vai socioloģisko aptauju mērķis ir pārsūtīt apgalvojumus, kas iegūti no simtiem vai tūkstošiem cilvēku lielas izlases, uz vairākiem miljoniem cilvēku. Kvalitātes kontrolē produktu partija darbojas kā vispārēja kopa.

Lai pārsūtītu secinājumus no izlases uz lielāku populāciju, ir nepieciešami daži pieņēmumi par izlases raksturlielumu saistību ar šīs lielākās populācijas īpašībām. Šie pieņēmumi ir balstīti uz atbilstošu varbūtības modeli.

Protams, ir iespējams apstrādāt izlases datus, neizmantojot vienu vai otru varbūtības modeli. Piemēram, varat aprēķināt izlases vidējo aritmētisko, saskaitīt noteiktu nosacījumu izpildes biežumu utt. Tomēr aprēķinu rezultāti attieksies tikai uz konkrētu izlasi, ar to palīdzību iegūtos secinājumus pārnest uz jebkuru citu populāciju ir nepareizi. Šo darbību dažreiz sauc par "datu analīzi". Salīdzinot ar varbūtības-statistiskajām metodēm, datu analīzei ir ierobežota izglītojoša vērtība.

Tātad varbūtības-statistisko lēmumu pieņemšanas metožu būtība ir tādu varbūtības modeļu izmantošana, kuru pamatā ir hipotēžu novērtēšana un pārbaude, izmantojot izlases raksturlielumus.

Mēs uzsveram, ka izlases raksturlielumu izmantošanas loģika lēmumu pieņemšanai, pamatojoties uz teorētiskajiem modeļiem, ietver vienlaicīgu divu paralēlu jēdzienu sēriju izmantošanu, no kurām viena atbilst varbūtības modeļiem, bet otra - izlases datiem. Diemžēl vairākos literāros avotos, kas parasti ir novecojuši vai rakstīti receptes garā, nav nošķirti parauga un teorētiskie raksturlielumi, kas lasītājus rada neskaidrības un kļūdas statistikas metožu praktiskajā izmantošanā.

Iepriekšējais

Aplūkojamā metožu grupa ir vissvarīgākā socioloģiskajos pētījumos, šīs metodes tiek izmantotas gandrīz katrā socioloģiskajā pētījumā, ko var uzskatīt par patiesi zinātnisku. To mērķis galvenokārt ir empīriskās informācijas statistisko modeļu identificēšana, t.i. modeļi, kas tiek izpildīti “vidēji”. Patiesībā socioloģija nodarbojas ar “vidējā cilvēka” izpēti. Turklāt vēl viens svarīgs varbūtības un statistikas metožu izmantošanas mērķis socioloģijā ir izlases ticamības novērtēšana. Cik liela ir pārliecība, ka izlase sniedz vairāk vai mazāk precīzus rezultātus un kāda ir statistikas secinājumu kļūda?

Galvenais pētījuma objekts, pielietojot varbūtības un statistikas metodes, ir nejaušie mainīgie. Nejaušam lieluma iegūšana uz kādu vērtību ir nejaušs notikums– notikums, kas, ja šie nosacījumi ir izpildīti, var notikt vai nenotikt. Piemēram, ja sociologs veic aptaujas politisko preferenču jomā pilsētas ielā, tad notikums “nākamais respondents izrādās varas partijas atbalstītājs” ir nejaušs, ja iepriekš nekas no respondenta neatklāja viņa politiskās preferences. . Ja sociologs intervēja respondentu pie Reģionālās domes ēkas, tad notikums vairs nav nejaušs. Tiek raksturots nejaušs notikums varbūtība viņa ofensīva. Atšķirībā no klasiskajām problēmām, kas saistītas ar kauliņu un kāršu kombinācijām, ko māca varbūtības kursos, socioloģiskajos pētījumos varbūtības aprēķināšana nav tik vienkārša.

Vissvarīgākais varbūtības empīriskā novērtējuma pamats ir biežuma tendence uz varbūtību, ja ar biežumu mēs saprotam attiecību, cik reižu notikums ir noticis, un cik reižu tas teorētiski varēja notikt. Piemēram, ja no 500 pilsētas ielās nejauši izvēlētajiem respondentiem 220 izrādījās varas partijas atbalstītāji, tad šādu respondentu sastopamības biežums ir 0,44. Kad pietiekami liela izmēra reprezentatīvs paraugs mēs iegūsim aptuveno notikuma iespējamību vai aptuveno to cilvēku īpatsvaru, kuriem piemīt noteikta iezīme. Mūsu piemērā ar labi atlasītu izlasi mēs atklājam, ka aptuveni 44% pilsoņu ir pie varas esošās partijas atbalstītāji. Protams, tā kā ne visi iedzīvotāji tika aptaujāti un daži, iespējams, aptaujas laikā ir melojuši, ir kāda kļūda.

Apskatīsim dažas problēmas, kas rodas empīrisko datu statistiskajā analīzē.

Lieluma sadalījuma novērtējums

Ja noteiktu raksturlielumu var izteikt kvantitatīvi (piemēram, pilsoņa politiskā aktivitāte kā vērtība, kas parāda, cik reizes pēdējo piecu gadu laikā viņš piedalījies dažāda līmeņa vēlēšanās), tad var izvirzīt uzdevumu izvērtēt sadales likumu. šo raksturlielumu kā gadījuma lielumu. Citiem vārdiem sakot, sadales likums parāda, kuras vērtības daudzums aizņem biežāk un kuras retāk un cik bieži/retāk. Visbiežāk sastopams gan tehnoloģijās un dabā, gan sabiedrībā parastās sadales likums. Tās formula un īpašības ir norādītas jebkurā statistikas mācību grāmatā un attēlā. 10.1 parāda diagrammas izskatu - tā ir “zvanveida” līkne, kas var būt vairāk “izstiepta” uz augšu vai vairāk “izsmērēta” pa nejaušā lieluma vērtību asi. Parastā likuma būtība ir tāda, ka visbiežāk nejaušajam mainīgajam ir vērtības, kas ir tuvu kādai “centrālajai” vērtībai, ko sauc par matemātiskās cerības, un jo tālāk no tā, jo retāk vērtība tur “nokļūst”.

Ir daudz piemēru sadalījumam, ko var pieņemt kā normālu ar nelielu kļūdu. Vēl 19. gadsimtā. Beļģu zinātnieks A. Kvetele un anglis F. Galtons pierādīja, ka jebkura demogrāfiskā vai antropometriskā rādītāja (mūža ilgums, augums, vecums laulībā u.c.) frekvenču sadalījumu raksturo “zvanveida” sadalījums. Tas pats F. Galtons un viņa sekotāji pierādīja, ka psiholoģiskās īpašības, piemēram, spējas, pakļaujas parastajam likumam.

Rīsi. 10.1.

Piemērs

Spilgtākais normāla sadalījuma piemērs socioloģijā attiecas uz cilvēku sociālo aktivitāti. Atbilstoši normālā sadalījuma likumam izrādās, ka sabiedrībā sociāli aktīvi cilvēki parasti ir aptuveni 5–7%. Visi šie sabiedriski aktīvie cilvēki brauc uz mītiņiem, konferencēm, semināriem utt. Apmēram tikpat daudz ir vispār izslēgti no līdzdalības sabiedriskajā dzīvē. Lielākajai daļai cilvēku (80–90%), šķiet, ir vienaldzīga politika un sabiedriskā dzīve, taču viņi seko līdzi sev interesējošiem procesiem, lai gan kopumā ir atrauta attieksme pret politiku un sabiedrību un neizrāda būtisku aktivitāti. Šādi cilvēki nokavē lielāko daļu politisko notikumu, bet laiku pa laikam skatās ziņas televīzijā vai internetā. Viņi arī dodas balsot svarīgākajās vēlēšanās, īpaši, ja viņiem "draud ar nūju" vai "mudina ar burkānu". Šo 80–90% dalībnieki individuāli no sociālpolitiskā viedokļa ir gandrīz bezjēdzīgi, taču socioloģisko pētījumu centri par šiem cilvēkiem ir diezgan ieinteresēti, jo viņu ir daudz, un viņu vēlmes nevar ignorēt. Tas pats attiecas uz pseidozinātniskām organizācijām, kas veic pētījumus pēc politiķu vai tirdzniecības korporāciju pasūtījumiem. Un nav vienaldzīgs “pelēkās masas” viedoklis par galvenajiem jautājumiem, kas saistīti ar daudzu tūkstošu un miljonu cilvēku uzvedības prognozēšanu vēlēšanās, kā arī akūtu politisko notikumu laikā, sabiedrības šķelšanās un dažādu politisko spēku konfliktu laikā. uz šiem centriem.

Protams, ne visas vērtības tiek sadalītas atbilstoši normālajam sadalījumam. Turklāt matemātiskajā statistikā vissvarīgākie ir binomiālie un eksponenciālie sadalījumi, Fišera-Snedekora, Hī kvadrāta un Studenta sadalījumi.

Pazīmju attiecību novērtējums

Vienkāršākais gadījums ir tad, kad jums vienkārši ir jānosaka savienojuma esamība/neesamība. Populārākā metode šajā ziņā ir Chi-square metode. Šī metode ir vērsta uz darbu ar kategoriskiem datiem. Piemēram, tie nepārprotami ir dzimums un ģimenes stāvoklis. Daži dati no pirmā acu uzmetiena šķiet skaitliski, taču tos var "pārvērst" kategoriskos datos, sadalot vērtību diapazonu vairākos nelielos intervālos. Piemēram, rūpnīcas pieredzi var iedalīt mazāk nekā vienu gadu, vienu līdz trīs gadus, trīs līdz sešus gadus un vairāk nekā sešus gadus.

Ļaujiet parametram X pieejams P iespējamās vērtības: (x1,..., X r1) un parametrs Y–t iespējamās vērtības: (y1,..., plkst T) , q ij ir novērotais pāra sastopamības biežums ( x es, plkst j), t.i. šāda pāra konstatēto gadījumu skaits. Mēs aprēķinām teorētiskās frekvences, t.i. cik reizes katram vērtību pārim jāparādās absolūti nesaistītiem lielumiem:

Pamatojoties uz novērotajām un teorētiskajām frekvencēm, mēs aprēķinām vērtību

Jums arī jāaprēķina summa brīvības pakāpes saskaņā ar formulu

Kur m, n– tabulā iekļauto kategoriju skaits. Turklāt mēs izvēlamies nozīmīguma līmenis. Jo augstāks uzticamība mēs vēlamies iegūt, jo zemāks nozīmes līmenis ir jāņem. Parasti tiek izvēlēta vērtība 0,05, kas nozīmē, ka mēs varam uzticēties rezultātiem ar varbūtību 0,95. Tālāk atsauces tabulās mēs atrodam kritisko vērtību pēc brīvības pakāpju skaita un nozīmīguma līmeņa. Ja , tad parametri X Un Y tiek uzskatīti par neatkarīgiem. Ja , tad parametri X Un Y – atkarīgi. Ja, tad ir bīstami izdarīt secinājumus par parametru atkarību vai neatkarību. Pēdējā gadījumā ir ieteicams veikt papildu pētījumus.

Ņemiet vērā arī to, ka Hī kvadrāta testu var izmantot ar ļoti augstu ticamību tikai tad, ja visas teorētiskās frekvences nav zemākas par doto slieksni, ko parasti uzskata par 5. Ļaujiet v ir minimālā teorētiskā frekvence. Ja v > 5, var droši izmantot Hī kvadrāta testu. Pie v< 5 использование критерия становится нежелательным. При v ≥ 5 вопрос остается открытым, требуется дополнительное исследование о применимости критерия "Хи-квадрат".

Sniegsim piemēru par Chi kvadrāta metodes izmantošanu. Piemēram, kādā pilsētā tika veikta vietējo futbola komandu jauno līdzjutēju aptauja un iegūti šādi rezultāti (10.1. tabula).

Izvirzīsim hipotēzi par pilsētas jauniešu futbola preferenču neatkarību N no respondenta dzimuma standarta nozīmīguma līmenī 0,05. Aprēķinām teorētiskās frekvences (10.2. tabula).

10.1. tabula

Līdzjutēju aptaujas rezultāti

10.2. tabula

Teorētiskās izvēles frekvences

Piemēram, teorētiskā frekvence Zvezda jauniešu faniem tiek iegūta kā

līdzīgi - citas teorētiskās frekvences. Tālāk mēs aprēķinām Chi kvadrāta vērtību:

Mēs nosakām brīvības pakāpju skaitu. Ja nozīmīguma līmenis ir 0,05, mēs meklējam kritisko vērtību:

Tā kā pārsvars ir ievērojams, mēs gandrīz droši varam teikt, ka pilsētas zēnu un meiteņu futbola preferences N ievērojami atšķiras, izņemot nereprezentatīvas izlases gadījumā, piemēram, ja pētnieks nav ieguvis izlasi no dažādām pilsētas teritorijām, aprobežojoties ar respondentu interviju savā blokā.

Sarežģītāka situācija ir tad, kad jums ir nepieciešams kvantitatīvi noteikt savienojuma stiprumu. Šajā gadījumā bieži tiek izmantotas metodes korelācijas analīze.Šīs metodes parasti tiek apspriestas matemātiskās statistikas padziļinātajos kursos.

Atkarību tuvināšana, izmantojot punktu datus

Lai ir punktu kopa - empīriski dati ( X es, yi), i = 1, ..., P. Ir nepieciešams tuvināt parametra reālo atkarību plkst no parametra X, un arī izstrādāt noteikumu vērtības aprēķināšanai y, Kad X atrodas starp diviem "mezgliem" Xi.

Problēmas risināšanai ir divas principiāli atšķirīgas pieejas. Pirmais ir tas, ka starp dotās saimes funkcijām (piemēram, polinomiem) tiek atlasīta funkcija, kuras grafiks iet caur esošajiem punktiem. Otrā pieeja “neliek” funkcijas grafikam iziet cauri punktiem. Populārākā metode socioloģijā un vairākās citās zinātnēs ir mazāko kvadrātu metode– pieder pie otrās metožu grupas.

Mazāko kvadrātu metodes būtība ir šāda. Dota funkciju saime plkst(x, a 1, ..., A t) ar m nenoteikti koeficienti. Nepieciešams izvēlēties nenoteiktus koeficientus, risinot optimizācijas uzdevumu

Minimālā funkcijas vērtība d var darboties kā tuvinājuma precizitātes mērs. Ja šī vērtība ir pārāk augsta, ir jāizvēlas cita funkciju klase plkst vai paplašināt izmantoto klasi. Piemēram, ja klase “polinomi, kuru pakāpe nav augstāka par 3” nenodrošināja pieņemamu precizitāti, mēs izmantojam klasi “polinomi, kuru pakāpe nav augstāka par 4” vai pat “polinomi, kuru pakāpe nav augstāka par 5”.

Visbiežāk metode tiek izmantota saimei “polinomi, kuru pakāpe nav augstāka par N":

Piemēram, kad N= 1 ir lineāru funkciju saime ar N = 2 – lineāro un kvadrātisko funkciju saime, ar N = 3 – lineāro, kvadrātisko un kubisko funkciju saime. Ļaujiet

Tad lineārās funkcijas koeficienti ( N= 1) tiek meklēti kā risinājums lineāro vienādojumu sistēmai

Formas funkcijas koeficienti A 0 + a 1x + a 2X 2 (N= 2) tiek meklēti kā sistēmas risinājums

Tie, kas vēlas piemērot šo metodi patvaļīgai vērtībai N var to izdarīt, redzot modeli, saskaņā ar kuru tiek apkopotas dotās vienādojumu sistēmas.

Sniegsim mazāko kvadrātu metodes izmantošanas piemēru. Ļaujiet noteiktas politiskās partijas numuram mainīties šādi:

Var atzīmēt, ka partijas lieluma izmaiņas dažādos gados nav īpaši atšķirīgas, kas ļauj tuvināt atkarību ar lineāro funkciju. Lai būtu vieglāk aprēķināt, nevis mainīgo X– gads – ievadiet mainīgo t = x – 2010., t.i. Ņemsim pirmo skaitīšanas gadu kā “nulle”. Mēs aprēķinām M 1; M 2:

Tagad mēs aprēķinām M", M*:

Likmes a 0, a 1 funkcijas y = a 0t + A 1 tiek aprēķināti kā vienādojumu sistēmas risinājums

Atrisinot šo sistēmu, piemēram, izmantojot Krāmera kārtulu vai aizstāšanas metodi, mēs iegūstam: A 0 = 11,12; A 1 = 3,03. Tādējādi mēs iegūstam tuvinājumu

kas ļauj ne tikai darboties ar vienu funkciju, nevis empīrisku punktu kopu, bet arī aprēķināt funkciju vērtības, kas pārsniedz sākotnējo datu robežas - "paredzēt nākotni".

Ņemiet vērā arī to, ka mazāko kvadrātu metodi var izmantot ne tikai polinomiem, bet arī citām funkciju grupām, piemēram, logaritmiem un eksponenciāliem:

Modeļa ticamības pakāpi, kas konstruēts, izmantojot mazāko kvadrātu metodi, var noteikt, pamatojoties uz R kvadrātu lielumu vai determinācijas koeficientu. To aprēķina kā

Šeit . Tuvāk R 2 pret 1, jo atbilstošāks modelis.

Ārkārtas noteikšana

Datu sērijas izņēmums ir anomāla vērtība, kas krasi izceļas vispārējā izlasē vai vispārējā sērijā. Piemēram, lai valsts pilsoņu procentuālais daudzums, kuriem ir pozitīva attieksme pret noteiktu politiķi, ir 2008.–2013. attiecīgi 15, 16, 12, 30, 14 un 12%. Ir viegli pamanīt, ka viena no vērtībām krasi atšķiras no visām pārējām. 2011.gadā politiķa reitings nez kāpēc krasi pārsniedza ierastās vērtības, kas bija 12–16% robežās. Emisiju klātbūtne var būt dažādu iemeslu dēļ:

  • 1)mērījumu kļūdas;
  • 2) ievaddatu neparastais raksturs(piemēram, analizējot politiķa saņemto balsu vidējo procentuālo daļu; šī vērtība vēlēšanu iecirknī militārajā vienībā var būtiski atšķirties no vidējās vērtības pilsētā);
  • 3) likuma sekas(vērtības, kas krasi atšķiras no pārējām, var noteikt ar matemātisku likumu - piemēram, normālā sadalījuma gadījumā izlasē var iekļaut objektu, kura vērtība krasi atšķiras no vidējās);
  • 4) katastrofas(piemēram, īslaicīgas, bet asas politiskās konfrontācijas periodā iedzīvotāju politiskās aktivitātes līmenis var krasi mainīties, kā tas notika 2000.–2005. gada “krāsaino revolūciju” un 2011. gada “arābu pavasara” laikā);
  • 5) kontroles darbības(piemēram, ja gadā pirms pētījuma kāds politiķis pieņēma ļoti populāru lēmumu, tad šogad viņa reitings var būt ievērojami augstāks nekā citus gadus).

Daudzas datu analīzes metodes nav izturīgas pret novirzēm, tāpēc, lai tās izmantotu efektīvi, dati ir jānotīra no novirzēm. Spilgts nestabilas metodes piemērs ir iepriekš minētā mazāko kvadrātu metode. Vienkāršākā metode izņēmumu meklēšanai ir balstīta uz t.s starpkvartiļu attālums. Diapazona noteikšana

Kur J m nozīmē T- kvartile. Ja kāds sērijas dalībnieks neietilpst diapazonā, tas tiek uzskatīts par izņēmumu.

Paskaidrosim ar piemēru. Kvartiļu nozīme ir tāda, ka tās sadala virkni četrās vienādās vai aptuveni vienādās grupās: pirmā kvartile “atdala” sērijas kreiso ceturtdaļu, sakārtota augošā secībā, trešā kvartile atdala sērijas labo ceturtdaļu, otrā kvartile. skrien pa vidu. Paskaidrosim, kā meklēt J 1, un J 3. Ielaidiet skaitļu virkni, kas sakārtotas augošā secībā P vērtības. Ja n + 1 dalās ar 4 bez atlikuma, tad J k esma k(P+ 1)/4. sērijas termiņš. Piemēram, ņemot vērā sēriju: 1, 2, 5, 6, 7, 8, 10, 11, 13, 15, 20, šeit ir terminu skaits n = 11. Tad ( P+ 1)/4 = 3, t.i. pirmā kvartile J 1 = 5 – sērijas trešais termiņš; 3( n + 1)/4 = 9, t.i. trešā kvartile Q:i= 13 – sērijas devītais dalībnieks.

Lieta ir nedaudz sarežģītāka, kad n + 1 nav reizināts ar 4. Piemēram, ņemot vērā virkni 2, 3, 5, 6, 7, 8, 9, 30, 32, 100, kur terminu skaits P= 10. Tad ( P + 1)/4 = 2,75 -

pozīcija starp sērijas otro locekli (v2 = 3) un sērijas trešo locekli (v3 = 5). Tad mēs ņemam vērtību 0,75v2 + 0,25v3 = 0,75 3 + 0,25 5 = 3,5 - tas būs J 1. 3(P+ 1)/4 = 8,25 – pozīcija starp sērijas astoto locekli (v8= 30) un devīto sērijas locekli (v9=32). Mēs ņemam vērtību 0,25v8 + 0,75v9 = 0,25 30 + + 0,75 32 = 31,5 — tas būs J 3. Ir arī citas aprēķina iespējas J 1 un J 3, taču ieteicams izmantot šeit piedāvāto opciju.

  • Stingri sakot, praksē parasti ir sastopams “aptuveni” normāls likums - tā kā normāls likums ir definēts nepārtrauktam daudzumam pa visu reālo asi, daudzi reālie lielumi nevar strikti apmierināt normāli sadalītu lielumu īpašības.
  • Nasļedovs A.D. Psiholoģiskās izpētes matemātiskās metodes. Datu analīze un interpretācija: mācību grāmata, rokasgrāmata. Sanktpēterburga: Rech, 2004. 49.–51.lpp.
  • Par svarīgākajiem nejaušo mainīgo sadalījumiem skatiet, piemēram: Orlovs A.I. Nejaušības matemātika: varbūtība un statistika - pamatfakti: mācību grāmata. pabalstu. M.: MZ-Press, 2004.

Kā tiek izmantota varbūtību teorija un matemātiskā statistika?Šīs disciplīnas ir lēmumu pieņemšanas varbūtības un statistikas metožu pamatā. Lai izmantotu to matemātisko aparātu, lēmumu pieņemšanas problēmas ir jāizsaka varbūtības-statistisko modeļu veidā. Konkrētas varbūtības-statistikas lēmumu pieņemšanas metodes pielietošana sastāv no trim posmiem:

Pāreja no ekonomiskās, vadības, tehnoloģiskās realitātes uz abstraktu matemātisko un statistisko shēmu, t.i. kontroles sistēmas varbūtības modeļa konstruēšana, tehnoloģiskais process, lēmumu pieņemšanas procedūra, īpaši pamatojoties uz statistiskās kontroles rezultātiem u.c.

Aprēķinu veikšana un secinājumu izdarīšana, izmantojot tīri matemātiskus līdzekļus varbūtiskā modeļa ietvaros;

Matemātisko un statistisko secinājumu interpretācija saistībā ar reālo situāciju un atbilstoša lēmuma pieņemšana (piemēram, par preces kvalitātes atbilstību vai neatbilstību noteiktajām prasībām, tehnoloģiskā procesa pielāgošanas nepieciešamību u.c.), jo īpaši, secinājumi (par bojāto izstrādājumu vienību īpatsvaru partijā, par specifisku tehnoloģiskā procesa kontrolēto parametru sadalījuma likumu formu utt.).

Matemātiskajā statistikā tiek izmantoti varbūtības teorijas jēdzieni, metodes un rezultāti. Apskatīsim galvenos jautājumus par lēmumu pieņemšanas varbūtības modeļu konstruēšanu ekonomiskajās, vadības, tehnoloģiskajās un citās situācijās. Lai aktīvi un pareizi izmantotu normatīvo, tehnisko un instrukciju dokumentus par varbūtības un statistikas lēmumu pieņemšanas metodēm, ir nepieciešamas priekšzināšanas. Līdz ar to ir jāzina, kādos apstākļos konkrēts dokuments ir jāizmanto, kādai sākotnējai informācijai jābūt tā izvēlei un piemērošanai, kādi lēmumi jāpieņem, pamatojoties uz datu apstrādes rezultātiem utt.

Lietojumprogrammu piemēri varbūtību teorija un matemātiskā statistika. Apskatīsim vairākus piemērus, kur varbūtības-statistiskie modeļi ir labs instruments vadības, ražošanas, ekonomikas un tautsaimniecības problēmu risināšanai. Tā, piemēram, A.N.Tolstoja romānā “Pastaiga cauri mokām” (1.sēj.) teikts: “Darbnīcā tiek ražoti divdesmit trīs procenti atkritumu, jūs pieturaties pie šī skaitļa,” Ivanam Iļjičam sacīja Strukovs.

Rodas jautājums, kā šos vārdus saprast rūpnīcas vadītāju sarunā, jo vienai produkcijas vienībai nevar būt 23% defektu. Tas var būt labs vai bojāts. Strukovs, iespējams, domāja, ka liela apjoma partijā ir aptuveni 23% bojātu produkcijas vienību. Tad rodas jautājums, ko nozīmē “aptuveni”? Lai 30 no 100 pārbaudītajām produkcijas vienībām izrādās brāķa, vai no 1000 - 300, vai no 100 000 - 30 000 utt., vai Strukovu apsūdz melos?

Vai cits piemērs. Monētai, ko izmanto kā partiju, jābūt “simetriskai”, t.i. metot to, vidēji pusē gadījumu jāparādās ģerbonim, pusē gadījumu - hash (astes, numurs). Bet ko nozīmē “vidēji”? Ja katrā sērijā veicat daudzas 10 metienu sērijas, tad bieži vien sastapsities sērijās, kurās monēta 4 reizes piezemējas kā ģerbonis. Simetriskai monētai tas notiks 20,5% skrējienu. Un, ja pēc 100 000 metieniem ir 40 000 ģerboņu, vai monētu var uzskatīt par simetrisku? Lēmumu pieņemšanas procedūra balstās uz varbūtību teoriju un matemātisko statistiku.

Attiecīgais piemērs var nešķist pietiekami nopietns. Tomēr tā nav. Lozēšana tiek plaši izmantota rūpnieciski tehnisko un ekonomisko eksperimentu organizēšanā, piemēram, apstrādājot gultņu kvalitātes rādītāja (berzes griezes momenta) mērīšanas rezultātus atkarībā no dažādiem tehnoloģiskiem faktoriem (saglabāšanas vides ietekme, gultņu sagatavošanas metodes pirms mērīšanas). , gultņu slodžu ietekme mērīšanas procesā utt.). P.). Teiksim, ir jāsalīdzina gultņu kvalitāte atkarībā no to uzglabāšanas rezultātiem dažādās konservēšanas eļļās, t.i. kompozīcijas eļļās A Un IN. Plānojot šādu eksperimentu, rodas jautājums, kādus gultņus vajadzētu ievietot kompozīcijas eļļā A, un kuras - eļļas sastāvā IN, bet tā, lai izvairītos no subjektivitātes un nodrošinātu pieņemtā lēmuma objektivitāti.

Atbildi uz šo jautājumu var iegūt, izlozējot. Līdzīgu piemēru var sniegt ar jebkura produkta kvalitātes kontroli. Lai izlemtu, vai kontrolētā produktu partija atbilst vai neatbilst noteiktajām prasībām, no tās tiek atlasīts paraugs. Pamatojoties uz parauga kontroles rezultātiem, tiek izdarīts secinājums par visu partiju. Šajā gadījumā, veidojot paraugu, ir ļoti svarīgi izvairīties no subjektivitātes, tas ir, ir nepieciešams, lai katrai produkta vienībai kontrolētajā partijā būtu vienāda iespēja tikt atlasītai paraugam. Ražošanas apstākļos produkcijas vienību atlase paraugam parasti notiek nevis izlozē, bet gan pēc speciālām nejaušo skaitļu tabulām vai izmantojot datora nejaušo skaitļu sensorus.

Līdzīgas salīdzināšanas objektivitātes nodrošināšanas problēmas rodas, salīdzinot dažādas ražošanas organizēšanas shēmas, atalgojumu, konkursu un konkursu laikā, atlasot kandidātus uz vakantajiem amatiem u.c. Visur mums vajag izlozi vai līdzīgas procedūras. Paskaidrosim ar piemēru par spēcīgāko un otro spēcīgāko komandu noteikšanu, organizējot turnīru pēc olimpiskās sistēmas (zaudētājs tiek izslēgts). Lai stiprākā komanda vienmēr uzvar vājāko. Skaidrs, ka par čempioni noteikti kļūs spēcīgākā komanda. Otrā spēcīgākā komanda finālu sasniegs tad un tikai tad, ja tai pirms fināla nebūs spēļu ar topošo čempioni. Ja šāda spēle ir paredzēta, otrā spēcīgākā komanda finālā neiekļūs. Tas, kurš plāno turnīru, var vai nu priekšlaicīgi “izsist” no turnīra otro spēcīgāko komandu, pirmajā tikšanās reizē sastādot to ar līderi, vai arī nodrošināt tai otro vietu, nodrošinot tikšanās ar vājākām komandām līdz pat spēles beigām. galīgais. Lai izvairītos no subjektivitātes, tiek veikta izloze. 8 komandu turnīrā iespējamība, ka finālā tiksies divas labākās komandas, ir 4/7. Attiecīgi ar varbūtību 3/7 otrā spēcīgākā komanda turnīru pametīs priekšlaicīgi.

Jebkurš produkta mērvienību mērījums (izmantojot suportu, mikrometru, ampērmetru utt.) satur kļūdas. Lai noskaidrotu, vai ir sistemātiskas kļūdas, ir jāveic atkārtoti mērījumi preces vienībai, kuras īpašības ir zināmas (piemēram, standarta paraugam). Jāatceras, ka papildus sistemātiskai kļūdai ir arī nejauša kļūda.

Tāpēc rodas jautājums, kā pēc mērījumu rezultātiem noskaidrot, vai nav sistemātiskas kļūdas. Ja mēs tikai atzīmējam, vai nākamā mērījuma laikā iegūtā kļūda ir pozitīva vai negatīva, tad šo uzdevumu var samazināt līdz iepriekšējam. Patiešām, salīdzināsim mērījumu ar monētas mešanu, pozitīvu kļūdu ar ģerboņa nozaudēšanu, negatīvu kļūdu ar režģi (nulles kļūda ar pietiekamu skalas iedalījumu skaitu gandrīz nekad nenotiek). Tad sistemātisku kļūdu neesamības pārbaude ir līdzvērtīga monētas simetrijas pārbaudei.

Šo apsvērumu mērķis ir samazināt sistemātiskas kļūdas neesamības pārbaudes problēmu līdz monētas simetrijas pārbaudes problēmai. Iepriekš minētais pamatojums noved pie tā sauktā “zīmes kritērija” matemātiskajā statistikā.

Tehnoloģisko procesu statistiskajā regulēšanā, pamatojoties uz matemātiskās statistikas metodēm, tiek izstrādāti statistikas procesa kontroles noteikumi un plāni, kuru mērķis ir savlaicīgi atklāt tehnoloģisko procesu problēmas un veikt pasākumus, lai tās pielāgotu un novērstu tādu produktu izlaišanu, kuri nedarbojas. atbilst noteiktajām prasībām. Šo pasākumu mērķis ir samazināt ražošanas izmaksas un zaudējumus no zemas kvalitātes vienību piegādes. Statistiskās pieņemšanas kontroles laikā, pamatojoties uz matemātiskās statistikas metodēm, tiek izstrādāti kvalitātes kontroles plāni, analizējot produktu partiju paraugus. Grūtības slēpjas spēju pareizi izveidot varbūtības-statistiskos lēmumu pieņemšanas modeļus, uz kuru pamata var atbildēt uz iepriekš uzdotajiem jautājumiem. Matemātiskajā statistikā šim nolūkam ir izstrādāti varbūtības modeļi un hipotēžu pārbaudes metodes, jo īpaši hipotēzes, ka bojāto produkcijas vienību īpatsvars ir vienāds ar noteiktu skaitu. R 0 , Piemēram, R 0 = 0,23 (atcerieties Strukova vārdus no A. N. Tolstoja romāna).

Vērtēšanas uzdevumi. Vairākās vadības, ražošanas, ekonomiskajās un tautsaimniecības situācijās rodas dažāda veida problēmas - varbūtības sadalījumu īpašību un parametru novērtēšanas problēmas.

Apskatīsim piemēru. Ļaujiet partijai N elektriskās lampas No šīs partijas paraugs no n elektriskās lampas Rodas vairāki dabiski jautājumi. Kā pēc paraugu elementu pārbaudes rezultātiem noteikt elektrisko spuldžu vidējo kalpošanas laiku un ar kādu precizitāti var novērtēt šo raksturlielumu? Kā mainīsies precizitāte, ja ņemsim lielāku paraugu? Pie kāda stundu skaita T var garantēt, ka vismaz 90% elektrisko lampu kalpos T un vēl stundas?

Pieņemsim, ka, pārbaudot izlases lielumu n elektriskās lampas izrādījās bojātas X elektriskās lampas Tad rodas šādi jautājumi. Kādas robežas var norādīt skaitlim? D bojātas spuldzes pa partijām, defektu līmenim D/ N un tā tālāk.?

Vai arī, statistiski analizējot tehnoloģisko procesu precizitāti un stabilitāti, ir jānovērtē tādi kvalitātes rādītāji kā kontrolējamā parametra vidējā vērtība un tā izkliedes pakāpe aplūkojamajā procesā. Saskaņā ar varbūtības teoriju kā gadījuma lieluma vidējo vērtību ieteicams izmantot tās matemātisko gaidu, bet kā izkliedes statistisko raksturlielumu dispersiju, standartnovirzi vai variācijas koeficientu. Tas rada jautājumu: kā novērtēt šos statistiskos raksturlielumus no izlases datiem un ar kādu precizitāti to var izdarīt? Var sniegt daudz līdzīgu piemēru. Šeit bija svarīgi parādīt, kā ražošanas vadībā var izmantot varbūtību teoriju un matemātisko statistiku, pieņemot lēmumus produktu kvalitātes statistiskās vadības jomā.

Kas ir "matemātiskā statistika"? Ar matemātisko statistiku saprot “matemātikas nozari, kas veltīta matemātiskām statistikas datu vākšanas, sistematizēšanas, apstrādes un interpretācijas metodēm, kā arī to izmantošanai zinātniskiem vai praktiskiem secinājumiem. Matemātiskās statistikas noteikumi un procedūras ir balstītas uz varbūtību teoriju, kas ļauj izvērtēt katrā uzdevumā iegūto secinājumu precizitāti un ticamību, pamatojoties uz pieejamo statistikas materiālu.” Šajā gadījumā statistikas dati attiecas uz informāciju par objektu skaitu jebkurā vairāk vai mazāk plašā kolekcijā, kam ir noteiktas pazīmes.

Pamatojoties uz risināmo problēmu veidu, matemātiskā statistika parasti tiek iedalīta trīs sadaļās: datu apraksts, novērtējums un hipotēžu pārbaude.

Pamatojoties uz apstrādāto statistikas datu veidu, matemātiskā statistika ir sadalīta četrās jomās:

Viendimensiju statistika (gadījuma lielumu statistika), kurā novērojuma rezultātu apraksta ar reālu skaitli;

Daudzfaktoru statistiskā analīze, kur objekta novērošanas rezultātu raksturo vairāki skaitļi (vektors);

Nejaušu procesu un laikrindu statistika, kur novērojuma rezultāts ir funkcija;

Neskaitliska rakstura objektu statistika, kurā novērojuma rezultāts ir neskaitlisks, piemēram, tā ir kopa (ģeometriska figūra), secība vai iegūta mērījuma rezultātā pēc kvalitatīva kritērija.

Vēsturiski pirmās parādījās dažas neskaitliskas dabas objektu statistikas jomas (jo īpaši defektu īpatsvara noteikšanas problēmas un hipotēžu pārbaude par to) un viendimensionālā statistika. Matemātiskais aparāts viņiem ir vienkāršāks, tāpēc to piemēru parasti izmanto, lai demonstrētu matemātiskās statistikas pamatidejas.

Tikai tās datu apstrādes metodes, t.i. matemātiskā statistika ir balstīta uz pierādījumiem, kuras pamatā ir attiecīgo reālo parādību un procesu varbūtības modeļi. Runa ir par patērētāju uzvedības modeļiem, risku rašanos, tehnoloģisko iekārtu darbību, eksperimentu rezultātu iegūšanu, slimības gaitu u.c. Reālas parādības varbūtības modelis jāuzskata par konstruētu, ja aplūkojamie lielumi un sakarības starp tiem ir izteiktas varbūtības teorijā. Atbilstība varbūtības realitātes modelim, t.i. tā atbilstība tiek pamatota, jo īpaši izmantojot statistikas metodes hipotēžu pārbaudei.

Nevarbūtības datu apstrādes metodes ir pētnieciskas, tās var izmantot tikai provizoriskā datu analīzē, jo neļauj novērtēt uz ierobežota statistikas materiāla pamata iegūto secinājumu precizitāti un ticamību.

Varbūtības un statistikas metodes ir piemērojamas visur, kur iespējams izveidot un pamatot parādības vai procesa varbūtības modeli. To izmantošana ir obligāta, ja secinājumi, kas izdarīti no izlases datiem, tiek nodoti visai populācijai (piemēram, no parauga uz visu produktu partiju).

Konkrētās pielietošanas jomās tiek izmantotas gan varbūtības, gan statistiskās vispārīgās un specifiskās metodes. Piemēram, ražošanas vadības sadaļā, kas veltīta produktu kvalitātes vadības statistiskajām metodēm, tiek izmantota lietišķā matemātiskā statistika (t.sk. eksperimentu projektēšana). Izmantojot tās metodes, tiek veikta tehnoloģisko procesu precizitātes un stabilitātes statistiskā analīze un statistiskā kvalitātes novērtēšana. Konkrētas metodes ietver produktu kvalitātes statistiskās pieņemšanas kontroles metodes, tehnoloģisko procesu statistisko regulēšanu, uzticamības novērtēšanu un kontroli u.c.

Plaši tiek izmantotas lietišķās varbūtības un statistikas disciplīnas, piemēram, uzticamības teorija un rindu teorija. Pirmās no tām saturs ir skaidrs no nosaukuma, otrā nodarbojas ar tādu sistēmu izpēti kā telefona centrāle, kas saņem zvanus nejaušos laikos - prasības abonentiem, kas sastāda numurus savos tālruņu aparātos. Šo prasību apkalpošanas ilgums, t.i. sarunu ilgums tiek modelēts arī ar nejaušiem mainīgajiem. Lielu ieguldījumu šo disciplīnu attīstībā sniedza PSRS Zinātņu akadēmijas korespondentloceklis A.Ya. Khinčins (1894-1959), Ukrainas PSR Zinātņu akadēmijas akadēmiķis B.V.Gņedenko (1912-1995) un citi pašmāju zinātnieki.

Īsi par matemātiskās statistikas vēsturi. Matemātiskā statistika kā zinātne sākas ar slavenā vācu matemātiķa Karla Frīdriha Gausa (1777-1855) darbiem, kurš, balstoties uz varbūtību teoriju, pētīja un pamatoja viņa 1795. gadā izveidoto mazāko kvadrātu metodi, ko izmantoja astronomisko datu apstrādei ( lai noskaidrotu mazas planētas Cereras orbītu). Viņa vārdā bieži tiek nosaukts viens no populārākajiem varbūtību sadalījumiem, parastais, un nejaušo procesu teorijā galvenais izpētes objekts ir Gausa procesi.

19. gadsimta beigās. - 20. gadsimta sākums Lielu ieguldījumu matemātiskajā statistikā sniedza angļu pētnieki, galvenokārt K. Pīrsons (1857-1936) un R. A. Fišers (1890-1962). Konkrēti, Pīrsons izstrādāja hī kvadrāta testu statistisko hipotēžu pārbaudei, un Fišers izstrādāja dispersijas analīzi, eksperimentālā dizaina teoriju un maksimālās varbūtības metodi parametru novērtēšanai.

Divdesmitā gadsimta 30. gados. Polis Džerijs Neimans (1894-1977) un anglis E. Pīrsons izstrādāja vispārīgo statistisko hipotēžu pārbaudes teoriju, un padomju matemātiķi akadēmiķis A.N. Kolmogorovs (1903-1987) un PSRS Zinātņu akadēmijas korespondents biedrs Ņ.V. Smirnovs (1900-1966) lika pamatus neparametriskai statistikai. Divdesmitā gadsimta četrdesmitajos gados. Rumānis A. Valds (1902-1950) izveidoja secīgās statistiskās analīzes teoriju.

Matemātiskā statistika šobrīd strauji attīstās. Tādējādi pēdējo 40 gadu laikā var izdalīt četras principiāli jaunas pētniecības jomas:

Matemātisko metožu izstrāde un ieviešana eksperimentu plānošanai;

Neskaitliskas dabas objektu statistikas kā patstāvīga virziena attīstība lietišķajā matemātiskajā statistikā;

Statistisko metožu izstrāde, kas ir izturīgas pret nelielām novirzēm no izmantotā varbūtības modeļa;

Plaši attīstīts darbs pie datoru programmatūras pakotņu izveides, kas paredzētas statistikas datu analīzei.

Varbūtības-statistiskās metodes un optimizācija. Optimizācijas ideja caurstrāvo mūsdienu lietišķo matemātisko statistiku un citas statistikas metodes. Proti, eksperimentu plānošanas metodes, statistiskā pieņemšanas kontrole, tehnoloģisko procesu statistiskā regulēšana u.c. Savukārt optimizācijas formulējumi lēmumu pieņemšanas teorijā, piemēram, pielietotā produktu kvalitātes optimizācijas un standarta prasību teorija, paredz plaši izplatītas varbūtības statistikas metodes, galvenokārt pielietotā matemātiskā statistika.

Ražošanas vadībā, it īpaši, optimizējot produktu kvalitāti un standarta prasības, īpaši svarīgi ir pielietot statistikas metodes produkta dzīves cikla sākumposmā, t.i. eksperimentālā dizaina izstrāžu izpētes sagatavošanas stadijā (perspektīvu produktu prasību izstrāde, priekšprojekts, tehniskās specifikācijas eksperimentālā dizaina izstrādei). Tas ir saistīts ar ierobežoto pieejamo informāciju produkta dzīves cikla sākuma posmā un nepieciešamību prognozēt tehniskās iespējas un ekonomisko situāciju nākotnē. Statistiskās metodes jāizmanto visos optimizācijas problēmas risināšanas posmos - mērogojot mainīgos, izstrādājot produktu un sistēmu darbības matemātiskos modeļus, veicot tehniskos un ekonomiskos eksperimentus utt.

Optimizācijas problēmās, tostarp produktu kvalitātes un standarta prasību optimizācijā, tiek izmantotas visas statistikas jomas. Proti, gadījuma lielumu statistika, daudzfaktoru statistiskā analīze, gadījuma procesu un laikrindu statistika, neskaitliskas dabas objektu statistika. Konkrētu datu analīzei ieteicams izvēlēties statistisko metodi saskaņā ar ieteikumiem.