fbpx
Wikipedia

Statistik

Statistik er en videnskabelig metode, hvormed man effektivt anvender numeriske data, som fx kan komme fra eksperimenter, spørgeskemaer eller registre.

Historisk set startede statistik med at være beskrivende, hvor fokus var at præsentere data grafisk, med tabeller og senere ved at regne statistiske mål som gennemsnit. Moderne statistik omfatter at drage konklusioner om det generelle tilfælde (hele populationen) ud fra det enkelte tilfælde (en stikprøve). Det kan for eksempel være at bestemme parametre til sandsynlighedsfordelingen for populationen. Dette kaldes statistisk inferens. Et andet eksempel kunne være at bestemme, om der er forskel på to populationer (eksempelvis en behandlet gruppe og en placebogruppe).

Danmarks Statistik producerer en del samfundsbeskrivende statistik, som bygger på administrative registre som fx CPR, BBR og Erhvervsregisteret, og dermed medtages hele populationen.

Indholdsfortegnelse

Stikprøver bruges, når hele populationen ikke kan undersøges. Det kan være, at det er dyrt at lave målingerne, eller at det ikke er fysisk muligt at undersøge mere end et udsnit af populationen. For eksempel er det ikke muligt at undersøge alt vandet i verdenshavene. Et andet problem, som statistik tager hensyn til, er, at målinger ofte er behæftet med usikkerhed, fejl eller mangler. Det kan for eksempel være målinger af den samme ting, hvor resultatet varierer for hver måling, men i gennemsnit har den korrekte (sande) værdi.

For eksempel kan høstudbyttet for to forskellige kornsorter på to forskellige marker måles for at finde ud af, hvilken sort der giver mest udbytte. Her risikeres det, at det ene udbytte er meget højere end det andet, uden at det gælder i gennemsnit. Hvis det skyldes, at den ene mark tilfældigvis blev angrebet af dyr eller sygdom, mens den anden tilfældigvis gik fri, vil resultatet ikke kunne bruges til noget. Derfor bliver man nødt til at have flere observationer og bruge statistiske metoder til at undersøge resultatet.

Hvis stikprøven omfatter et tilstrækkeligt antal observationer til at indfri forventningerne om pålidelighed i målingen, betegnes den som signifikant.

Ordet statistik kommer fra det latinske statisticum collegium ("statsrådgiver") og det italienske ord statista ("statsmand" eller "politiker"). Ordet kom til Danmark via tysk indføring af Gottfried Achenwall i 1749, og beskrev oprindeligt behandling af data for staten.

Statistik bygger på resultater fra sandsynlighedsregning. De to fag er ret tæt forbundne, og deres udvikling refererer også langt hen ad vejen til de samme matematikere. Statistik har dog altid udgangspunkt i analyser af indsamlede data, mens sandsynlighedsregning omfatter enhver hypotetisk beregning af muligheder i et udfaldsrum

Uddybende artikel: Beskrivende statistik
Eksempel på histogram af 100 normalfordelte tilfældige tal

Beskrivende statistik omfatter at præsentere data i form af tabeller (krydstabeller, kontingenstabeller) eller grafisk i form af landkort eller diagrammer.

Der laves ingen model for data, og der bruges ingen antagelser om, hvilke fordelinger data tilhører. Ofte undersøger man et datasæt med beskrivende statistik, før man går til videre behandling af det.

Eksempler på statistiske mål, der bruges, er kvartiler, median, gennemsnit og empirisk varians. Grafiske fremstillinger omfatter blandt andet skatterplot, boksplot og histogrammer.

Planlægning inden for statistik omhandler metoder, som gør målinger mere præcise. Hvis man bruger de korrekte metoder, kan måleusikkerheden for en stikprøve eller et eksperiment gøres meget mindre, end hvis man ikke planlagde først.

Et eksempel er en meningsmåling, som bør være taget af en gruppe, der er repræsentativ for befolkningen (populationen). Hvis der er 10% af befolkningen, der er mellem 18 og 24 år, bør der også være 10% i undersøgelsen. Det samme gælder med køn, indkomst, hvor i landet man kommer fra og andre ting. Med et forhåndskendskab til den befolkning, man undersøger, er det muligt at planlægge, hvilke personer man spørger, så det omtrent kommer til at passe. Inden for de definerede grupper udvælges stikprøven tilfældigt, så det ikke er de samme, der bliver spurgt hver gang, eller en systematisk udvælgelse af forskellige personer.

Uddybende artikel: Estimat

I moderne statistik bruges modeller til at drage konklusioner. Modellerne har nogle parametre, som afgør nogle egenskaber for dem. For normalfordelingen er middelværdi og standardafvigelse parametrene. Når en parameter til en model udregnes ud fra en stikprøve, hedder det, at parameteren bliver estimeret. Der kan laves et punktestimat, hvor parameteren estimeres med én værdi, eller et intervalestimat, hvor der estimeres et interval, som parameterens værdi forventes at være inden for.

Uddybende artikel: Regressionsanalyse
Lineær regressionsanalyse går ud på at finde ligningen for den rette linje, der passer bedst til givne målepunkter

Regressionsanalyse er en gren inden for statistikken, hvor værdien af en eller flere variable (kaldt afhængige variabel eller respons variabel) forudsiges ud fra en eller flere andre variabler (kaldet baggrundsvariabel eller de uafhængige variabler). Resultatet er en matematisk funktion, hvor de afhængige variabler kan regnes på baggrund af baggrundsvariablerne. Funktionen vælges, så et afstandsmål mellem datapunkterne og funktionsværdien for datapunkterne minimeres. Afstandsmålet kan vælges vilkårligt, men Euklidisk afstand bruges ofte.

Formålet kan for eksempel være at tage højde for unøjagtigheder i data, at udfylde manglende observationer i data eller at forudsige de afhængiges variablers værdier for nye data, hvor kun baggrundsvariablerne er kendt.

Uddybende artikel: Variansanalyse

Variansanalyse (forkortet ANOVA [fra engelsk, Analysis of Variance]) er en metode til at sammenligne to eller flere middelværdier. Navnet kommer af, at den empiriske varians bruges til at lave hypotesetest med. Man bruger variansanalyse, når man har med kvantitative faktorer at gøre. For eksempel kan faktoren være brug af medicin eller brug af placebo, hvis man ønsker at finde ud af om en type medicin virker. Der kan også være flere niveauer så som høj, mellem og lav.

Første skridt i en variansanalyse er at estimere variansen for middelværdierne. Andet skridt er at sammenligne dem ved brug af hypotesetest. Dette bruges også til at undersøge om koefficienter fundet med regressionsanalyse bør medtages eller udelades fra modellen.

Uddybende artikel: Hypoteseprøvning

Når en regressionsanalyse eller variansanalyse er udført, er det vigtigt at vide, om resultatet er sandsynligt. Hertil bruges hypoteseprøvning (også kaldet hypotesetest). Hypoteseprøvning kan også bruges til at undersøge om på forhånd bestemte eller kendte værdier passer med et nyt datasæt.

I hypoteseprøvning sammenlignes en nulhypotese med en alternativ hypotese, hvor den alternative hypotese accepteres, hvis nulhypotesen kan afvises. Den alternative hypotese er den påstand, som ønskes bekræftet, mens nulhypotesen er den modsatte påstand (en negation af påstanden). Eksempelvis kan den alternative hypotese være, at person A løber hurtigere end person B. Her vil man vælge nulhypotesen til at være, at person A løber langsommere end eller lige så hurtigt som B.

Uddybende artikel: Bayesiansk statistik

Der er to hovedretninger for hvordan en parameter estimeres: Frekvensstatistik statistik (også kaldet for Neyman-Pearsons statistik) og den bayesianske statistik. I den førstnævnte vælges estimat til at være den værdi, som er mest sandsynlig. Dette kan have det problem, at sandynlighedsfordelingen omkring den maksimale værdi kan være flad, så der er et interval af værdier, som er næsten lige sandsynlige. I den bayesianske statistik tages der hensyn til dette, ved at udregne fordelingen for parameter og lade estimatet være et gennemsnit af fordelingen. Det kræver i midlertidigt generelt megen regnekraft, at regne denne fordeling. Derfor er den bayesianske statistik først begyndt at blive anvendt i praksis efter, at computere har fået tilstrækkeligt regnekraft.

De statistiske metoder til at se på store mængder tal er blevet brugt inden for blandt andet fysik og kemi. Den kinetiske gasteori inden for termodynamik er blevet udledt ud fra statistiske betragtning af atomer. Ligeledes er massevirkningsloven inden for kemi udledt ud fra statistiske betragtninger.

  • Propability and Statistics for Engineers (2000) af Miller & Freund (Prentice Hall), ISBN 0-13-017974-4
  • Statistik I & II af L. Brøndum og J.D Monrad (1984 / 1989)
  • Gyldendals 10 binds leksikon, 1978, ISBN 87-01-57251-2


Wikimedia Commons har medier relateret til:

Statistik
statistik, sprog, overvåg, rediger, videnskabelig, metode, hvormed, effektivt, anvender, numeriske, data, komme, eksperimenter, spørgeskemaer, eller, registre, historisk, startede, statistik, være, beskrivende, hvor, fokus, præsentere, data, grafisk, tabeller,. Statistik Sprog Overvag Rediger Statistik er en videnskabelig metode hvormed man effektivt anvender numeriske data som fx kan komme fra eksperimenter sporgeskemaer eller registre Historisk set startede statistik med at vaere beskrivende hvor fokus var at praesentere data grafisk med tabeller og senere ved at regne statistiske mal som gennemsnit Moderne statistik omfatter at drage konklusioner om det generelle tilfaelde hele populationen ud fra det enkelte tilfaelde en stikprove Det kan for eksempel vaere at bestemme parametre til sandsynlighedsfordelingen for populationen Dette kaldes statistisk inferens Et andet eksempel kunne vaere at bestemme om der er forskel pa to populationer eksempelvis en behandlet gruppe og en placebogruppe Danmarks Statistik producerer en del samfundsbeskrivende statistik som bygger pa administrative registre som fx CPR BBR og Erhvervsregisteret og dermed medtages hele populationen Indholdsfortegnelse 1 Hvorfor bruge stikprover 2 Etymologi 3 Udspring fra sandsynlighedsregning 4 Beskrivende statistik 5 Planlaegning 6 Estimering 7 Regressionsanalyse 8 Variansanalyse 9 Hypoteseprovning 10 Bayesiansk statistik 11 Brug af statistiske teorier 12 Se ogsa 13 Referencer 14 Relaterede artikler 15 Eksterne henvisninger kilderHvorfor bruge stikprover RedigerStikprover bruges nar hele populationen ikke kan undersoges Det kan vaere at det er dyrt at lave malingerne eller at det ikke er fysisk muligt at undersoge mere end et udsnit af populationen For eksempel er det ikke muligt at undersoge alt vandet i verdenshavene Et andet problem som statistik tager hensyn til er at malinger ofte er behaeftet med usikkerhed fejl eller mangler Det kan for eksempel vaere malinger af den samme ting hvor resultatet varierer for hver maling men i gennemsnit har den korrekte sande vaerdi For eksempel kan hostudbyttet for to forskellige kornsorter pa to forskellige marker males for at finde ud af hvilken sort der giver mest udbytte Her risikeres det at det ene udbytte er meget hojere end det andet uden at det gaelder i gennemsnit Hvis det skyldes at den ene mark tilfaeldigvis blev angrebet af dyr eller sygdom mens den anden tilfaeldigvis gik fri vil resultatet ikke kunne bruges til noget Derfor bliver man nodt til at have flere observationer og bruge statistiske metoder til at undersoge resultatet Hvis stikproven omfatter et tilstraekkeligt antal observationer til at indfri forventningerne om palidelighed i malingen betegnes den som signifikant Etymologi RedigerOrdet statistik kommer fra det latinske statisticum collegium statsradgiver og det italienske ord statista statsmand eller politiker Ordet kom til Danmark via tysk indforing af Gottfried Achenwall i 1749 og beskrev oprindeligt behandling af data for staten Udspring fra sandsynlighedsregning RedigerStatistik bygger pa resultater fra sandsynlighedsregning De to fag er ret taet forbundne og deres udvikling refererer ogsa langt hen ad vejen til de samme matematikere Statistik har dog altid udgangspunkt i analyser af indsamlede data mens sandsynlighedsregning omfatter enhver hypotetisk beregning af muligheder i et udfaldsrumBeskrivende statistik Rediger Uddybende artikel Beskrivende statistik Eksempel pa histogram af 100 normalfordelte tilfaeldige tal Beskrivende statistik omfatter at praesentere data i form af tabeller krydstabeller kontingenstabeller eller grafisk i form af landkort eller diagrammer Der laves ingen model for data og der bruges ingen antagelser om hvilke fordelinger data tilhorer Ofte undersoger man et datasaet med beskrivende statistik for man gar til videre behandling af det Eksempler pa statistiske mal der bruges er kvartiler median gennemsnit og empirisk varians Grafiske fremstillinger omfatter blandt andet skatterplot boksplot og histogrammer Planlaegning Rediger Uddybende artikel Sporgeundersogelsesmetodologi Planlaegning inden for statistik omhandler metoder som gor malinger mere praecise Hvis man bruger de korrekte metoder kan maleusikkerheden for en stikprove eller et eksperiment gores meget mindre end hvis man ikke planlagde forst Et eksempel er en meningsmaling som bor vaere taget af en gruppe der er repraesentativ for befolkningen populationen Hvis der er 10 af befolkningen der er mellem 18 og 24 ar bor der ogsa vaere 10 i undersogelsen Det samme gaelder med kon indkomst hvor i landet man kommer fra og andre ting Med et forhandskendskab til den befolkning man undersoger er det muligt at planlaegge hvilke personer man sporger sa det omtrent kommer til at passe Inden for de definerede grupper udvaelges stikproven tilfaeldigt sa det ikke er de samme der bliver spurgt hver gang eller en systematisk udvaelgelse af forskellige personer Estimering Rediger Uddybende artikel Estimat I moderne statistik bruges modeller til at drage konklusioner Modellerne har nogle parametre som afgor nogle egenskaber for dem For normalfordelingen er middelvaerdi og standardafvigelse parametrene Nar en parameter til en model udregnes ud fra en stikprove hedder det at parameteren bliver estimeret Der kan laves et punktestimat hvor parameteren estimeres med en vaerdi eller et intervalestimat hvor der estimeres et interval som parameterens vaerdi forventes at vaere inden for Regressionsanalyse Rediger Uddybende artikel Regressionsanalyse Lineaer regressionsanalyse gar ud pa at finde ligningen for den rette linje der passer bedst til givne malepunkter Regressionsanalyse er en gren inden for statistikken hvor vaerdien af en eller flere variable kaldt afhaengige variabel eller respons variabel forudsiges ud fra en eller flere andre variabler kaldet baggrundsvariabel eller de uafhaengige variabler Resultatet er en matematisk funktion hvor de afhaengige variabler kan regnes pa baggrund af baggrundsvariablerne Funktionen vaelges sa et afstandsmal mellem datapunkterne og funktionsvaerdien for datapunkterne minimeres Afstandsmalet kan vaelges vilkarligt men Euklidisk afstand bruges ofte Formalet kan for eksempel vaere at tage hojde for unojagtigheder i data at udfylde manglende observationer i data eller at forudsige de afhaengiges variablers vaerdier for nye data hvor kun baggrundsvariablerne er kendt Variansanalyse Rediger Uddybende artikel Variansanalyse Variansanalyse forkortet ANOVA fra engelsk Analysis of Variance er en metode til at sammenligne to eller flere middelvaerdier Navnet kommer af at den empiriske varians bruges til at lave hypotesetest med Man bruger variansanalyse nar man har med kvantitative faktorer at gore For eksempel kan faktoren vaere brug af medicin eller brug af placebo hvis man onsker at finde ud af om en type medicin virker Der kan ogsa vaere flere niveauer sa som hoj mellem og lav Forste skridt i en variansanalyse er at estimere variansen for middelvaerdierne Andet skridt er at sammenligne dem ved brug af hypotesetest Dette bruges ogsa til at undersoge om koefficienter fundet med regressionsanalyse bor medtages eller udelades fra modellen Hypoteseprovning Rediger Uddybende artikel Hypoteseprovning Nar en regressionsanalyse eller variansanalyse er udfort er det vigtigt at vide om resultatet er sandsynligt Hertil bruges hypoteseprovning ogsa kaldet hypotesetest Hypoteseprovning kan ogsa bruges til at undersoge om pa forhand bestemte eller kendte vaerdier passer med et nyt datasaet I hypoteseprovning sammenlignes en nulhypotese med en alternativ hypotese hvor den alternative hypotese accepteres hvis nulhypotesen kan afvises Den alternative hypotese er den pastand som onskes bekraeftet mens nulhypotesen er den modsatte pastand en negation af pastanden Eksempelvis kan den alternative hypotese vaere at person A lober hurtigere end person B Her vil man vaelge nulhypotesen til at vaere at person A lober langsommere end eller lige sa hurtigt som B Bayesiansk statistik Rediger Uddybende artikel Bayesiansk statistik Der er to hovedretninger for hvordan en parameter estimeres Frekvensstatistik statistik ogsa kaldet for Neyman Pearsons statistik og den bayesianske statistik I den forstnaevnte vaelges estimat til at vaere den vaerdi som er mest sandsynlig Dette kan have det problem at sandynlighedsfordelingen omkring den maksimale vaerdi kan vaere flad sa der er et interval af vaerdier som er naesten lige sandsynlige I den bayesianske statistik tages der hensyn til dette ved at udregne fordelingen for parameter og lade estimatet vaere et gennemsnit af fordelingen Det kraever i midlertidigt generelt megen regnekraft at regne denne fordeling Derfor er den bayesianske statistik forst begyndt at blive anvendt i praksis efter at computere har faet tilstraekkeligt regnekraft Brug af statistiske teorier RedigerDe statistiske metoder til at se pa store maengder tal er blevet brugt inden for blandt andet fysik og kemi Den kinetiske gasteori inden for termodynamik er blevet udledt ud fra statistiske betragtning af atomer Ligeledes er massevirkningsloven inden for kemi udledt ud fra statistiske betragtninger Se ogsa RedigerChi i anden fordelingenReferencer RedigerPropability and Statistics for Engineers 2000 af Miller amp Freund Prentice Hall ISBN 0 13 017974 4 Statistik I amp II af L Brondum og J D Monrad 1984 1989 Gyldendals 10 binds leksikon 1978 ISBN 87 01 57251 2Relaterede artikler RedigerPsykometri psykologi SignifikansniveauEksterne henvisninger kilder RedigerDanmarks Statistik Faeroernes Statistik Hagstova Foroya Gronlands Statistik Kalaallit Nunaanni Naatsorsueqqissaartarfik Andre statistikkilder Nordisk Statistisk Arbog Manifest Fa styr pa tal og statistik Videnskab dk 2018 Wikimedia Commons har medier relateret til StatistikHentet fra https da wikipedia org w index php title Statistik amp oldid 10625179, wikipedia, wiki, bog, bøger, bibliotek,

artikel

, læs, download, gratis, gratis download, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, billede, musik, sang, film, bog, spil, spil.