Monday, 4 December 2017

Glidande medelvärde graf excel


Flyttande medelvärde I det här exemplet lär du dig hur du beräknar glidande medelvärdet för en tidsserie i Excel. Ett glidande medel används för att jämna ut oegentligheter (toppar och dalar) för att enkelt kunna känna igen trender. 1. Låt oss först titta på våra tidsserier. 2. Klicka på Dataanalys på fliken Data. Obs! Kan inte hitta knappen Data Analysis Klicka här för att ladda verktyget Analysis ToolPak. 3. Välj Flytta genomsnitt och klicka på OK. 4. Klicka i rutan Inmatningsområde och välj intervallet B2: M2. 5. Klicka i rutan Intervall och skriv 6. 6. Klicka i rutan Utmatningsområde och välj cell B3. 8. Skriv ett diagram över dessa värden. Förklaring: Eftersom vi ställer intervallet till 6 är det rörliga genomsnittet genomsnittet för de föregående 5 datapunkterna och den aktuella datapunkten. Som ett resultat utjämnas toppar och dalar. Diagrammet visar en ökande trend. Excel kan inte beräkna det rörliga genomsnittet för de första 5 datapunkterna, eftersom det inte finns tillräckligt med tidigare datapunkter. 9. Upprepa steg 2 till 8 för intervall 2 och intervall 4. Slutsats: Ju större intervall desto mer toppar och dalar släpper ut. Ju mindre intervallet desto närmare de rörliga medelvärdena ligger till de faktiska datapunkterna. Exempel på statistisk dataanalys Det här är en webbtextkompanionswebbplats för företagsstatistik USA Site. Om du vill ha mer information, vänligen fyll i det här formuläret. : Sitio Espejo för Amrica Latina Sitio de los EEUU Excel är det mycket använda statistiska paketet, som fungerar som ett verktyg för att förstå statistiska begrepp och beräkning för att kontrollera din handarbetade beräkning för att lösa dina läxor. Webbplatsen ger en introduktion för att förstå grunderna i och arbetet med Excel. Genom att rätta till de illustrerade numeriska exemplen på denna sida kommer du att förbättra din förtrogenhet och därigenom öka effektiviteten och effektiviteten i din process i statistiken. Att söka på webbplatsen. försök E dit F in på sidan Ctrl f. Ange ett ord eller en fras i dialogrutan, t. ex. quot variancequot eller quot averagequot Om det första uttrycket av ordfrasen inte är det du letar efter, försök F in Next. Introduktion Denna webbplats ger illustrativ erfarenhet av användningen av Excel för datasammanfattning, presentation och för annan grundläggande statistisk analys. Jag tror att den populära användningen av Excel ligger på de områden där Excel verkligen kan utmärka sig. Detta inkluderar organiseringsdata, dvs grundläggande datahantering, tabulering och grafik. För riktiga statistiska analyser måste man lära sig med professionella kommersiella statistikpaket som SAS och SPSS. Microsoft Excel 2000 (version 9) tillhandahåller en uppsättning dataanalysverktyg som heter Analysverktygspaketet som du kan använda för att spara steg när du utvecklar komplexa statistiska analyser. Du anger data och parametrar för varje analys, verktyget använder lämpliga statistiska makrofunktioner och visar sedan resultaten i ett utmatningsbord. Vissa verktyg genererar diagram i tillägg till utmatningstabeller. Om kommandot Data Analys kan väljas på Verktyg-menyn, är Analysis ToolPak installerat på ditt system. Om kommandot Data Analys inte finns på Verktyg-menyn måste du installera Analysis ToolPak genom att göra följande: Steg 1: Klicka på Add-Ins på Verktyg-menyn. Om Analysverktygspaket inte finns listat i dialogrutan Tillägg, klicka på Bläddra och leta reda på enhet, mappnamn och filnamn för Analysverktygspak-tillägget Analys32.xll som vanligtvis finns i mappen ProgramfilerMicrosoft OfficeOfficeLibraryAnalysis. När du väl har hittat filen, markera den och klicka på OK. Steg 2: Om du inte hittar filen Analys32.xll måste du installera den. Sätt in din Microsoft Office 2000-skiva 1 i cd-rom-enheten. Välj Kör från Windows Start-menyn. Bläddra och välj köra för din cd. Välj Setup. exe, klicka på Öppna och klicka på OK. Klicka på knappen Lägg till eller ta bort funktioner. Klicka på nästa till Microsoft Excel för Windows. Klicka på nästa till tillägg. Klicka på nedpilen bredvid Analysis ToolPak. Välj Kör från den här datorn. Välj knappen Uppdatera nu. Excel kommer nu att uppdatera ditt system för att inkludera Analysis ToolPak. Starta Excel. Klicka på Add-Ins på Verktyg-menyn. - och välj kryssrutan Analysverktygspaket. Steg 3: Analysis ToolPak Add-In är nu installerat och Data Analysis. kommer nu att väljas på Verktyg-menyn. Microsoft Excel är ett kraftfullt kalkylarkspaket tillgängligt för Microsoft Windows och Apple Macintosh. Kalkylbladsprogrammet används för att lagra information i kolumner och rader som sedan kan organiseras och behandlas. Kalkylark är utformade för att fungera bra med siffror men innehåller ofta text. Excel organiserar ditt arbete i arbetsböcker varje arbetsbok kan innehålla många kalkylblad kalkylblad används för att lista och analysera data. Excel är tillgängligt på alla offentligt åtkomst-datorer (dvs. de, t ex i biblioteket och PC Labs). Den kan öppnas antingen genom att välja Start - Program - Microsoft Excel eller genom att klicka på Excel Short Cut som finns antingen på skrivbordet eller på någon dator eller på verktygsfältet Office. Öppna ett dokument: Klicka på File-Open (CtrlO) för att öppna en befintlig arbetsbok ändra mappområdet eller kör för att leta efter filer på andra platser För att skapa en ny arbetsbok klickar du på File-New-Blank Document. Spara och stänga ett dokument: För att spara ditt dokument med dess nuvarande filnamn, plats och filformat, klicka antingen på Arkiv - Spara. Om du sparar för första gången klickar du på Arkiv Spara Spara-typ ett namn på ditt dokument och klickar sedan på OK. Använd också File-Save om du vill spara till en annan filamellokalisering. När du är färdig med att arbeta på ett dokument ska du stänga det. Gå till Arkiv-menyn och klicka på Stäng. Om du har gjort några ändringar sedan filen sparades sparas du om du vill spara dem. Excel-skärmen Arbetsböcker och kalkylblad: När du startar Excel visas ett tomt kalkylblad som består av ett flertal rutor av celler med numrerade rader nerför sidan och kolumner i alfabetisk rubrik över sidan. Varje cell refereras av dess koordinater (t ex A3 används för att referera till cellen i kolumn A och rad 3 B10: B20 används för att referera till cellintervallet i kolumn B och raderna 10 till 20). Ditt arbete lagras i en Excel-fil som heter en arbetsbok. Varje arbetsbok kan innehålla flera kalkylblad och diagram - det aktuella kalkylbladet heter det aktiva arket. Om du vill visa ett annat kalkylblad i en arbetsbok klickar du på lämplig arkflik. Du kan komma åt och exekvera kommandon direkt från huvudmenyn eller du kan peka på en av verktygsfältets knappar (displayrutan som visas under knappen, när du placerar markören över den, anger namnet på knappen) och klickar en gång. Flytta runt kalkylbladet: Det är viktigt att kunna flytta runt kalkylbladet effektivt eftersom du bara kan skriva in eller ändra data vid markörens position. Du kan flytta markören med hjälp av piltangenterna eller genom att flytta musen till önskad cell och klicka. När väl vald cell blir den aktiva cellen och identifieras med en tjock gräns kan endast en cell vara aktiv i taget. För att flytta från ett kalkylblad till ett annat klickar du på flikarna. (Om din arbetsbok innehåller många ark, högerklicka på flikrutningsknapparna och klicka sedan på det ark du vill ha.) Namnet på det aktiva arket visas med fetstil. Flytta mellan celler: Här är en snabbtangent för att flytta den aktiva cellen: Hem - flyttas till den första kolumnen i den aktuella raden CtrlHome - flyttas till det övre vänstra hörnet av dokumentet Sluta sedan Hem - flyttas till den sista cellen i dokumentet Till flytta mellan celler på ett kalkylblad, klicka på någon cell eller använd piltangenterna. Om du vill se ett annat område i arket använder du rullningsfälten och klickar på pilarna eller området ovanför rullningslådan i antingen vertikala eller horisontella rullningsfält. Observera att storleken på en bläddringsruta anger proportionell mängd av det använda området på det ark som syns i fönstret. Positionen för en rullningsruta indikerar det synliga områdets relativa plats i arbetsbladet. Ange data Ett nytt arbetsblad är ett rutnät med rader och kolumner. Raderna är märkta med siffror, och kolumnerna är märkta med bokstäver. Varje korsning av en rad och en kolumn är en cell. Varje cell har en adress. vilken är kolumnbokstaven och radnumret. Pilen på kalkylbladet till höger pekar på cell A1, som för närvarande är markerad. vilket indikerar att det är en aktiv cell. En cell måste vara aktiv för att ange information i den. För att markera (välj) en cell, klicka på den. För att välja mer än en cell: Klicka på en cell (t. ex. A1) och håll sedan växlingsnyckeln medan du klickar på en annan (t. ex. D4) för att välja alla celler mellan och inklusive A1 och D4. Klicka på en cell (t. ex. A1) och dra musen över det önskade området, klicka inte på en annan cell (t. ex. D4) för att välja alla celler mellan och inklusive A1 och D4. För att välja flera celler som inte är intill, tryck på kontrollen och klicka på de celler du vill välja. Klicka på ett nummer eller bokstavsmärkning en rad eller kolumn för att välja den hela raden eller kolumnen. Ett kalkylblad kan ha upp till 256 kolumner och 65 536 rader, så det tar ett tag innan du går tom för rymden. Varje cell kan innehålla en etikett. värde. logiskt värde. eller formel. Etiketter kan innehålla en kombination av bokstäver, siffror eller symboler. Värden är siffror. Endast värden (siffror) kan användas i beräkningarna. Ett värde kan också vara ett datum eller en tidLogiska värden är sanna eller falska. Formuler gör automatiskt beräkningar på värdena i andra specificerade celler och visar resultatet i cellen där formeln anges (till exempel kan du ange den cellen D3 är att innehålla summan av siffrorna i B3 och C3 kommer numret som visas i D3 att vara en funktion av numren som matas in i B3 och C3). Om du vill ange information i en cell markerar du cellen och börjar skriva. Observera att när du skriver information i cellen visas informationen du anger också i formulärfältet. Du kan också ange information i formulärfältet och informationen kommer att visas i den valda cellen. När du har skrivit in etiketten eller värdet: Tryck på Enter för att flytta till nästa cell nedan (i det här fallet A2) Tryck på Tab för att flytta till nästa cell till höger (i det här fallet B1) Klicka i vilken cell som helst för att välja det skriver in etiketter Om inte informationen du anger är formaterad som ett värde eller en formel, tolkar Excel det som en etikett och standardinställer texten på vänster sida av cellen. Om du skapar ett långt arbetsblad och du kommer att upprepa samma etikettinformation i många olika celler kan du använda funktionen AutoComplete. Den här funktionen kommer att se på andra poster i samma kolumn och försöka matcha en tidigare post med din aktuella post. Om du till exempel har skrivit Wesleyan i en annan cell och skriver W i en ny cell, kommer Excel automatiskt att skriva in Wesleyan. Om du tänkte skriva Wesleyan i cellen, är din uppgift klar, och du kan gå vidare till nästa cell. Om du tänkte skriva något annat, t. ex. Williams, in i cellen, fortsätt bara att skriva för att skriva in termen. För att aktivera funktionen AutoComplete, klicka på Verktyg i menyraden, välj sedan Alternativ, välj sedan Redigera och klicka för att markera kryssrutan bredvid Aktivera AutoComplete för cellvärden. Ett annat sätt att snabbt ange upprepade etiketter är att använda Pick List-funktionen. Högerklicka på en cell och välj sedan Välj från lista. Detta ger dig en meny med alla andra poster i celler i den kolumnen. Klicka på ett objekt i menyn för att mata in det till den aktuella valda cellen. Ett värde är ett nummer, datum eller tid, plus några symboler om det behövs för att ytterligare definiera numren 91such som. - () 93. Antal antas vara positiva för att ange ett negativt tal, använda ett minustecken - eller bifoga numret inom parentes (). Datum sparas som MMDDYYYY, men du behöver inte ange det exakt i det formatet. Om du går in den 9 januari eller 9 januari kommer Excel att känna igen den den 9 januari i det aktuella året och lagra den som 192002. Ange det fyrsiffriga året för ett annat år än det aktuella året (t. ex. 9 jan 1999). För att ange dagens datum, tryck på kontrollen och samtidigt. Tider som standard till en 24-timmars klocka. Använd a eller p för att ange am eller pm om du använder en 12 timmars klocka (t ex 8:30 p tolkas som 8:30 PM). För att ange aktuell tid trycker du på kontroll och: (skift-semikolon) samtidigt. En post som tolkas som ett värde (nummer, datum eller tid) är inriktad på cellens högra sida, för att omforma ett värde. Avrunda nummer som uppfyller specificerade kriterier: Att tillämpa färger till högsta och / eller minsta värden: Välj en cell i regionen och tryck CtrlShift (i Excel 2003, tryck på detta eller CtrlA) för att välja aktuell region. På menyn Format väljer du Villkorlig formatering. I villkor 1 väljer du Formel Is och skriver MAX (F: F) F1. Klicka på Format, välj fliken Teckensnitt, välj en färg och klicka sedan på OK. I villkor 2, välj Formel Is och skriv MIN (F: F) F1. Upprepa steg 4, välj en annan färg än du valde för tillstånd 1 och klicka sedan på OK. Obs! Var noga med att skilja mellan absolut referens och relativ referens när du anger formlerna. Rundnummer som uppfyller specificerade kriterier Problem: Avrunda alla siffror i kolumn A till noll decimaler, förutom de som har 5 i första decimalen. Lösning: Använd IF, MOD och ROUND-funktionerna i följande formel: IF (MOD (A2,1) 0,5, A2, ROUND (A2,0)) Att kopiera och klistra in alla celler i ett ark Välj cellerna i arket genom att trycka på CtrlA (i Excel 2003, välj en cell i ett tomt område innan du trycker på CtrlA eller från en vald cell i ett Current RegionList-område, tryck CtrlAA). ELLER Klicka på Välj allt längst upp till vänster mellan rader och kolumner. Tryck på CtrlC. Tryck CtrlPage Down för att välja ett annat ark, välj sedan cell A1. Tryck enter. Kopiera hela arket Kopiering av hela arket innebär att du kopierar cellerna, sidinställningsparametrarna och det definierade intervallet Namn. Alternativ 1: Flytta muspekaren till en arkflik. Tryck Ctrl och håll muspekaren för att dra arket till en annan plats. Släpp musknappen och Ctrl-tangenten. Alternativ 2: Högerklicka på lämplig arkflik. På snabbmenyn väljer du Flytta eller Kopiera. I dialogrutan Flytta eller kopiera kan du kopiera arket antingen till en annan plats i den aktuella arbetsboken eller till en annan arbetsbok. Var noga med att markera kryssrutan Skapa en kopia. Alternativ 3: Välj Ordna från fönstermenyn. Välj Kakel till kakel alla öppna arbetsböcker i fönstret. Använd Alternativ 1 (dra arket medan du trycker på Ctrl) för att kopiera eller flytta ett ark. Sortering efter kolumner Standardinställningen för sortering i Ascending eller Descending order är för rad. Sortera efter kolumner: På menyn Data väljer du Sortera och sedan Alternativ. Välj alternativet Sortera vänster till höger och klicka på OK. I rutan Sortera efter val av sorteringsdialogrutan väljer du det radnummer som kolumnerna ska sorteras till och klickar på OK. Beskrivande statistik Data Analysis ToolPak har ett beskrivande statistikverktyg som ger dig ett enkelt sätt att beräkna sammanfattningsstatistik för en uppsättning provdata. Sammanfattningsstatistik inkluderar Mean, Standard Error, Median, Mode, Standardavvikelse, Varians, Kurtosis, Skewness, Range, Minimum, Maximum, Sum och Count. Detta verktyg eliminerar behovet av att skriva individuella funktioner för att hitta vart och ett av dessa resultat. Excel innehåller utarbetade och anpassningsbara verktygsfält, till exempel standardverktygsfältet som visas här: Några av ikonerna är användbara matematiska beräkningar: är Autosum-ikonen, som går in i formel summan () för att lägga till ett antal celler. är FunctionWizard-ikonen, som ger dig tillgång till alla tillgängliga funktioner. är GraphWizard-ikonen, vilket ger tillgång till alla tillgängliga graftyper, som visas i den här skärmen: Excel kan användas för att generera mätvärden för placering och variabilitet för en variabel. Antag att vi önskar hitta beskrivande statistik för en provdata: 2, 4, 6 och 8. Steg 1. Välj rullgardinsmenyn Verktyg, om du ser dataanalys klickar du på det här alternativet, annars klickar du på tillägg . möjlighet att installera analysverktygspaket. Steg 2. Klicka på alternativet för dataanalys. Steg 3. Välj Beskrivande statistik från listan Analysverktyg. Steg 4. När dialogrutan visas: Ange A1: A4 i rutan för ingångsintervall, A1 är ett värde i kolumn A och rad 1. i detta fall är detta värde 2. Med samma teknik anger du andra värden tills du når den sista. Om ett prov består av 20 nummer kan du välja t. ex. A1, A2, A3 etc. som ingångsintervall. Steg 5. Välj ett utmatningsområde. i detta fall B1. Klicka på sammanfattande statistik för att se resultaten. När du klickar på OK. Du kommer att se resultatet i det valda området. Som du kommer att se är medelvärdet av provet 5, medianen är 5, standardavvikelsen är 2,581989, provvarianansen är 6,6666667, intervallet är 6 och så vidare. Var och en av dessa faktorer kan vara viktig vid beräkningen av olika statistiska förfaranden. Normal Distribution Överväg problemet med att hitta sannolikheten för att få mindre än ett visst värde under någon normal sannolikhetsfördelning. Som ett illustrativt exempel, låt oss anta att SAT-poängen rikstäckande distribueras normalt med en genomsnittlig och standardavvikelse på 500 respektive 100. Svar på följande frågor baserat på den givna informationen: A: Vilken sannolikhet är det att ett slumpmässigt valt studentpoäng blir mindre än 600 poäng B: Vilken är sannolikheten för att ett slumpmässigt valt studentpoäng kommer att överstiga 600 poäng C: Vad är sannolikheten att ett slumpmässigt valt studentpoäng kommer att ligga mellan 400 och 600 Tips: Med Excel kan du hitta sannolikheten för att få ett värde som är ungefär mindre än eller lika med ett givet värde. I ett problem, när genomsnittet och standardavvikelsen för befolkningen ges, måste du använda sunt förnuft för att hitta olika sannolikheter baserat på frågan eftersom du vet att området under en normal kurva är 1. I arbetsarket välj cell där du vill att svaret ska visas. Antag att du valde cell nummer ett, A1. Från menyerna, välj quotinsert pull-downquot. Steg 2-3 Från menyerna, välj insert och klicka sedan på funktionen Funktion. Steg 4. Efter att du har klickat på funktionen Funktion visas dialogrutan Klistra in funktion från Funktionskategori. Välj Statistisk sedan NORMDIST från rutan Funktionsnamn Klicka på OK Steg 5. När du har klickat på OK visas distributionsrutan NORMDIST: i. Ange 600 i X (värdefältet) ii. Ange 500 i Mean boxen iii. Ange 100 i rutan Standardavvikelse iv. Skriv quottruequot i den kumulativa rutan och klicka sedan på OK. Som du ser värdet 0.84134474 visas i A1, vilket indikerar sannolikheten för att en slumpmässigt vald elever gör poäng under 600 poäng. Med hjälp av sunt förnuft kan vi svara på en del quotbquot genom att subtrahera 0,84134474 från 1. Så svaret på delquotquot är 1 - 0.8413474 eller 0.158653. Det här är sannolikheten för att en slumpmässigt valda studentpoäng är större än 600 poäng. För att svara på delkvotot, använd samma tekniker för att hitta sannolikheterna eller området på vänster sida av värdena 600 och 400. Eftersom dessa områden eller sannolikheter överlappar varandra för att svara på frågan borde du subtrahera mindre sannolikhet från större sannolikhet. Svaret är lika med 0,84134474 - 0,155865526 ​​som är 0,68269. Skärmbilden ska se ut som följande: Beräkna värdet på en slumpmässig variabel som ofta kallas quotxquot-värdet. Du kan använda NORMINV från funktionsfältet för att beräkna ett värde för den slumpmässiga variabeln - om sannolikheten för den vänstra sidan av denna variabel anges. I själva verket bör du använda denna funktion för att beräkna olika procentuella parametrar. I detta problem kan man fråga vad som är poängen för en student vars percentil är 90. Det betyder att cirka 90 av eleverna är mindre än detta nummer. Å andra sidan om vi ombads att göra detta problem för hand, skulle vi ha beräknat x-värdet med normalfördelningsformeln x m zd. Nu kan vi använda Excel för att beräkna P90. I Paste-funktionen, klicka på statistiken och klicka sedan på NORMINV. Skärmbilden skulle se ut som följer: När du ser NORMINV visas dialogrutan. jag. Ange 0,90 för sannolikheten (det betyder att ungefär 90 poäng är mindre än det värde vi söker) ii. Ange 500 för medelvärdet (detta är medelvärdet av den normala fördelningen i vårt fall) iii. Ange 100 för standardavvikelsen (det här är standardavvikelsen för normalfördelningen i vårt fall) I slutet av den här skärmen kommer du att se formelresultatet som är cirka 628 poäng. Det innebär att de 10 bästa av eleverna gjorde bättre än 628. Förtroendeintervall för medelvärdet Antag att vi önskar uppskatta ett konfidensintervall för medeltalet av en befolkning. Beroende på storleken på din samplingsstorlek kan du använda ett av följande fall: Stora provstorlek (n är större än, t ex 30): Den allmänna formeln för att utveckla ett konfidensintervall för en population betyder: I denna formel är den genomsnittliga av provet Z är intervallkoefficienten, som kan hittas från det normala distributionsbordet (till exempel är intervallkoefficienten för en 95 konfidensnivå 1,96). S är standardavvikelsen för provet och n är provstorleken. Nu vill vi visa hur Excel används för att utveckla ett visst konfidensintervall för ett populationsmedel baserat på en provinformation. Som du ser för att utvärdera denna formel behöver du quotthe mean av samplequot och felmarginalen Excel kommer automatiskt att beräkna dessa kvantiteter för dig. Det enda du behöver göra är att lägga till felmarginalen till medelvärdet av provet, Hitta den övre gränsen för intervallet och subtrahera felmarginalen från medelvärdet till den nedre gränsen för intervallet. För att visa hur Excel hittar dessa kvantiteter kommer vi att använda datasatsen, som innehåller timmarna av 36 arbetsstudentsstuderande här, vid University of Baltimore. Dessa siffror visas i cellerna A1 till A36 på ett Excel-arbetsblad. Efter inmatningen av data följde vi det beskrivande statistiska förfarandet för att beräkna de okända kvantiteterna. Det enda ytterligare steget är att klicka på konfidensintervallet i den beskrivande statistiska dialogrutan och ange den angivna konfidensnivån, i det här fallet 95. Här är ovanstående procedurer steg för steg: Steg 1. Ange data i cellerna A1 till A36 (på kalkylbladet) Steg 2. Från menyerna välj Verktyg Steg 3. Klicka på Data Analysis, välj sedan alternativet Beskrivande statistik och klicka sedan på OK. På den beskrivande statistiska dialogrutan klickar du på Sammandragsstatistik. När du har gjort det, klicka på konfidensintervallnivån och skriv 95 - eller i andra problem oavsett konfidensintervall du önskar. I rutan Utmatningsområde anger du B1 eller vilken plats du önskar. Klicka nu på OK. Skärmbilden skulle se ut som följande: Som du ser visar kalkylbladet att medelvärdet av provet är 6.902777778 och det absoluta värdet av felmarginalen 0,231678109. Detta medelvärde är baserat på denna provinformation. Ett 95 konfidensintervall för UB-studiestudentens timmeinkomst har en övre gräns på 6.902777778 0.231678109 och en nedre gräns på 6.902777778 - 0.231678109. Å andra sidan kan vi säga att alla de intervaller som bildas på detta sätt innehåller 95 populationens medelvärde. Eller för praktiska ändamål kan vi vara 95 övertygade om att medeltalet av befolkningen ligger mellan 6.902777778 - 0.231678109 och 6.902777778 0.231678109. Vi kan vara minst 95 övertygade om att intervall 6,68 och 7,13 innehåller den genomsnittliga timmarsinkomsten för en arbetsstudent. Smal provstorlek (säg mindre än 30) Om provet n är mindre än 30 eller vi måste använda det lilla provet för att utveckla ett konfidensintervall för medeltalet av en population. Den allmänna formeln för att utveckla konfidensintervaller för populationen betyder baserat på litet ett prov är: I denna formel är medelvärdet av provet. är intervallkoefficienten som tillhandahåller ett område i överdelen av en t-fördelning med n-1 frihetsgrader som kan hittas från en t-fördelningstabell (till exempel är intervallkoefficienten för 90-konfidensnivå 1.833 om provet är 10). S är standardavvikelsen för provet och n är provstorleken. Nu vill du se hur Excel används för att utveckla ett visst konfidensintervall för ett populationmedel baserat på denna lilla provinformation. Som du ser, för att utvärdera denna formel behöver du quotthe mean av samplequot och felmarginalen Excel kommer automatiskt att beräkna dessa kvantiteter som det gjorde för stora prover. Återigen är de enda sakerna du behöver göra: Lägg felmarginalen till medelvärdet av provet, hitta intervallets övre gräns och subtrahera felmarginalen från medelvärdet för att hitta intervallets nedre gräns. För att visa hur Excel hittar dessa kvantiteter kommer vi att använda datasatsen, som innehåller timmarsinkomsterna för 10 arbetsstudentsstudenter här vid University of Baltimore. Dessa siffror visas i cellerna A1 till A10 på ett Excel-arbetsblad. Efter att ha skrivit in data följer vi det beskrivande statistiska förfarandet för att beräkna de okända kvantiteterna (exakt hur vi hittade mängder för stort urval). Här följer proceduren i steg-för-steg-form: Steg 1. Ange data i cellerna A1 till A10 på kalkylbladet Steg 2. Från menyerna välj Verktyg Steg 3. Klicka på Data Analysis och välj sedan alternativet Beskrivande statistik. Klicka på OK i den beskrivande statistikdialogrutan, klicka på Sammanfattningsstatistik, klicka på konfidensintervallnivån och skriv in 90 eller i andra problem beroende på vilket konfidensintervall du önskar. I rutan Utmatningsområde anger du B1 eller vilken plats du vill ha. Klicka nu på OK. Skärmbilden kommer att se ut som följande: Nu, beräknar du förtroendeintervallet för det stora provet, baserat på den här lilla provinformationen, som beräkningen av konfidensintervallet för det stora provet. Förtroendeintervallet är: 6,8 0,414426102 eller 6,39 7,21. Vi kan vara minst 90 förtroende att intervallet 6,39 och 7,21 innehåller det sanna medlet för befolkningen. Test av hypotesen beträffande befolkningen betyder igen, vi måste skilja två fall med avseende på storleken på ditt prov Stora provstorlek (säg över 30): I det här avsnittet vill du veta hur Excel kan användas för att utföra ett hypotestest om en befolkningsmedelvärde. Vi kommer att använda timmarsinkomsterna för olika arbetsstudiestudenter än de som introducerades tidigare i avsnittet om konfidensintervall. Data matas in i cellerna A1 till A36. Målsättningen är att testa följande Null - och Alternativhypotes: Nollhypotesen anger att den genomsnittliga timmarsinkomsten för en studiestudent motsvarar 7 per timme, men den alternativa hypotesen indikerar att den genomsnittliga timlönen inte är lika med 7 per timme. Jag kommer att upprepa de steg som tas i beskrivande statistik och i slutet kommer att visa hur man hittar värdet av teststatistiken i detta fall, z, med hjälp av en cellformel. Steg 1. Ange data i cellerna A1 till A36 (på kalkylbladet) Steg 2. Från menyerna välj Verktyg Steg 3. Klicka på Data Analysis och välj alternativet Beskrivande statistik, klicka på OK. På den beskrivande statistiska dialogrutan klickar du på Sammandragsstatistik. Välj rutan Utmatningsområde, skriv B1 eller vilken plats du vill ha. Klicka nu på OK. (För att beräkna värdet av teststatistiken söka efter medelvärdet av provet, då standardfelet. I denna utgång ligger dessa värden i cellerna C3 och C4.) Steg 4. Välj cell D1 och ange cellformeln (C3-7 ) C4. Skärmbilden ska se ut som följande: Värdet i cell D1 är värdet av teststatistiken. Eftersom detta värde faller i acceptintervallet -1,96 till 1,96 (från det normala distributionsbordet) misslyckas vi att neka hypotesen. Små provstorlek (säg mindre än 30): Med hjälp av steg som tagit det stora provstorleksfallet kan Excel användas för att utföra en hypotes för småprovfall. Låt oss använda den timliga inkomsten för 10 arbetsstudenter på UB för att utföra följande hypotes. Nollhypotesen indikerar att en arbetstidsstudents genomsnittliga timmeinkomst är lika med 7 per timme. Den alternativa hypotesen indikerar att genomsnittlig timelön inte är lika med 7 per timme. Jag kommer att upprepa de steg som tas i beskrivande statistik och i slutet kommer att visa hur man hittar värdet av teststatistiken i detta fall quottquot med hjälp av en cellformel. Steg 1. Ange data i cellerna A1 till A10 (på kalkylbladet) Steg 2. Från menyerna välj Verktyg Steg 3. Klicka på Data Analysis och välj alternativet Beskrivande statistik. Klicka på OK. På den beskrivande statistiska dialogrutan klickar du på Sammandragsstatistik. Välj rutorna Utmatningsområde, ange B1 eller vilken plats du valde. Återigen, klicka på OK. (För att beräkna värdet av teststatistiken söka efter medelvärdet av provet är standardfelet, i dessa utgångar ligger dessa värden i cellerna C3 och C4.) Steg 4. Välj cell D1 och ange cellformeln (C3-7) C4. Skärmbilden skulle se ut som följande: Eftersom värdet av teststatistik t -0.66896 faller i acceptintervallet -2.262 till 2.262 (från t-tabellen, där 0,025 och graderna av frihet är 9), misslyckas vi att avvisa nollhypotesen. Skillnad mellan medelvärdet av två populationer I det här avsnittet kommer vi att visa hur Excel används för att utföra ett hypotesprov om skillnaden mellan två populationer, förutsatt att populationerna har lika stora variationer. Uppgifterna i detta fall tas från olika kontor här vid University of Baltimore. Jag samlade in timmeinkomstuppgifterna för 36 slumpmässigt utvalda arbetsstudiestudenter och 36 studentassistenter. Timinginkomsten för arbetsstudentstuderande var 6-8 medan timmarsintervallet för studentassistenter var 6-9. Huvudsyftet med denna hypotesprovning är att se om det finns en signifikant skillnad mellan de två populationernas medel. NULL - och ALTERNATIV-hypotesen är att medlen är lika och medlen inte är lika. Med hänvisning till kalkylbladet valde jag A1 och A2 som etikettcentraler. Arbetsstudiestudentens inkomster för en provstorlek 36 visas i cellerna A2: A37. och studentassistenternas inkomster för en provstorlek 36 visas i cellerna B2: B37 Data för arbetsstudie Student: 6, 6, 6, 6, 6, 6, 6,5, 6,5, 6,5, 6,5, 6,5, 6,5, 7, 7, 7, 7, 7, 7, 7, 7,5, 7,5, 7,5, 7,5, 7,5, 7,5, 8, 8, 8, 8, 8, 8, 8, 8. Data för studentassistent: 6 6,6 6,6 6,5 6,5 6,5 7 7 7 7 7 7,5 7,5 7,5 7,5 8 8 8 8 8 8 , 8, 8, 8,5, 8,5, 8,5, 8,5, 8,5, 9, 9, 9, 9. Använd beskrivningen av beskrivande statistik för att beräkna avvikelserna för de två proverna. Excel-förfarandet för att testa skillnaden mellan de två befolkningsmedlen kommer att kräva information om skillnaderna mellan de två populationerna. Eftersom skillnaderna mellan de två populationerna är okända bör de ersättas med provvariationer. Den beskrivande för båda proverna visar att variansen av första provet är s 1 2 0,55546218. medan variansen av det andra provet s 2 2 0,969748. För att utföra den önskade testhypotesen med Excel kan följande steg vidtas: Steg 1. Från menyerna välj Verktyg och klicka sedan på alternativet Data Analysis. Steg 2. När dialogrutan Dataanalys visas: Välj z-Test: Två exempel på medel och klicka sedan på OK Steg 3. När z-Test: Two Sample for means dialogrutan visas: Ange A1: A36 i ruta 1 (arbetsstudiestudenter timelön) Ange B1: B36 i rutan 2 för variabel 2 (studentassistent timelön) Ange 0 i rutan Hypotesemåttlig skillnad (om du vill testa en medelskillnad annat än 0, ange det värdet) Ange variansen för det första provet i variabel 1-variansrutan Ange variansen för det andra provet i rutan Variabel 2-varians och välj Etiketter Ange 0,05 eller, vilken nivå av betydelse du vill ha i alfakassetten Välj ett lämpligt utmatningsområde för resultat, jag valde C19. klicka sedan på OK. Värdet av teststatistik z-1.9845824 visas i vårt fall i cell D24. Avvisningsregeln för detta test är z 1,96 från det normala distributionsbordet. I Excel-utgången är dessa värden för ett tvåstegstest z 1.959961082. Eftersom värdet av teststatistiken z-1.9845824 är mindre än -1,959961082 avvisar vi nollhypotesen. We can also draw this conclusion by comparing the p-value for a two tail - test and the alpha value. Since p-value 0.047190813 is less than a0.05 we reject the null hypothesis. Overall we can say, based on the sample results, the two populations means are different. Small Samples: n 1 OR n 2 are less than 30 In this section we will show how Excel is used to conduct a hypothesis test about the difference between two population means. - Given that the populations have equal variances when two small independent samples are taken from both populations. Similar to the above case, the data in this case are taken from various offices here at the University of Baltimore. I collected hourly income data of 11 randomly selected work-study students and 11 randomly selected student assistants. The hourly income range for both groups was similar range, 6 - 8 and 6-9. The main objective in this hypothesis testing is similar too, to see whether there is a significant difference between the means of the two populations. The NULL and the ALTERNATIVE hypothesis are that the means are equal and they are not equal, respectively. Referring to the spreadsheet, we chose A1 and A2 as label centers. The work-study students hourly income for a sample size 11 are shown in cells A2:A12 . and the student assistants hourly income for a sample size 11 is shown in cells B2:B12 . Unlike previous case, you do not have to calculate the variances of the two samples, Excel will automatically calculate these quantities and use them in the calculation of the value of the test statistic. Similar to the previous case, but a bit different in step 2, to conduct the desired test hypothesis with Excel the following steps can be taken: Step 1. From the menus select Tools then click on the Data Analysis option. Step 2. When the Data Analysis dialog box appears: Choose t-Test: Two Sample Assuming Equal Variances then click OK Step 3 When the t-Test: Two Sample Assuming Equal Variances dialog box appears : Enter A1:A12 in the variable 1 range box (work-study student hourly income) Enter B1:B12 in the variable 2 range box (student assistant hourly income) Enter 0 in the Hypothesis Mean Difference box(if you desire to test a mean difference other than zero, enter that value) then select Labels Enter 0.05 or, whatever level of significance you desire, in the Alpha box Select a suitable Output Range for the results, I chose C1, then click OK. The value of the test statistic t-1.362229828 appears, in our case, in cell D10. The rejection rule for this test is t 2.086 from the t distribution table where the t value is based on a t distribution with n 1 - n 2 -2 degrees of freedom and where the area of the upper one tail is 0.025 ( that is equal to alpha2). In the Excel output the values for a two-tail test are t 2.085962478. Since the value of the test statistic t-1.362229828, is in an acceptance range of t 2.085962478, we fail to reject the null hypothesis. We can also draw this conclusion by comparing the p-value for a two-tail test and the alpha value. Since the p-value 0.188271278 is greater than a0.05 again . we fail to reject the null hypothesis. Overall we can say, based on sample results, the two populations means are equal. Enter data in an Excel work sheet starting with cell A2 and ending with cell C8. The following steps should be taken to find the proper output for interpretation. Step 1. From the menus select Tools and click on Data Analysis option. Step 2. When data analysis dialog appears, choose Anova single-factor option enter A2:C8 in the input range box. Select labels in first row. Step3. Select any cell as output(in here we selected A11). Click OK. The general form of Anova table looks like following: Source of Variation Suppose the test is done at level of significance a 0.05, we reject the null hypothesis. This means there is a significant difference between means of hourly incomes of student assistants in these departments. The Two-way ANOVA Without Replication In this section, the study involves six students who were offered different hourly wages in three different department services here at the University of Baltimore. The objective is to see whether the hourly incomes are the same. Therefore, we can consider the following: Treatment: Hourly payments in the three departments Blocks: Each student is a block since each student has worked in the three different departments The general form of Anova table would look like: Source of Variation Degrees of freedom To find the Excel output for the above data the following steps can be taken: Step 1. From the menus select Tools and click on Data Analysis option. Step2. When data analysis box appears: select Anova two-factor without replication then Enter A2: D8 in the input range. Select labels in first row. Step3. Select an output range (in here we selected A11) then OK. Source of Variation NOTE: FMSTMSE 0.9805560.497222 1.972067 F 3.33 from table (5 numerator DF and 10 denominator DF) Since 1.972067 Goodness-of-Fit Test for Discrete Random Variables The CHI-SQUARE distribution can be used in a hypothesis test involving a population variance. However, in this section we would like to test and see how close a sample results are to the expected results. Example: The Multinomial Random Variable In this example the objective is to see whether or not based on a randomly selected sample information the standards set for a population is met. There are so many practical examples that can be used in this situation. For example it is assumed the guidelines for hiring people with different ethnic background for the US government is set at 70(WHITE), 20(African American) and 10(others), respectively. A randomly selected sample of 1000 US employees shows the following results that is summarized in a table. EXPECTED NUMBER OF EMPLOYEES OBSERVED FROM SAMPLE As you see the observed sample numbers for groups two and three are lower than their expected values unlike group one which has a higher expected value. Is this a clear sign of discrimination with respect to ethnic background Well depends on how much lower the expected values are. The lower amount might not statistically be significant. To see whether these differences are significant we can use Excel and find the value of the CHI-SQUARE. If this value falls within the acceptance region we can assume that the guidelines are met otherwise they are not. Now lets enter these numbers into Excel spread - sheet. We used cells B7-B9 for the expected proportions, C7-C9 for the observed values and D7-D9 for the expected frequency. To calculate the expected frequency for a category, you can multiply the proportion of that category by the sample size (in here 1000). The formula for the first cell of the expected value column, D7 is 1000B7. To find other entries in the expected value column, use the copy and the paste menu as shown in the following picture. These are important values for the chi-square test. The observed range in this case is C7: C9 while the expected range is D7: D9. The null and the alternative hypothesis for this test are as follows: H A . The population proportions are not P W 0.70, P A 0.20 and P O 0.10 Now lets use Excel to calculate the p-value in a CHI-SQUARE test. Step 1. Select a cell in the work sheet, the location which you like the p value of the CHI-SQUARE to appear. We chose cell D12. Step 2. From the menus, select insert then click on the Function option, Paste Function dialog box appears. Step 3. Refer to function category box and choose statistical . from function name box select CHITEST and click on OK . Step 4. When the CHITEST dialog appears: Enter C7: C9 in the actual-range box then enter D7: D9 in the expected-range box, and finally click on OK . The p-value will appear in the selected cell, D12. As you see the p value is 0.002392 which is less than the value of the level of significance (in this case the level of significance, a 0.10). Hence the null hypothesis should be rejected. This means based on the sample information the guidelines are not met. Notice if you type CHITEST(C7:C9,D7:D9) in the formula bar the p-value will show up in the designated cell. NOTE: Excel can actually find the value of the CHI-SQUARE. To find this value first select an empty cell on the spread sheet then in the formula bar type CHIINV(D12,2). D12 designates the p-Value found previously and 2 is the degrees of freedom (number of rows minus one). The CHI-SQUARE value in this case is 12.07121. If we refer to the CHI-SQUARE table we will see that the cut off is 4.60517 since 12.071214.60517 we reject the null. The following screen shot shows you how to the CHI-SQUARE value. Test of Independence: Contingency Tables The CHI-SQUARE distribution is also used to test and see whether two variables are independent or not. For example based on sample data you might want to see whether smoking and gender are independent events for a certain population. The variables of interest in this case are smoking and the gender of an individual. Another example in this situation could involve the age range of an individual and his or her smoking habit. Similar to case one data may appear in a table but unlike the case one this table may contains several columns in addition to rows. The initial table contains the observed values. To find expected values for this table we set up another table similar to this one. To find the value of each cell in the new table we should multiply the sum of the cell column by the sum of the cell row and divide the results by the grand total. The grand total is the total number of observations in a study. Now based on the following table test whether or not the smoking habit and gender of the population that the following sample taken from are independent. On the other hand is that true that males in this population smoke more than females You could use formula bar to calculate the expected values for the expected range. For example to find the expected value for the cell C5 which is replaced in c11 you could click on the formula bar and enter C6D5D6 then enter in cell C11. Step 1. Observed Range b4:c5 Smoking and gender So the observed range is b4:c5 and the expected range is b10:c11. Step 3. Click on fx (paste function) Step 4. When Paste Function dialog box appears, click on Statistical in function category and CHITEST in the function name then click OK. When the CHITEST box appears, enter b4:c5 for the actual range, then b10:c11 for the expected range. Step 5. Click on OK (the p-value appears). 0.477395 Conclusion: Since p-value is greater than the level of significance (0.05), fails to reject the null. This means smoking and gender are independent events. Based on sample information one can not assure females smoke more than males or the other way around. Step 6. To find the chi-square value, use CHINV function, when Chinv box appears enter 0.477395 for probability part, then 1 for the degrees of freedom. Degrees of freedom(number of columns-1)X(number of rows-1) Test Hypothesis Concerning the Variance of Two Populations In this section we would like to examine whether or not the variances of two populations are equal. Whenever independent simple random samples of equal or different sizes such as n 1 and n 2 are taken from two normal distributions with equal variances, the sampling distribution of s 1 2 s 2 2 has F distribution with n 1 - 1 degrees of freedom for the numerator and n 2 - 1 degrees of freedom for the denominator. In the ratio s 1 2 s 2 2 the numerator s 1 2 and the denominator s 2 2 are variances of the first and the second sample, respectively. The following figure shows the graph of an F distribution with 10 degrees of freedom for both the numerator and the denominator. Unlike the normal distribution as you see the F distribution is not symmetric. The shape of an F distribution is positively skewed and depends on the degrees of freedom for the numerator and the denominator. The value of F is always positive. Now let see whether or not the variances of hourly income of student-assistant and work-study students based on samples taken from populations previously are equal. Assume that the hypothesis test in this case is conducted at a 0.10. The null and the alternative are: Rejection Rule: Reject the null hypothesis if Flt F 0.095 or Fgt F 0.05 where F, the value of the test statistic is equal to s 1 2 s 2 2. with 10 degrees of freedom for both the numerator and the denominator. We can find the value of F .05 from the F distribution table. If s 1 2 s 2 2. we do not need to know the value of F 0.095 otherwise, F 0.95 1 F 0.05 for equal sample sizes. A survey of eleven student-assistant and eleven work-study students shows the following descriptive statistics. Our objective is to find the value of s 1 2 s 2 2. where s 1 2 is the value of the variance of student assistant sample and s 2 2 is the value of the variance of the work study students sample. As you see these values are in cells F8 and D8 of the descriptive statistic output. To calculate the value of s 1 2 s 2 2. select a cell such as A16 and enter cell formula F8D8 and enter. This is the value of F in our problem. Since this value, F1.984615385, falls in acceptance area we fail to reject the null hypothesis. Hence, the sample results do support the conclusion that student assistants hourly income variance is equal to the work study students hourly income variance. The following screen shoot shows how to find the F value. We can follow the same format for one tail test(s). Linear Correlation and Regression Analysis In this section the objective is to see whether there is a correlation between two variables and to find a model that predicts one variable in terms of the other variable. There are so many examples that we could mention but we will mention the popular ones in the world of business. Usually independent variable is presented by the letter x and the dependent variable is presented by the letter y. A business man would like to see whether there is a relationship between the number of cases of sold and the temperature in a hot summer day based on information taken from the past. He also would like to estimate the number cases of soda which will be sold in a particular hot summer day in a ball game. He clearly recorded temperatures and number of cases of soda sold on those particular days. The following table shows the recorded data from June 1 through June 13. The weatherman predicts a 94F degree temperature for June 14. The businessman would like to meet all demands for the cases of sodas ordered by customers on June 14. Now lets use Excel to find the linear correlation coefficient and the regression line equation. The linear correlation coefficient is a quantity between -1 and 1. This quantity is denoted by R . The closer R to 1 the stronger positive (direct) correlation and similarly the closer R to -1 the stronger negative (inverse) correlation exists between the two variables. The general form of the regression line is y mx b. In this formula, m is the slope of the line and b is the y-intercept. You can find these quantities from the Excel output. In this situation the variable y (the dependent variable) is the number of cases of soda and the x (independent variable) is the temperature. To find the Excel output the following steps can be taken: Step 1. From the menus choose Tools and click on Data Analysis. Step 2. When Data Analysis dialog box appears, click on correlation. Step 3. When correlation dialog box appears, enter B1:C14 in the input range box. Click on Labels in first row and enter a16 in the output range box. Click on OK. As you see the correlation between the number of cases of soda demanded and the temperature is a very strong positive correlation. This means as the temperature increases the demand for cases of soda is also increasing. The linear correlation coefficient is 0.966598577 which is very close to 1. Now lets follow same steps but a bit different to find the regression equation. Step 1. From the menus choose Tools and click on Data Analysis Step 2 . When Data Analysis dialog box appears, click on regression . Step 3. When Regression dialog box appears, enter b1:b14 in the y-range box and c1:c14 in the x-range box. Click on labels . Step 4. Enter a19 in the output range box . Note: The regression equation in general should look like Ym X b. In this equation m is the slope of the regression line and b is its y-intercept. Adjusted R Square The relationship between the number of cans of soda and the temperature is: Y 0.879202711 X 9.17800767 The number of cans of soda 0.879202711(Temperature) 9.17800767. Referring to this expression we can approximately predict the number of cases of soda needed on June 14. The weather forecast for this is 94 degrees, hence the number of cans of soda needed is equal to The number of cases of soda0.879202711(94) 9.17800767 91.82 or about 92 cases. Moving Average and Exponential Smoothing Moving Average Models: Use the Add Trendline option to analyze a moving average forecasting model in Excel. You must first create a graph of the time series you want to analyze. Select the range that contains your data and make a scatter plot of the data. Once the chart is created, follow these steps: Click on the chart to select it, and click on any point on the line to select the data series. When you click on the chart to select it, a new option, Chart, s added to the menu bar. From the Chart menu, select Add Trendline. The following is the moving average of order 4 for weekly sales: Exponential Smoothing Models: The simplest way to analyze a timer series using an Exponential Smoothing model in Excel is to use the data analysis tool. This tool works almost exactly like the one for Moving Average, except that you will need to input the value of a instead of the number of periods, k. Once you have entered the data range and the damping factor, 1- a. and indicated what output you want and a location, the analysis is the same as the one for the Moving Average model. Applications and Numerical Examples Descriptive Statistics: Suppose you have the following, n 10, data: 1.2, 1.5, 2.6, 3.8, 2.4, 1.9, 3.5, 2.5, 2.4, 3.0 Type your n data points into the cells A1 through An. Click on the Tools menu. (At the bottom of the Tools menu will be a submenu Data Analysis. , if the Analysis Tool Pack has been properly installed.) Clicking on Data Analysis. will lead to a menu from which Descriptive Statistics is to be selected. Select Descriptive Statistics by pointing at it and clicking twice, or by highlighting it and clicking on the Okay button. Within the Descriptive Statistics submenu, a. for the input range enter A1:Dn, assuming you typed the data into cells A1 to An. b. click on the output range button and enter the output range C1:C16. c. click on the Summary Statistics box d. finally, click on Okay. The Central Tendency: The data can be sorted in ascending order: 1.2, 1.5, 1.9, 2.4, 2.4, 2.5, 2.6, 3.0, 3.5, 3.8 The mean, median and mode are computed as follows: (1.2 1.5 2.6 3.8 2.4 1.9 3.5 2.5 2.4 3.0) 10 2.48 The mode is 2.4, since it is the only value that occurs twice. The midrange is (1.2 3.8) 2 2.5. Note that the mean, median and mode of this set of data are very close to each other. This suggests that the data is very symmetrically distributed. Variance: The variance of a set of data is the average of the cumulative measure of the squares of the difference of all the data values from the mean. The sample variance-based estimation for the population variance are computed differently. The sample variance is simply the arithmetic mean of the squares of the difference between each data value in the sample and the mean of the sample. On the other hand, the formula for an estimate for the variance in the population is similar to the formula for the sample variance, except that the denominator in the fraction is (n-1) instead of n. However, you should not worry about this difference if the sample size is large, say over 30. Compute an estimate for the variance of the population . given the following sorted data: 1.2, 1.5, 1.9, 2.4, 2.4, 2.5, 2.6, 3.0, 3.5, 3.8 mean 2.48 as computed earlier. An estimate for the population variance is: s 2 1 (10-1) (1.2 - 2.48) 2 (1.5 - 2.48) 2 (1.9 - 2.48) 2 (2.4 -2.48) 2 (2.4 - 2.48) 2 (2.5 - 2.48) 2 (2.6 - 2.48) 2 (3.0 - 2.48) 2 (3.5 -2.48) 2 (3.8 - 2.48) 2 (1 9) (1.6384 0.9604 0.3364 0.0064 0.0064 0.0004 0.0144 0.2704 1.0404 1.7424) 0.6684 Therefore, the standard deviation is s ( 0.6684 ) 12 0.8176 Probability and Expected Values: Newsweek reported that average take for bank robberies was 3,244 but 85 percent of the robbers were caught. Assuming 60 percent of those caught lose their entire take and 40 percent lose half, graph the probability mass function using EXCEL. Calculate the expected take from a bank robbery. Does it pay to be a bank robber To construct the probability function for bank robberies, first define the random variable x, bank robbery take. If the robber is not caught, x 3,244. If the robber is caught and manages to keep half, x 1,622. If the robber is caught and loses it all, then x 0. The associated probabilities for these x values are 0.15 (1 - 0.85), 0.34 (0.85)(0.4), and 0.51 (0.85)(0.6). After entering the x values in cells A1, A2 and A3 and after entering the associated probabilities in B1, B2, and B3, the following steps lead to the probability mass function: Click on ChartWizard. The ChartWizard Step 1 of 4 screen will appear. Highlight Column at ChartWizard Step 1 of 4 and click Next. At ChartWizard Step 2 of 4 Chart Source Data, enter B1:B3 for Data range, and click column button for Series in. A graph will appear. Click on series toward the top of the screen to get a new page. At the bottom of the Series page, is a rectangle for Category (X) axis labels: Click on this rectangle and then highlight A1:A3. At Step 3 of 4 move on by clicking on Next, and at Step 4 of 4, click on Finish. The expected value of a robbery is 1,038.08. E(X) (0)(0.51)(1622)(0.34) (3244)(0.15) 0 551.48 486.60 1038.08 The expected return on a bank robbery is positive. On average, bank robbers get 1,038.08 per heist. If criminals make their decisions strictly on this expected value, then it pays to rob banks. A decision rule based only on an expected value, however, ignores the risks or variability in the returns. In addition, our expected value calculations do not include the cost of jail time, which could be viewed by criminals as substantial. Discrete Continuous Random Variables: Binomial Distribution Application: A multiple choice test has four unrelated questions. Each question has five possible choices but only one is correct. Thus, a person who guesses randomly has a probability of 0.2 of guessing correctly. Draw a tree diagram showing the different ways in which a test taker could get 0, 1, 2, 3 and 4 correct answers. Sketch the probability mass function for this test. What is the probability a person who guesses will get two or more correct Solution: Letting Y stand for a correct answer and N a wrong answer, where the probability of Y is 0.2 and the probability of N is 0.8 for each of the four questions, the probability tree diagram is shown in the textbook on page 182. This probability tree diagram shows the branches that must be followed to show the calculations captured in the binomial mass function for n 4 and 0.2. For example, the tree diagram shows the six different branch systems that yield two correct and two wrong answers (which corresponds to 4(22) 6. The binomial mass function shows the probability of two correct answers as P(x 2 n 4, p 0.2) 6(.2)2(.8)2 6(0.0256) 0.1536 P(2) Which is obtained from excel by using the BINOMDIST Command, where the first entry is x, the second is n, and the third is mass (0) or cumulative (1) that is, entering BINOMDIST(2,4,0.2,0) IN ANY EXCEL CELL YIELDS 0.1536 AND BINOMDIST(3,4,0.2,0) YIELDS P(x3n4, p 0.2) 0.0256 BINOMDIST(4,4,0.2,0) YIELDS P(x4n4, p 0.2) 0.0016 1-BINOMDIST(1,4,0.2,1) YIELDS P(x 179 2 n 4, p 0.2) 0.1808 Normal Example: If the time required to complete an examination by those with a certain learning disability is believed to be distributed normally, with mean of 65 minutes and a standard deviation of 15 minutes, then when can the exam be terminated so that 99 percent of those with the disability can finish Solution: Because t he average and standard deviation are known, what needs to be established is the amount of time, above the mean time, such that 99 percent of the distribution is lower. This is a distance that is measured in standard deviations as given by the Z value corresponding to the 0.99 probability found in the body of Appendix B, Table 5,as shown in the textbook OR the commands entered into any cell of Excel to find this Z value is NORMINV(0.99,0,1) for 2.326342. The closest cumulative probability that can be found is 0.9901, in the row labeled 2.3 and column headed by .03, Z 2.33, which is only an approximation for the more exact 2.326342 found in Excel. Using this more exact value the calculation with mean m and standard deviation s in the following formula would be Z ( X - m ) s That is, Z ( x - 65)15 Thus, x 65 15(2.32634) 99.9 minutes. Alternatively, instead of standardizing with the Z distribution using Excel we can simply work directly with the normal distribution with a mean of 65 and standard deviation of 15 and enter NORMINV(0.99,65,15). In general to obtain the x value for which alpha percent of a normal random variables values are lower, the following NORMINV command may be used, where the first entry is a. the second is m. and the third is s. Another Example: In the early 1980s, the Toro Company of Minneapolis, Minnesota, advertised that it would refund the purchase price of a snow blower if the following winters snowfall was less than 21 percent of the local average. If the average snowfall is 45.25 inches, with a standard deviation of 12.2 inches, what is the likelihood that Toro will have to make refunds Solution: Within limits, snowfall is a continuous random variable that can be expected to vary symmetrically around its mean, with values closer to the mean occurring most often. Thus, it seems reasonable to assume that snowfall (x) is approximately normally distributed with a mean of 45.25 inches and standard deviation of 12.2 inches. Nine and one half inches is 21 percent of the mean snowfall of 45.25 inches and, with a standard deviation of 12.2 inches, the number of standard deviations between 45.25 inches and 9.5 inches is Z: Z ( x - m ) s (9.50 - 45.25)12.2 -2.93 Using Appendix B, Table 5, the textbook demonstrates the determination of P(x 163 9.50) P(z 163 -2.93) 0.17, the probability of snowfall less than 9.5 inches. Using Excel, this normal probability is obtained with the NORMDIST command, where the first entry is x, the second is mean m. the third is standard deviation s, and the fourth is CUMULATIVE (1). Entering NORMDIST(9.5,45.25,12.2,1), Gives P( x 163 9.50) 0.001693. Sampling Distribution and the Central Limit Theorem : A bakery sells an average of 24 loaves of bread per day. Sales (x) are normally distributed with a standard deviation of 4. If a random sample of size n 1 (day) is selected, what is the probability this x value will exceed 28 If a random sample of size n 4 (days) is selected, what is theprobability that xbar 179 28 Why does the answer in part 1 differ from that in part 2 1. The sampling distribution of the sample mean xbar is normal with a mean of 24 and a standard error of the mean of 4. Thus, using Excel, 0.15866 1-NORMDIST(28,24,4,1). 2. The sampling distribution of the sample mean xbar is normal with a mean of 24 and a standard error of the mean of 2 using Excel, 0.02275 1-NORMDIST(28,24,2,1). Regression Analysis: The highway deaths per 100 million vehicle miles and highway speed limits for 10 countries, are given below: (Death, Speed) (3.0, 55), (3.3, 55), (3.4, 55), (3.5, 70), (4.1, 55), (4.3, 60), (4.7, 55), (4.9, 60), (5.1, 60), and (6.1, 75). From this we can see that five countries with the same speed limit have very different positions on the safety list. For example, Britain. with a speed limit of 70 is demonstrably safer than Japan, at 55. Can we argue that, speed has little to do with safety. Use regression analysis to answer this question. Solution: Enter the ten paired y and x data into cells A2 to A11 and B2 to B11, with the death rate label in A1 and speed limits label in B1, the following steps produce the regression output. Choose Regression from Data Analysis in the Tools menu. The Regression dialog box will will appear. Note: Use the mouse to move between the boxes and buttons. Click on the desired box or button. The large rectangular boxes require a range from the worksheet. A range may be typed in or selected by highlighting the cells with the mouse after clicking on the box. If the dialog box blocks the data, it can be moved on the screen by clicking on the title bar and dragging. For the Input Y Range, enter A1 to A11, and for the Input X Range enter B1 to B11. Because the Y and X ranges include the Death and Speed labels in A1 and B1, select the Labels box with a click. Click the Output Range button and type reference cell, which in this demonstration is A13. To get the predicted values of Y (Death rates) and residuals select the Residuals box with a click. Your screen display should show a Table, clicking OK will give the SUMMARY OUTPUT, ANOVA AND RESIDUAL OUTPUT The first section of the EXCEL printout gives SUMMARY OUTPUT. The Multiple R is the square root of the R Square the computation and interpretation of which we have already discussed. The Standard Error of estimate (which will be discussed in the next chapter) is s 0.86423, which is the square root of Residual SS 5.97511 divided by its degrees of freedom, df 8, as given in the ANOVA section. We will also discuss the adjusted R-square of 0.21325 in the following chapters. Under the ANOVA section are the estimated regression coefficients and related statistics that will be discussed in detail in the next chapter. For now it is sufficient to recognize that the calculated coefficient values for the slope and y intercept are provided (b 0.07556 and a -0.29333). Next to these coefficient estimates is information on the variability in the distribution of the least-squares estimators from which these specific estimates were drawn: the column titled Std. Error contains the standard deviations (standard errors) of the intercept and slope distributions the t-ratio and p columns give the calculated values of the t statistics and associated p-values. As shown in Chapter 13, the t statistic of 1.85458 and p-value of 0.10077, for example, indicates that the sample slope (0.07556) is sufficiently different from zero, at even the 0.10 two-tail Type I error level, to conclude that there is a significant relationship between deaths and speed limits in the population. This conclusion is contrary to assertion that speed has little to do with safety. SUMMARY OUTPUT: Multiple R 0.54833, R Square 0.30067, Adjusted R Square 0.21325, Standard Error 0.86423, Observations 10 ANOVA df SS MS F P-value Regression 1 2.56889 2.56889 3.43945 0.10077 Residual 8 5.97511 0.74689 Total 9 8.54400 Coeffs. Estimate Std. Error T Stat P-value Lower 95 Upper 95 Intercept -0.29333 2.45963 -0.11926 0.90801 -5.96526 5.37860 Speed 0.07556 0.04074 1.85458 0.10077 -0.01839 0.16950 Predicted Residuals 3.86222 -0.86222 3.86222 -0.56222 3.86222 -0.46222 4.99556 -1.49556 3.86222 0.23778 4.24000 0.06000 3.86222 0.83778 4.24000 0.66000 4.24000 0.86000 5.37333 0.72667 Microsoft Excel Add-Ins Forecasting with regression requires the Excel add-in called Analysis ToolPak , and linear programming requires the Excel add-in called Solver . How you check to see if these are activated on your computer, and how to activate them if they are not active, varies with Excel version. Here are instructions for the most common versions. If Excel will not let you activate Data Analysis and Solver, you must use a different computer. Excel 20022003: Start Excel, then click Tools and look for Data Analysis and for Solver. If both are there, press Esc (escape) and continue with the respective assignment. Otherwise click Tools, Add-Ins, and check the boxes for Analysis ToolPak and for Solver, then click OK. Click Tools again, and both tools should be there. Excel 2007: Start Excel 2007 and click the Data tab at the top. Look to see if Data Analysis and Solver show in the Analysis section at the far right. If both are there, continue with the respective assignment. Otherwise, do the following steps exactly as indicated: - click the 8220Office Button8221 at top left - click the Excel Options button near the bottom of the resulting window - click the Add-ins button on the left of the next screen - near the bottom at Manage Excel Add-ins, click Go - check the boxes for Analysis ToolPak and Solver Add-in if they are not already checked, then click OK - click the Data tab as above and verify that the add-ins show. Excel 2010: Start Excel 2010 and click the Data tab at the top. Look to see if Data Analysis and Solver show in the Analysis section at the far right. If both are there, continue with the respective assignment. Otherwise, do the following steps exactly as indicated: - click the File tab at top left - click the Options button near the bottom of the left side - click the Add-ins button near the bottom left of the next screen - near the bottom at Manage Excel Add-ins, click Go - check the boxes for Analysis ToolPak and Solver Add-in if they are not already checked, then click OK - click the Data tab as above and verify that the add-ins show. Solving Linear Programs by Excel Some of these examples can be modified for other types problems Computer-assisted Learning: E-Labs and Computational Tools My teaching style deprecates the plug the numbers into the software and let the magic box work it out approach. Personal computers, spreadsheets, e. g. Excel. professional statistical packages (e. g. such as SPSS), and other information technologies are now ubiquitous in statistical data analysis. Without using these tools, one cannot perform any realistic statistical data analysis on large data sets. The appearance of other computer software, JavaScript Applets. Statistical Demonstrations Applets. and Online Computation are the most important events in the process of teaching and learning concepts in model-based statistical decision making courses. These tools allow you to construct numerical examples to understand the concepts, and to find their significance for yourself. Use any or online interactive tools available on the WWW to perform statistical experiments (with the same purpose, as you used to do experiments in physics labs to learn physics) to understand statistical concepts such as Central Limit Theorem are entertaining and educating. Computer-assisted learning is similar to the experiential model of learning. The adherents of experiential learning are fairly adamant about how we learn. Learning seldom takes place by rote. Learning occurs because we immerse ourselves in a situation in which we are forced to perform and think. You get feedback from the computer output and then adjust your thinking-process if needed. A SPSS-Example . SPSS-Examples . SPSS-More Examples . (Statistical Package for the Social Sciences) is a data management and analysis product. It can perform a variety of data analysis and presentation functions, including statistical analyses and graphical presentation of data. SAS (Statistical Analysis System) is a system of software packages some of its basic functions and uses are: database management inputting, cleaning and manipulating data, statistical analysis, calculating simple statistics such as means, variances, correlations running standard routines such as regressions. Available at: SPSSSAS Packages on Citrix (Installing and Accessing ) Use your email ID and Password: Technical Difficulties OTS Call Center (401) 837-6262 Excel Examples. Excel More Examples It is Excellent for Descriptive Statistics, and getting acceptance is improving, as computational tool for Inferential Statistics. The Value of Performing Experiment: If the learning environment is focused on background information, knowledge of terms and new concepts, the learner is likely to learn that basic information successfully. However, this basic knowledge may not be sufficient to enable the learner to carry out successfully the on-the-job tasks that require more than basic knowledge. Thus, the probability of making real errors in the business environment is high. On the other hand, if the learning environment allows the learner to experience and learn from failures within a variety of situations similar to what they would experience in the real world of their job, the probability of having similar failures in their business environment is low. This is the realm of simulations-a safe place to fail. The appearance of statistical software is one of the most important events in the process of decision making under uncertainty. Statistical software systems are used to construct examples, to understand the existing concepts, and to find new statistical properties. On the other hand, new developments in the process of decision making under uncertainty often motivate developments of new approaches and revision of the existing software systems. Statistical software systems rely on a cooperation of statisticians, and software developers. Beside the professional statistical software Online statistical computation . and the use of a scientific calculator is required for the course. A Scientific Calculator is the one, which has capability to give you, say, the result of square root of 5. Any calculator that goes beyond the 4 operations is fine for this course. These calculators allow you to perform simple calculations you need in this course, for example, enabling you to take square root, to raise e to the power of say, 0.36. och så vidare. These types of calculators are called general Scientific Calculators. There are also more specific and advanced calculators for mathematical computations in other areas such as Finance, Accounting, and even Statistics. The last one, for example, computes mean, variance, skewness, and kurtosis of a sample by simply entering all data one-by-one and then pressing any of the mean, variance, skewness, and kurtosis keys. Without a computer one cannot perform any realistic statistical data analysis. Students who are signing up for the course are expected to know the basics of Excel. As a starting point, you need visiting the Excel Web site created for this course. If you are challenged by or unfamiliar with Excel, you may seek tutorial help from the Academic Resource Center at 410-837-5385, E-mail. What and How to Hand-in My Computer Assignment For the computer assignment I do recommend in checking your hand computation homework, and checking some of the numerical examples from your textbook. As part of your homework assignment you don not have to hand in the printout of the computer assisted learning, however, you must include within your handing homework a paragraph entitled Computer Implementation describing your (positive or negative) experience. Interesting and Useful Sites The Copyright Statement: The fair use, according to the 1996 Fair Use Guidelines for Educational Multimedia. of materials presented on this Web site is permitted for non-commercial and classroom purposes only. This site may be mirrored intact (including these notices), on any server with public access. All files are available at home. ubalt. eduntsbarshBusiness-stat for mirroring. Kindly e-mail me your comments, suggestions, and concerns. Tack. EOF: CopyRights 1994-2015.From 8:00 PM CST Friday, Feb 24 - 6:00 PM CST Saturday, Feb 25, ni will be undergoing system upgrades that may result in temporary service interruption. Vi uppskattar ditt tålamod när vi förbättrar vår online-upplevelse. Moving Beyond Microsoft Excel för mätdataanalys och rapportering Publiceringsdatum: 18, 2014 44 4,39 5 Skriv ut Till följd av sin utbredda tillgänglighet är Microsoft Excel ofta de facto valet av ingenjörer och forskare som behöver programvara för mätdataanalys och manipulation. Microsoft Excel låter sig bra till extremt enkla test - och mätapplikationer och de finansiella användningarna som den utformades för, men i en era när företag tvingas göra mer med mindre, väljer man lämpliga verktyg för att maximera effektiviteten (därmed sänka kostnaderna) är absolut nödvändigt . Bara för att Microsoft Excel redan är installerat på datorn gör det inte rätt verktyg för alla jobb. National Instruments DIAdem-programvara som skapades specifikt för hantering, inspektion, analys och rapportering av förvärvade eller simulerade tekniska och vetenskapliga data ger effektivitetsvinster och skalbarhet med funktioner som övervinner begränsningarna i Excel i de flesta efterbehandlingsapplikationer. Innehållsförteckning 1. Skillnader i grundläggande byggstenar: celler mot kanaler Microsoft Excel använder cellen som sin grundläggande byggsten.160 Celler bildar rader och kolumner för att skapa ett kalkylblad, en arkitektur som är idealisk för budgetar och balansräkningar.160 Enkel Enstaka datainsamlingstillämpningar, till exempel de som samlar en enda datapunkt en timme under en dag, är ofta enkelt mappade till den här arkitekturen eftersom varje enskild datapunkt har större betydelse när färre datapunkter samlas.160 Varje data punkt existerar som en cell i ett kalkylblad och måste manipuleras med Excels cellbaserade paradigm. De flesta datainsamlingsapplikationer är dock inte trivial.160 Program som samlar dussintals datakanaler med mega-prissättning per sekund (MSs) är vanliga.160 I dessa applikationer görs data manipulation och interaktion på en signal eller kanal som en helhet.160 När man manipulerar kanaler i Excel som kolumner av enskilda celler förloras en signalens enhet.160 Även om hela Excel-kolumnerna kan manipuleras åt gången, är detta mer besvärligt med längre kolumner.160 Även kolumner innehåller ofta beskrivande information som ett namn eller en enhet utöver de råa numeriska data.160 I det här fallet måste en delmängd av kolumnen väljas (till exempel intervallet A2: A99), införande av overhead och potentialen för felaktigheter eller fel. I figur 1. Excel används för att utföra en enkel men vanlig teknisk uppgift: medelvärde fem temperaturkanaler lagrade i kolumner för att skapa en resulterande medelkanal.160 Den genomsnittliga beräkningen måste först göras med cellens byggblock och kopieras (eller fyllas) till alla celler i den resulterande kolumnen.160 Med DIAdem, som använder kanalen som grundblock, är medelvärdena lika enkla som att dra och släppa inmatningskanaler till funktionen Medelkanaler, som visas i Figur 2 .160 Individuella datapunkter kan fortfarande manipuleras i DIAdem vid behov. Figur 1 . Microsoft Excel använder cellen som sin grundläggande byggsten.160 Även enkel dataanalys måste tillämpas på en cell och sedan upprepas för alla celler i en kolumn (kanal). Figur 2. NI DIAdem fungerar med byggstenen av a160channel.160 Averaging är lika enkelt som att dra och släppa hela datakanaler istället för att onödigt manipulera enskilda datapunkter. 2. Hundratals beräkningar av konstruktions - och vetenskapliga analyser Medan antalet tillgängliga formler för finansinriktade beräkningar i Excel är omfattande måste du konfigurera ett valfritt tillägg som kallas analysverktygspaketet för åtkomst till några tekniska och statistiska beräkningar.160 Analysen Verktygsfunktionerna är extremt begränsade, vilket visas i Figur 3 med den gemensamma konstruktionsberäkningen Fast Fourier Transform (FFT) .160 I allmänhet uppfyller Excels analysfunktioner ofta inte kraven för vetenskapliga eller tekniska applikationer.160 För ytterligare utvidgningsbarhet ger Excel en robust Visual Basic for Applications (VBA) - motor och en utmärkt VBA-redigeringsmiljö som gör det möjligt för dig att skriva dina egna konstruktionsberäkningar från början när Excels inbyggda funktioner är otillräckliga för din applikation. Figur 3. Microsoft Excel ger en omfattande uppsättning finansieringsbaserade beräkningar och låter ingenjörer skriva sin egen kod för att möta deras applikationsbehov. I DIAdem har hundratals konstruktions - och vetenskapliga analysberäkningar från enkelt tillägg till komplex matrismanipulation och orderanalys inkluderats i miljön.160 Analysfunktionerna i DIAdem är konfigurationsbaserade, ingen programmering krävs för att köra jämn komplex analys, t. ex. Digital filtrering , som visas i Figur 4.160 Dessutom innehåller DIAdem-analysfunktionerna fullständiga förhandsgranskningar av analysresultat så att du kan undvika felaktiga beräkningar genom att se till att du använder de korrekta parametrarna innan du kör varje beräkning. Figur 4. DIAdem innehåller hundratals analysfunktioner specifika för forskare och ingenjörer.160 Varje beräkning är konfigurationsbaserad och ger en förhandsvisning av resulterande kanaler så att du kan interagera med parametrar för att säkerställa noggrannhet och minska fel. DIAdem innehåller också ett ramverk för att skapa egna domänspecifika beräkningar som kallas Beräkningshanteraren, och den innehåller ett integrerat Visual Basic-skriptgränssnitt för att sekvensera inbyggda DIAdem-beräkningar eller definiera egna anpassade beräkningar. 3. Ladda och manipulera stora volymer av data Dataströmhastigheter för vanliga applikationer når eller överstiger MSs-priser.160 I en applikation som samlar en enda kanal av data vid 1 MS, samlas totalt 1 000 000 datapunkter i ett en sekunders förvärv . På några minuter kan miljontals datapunkter sparas på gigabyte hårddiskutrymme. När Microsoft Excel försöker ladda en datafil som innehåller en stor mängd data försöker den att ladda varje enskild datapunkt i minnet.160 Med utgåvan av 64-bitarsversionen av Microsoft Excel 2010 är detta mindre begränsad, som applikationen har ett större adresserbart minnesutrymme, men laddning av hela en stor dataset i Excel kan ofta ta många minuter på grund av den stora volymen av data som behöver laddas.160 Dessutom lagrar Excel inte bara numeriska värden i varje cell men också numerisk formatering, cellformatering, formler, kalkylarklänkar, Internet-hyperlänkar och kommentarer.160 Den här cellcentrerade flexibiliteten är idealisk för företagsspecifikkartor där synlighet på cellnivå är nyckeln, men den lägger till160 unødvendigt minnesutgifter för dataset med miljontals värden . 160 För att undvika eventuella minnesproblem ställer Excel en gräns på maximalt 160W och kolumner.160 Introduktionen av Excel 2007 ökade det totala antalet rader per arbetsblad från 65.536 till drygt 1.000.000 (2.20 för att vara exakt) och den totala Antal kolumner från 256 till 16 384 (2 14). 160 Användning av figurerna 5 och 6. kontrast Excels rad - och kolumnbegränsning med DIAdems förmåga att manipulera 500.000.000 rader (poäng) som enbart en bråkdel av dess begränsning.160 Figur 5. Excel kan bara ladda över drygt 1 miljon rader data för en given kolumn.160 Detta är en begränsning för forskare och ingenjörer. Figur 6. DIAdem kan enkelt hantera extremt stora datasatser.160 Den här bilden visar 160 exempel på 500 000 000 (en halv miljarder) datapunkter i en kanal - 500 gånger det maximala antalet rader som tillåts av Excel. Såsom visas i figur 5. en förvärvshastighet på 1 MS med en enda kanal skulle överstiga antalet datapunkter som Excel kunde ladda på drygt en sekund av förvärvet.160 Många ingenjörer och forskare känner sig tvungna att tillåta begränsningarna i deras datapostbehandlingsprogramvara för att diktera Villkoren för deras förvärv och antingen minska anskaffningsgraden eller segmentförvärv i flera datafiler, introducerar en mardröm för datahantering och organisation. DIAdem var utformat för att manipulera mätdata i både små och stora volymer och kan bearbeta upp till 2.000.000.000 datapunkter (2 31) per kanal över 65 536 (2 16) totala datakanaler.160 Dessutom inkluderar DIAdem160 selektiv laddning, datareduktion och register Laddar funktioner som är särskilt utformade för att arbeta med extremt stora datasatser.160 DIAdem kan selektivt ladda en delmängd av datakanalerna i en datafil medan Excel alltid importerar alla kolumnerna från en datafil.160 Om du bara behöver ladda 1 kanal från en mycket stor datafil med 10 kanaler i den. Endast 10 av de datavärden som du faktiskt behöver är mycket snabbare och effektivare än Excels-metoden för att ladda 100 av data när 90 är overhead.160 När filer laddas med datareduktion laddar DIAdem data från ett valt radintervall andor kondenserar varje N-rad till ett representativt värde, medan Excel alltid laddar alla data rader.160 När filer är registrerade laddas DI Adem använder den befintliga datafilen på disken, eftersom virtuellt minne på platsen inte laddar alla värden från datafilen samtidigt, men registrerar istället hur man får tillgång till block av datavärden på begäran.160 Detta gör att registrerade laddade kanaler 160 är lässkyddade, men det möjliggör mycket snabb grafik och inspektion av extremt stora datamängder, som visas i Figur 6. Visa en användarlösning om hur DIAdem behandlar enorma mängder data för att hjälpa till att förutse och övervaka jordbävningsaktivitet. 4. Flexibilitet i File Storage Format Program som samlar in och sparar data vid höga strömmingshastigheter måste skriva data till disken med ett streaming-kompatibelt filformat.160 Binära filformat används oftast eftersom de inte innehåller det externa överhead som krävs för att skapa en fil mänskligt läsbar hur ASCII-filer gör.160 En jämförelse av vanliga filformat, 160 inklusive den öppna binära formatstandarden för National Instruments-programvaran, som kallas Technical Data Management Streaming (TDMS), visas i Tabell 1. 160160160160160 Tabell 1. Det finns många filformatalternativ tillgängliga, men binära filformat som TDMS är de enda format som är kompatibla med höghastighetsströmmar. Kan kräva en verktygslåda eller tilläggsmodul. DIAdem är flexibel nog för att läsa alla anpassade filformat inklusive anpassade binära filformat på grund av modulära bitar av kod som heter DataPlugins som vet hur man analyserar och tolkar 160 innehållet i en datafil.160 DataPlugins formaterar också de analyserade data från den specifika datafilen i en gemensam datastruktur inuti DIAdem, vilket gör det enkelt att jämföra data laddade från olika filformat.160 National Instruments har publicerat gratis nedladdningsbara DataPlugins för hundratals de vanligaste datafilformat, och det finns publicerade API för LabVIEW och VBScript för dig för att skapa DataPlugins för egna äldre datafiler.160 Detta gör det möjligt för DIAdem att vara modulär och skalbar nog att hantera valfria aktuella, tidigare eller kommande datafilformatval. Däremot, medan Excel kan läsa ASCII-filer, är det vanligtvis helt inte möjligt att ladda data från binära filer.160 Även om Excel framgångsrikt laddar en ASCII-fil, har den begränsad förmåga att korrekt tolka egenskaps - och kanalstrukturen i datafilen. 160Too ofta är tidskrävande omformatering av de importerade ASCII-data nödvändiga innan den kan användas alls.160 Ett undantag till detta problem är 160TDMS-filformatet från 160 nationella instrument, vilket Excel laddas med korrekt formatering av strukturen, egenskaperna och data från TDMS-filen, using160 det kostnadsfria TDM Excel-tillägget. Besök TDMS hemsida för att lära dig mer om TDMS-filformatet för lagring av mätdata till disken. 5. Inbyggda verktyg för datahantering och trending Över tiden är det vanligt att lagra och försöka organisera hundratals eller tusentals datafiler på disken.160 Dessa filer lagras ofta på olika sätt med olika format och kan till och med lagras på olika platser på en lokal maskin eller över ett nätverk. Om du vill trenden data över flera datafiler med hjälp av Microsoft Excel måste du öppna varje enskild datafil, kopiera de relevanta kolumnerna och klistra in dem i en mastergrupp (aggregerad) fil och flytta till nästa datafil.160 Precis trending liknande Datakanaler över hundratals unika datafiler kan ta dagar eller veckor. DIAdem kan utföra samma uppgift på några sekunder.160 Med hjälp av DataPlugins kan DIAdem ladda dessa olika filformat till en gemensam importerad struktur för enhetlig analys och rapportering. Dessutom installerar DIAdem en teknik som heter My DataFinder som hjälper dig att snabbt hitta och isolera de exakta dataseten du söker, även om de finns över olika filer som visas i Figur 7. 160 My DataFinder skapar automatiskt ett index över den beskrivande informationen Innehållet i datafiler som blir sökbara inom DIAdem.160 Med DIAdem och DataFinder-tekniken kan du snabbt hitta alla datafiler som skrivits av en viss operatör, hitta alla misslyckade tester eller ens identifiera alla datakanaler över alla datafiler som lagrats Använda en specifik typ av sensor.160 Ju mer information du dokumenterar i dina datafiler, desto fler möjligheter är tillgängliga när du söker efter specifika data lagrade över flera filer i olika mappar och eller filformat. Figur 7. I den här frågan har DataFinder placerat datakanaler över alla datafiler som samlades in med ett J-Type-termoelement och lagras på disk av operatören Jennifer. Visa en webbsändning som visar DIAdem och NI DataFinder för datahantering, analys och rapportering. 6. Datainspektion och synkronisering Med Microsoft Excel kan användare skapa grundläggande diagram och diagram, men statiska grafer tillåter dig inte att interagera fullständigt med och inspektera data som har mätts över tiden.160 Det är exempelvis omöjligt att visualisera korrelerade mätdata och GPS160data med inbyggda verktyg i Excel. 160 För att helt och hållet karakterisera alla aspekter av tidsbaserade mätningar innehåller DIAdem ett kraftfullt visualiseringsverktyg som har synkroniserbara visningsytor som är idealiska för att spela upp mätningar samordnade med videoklipp, 3D-modeller, axelsystem, GPS-kartskärmar, konturer, ljuduppspelning, och mer.160 Detta gör att du kan spela upp en mätning synkroniserad med annan information för att fullständigt förstå dess sammanhang.160 DIAdems visualiseringsverktyg gör det också enkelt för dig att zooma in i en viss region i ett diagram, kopiera eller radera eller interpolera dataområdena och undersöka Exakta värden för specifika punkter grafiskt.160 Med hjälp av det här dynamiska verktyget är det enkelt att identifiera intressanta regioner eller hitta avvikelser inom större dataset. Figur 8 . Med DIAdem kan du helt synkronisera uppspelningen av mätdata, ljuddata, GPS-koordinater, video och mer. 7. Rapporteringsmallar som du kan få (WYSIWYG) DIAdem har en robust rapporteringsmaskin som utnyttjar återanvändbara mallar eftersom många ingenjörer genererar samma rapporter flera gånger med olika datasatser.160 WYSIWYG-rapportmallen i DIAdem lagra referenser till data i minnet i motsats till att lagra själva data värden själva. För att skapa rapporter från olika dataset med samma lagrade rapportmall kan du helt enkelt ladda de nya dataen till minnet och den laddade rapportmallen uppdaterar upprepade gånger 160its visning med de nyinstallerade datavärdena.160 Du kan sedan exportera fulländad, upplagd publikation Redan rapporterar till de vanligaste rapporteringsformaten, inklusive PDF, PowerPoint, HTML, bild och mer. 160 I Excel sparas rapportdisplayen tillsammans med data i en gemensam kalkylarkfil, vilket gör det mycket svårare att använda en viss rapportdisplay för flera dataset. 160 Figur 9. DIAdem har en WYSIWYG-rapportredigerare. Publicerade färdiga exporterade rapporter kommer att se ut som de är identiska med deras redigeringstidsmallar. 8. Interaktiv Automation Excel ger en kraftfull miljö för att utveckla makron.160 Med inspelningsläge kan du spela in makroner som 160automatiserar långa utvärderingar eller beräkningar.160 DIAdem similarly160 har 160an integrerad VBScript-editor, en användardialogredaktör och en manusskrivare för att interaktivt skapa skript som automatiserar långa utvärderingar eller beräkningar. 160160Användning av skript kan hela DIAdem-miljön anpassas och automatiseras så att processer för repetitiva dataflytningar som brukade ta dagar kan uppnås på några minuter.160 Detta maximerar effektiviteten hos ingenjörer och forskare och minskar dramatiskt tiden det tar dem för att göra rå mätdata till användbar information. 9. Excel är gratis, men för dyrt att använda Microsoft Office används av cirka 80 företag1. 160 Många ingenjörer och forskare ser Excel som fri programvara eftersom den är installerad på de flesta företagsdatorer utan fråga.160 Ofta börjar forskare och ingenjörer använd Excel för deras analys och rapporteringsbehov eftersom det är bekant och tillgängligt.160 När de stöter på Excels-begränsningar som sammanfattas i tabell 2. De lever antingen med ofta repetitiv och tidskrävande manuell bearbetning eller spenderar timmar och veckor som utvecklar och underhåller anpassad makrokod. Om du uppskattar att personalkostnader (inklusive lön, försäkring, utrustning, etc.) för en ingenjör totalt 100 000 årligen, skulle kostnaden för att köpa en licens för DIAdem Advanced och en hel vecka av träning återhämtas efter bara 2,8 arbetsveckor av realiserade produktivitetsvinster över Microsoft Excel. Som detaljerat i detta dokument betalar NI DIAdem snabbt sig själv genom att övervinna gränserna i Excel och introducera ytterligare effektivitetsverktyg för hantering, analysering och160 rapporteringsmätningsdata.160160 Tabell 2. DIAdem ökar effektiviteten genom att övervinna begränsningarna i Microsoft Excel. 10. Läs mer och flytta till DIAdem idag Använd resurserna nedan för att lära dig mer om att flytta bortom Excel till mer kraftfulla verktyg för mätdataanalys och rapportering. Visa en webbsändningsperspektiv DIAdems har förmåner för datahantering, analys och rapportering. Titta på sex 1 minuters videor för att lära dig mer om DIAdem. Ladda ner DIAdem och utforska miljön med en gratis 7-dagars utvärdering. Tala med en expert för en gratis webbdemo eller att få dina frågor besvarade genast.

No comments:

Post a Comment