Hoe Basic Data Analysis te doen in Excel

Hoe Basic Data Analysis te doen in Excel / produktiviteit

Meestal wanneer u statistieken uitvoert, wilt u statistische software gebruiken. Deze hulpmiddelen zijn gemaakt om berekeningen te doen zoals t-testen, chikwadraattests, correlaties, enzovoort. Excel is niet bedoeld voor gegevensanalyse. Maar dat betekent niet dat je het niet kunt doen.

Helaas zijn de statistische functies van Excel niet altijd intuïtief. En ze geven je meestal esoterische resultaten. Dus in plaats van het gebruik van statistische functies, gebruiken we de go-to Excel statistieken-invoegtoepassing: de Data Analysis Toolpak.

De Toolpak bevat, ondanks zijn nogal ongelukkige spelling, een breed scala aan nuttige statistische functies. Laten we eens kijken wat we kunnen doen met Excel-statistieken.

Het Excel Data Analysis Toolpak toevoegen

Terwijl jij kan doen statistieken zonder de Data Analysis Toolpak, het is veel gemakkelijker ermee. Ga naar voor het installeren van de Toolpak in Excel 2016 Bestand> Opties> Add-ins.

Klik Gaan naast “Beheer: Excel-invoegtoepassingen.”

Vink in het resulterende venster het selectievakje naast aan Analyse Toolpak en klik vervolgens op OK.

Als u de Data Analysis Toolpak correct aan Excel hebt toegevoegd, ziet u a Gegevensanalyse knop in de Gegevens tabblad, gegroepeerd in de Analyse sectie:

Als u nog meer power wilt, moet u Excel's andere invoegtoepassingen Power Up Excel met 10 invoegtoepassingen bekijken om gegevens te verwerken, analyseren en visualiseren als een professional Power-up Excel met 10 invoegtoepassingen om gegevens te verwerken, analyseren en visualiseren Net als een Pro Vanilla Excel is geweldig, maar je kunt het nog krachtiger maken met invoegtoepassingen. Welke gegevens u ook moet verwerken, de kans is groot dat iemand hiervoor een Excel-app heeft gemaakt. Hier is een selectie. Lees verder .

Beschrijvende statistiek in Excel

Ongeacht de statistische test die u uitvoert, wilt u waarschijnlijk de beschrijvende statistieken van Excel eerst ontvangen. Dit geeft je informatie over gemiddelden, medianen, variantie, standaardafwijking en -fout, kurtosis, skewness en een aantal andere figuren.

Het uitvoeren van beschrijvende statistieken in Excel is eenvoudig. Klik Gegevensanalyse op het tabblad Gegevens, selecteer Beschrijvende statistieken, en selecteer je invoerbereik. Klik op de pijl naast het veld voor invoerbereik, klik-en-sleep om uw gegevens te selecteren en druk op invoeren (of klik op de overeenkomende pijl naar beneden), zoals in de onderstaande GIF.

Geef daarna aan Excel door of uw gegevens labels bevatten, of u de uitvoer in een nieuw blad of op een nieuw blad wilt en of u samenvattingsstatistieken en andere opties wilt.

Daarna sloeg OK, en je krijgt je beschrijvende statistieken:

Studententest in Excel

De t-test is een van de meest elementaire statistische tests, en het is eenvoudig om in Excel te berekenen met de Toolpak. Klik op de Gegevensanalyse en scroll naar beneden totdat je de t-test opties.

Je hebt drie keuzes:

  • t-Test: twee monsters voor gemiddelden gecombineerd moet worden gebruikt wanneer uw metingen of waarnemingen zijn gepaard. Gebruik dit wanneer u twee metingen van dezelfde onderwerpen hebt uitgevoerd, zoals het meten van de bloeddruk voor en na een interventie.
  • t-Test: tweeledige veronderstelling van gelijke verschillen moet worden gebruikt wanneer uw metingen onafhankelijk zijn (wat meestal betekent dat ze op twee verschillende onderwerpgroepen zijn uitgevoerd). We zullen het bespreken “gelijke varianties” deel in een moment.
  • t-Test: Two-Sample uitgaande van ongelijke afwijkingen is ook voor onafhankelijke metingen, maar wordt gebruikt wanneer uw afwijkingen ongelijk zijn.

Als u wilt testen of de varianties van uw twee steekproeven gelijk zijn, moet u een F-toets uitvoeren. Vind F-test twee-steekproef voor afwijkingen in de lijst Analysehulpmiddelen, selecteer het en klik op OK.

Voer uw twee gegevenssets in in de vakken voor invoerbereik. Laat de alpha-waarde op 0.05 tenzij je reden hebt om het te veranderen. Als je niet weet wat dat betekent, ga je gewoon weg. Klik ten slotte op OK.

Excel geeft u de resultaten in een nieuw blad (tenzij u hebt geselecteerd Output bereik en een cel in uw huidige blad):

Je kijkt hier naar de P-waarde. Als het minder is dan 0,05, heb je ongelijke varianties. Dus om het t-test, moet u de optie ongelijke varianties gebruiken.

Een uitvoeren t-test, selecteer de juiste test in het venster Analyse-tools en selecteer beide sets van uw gegevens op dezelfde manier als u deed voor de F-test. Laat de alpha-waarde op 0,05 en druk op OK.

De resultaten bevatten alles wat u moet melden voor een t-test: de gemiddelden, vrijheidsgraden (df), t-statistiek en de P-waarden voor zowel een- als tweezijdige tests. Als de P-waarde kleiner is dan 0,05, zijn de twee monsters aanzienlijk verschillend.

Als u niet zeker weet of u een een- of tweestaartig wilt gebruiken t-test, bekijk deze uitleg van UCLA.

ANOVA in Excel

De Excel Data Analysis Toolpak biedt drie soorten variantieanalyse (ANOVA). Helaas geeft dit je niet de mogelijkheid om de nodige vervolgtesten uit te voeren, zoals Tukey of Bonferroni. Maar je kunt zien of er een verband is tussen een paar verschillende variabelen.

Hier zijn de drie ANOVA-tests in Excel:

  • ANOVA: enkele factor analyseert variantie met één afhankelijke variabele en één onafhankelijke variabele. Het verdient de voorkeur om meerdere te gebruiken t-test wanneer u meer dan twee groepen hebt.
  • ANOVA: twee-factor met replicatie is vergelijkbaar met de gepaarde t-test; het gaat om meerdere metingen op afzonderlijke onderwerpen. De “tweeledige” een deel van deze test geeft aan dat er twee onafhankelijke variabelen zijn.
  • ANOVA: twee factoren zonder replicatie omvat twee onafhankelijke variabelen, maar geen replicatie in de meting.

We zullen hier de enkelvoudige factoranalyse bespreken. In ons voorbeeld kijken we naar drie reeksen getallen, gelabeld “Interventie 1,” “Interventie 2,” en “Interventie 3.” Klik op om een ​​ANOVA uit te voeren Gegevensanalyse, selecteer vervolgens ANOVA: enkele factor.

Selecteer het invoerbereik en zorg ervoor dat u Excel vertelt of uw groepen zich in kolommen of rijen bevinden. Ik heb ook geselecteerd “Labels in de eerste rij” hier zodat de groepsnamen worden weergegeven in de resultaten.

Na het slaan OK, we krijgen de volgende resultaten:

Merk op dat de P-waarde kleiner is dan 0,05, dus we hebben een significant resultaat. Dat betekent dat er een significant verschil is tussen ten minste twee van de groepen in de test. Maar omdat Excel geen tests levert om te bepalen welke groepen verschillen, het beste wat je kunt doen is kijken naar de gemiddelden weergegeven in de samenvatting. In ons voorbeeld ziet Intervention 3 eruit zoals het is waarschijnlijk degene die anders is.

Dit is niet statistisch verantwoord. Maar als u alleen wilt zien of er een verschil is en ziet welke groep dit waarschijnlijk veroorzaakt, werkt het.

Twee-factor ANOVA is ingewikkelder. Als je meer wilt weten over wanneer je de twee-factor methode moet gebruiken, bekijk deze video van Sophia.org en de “zonder replicatie” en “met replicatie” voorbeelden uit Real Statistics.

Correlatie in Excel

Het berekenen van de correlatie in Excel is veel eenvoudiger dan de t-test of een ANOVA. Gebruik de Gegevensanalyse om het venster Analyse-tools te openen en selecteer Correlatie.

Selecteer uw invoerbereik, identificeer uw groepen als kolommen of rijen en vertel Excel of u labels hebt. Daarna sloeg OK.

Je krijgt geen maten van betekenis, maar je kunt zien hoe elke groep is gecorreleerd met de anderen. Een waarde van één is een absolute correlatie, wat aangeeft dat de waarden exact hetzelfde zijn. Hoe dichter bij één de correlatiewaarde, hoe sterker de correlatie.

Regressie in Excel

Regressie is een van de meest gebruikte statistische tests in de industrie en Excel biedt verrassend veel vermogen voor deze berekening. We zullen hier een snelle meervoudige regressie in Excel uitvoeren. Als u niet bekend bent met regressie, raadpleegt u de handleiding van HBR voor het gebruik van regressie voor bedrijven.

Laten we zeggen dat onze afhankelijke variabele de bloeddruk is en onze twee onafhankelijke variabelen zijn gewicht en zoutinname. We willen zien wat een betere voorspeller van de bloeddruk is (of dat ze allebei goed zijn).

Klik Gegevensanalyse en selecteer regressie. Wees voorzichtig bij het invullen van de vakken voor invoerbereik deze keer. De Y-bereik invoeren box moet uw enige afhankelijke variabele bevatten. De Input X bereik box kan meerdere onafhankelijke variabelen bevatten. Maak voor een eenvoudige regressie je geen zorgen over de rest (vergeet niet om Excel te vertellen als je labels hebt geselecteerd).

Dit is hoe onze berekening eruit ziet:

Na het slaan OK, je krijgt een grote lijst met resultaten. Ik heb hier de P-waarde voor zowel gewicht als zoutinname aangegeven:

Zoals je kunt zien, is de P-waarde voor het gewicht groter dan 0,05, dus er is geen significante relatie daar. De P-waarde voor zout is echter lager dan 0,05, wat aangeeft dat het een goede voorspeller van de bloeddruk is.

Als u van plan bent uw regressiegegevens te presenteren, onthoud dan dat u een regressielijn kunt toevoegen aan een scatterplot in Excel. Het is een geweldig visueel hulpmiddel. Hoe uw gegevensanalyse visualiseren met Excel Power Tools Hoe uw gegevensanalyse visualiseren met Excel Power Tools Excel vermoord het met zijn geavanceerde functies voor gegevensbeheer. Zodra u een van de nieuwe hulpmiddelen hebt gebruikt, wilt u ze allemaal. Word een meester in uw gegevensanalyse met elektrische gereedschappen! Lees meer voor deze analyse.

Excel-statistieken: verrassend goed

Hoewel Excel niet bekend staat om zijn statistische kracht, pakt het feitelijk enkele echt nuttige functionaliteit in. Vooral als je de Data Analysis Toolpak-statistieken invoegtoepassing downloadt. Ik hoop dat je hebt geleerd hoe je de Toolpak kunt gebruiken en dat je nu alleen kunt spelen om erachter te komen hoe je meer van zijn functies kunt gebruiken.

Met dit nu onder uw riem, brengt u uw Excel-vaardigheden naar het volgende niveau met onze artikelen over het gebruik van Excel's Goal Seek-functie voor meer data-crunching, het beheer van IF-statements in Excel en het toevoegen van vervolgkeuzelijsten als cellen in Excel.

Ik heb ook links naar andere sites met goede statistische zelfstudies waarin we verwarrende concepten moesten overslaan. Bekijk onze gids voor gratis statistiekenbronnen Leer gratis statistieken met deze 6 bronnen Leer gratis statistieken met deze 6 bronnen Statistieken hebben een reputatie als een onderwerp dat moeilijk te begrijpen is. Maar door te leren van de juiste bron kunt u de enquêteresultaten, verkiezingsrapporten en uw klassestoewijzingen in een mum van tijd begrijpen. Lees ook meer.

Ontdek meer over: Microsoft Excel, Spreadsheet.