Statistik f�r Jedermann

ArticleCategory:

Applications

AuthorImage:

[Photo of the Author]

TranslationInfo:

original in en J�rgen Pohl

en to de J�rgen Pohl

AboutTheAuthor:

J�rgen Pohl arbeitet als Entwicklungsingenieur und �bersetzer an der Pazifikk�ste der USA.

Abstract:


Die meisten Statistik-Pakete sind in ihrem Umfang etwas �berw�ltigend, sie zwingen den Benutzer auf einen steilen Lernpfad, ausserdem sind sie teuer. Es existieren jedoch einige hilfreiche Alternativen f�r jene, die solche am dringendsten ben�tigen: Anf�nger, die gerade in die magische Welt der Statistik einsteigen und jene, f�r welche die umfangreichen kommerziellen Pakete einfach zu umfangreich sind. SalStat ist eine der gew�nschten Alternativen - dank seines Sch�pfers ist es Open Source, d.h. es ist gratis! Ein weiterer Vorteil: das Programm l�uft auf den meisten Plattformen und ist sehr benutzerfreundlich.
Das Programm ist in Python geschrieben, es kann jedoch ohne Vorkenntnisse dieser Sprache benutzt werden. Auf der Homepage des Programms ist eine deutsche Version des Handbuchs zu finden.

ArticleIllustration:[Das Titelbild des Artikels]

[Logo]

ArticleBody:

SalStat - das Statistikprogramm

Einleitung

Mit seiner eigenen Erfahrung im Hintergrund, war sich der Entwickler von SalStat wohl bewusst, in welcher Klemme sich die neu in die Statistik Eingef�hrten befinden: um ihr neues Wissen aufzubauen (oder einfach ihre Hausaufgaben oder ein Projekt auszuf�hren), ist ein erschwingliches, benutzerfreundliches Statistikprogramm erforderlich. Mit diesen Gedanken begann Alan James Salmoni SalStat zu entwickeln. Es wurde unter der GNU-Lizenz ver�ffentlicht, es ist auf seiner Homepage zu finden.

Was kann man mit SalStat anfangen?

Leider kann dieser Artikel keine Einf�hrung in die Statistik anbieten, in ('Ressourcen') finden sich einige Quellen zu dem Thema.
Nachfolgend die Listen mit den Statistiken und Tests die SalStat ausf�hren kann.

Parametrische and Nicht-parametrische Tests sind hier zusammengefasst:

N (Gesamtumfang) Bereich
Summe Anzahl der fehlenden Zellen
Mittelwert geometrisches Mittel
Varianz harmonisches Mittel
Standardabweichung Schiefe
Standardfehler Kurtosis
Quadratsumme Medianwert
Summe der Abweichungsquadrate durchschnittliche absolute Abweichung
Varianzkoeffizient Modalwert, h�ufigster Wert
Minimum Quartilabstand
Maximum Anzahl der spezifischen Datennivaus

Inferenzstatistik

t-Test (paarweise) Pearsons Korrelation
t-Test (nicht-paarweise) Spearmans Rangkorrelation
Vorzeichentest mit einer Stichprobe Kendallsche Rangkorrelation
Vorzeichentest mit zwei Stichproben Punktbiseriale Korrelation r
F-Test, Varianzverh�ltnistest Lineae Regression
Wilcoxon Rangsummentest Einfaktorvarianzanalyse (zwischen Datenreihen)
Mann-Whitney U-Test Einfaktorvarianzanalyse (innerhalb einer Datenreihe)
Kolmogorov-Smirnov-Test Kruskall-Wallis H-Test
Paarweiser Permutationstest Friedmantest

Wie arbeitet man mit SalStat?

Bevor wir einen Blick auf SalStat werfen k�nnen, muss das Programm auf unserer Maschine installiert sein, darauf kommen wir jedoch sp�ter - einleitend m�chte ich einen Eindruck von dem Programm geben.
Beim �ffnen des Programms erscheinen zwei Fenster auf dem Bildschirm (ich muss hier einflechten, dass das Programm nicht lokalisiert ist, d.h. alle Werkzeuge, Auswahllisten, usw. sind in Englisch, z.Z. gibt es jedoch eine deutschsprachige Version des Benutzerhandbuchs - es kann von der Homepage heruntergeladen werden):


SalStat Statistics Main Window


Das Fenster im Vordergrund oben (betitelt 'SalStat Statistics') ist im Tabellenformat: hier geben wir unsere zu analysierenden Daten ein. Am oberen Rand des Fensters das Men� mit den �blichen Werkzeugen - klicken wir auf ein Werkzeug, �ffnet sich die zugeh�rige Dropdownliste zur Auswahl.

Das zweite Fenster ('SalStat Statistcs - Output') ist beim �ffnen leer, dort werden nach Durchf�hrung des Tests die Ergebnisse ausgegeben.


Um dem Einstiegsfrust vorzubeugen, hat der Autor von SalStat in weiser Voraussicht eine Testdatei beigef�gt (testreport1.txt). Wir geben also die Daten aus dieser Datei in unsere Tabelle ein, w�hlen die gew�nschten Statistiken und Tests - nach Best�tigung mit 'Okay' wird kurz darauf das Ergebnis im Output-Fenster erscheinen.
Der Screenshot unten zeigt diesen Vorgang in dieser Reihenfolge:


  1. Wir tragen die Daten der Testdatei in die Spalten A, B, C der Tabelle ein ('SalStat Statistics'-Fenster, unten links oben).
  2. In der Werkzeugleiste w�hlen wir 'Analyse'. Im folgenden Dropdownmen� w�hlen wir den 'One Condition Test' (nur ein Beispiel...).
  3. Das 'One Condition Test'-Fenster �ffnet sich. Hier markieren wir in den Abhakk�stchen unsere gew�nschten Statistiken und Test(s):
  4. Wir klicken auf 'Okay' und das vorher leere 'SalStat Statistics - Output'-Fenster zeigt uns die Ergebnisse.

Test File

SalStat herunterladen und installieren

Das Programm kann von seiner Homepage. heruntergeladen werden. Dort finden wir einige Alternativen, um den entsprechenden Betriebssystemen gerecht zu werden. Ich habe zum Beispiel das Programm auf zwei Desktopmaschinen mit unterschiedlichen Betriebssystemen laufen. Der Sourcecode steht ebenfalls zur Verf�gung - vielleicht m�chte jemand seine Pythonerfahrung demonstrieren und zur Erweiterung des Programms beitragen... Vor der Installation bitte den 'Basic Users Guide' lesen, der auf der SalStat-Homepage unter 'Documentation'zu finden ist. Die Instruktionen dort sind sehr klar, so dass wir diese hier nicht wiederholen m�ssen.


SalStat Einstellungen

Eine sehr n�tzliche Eigenschaft von Salstat ist die M�glichkeit, durch Skripts pers�nliche Einstellungen vornehmen zu k�nnen, um Vorg�nge zu automatisieren, eigene Tests zu bauen, usw. Im Handbuch (deutsche Version herunterladen, falls n�tig) finden wir ausf�hrliche Beschreibungen zum Skripting im Anhang C - API-Details zum Skripting, das ist auch eine gute Einf�hrung zu diesem Thema, der Benutzer sollte sich ermutigt f�hlen, Skripts zu schreiben.
Das letzte Werkzeug der Analyse-Dropdownliste f�hrt direkt zum Skriptingfenster ('Scripting Window'), hier werden wir unsere Skripts eingeben: probieren wir doch einige von den Beispielen, die im Handbuch aufgef�hrt sind, gar nicht so schwierig, oder...?

Um weitgehende pers�nliche Anpassungen am Programm vornehmen zu k�nnen, sind Kenntnisse in Python Voraussetzung - in dieser Sprache ist das Programm geschrieben. Gl�cklicherweise ist Python eine freie Sprache, sie kann also gratis heruntergeladen werden. Ausf�hrliche Einf�hrungen und Dokumentation f�r Anf�nger und Experten stehen auf der Python-Webseite zur Verf�gung.
Falls sich Ihnen bei dem Gedanken die Haare str�uben - na ja, SalStat kann einfach benutzt werden wie es ist - mit Pythonkenntnissen k�nnten Sie eventuell mehr aus dem Programm herausholen.

Fazit

Die Grundidee f�r SalStat entsprang dem vielfachen Wunsch, ein einfaches Programm zur Verf�gung zu stellen, das den Einsteiger ermutigt und den seri�sen Benutzer ebenfalls zufriedenstellen kann. Der Benutzer kann sich in der gewohnten Weise einfach durch die Men�s der Statistiken und Tests klicken. Das Handbuch gibt Anweisungen f�r die Tests, ausserdem einige Hinweise �ber den Wert der Ergebnisse. Ganz allgemein wird jedoch vorausgesetzt, dass der Benutzer mindestens Grundkenntnisse der Statistik hat oder dabei ist, diese zu erwerben.

Eine Warnung: bevor Sie versuchen, Ihre Karriere als zuk�nftiger Wissenschaftler auf Daten aufbauen, die Sie mit diesem Programm erzeugt haben, h�ren Sie auf die Empfehlung des Programmentwicklers und testen Sie das Programm. Anf�nger k�nnen wahrscheinlich Beispiele mit Testergebnissen in ihren Fachb�chern finden. Tragen Sie einige Daten von Testbeispielen in Salstat ein und vergleichen Sie die Ergebnisse mit denen, die mittels anderer Programme gefunden wurden. Die Testdatei (testreport1.txt) ist ein Anfang, dort sind auch Vergleiche mit den Ergebnissen von Tests mit anderen Programmen aufgef�hrt.

Resources

Wer mit Hilfe seiner bevorzugten Suchmaschine im WWW w�hlt, kann in Bezug auf Statistik viele Quellen finden, die besten und umfassensten scheinen in Englisch zu sein.