Live-Forum - Die aktuellen Beiträge
Anzeige
Archiv - Navigation
412to416
Aktuelles Verzeichnis
Verzeichnis Index
Übersicht Verzeichnisse
Vorheriger Thread
Rückwärts Blättern
Nächster Thread
Vorwärts blättern
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
412to416
412to416
Aktuelles Verzeichnis
Verzeichnis Index
Verzeichnis Index
Übersicht Verzeichnisse
Inhaltsverzeichnis

Statistik Problem

Statistik Problem
Digga
Hallo zusammen!
Ich hätte eine Frage und wäre sehr froh wenn mir einer dabei helfen könnte.
Es handelt sich dabei weniger um ein Problem mit Excel sonder eher um ein "statistisches" Problem.
Ich habe eine Tabelle erstellt, die die Mitarbeiterdaten einer Firma enthält.
Dargestellt werden Eintritte minus Austritte für jeden Monat seit 2000 bis 2004.
Nun möchte ich eine möglichst sichere Prognose für die kommenden Monate machen.
Ich habe zuerst den "MITTELWERT" berechnet um einen Anhalstpunkt für jeden Monat zu haben. Ebenso die "STANDARDABWEICHUNG".
Nur gibt mir diese immer positive Werte heraus, obwohl es durchaus in einigen
Monaten mehr Aus- als Eintritte gab.
Das kann also auch nicht der richtige Weg sein.
Dann habe ich noch den "TREND" berechnet. Im Vergleich mit den Daten der ersten beiden Monate 2004 liegt dieser jedoch ständig ca. 5% über der Realität.
Weiß jemand ob es eine Funktion gibt, die genauere Prognosen geben kann?
Ich habe es mit der Varianz probiert, es kommen jedoch nur Werte dabei heraus, mit denen ich nichts anfangen kann.
Wäre klasse wenn mir jemand helfen könnte.
Vielen Dank
digga

1
Beitrag zum Forumthread
Beitrag zu diesem Forumthread

Betreff
Benutzer
Anzeige
AW: Statistik Problem
Uwe
Hallo, digga!
Mir scheint, Du näherst Dich der Lösung der Aufgabe ohne Recht mit den Worten aus der Statistik etwas anfangen zu können.
Grundsätzlich ist es bestimmt nicht verkehrt, den Mittelwert einer Zeitreihe zu berechnen, doch sollte gleichzeitig überprüft werden, ob die Zeitreihe sesonalen Einflüssen unterliegt (z.B. Änderung in den Sommermonaten anders als in den Wintermonaten). Mit 48 Datensätzen liegen zwar bereits eine Mindestanzahl an Daten vor, doch ob diese tatsächlich ausreichen, um mögliche Schwankungen beschreiben zu können, hängt wohl besonders von dem Untersuchungsobjekt ab.
Aber auch "unnatürliche" Ausschläge, die in dem sonst beobachteten Regelverlauf widersprechen, sind im Vorfeld in der Hinsicht zu bewerten, wie sie in die Datenanalyse einfliessen sollen (Glättung?).
Die Standardabweichung einer Zeitreihe gibt Dir einen Absolutwert oder richtiger, sie ist das Ergebnis einer Radizierung, die eben ein betragsgleiches positves und negatives Resultat liefert (s.u.). Sie liefert also ein "Streumaß" um einen Mittelwert (siehe Ansätze in der Online-Hilfe zur EXCEL-Funktion STABW).
In besonderen Fällen kann diese Breite ein Band beschreiben, in dem ein bestimmter Anteil aller Beobachtungswerte liegen, sofern eine Normalverteilung für die Zeitreihe unterstellt werden kann.
Liegt der Mittelwert einer Zeitreihe bei +4 und ist die (einfache) Standardabweichung 8, so sagen diese beiden Zahlen aus, dass bei der Annahme eine Normalverteilung in ca. ~68,3% aller Fälle die Veränderungsgröße zwischen -4 und +12 liegen wird (4-8 bzw. 4+8).
Ferner ist, unter gleicher Annahme der Normalverteilung, bei diesen Werten zu erwarten, dass in ~95,4% aller Fälle die Grenzen 4-2*8=-12 bzw. 4+2*8=20 nicht überschritten werden. ~99,7% aller, bisher aufgetretenen Fälle werden bei der Auweitung auf die dreifache Standardabweichung erfasst.
Du siehst also, je kleiner der Wert der Standardabweichung wird, um so "zuverlässiger" ist die Aussage des Mittelwertes.
Mit der Trend wird nun, je nach Ansatz, nur versucht, die bestmögliche Anpassung einer Funktionsgleichung an die Beobachtungswerte zu erzielen. Dies führt dann vor allen dingen zu Problemen, wenn die Zeitreihe "Ausreißerdaten" enthält. Die Wahl des Ansatzes (Linear, Logarithmisch, Exponentiell, Potenzen, trigonometriche Funktionen) hängt von dem Datenmaterial an.
Der Korrelationsfaktor (-1 <= R2 <= 1)ist ein Maß, der Güte für den gewählten Ansatz liefert; je näher dieser bei +1 liegt, umso besser wird der Datenverlauf durch den Funktionsverlauf beschrieben (hierzu gff. über die im Diagramm gebotene Möglichkeit der Trendline mit Formalangabe (Option), sich einen ersten Überblick verschaffen).

Ob sich also eine Zeitreihe besser durch den einen oder anderen Funktionstyp beschreiben läßt, hängt vom Verlauf des Graphen ab, wobei um einen Mittelwert schwankende Zeitreihen, möglicherweise besser durch harmonische Schwingungen (trigonometrische Ansätze) beschreiben werden können. Der von Dir angegebene Wert der Abweichung mit 5%, kann für sich alleine so nicht von mir bewertet werden.
Die Varianz ist ebenfalls ein Streuungsmaß, dass direkt aus der Standardabweichung ermittelt werden kann, indem man die Standardabweichung quadriert (bei der manuellen Berechnung ergibt sich die Standardabweichung aus der Varianz: Die Varianz ermittelt sich aus der Summer aller quadrierten Differenzen zwischen Zeitreihenwert und dem Mittelwert der Zeitreihe, geteilt durch die Anzahl der Beobachtungen. aus diesem Wert die Wurzel gezogen, liefert die Standardabweichung).
Das Verhältnis der Standardabweichung zum Mittelwert liefert Dir den Varianzkoeffizienten.

Soweit ein erster Hinweis, der nur allgemein bleiben kann und durch den Verweis auf die Onlinehilfe und Formelsammlungen ergänzt wird, da ich die Daten nicht kenne. Dennoch hoffe ich, dass Dir hiermit zusätzliche Information gegeben werden konnte, die einen erfolgreichen Abschluß Deiner Arbeit mitermöglicht.
Gruß!
Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Anzeige