Anzeige
Archiv - Navigation
648to652
Aktuelles Verzeichnis
Verzeichnis Index
Übersicht Verzeichnisse
Vorheriger Thread
Rückwärts Blättern
Nächster Thread
Vorwärts blättern
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
648to652
648to652
Aktuelles Verzeichnis
Verzeichnis Index
Verzeichnis Index
Übersicht Verzeichnisse
Inhaltsverzeichnis

Statistik - Bildung von zwei homogenen Gruppen

Statistik - Bildung von zwei homogenen Gruppen
11.08.2005 16:42:15
zwei
Hallo,
für die (automatische) Bildung von zwei "homogenen" Gruppen benötige ich dringend Hilfe.
Folgendes Problem: Ich möchte auf der Basis von zwei oder mehr metrisch skalierten Variablen (verdichtete Daten, keine Urliste) zwei zufällig gewählte Gruppen bilden, die homogen sind. Die Homogenität definiere ich durch den Gesamt-Mittelwert der Variablen, wobei ich eine "kleine" Abweichung akzeptiere. Am besten erkläre ich das anhand des beigefügten Excel-Beispiels:
Excel-Datei: https://www.herber.de/bbs/user/25549.xls
Mir liegen 997 kleine Grüppchen (= Bereich) mit aufsummierten Merkmalen vor (Basis, Variable1, Variable2). Nun muss ich diese 997 Grüppchen so zusammenstellen, dass ich
1.) zwei gleichgroße Gruppen (Test- und Kontrastgruppe) erhalte, und
2.) die Mittelwerte von Variable1 und Variable2 der eben gebildeten Test- und Kontrastgruppe gleich/ähnlich den Gesamtmittelwerten sind.
Als weiteres Problem kommt hinzu, dass die 997 Grüppchen NICHT weiter aufteilbar sind, da sie gleichzeitig Gruppen auf einer Datenbank repräsentieren. Ergo muss bei der Zusammenstellung der Test- und Kontrastgruppe gleichzeitig festgehalten werden, aus welchen Bereichen die Test- bzw. die Kontrastgruppe gebildet wird.
Ich mache mir dazu schon ewig Gedanken, wie ich das umsetzen kann, komme aber einfach nicht weiter... Angefangen habe ich damit, dass ich mir für beide Variablen zunächst Durchschnittswerte je Bereich errechnet habe, diese dann absteigend sortiert habe, und dann in jeder Zeile manuell 0 bzw. 1 eingegeben habe (0 = Testgruppe, 1 = Kontrastgruppe. Durch eine SUMMEWENN-Formel für 0 und 1 habe ich mir die Werte für Test- und Kontrastgruppe errechnet. Das Problem ist nur, dass wenn die Gruppen nicht gleich groß sind oder aber die Durchschnittswerte zu stark voneinander abweichen, ich wieder von vorne beginnen muss, und das wird mit hoher Wahrscheinlichkeit wieder nix! **PANIK!**
Im Prinzip möchte ich, dass Excel einfach nur, gaaanz einfach nur folgendes durchführt:
"Hier sind die Daten:
- ich habe 997 Bereiche,
- 7.750 ist die Gesamtbasis,
- 78,83 ist der Gesamtmittelwert von Variable1,
- 35,95 ist der Gesamtmittelwert von Variable2,
- Stelle mir die Bereiche solange zusammen, bis ich in etwa 3.775 Fälle pro Test- bzw. Kontrastgruppe erhalte und ihre Variablen-Mittelwerte gleichzeitig ähnlich (bzw. mit einer kleinen Abweichung, die ich irgendwo in Excel vorgebe,) den Gesamtmittelwerten sind und notiere mir gleichzeitig irgendwo in Excel die Bereiche, die die Test- bzw. Kontrastgruppe bilden. Dabei darf kein Bereich ausgelassen werden."
Ich denke, dass das irgendwie mit VBA gehen muss. Wer kann mir generell zu diesem Thema helfen, bzw. wer hatte schon mal mit ähnlichen Problemen zu kämpfen bzw. wer kann mir VBA-Stichwörter liefern, die ich für eine Umsetzung wohl benötigen werde. Ich bin zwar kein Crack in VBA, habe aber schon einfache Schleifen in Excel-VBA programmiert und würde mich dann damit einlesen. Wer hat vielleicht eine andere Idee, wie ich das umsetzen könnte, vielleich ist meine Idee ja für die Katz’!?!
Bitte um Hilfe und schon jetzt vielen Dank!
S. Güder

4
Beiträge zum Forumthread
Beiträge zu diesem Forumthread

Betreff
Datum
Anwender
Anzeige
AW: Statistik - Bildung von zwei homogenen Gruppen
11.08.2005 18:04:31
zwei
Hallo,
das ist programmtechnisch ganz einfach. Wichtig ist aber die Toleranz, kannst
du das konkretisieren?
Gruß K.Rola
AW: Statistik - Bildung von zwei homogenen Gruppen
11.08.2005 21:43:16
zwei
Hi K. Rola,
Du beschämst mich, indem Du schreibst, dass das an sich ganz einfach ist ;-).
Aber kommen wir zum Problem: die Toleranz bzw. vielmehr die Abweichung die ich in diesem Fall tolerieren will, ist für die:
Basis: Basis/2 plus/minus 50 = 3.725 > 3.775 Variable1: MW plus/minus 2,5 = 76,28 > 78,78 Variable2: MW plus/minus 2 = 33,92 > 35,92 Mit diesen Werten müsstest Du eigentlich was anfangen können, aber Du musst Dich nicht genau daran halten. Wenn die Werte zu klein sind, kannst Du sie auch einfach vergrößern, nur um der Lösung willen ;-).
Mir ist klar, dass ich in diesem Fall recht unwissenschaftlich vorgehe, wenn ich nur die Mittelwerte vergleiche, aber der ganze Rattenschwanz kommt noch: Wenn ich meine Test- und Kontrastgruppen gefunden habe, füge ich diese Daten in ein Excel-Formular ein, in welchem automatisch ein Signifikanztest durchgeführt wird. Für diese Variablen existieren natürlich auch noch die quadrierten Werte, anhand derer ich die Varianz errechnen und die Prüfung der Gruppen auf signifikante Unterschiede testen kann. Das ist dann mein eigentlicher Test. Nur muss ich die Gruppen halt erst einmal zusammenstellen, und da hilft dann diese Vorgehensweise. Wenn ich recht ähnliche Mittelwerte habe, so hat die Erfahrung gezeigt, dann sind die Gruppen auch meistens homogen.
Außerdem wollte ich in meiner Datei niemanden mit dem Zahlenwust erschlagen, der sich dann ergeben hätte. Wenn Du Dir jetzt auch noch vorstellst, dass ich eigentlich fünf Variablen habe und von dreien zusätzlich die quadrierten Werte, weißt Du was ich meine… Umgekehrt wird es - denke ich - auch schwieriger Gruppen zu finden, bei denen alle Variablen homogen sind.
So, ich hoffe, ich konnte Dir helfen, damit Du mir helfen kannst…
Viele Grüße
Sinan
Anzeige
AW: Statistik - Bildung von zwei homogenen Gruppen
11.08.2005 18:51:11
zwei
Hi,
wie kann man 997 Gruppen in zwei gleichgroße Teile teilen, wenn die einzelnen Gruppen nicht geteilt werden können?
mfg Fred
AW: Statistik - Bildung von zwei homogenen Gruppen
11.08.2005 22:01:43
zwei
Hallo Fred,
Deine Frage ist berechtigt und ganz einfach zu beantworten, wenn ich Dich richtig verstanden habe:
997 / 2 ist immer ungerade, klar... Die Gruppenaufteilung bezieht sich aber nicht auf die Zahl 997 sondern auf die Basiszahlen, die sich in diesen Grüppchen befinden. Die 997 Grüppchen sind nicht gleichverteilt, sondern die eine Gruppe hat mal 10 Fälle, die andere nur 3, wieder eine andere 7 usw.... Nun muss also die zufällige
Zusammenstellung so erfolgen, dass trotzdem die absolute Zahl der Fälle ungefähr gleich aufgeteilt ist.
Anderes Beispiel: Du hast 7 verschieden dicke Bücher und eine Waage (wie bei einer Kinderwippe). Ordne die Bücher in zwei Gruppen so auf der Waage an, dass (ungefähr) ein Gleichgewicht herrscht. Wenn ein Buch nicht gerade so dick ist, dass es ganz allein auf der einen Seite ist, und die anderen sechs auf der anderen (Ausreißer), dann sollte es in etwa 4:3 ausgehen. Wenn ich 997 Bücher habe, die verschieden dick sind, dann kann ich schon viel einfacher für ein Gleichgewicht sorgen, in dem ich in einer Testgruppe einfach ein paar dünne Bücher durch ein paar dicke Bücher austausche.
Hoffe jetzt ist alles klar! Ansonsten einfach fragen...
Viele Grüße
S. Güder
Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Anzeige