für die (automatische) Bildung von zwei "homogenen" Gruppen benötige ich dringend Hilfe.
Folgendes Problem: Ich möchte auf der Basis von zwei oder mehr metrisch skalierten Variablen (verdichtete Daten, keine Urliste) zwei zufällig gewählte Gruppen bilden, die homogen sind. Die Homogenität definiere ich durch den Gesamt-Mittelwert der Variablen, wobei ich eine "kleine" Abweichung akzeptiere. Am besten erkläre ich das anhand des beigefügten Excel-Beispiels:
Excel-Datei: https://www.herber.de/bbs/user/25549.xls
Mir liegen 997 kleine Grüppchen (= Bereich) mit aufsummierten Merkmalen vor (Basis, Variable1, Variable2). Nun muss ich diese 997 Grüppchen so zusammenstellen, dass ich
1.) zwei gleichgroße Gruppen (Test- und Kontrastgruppe) erhalte, und
2.) die Mittelwerte von Variable1 und Variable2 der eben gebildeten Test- und Kontrastgruppe gleich/ähnlich den Gesamtmittelwerten sind.
Als weiteres Problem kommt hinzu, dass die 997 Grüppchen NICHT weiter aufteilbar sind, da sie gleichzeitig Gruppen auf einer Datenbank repräsentieren. Ergo muss bei der Zusammenstellung der Test- und Kontrastgruppe gleichzeitig festgehalten werden, aus welchen Bereichen die Test- bzw. die Kontrastgruppe gebildet wird.
Ich mache mir dazu schon ewig Gedanken, wie ich das umsetzen kann, komme aber einfach nicht weiter... Angefangen habe ich damit, dass ich mir für beide Variablen zunächst Durchschnittswerte je Bereich errechnet habe, diese dann absteigend sortiert habe, und dann in jeder Zeile manuell 0 bzw. 1 eingegeben habe (0 = Testgruppe, 1 = Kontrastgruppe. Durch eine SUMMEWENN-Formel für 0 und 1 habe ich mir die Werte für Test- und Kontrastgruppe errechnet. Das Problem ist nur, dass wenn die Gruppen nicht gleich groß sind oder aber die Durchschnittswerte zu stark voneinander abweichen, ich wieder von vorne beginnen muss, und das wird mit hoher Wahrscheinlichkeit wieder nix! **PANIK!**
Im Prinzip möchte ich, dass Excel einfach nur, gaaanz einfach nur folgendes durchführt:
"Hier sind die Daten:
- ich habe 997 Bereiche,
- 7.750 ist die Gesamtbasis,
- 78,83 ist der Gesamtmittelwert von Variable1,
- 35,95 ist der Gesamtmittelwert von Variable2,
- Stelle mir die Bereiche solange zusammen, bis ich in etwa 3.775 Fälle pro Test- bzw. Kontrastgruppe erhalte und ihre Variablen-Mittelwerte gleichzeitig ähnlich (bzw. mit einer kleinen Abweichung, die ich irgendwo in Excel vorgebe,) den Gesamtmittelwerten sind und notiere mir gleichzeitig irgendwo in Excel die Bereiche, die die Test- bzw. Kontrastgruppe bilden. Dabei darf kein Bereich ausgelassen werden."
Ich denke, dass das irgendwie mit VBA gehen muss. Wer kann mir generell zu diesem Thema helfen, bzw. wer hatte schon mal mit ähnlichen Problemen zu kämpfen bzw. wer kann mir VBA-Stichwörter liefern, die ich für eine Umsetzung wohl benötigen werde. Ich bin zwar kein Crack in VBA, habe aber schon einfache Schleifen in Excel-VBA programmiert und würde mich dann damit einlesen. Wer hat vielleicht eine andere Idee, wie ich das umsetzen könnte, vielleich ist meine Idee ja für die Katz!?!
Bitte um Hilfe und schon jetzt vielen Dank!
S. Güder