Live-Forum - Die aktuellen Beiträge
Anzeige
Archiv - Navigation
652to656
Aktuelles Verzeichnis
Verzeichnis Index
Übersicht Verzeichnisse
Vorheriger Thread
Rückwärts Blättern
Nächster Thread
Vorwärts blättern
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
652to656
652to656
Aktuelles Verzeichnis
Verzeichnis Index
Verzeichnis Index
Übersicht Verzeichnisse
Inhaltsverzeichnis

Bildung von zwei homogenen Gruppen

Bildung von zwei homogenen Gruppen
15.08.2005 10:38:57
zwei
Hallo,
ich habe diesen Beitrag neu gepostet, da ich leider keine Antworten mehr erhalten habe... Weiter unten im Forum (Suchstichwort "Sinan") kann man die ganzen Beiträge lesen...
Für die (automatische) Bildung von zwei "homogenen" Gruppen benötige ich dringend Hilfe.
Folgendes Problem: Ich möchte auf der Basis von zwei oder mehr metrisch skalierten Variablen (verdichtete Daten, keine Urliste) zwei zufällig gewählte Gruppen bilden, die homogen sind. Die Homogenität definiere ich durch den Gesamt-Mittelwert der Variablen, wobei ich eine "kleine" Abweichung akzeptiere. Am besten erkläre ich das anhand des beigefügten Excel-Beispiels:
Excel-Datei: https://www.herber.de/bbs/user/25549.xls
Mir liegen 997 kleine Grüppchen (= Bereich) mit aufsummierten Merkmalen vor (Basis, Variable1, Variable2). Nun muss ich diese 997 Grüppchen so zusammenstellen, dass ich
1.) zwei gleichgroße Gruppen (Test- und Kontrastgruppe) erhalte, und
2.) die Mittelwerte von Variable1 und Variable2 der eben gebildeten Test- und Kontrastgruppe gleich/ähnlich den Gesamtmittelwerten sind.
Als weiteres Problem kommt hinzu, dass die 997 Grüppchen NICHT weiter aufteilbar sind, da sie gleichzeitig Gruppen auf einer Datenbank repräsentieren. Ergo muss bei der Zusammenstellung der Test- und Kontrastgruppe gleichzeitig festgehalten werden, aus welchen Bereichen die Test- bzw. die Kontrastgruppe gebildet wird.
Ich mache mir dazu schon ewig Gedanken, wie ich das umsetzen kann, komme aber einfach nicht weiter... Angefangen habe ich damit, dass ich mir für beide Variablen zunächst Durchschnittswerte je Bereich errechnet habe, diese dann absteigend sortiert habe, und dann in jeder Zeile manuell 0 bzw. 1 eingegeben habe (0 = Testgruppe, 1 = Kontrastgruppe. Durch eine SUMMEWENN-Formel für 0 und 1 habe ich mir die Werte für Test- und Kontrastgruppe errechnet. Das Problem ist nur, dass wenn die Gruppen nicht gleich groß sind oder aber die Durchschnittswerte zu stark voneinander abweichen, ich wieder von vorne beginnen muss, und das wird mit hoher Wahrscheinlichkeit wieder nix! **PANIK!**
Im Prinzip möchte ich, dass Excel einfach nur, gaaanz einfach nur folgendes durchführt:
"Hier sind die Daten:
- ich habe 997 Bereiche,
- 7.750 ist die Gesamtbasis,
- 78,83 ist der Gesamtmittelwert von Variable1,
- 35,95 ist der Gesamtmittelwert von Variable2,
- Stelle mir die Bereiche solange zusammen, bis ich in etwa 3.775 Fälle pro Test- bzw. Kontrastgruppe erhalte und ihre Variablen-Mittelwerte gleichzeitig ähnlich (bzw. mit einer kleinen Abweichung, die ich irgendwo in Excel vorgebe,) den Gesamtmittelwerten sind und notiere mir gleichzeitig irgendwo in Excel die Bereiche, die die Test- bzw. Kontrastgruppe bilden. Dabei darf kein Bereich ausgelassen werden."
Ich denke, dass das irgendwie mit VBA gehen muss. Wer kann mir generell zu diesem Thema helfen, bzw. wer hatte schon mal mit ähnlichen Problemen zu kämpfen bzw. wer kann mir VBA-Stichwörter liefern, die ich für eine Umsetzung wohl benötigen werde. Ich bin zwar kein Crack in VBA, habe aber schon einfache Schleifen in Excel-VBA programmiert und würde mich dann damit einlesen. Wer hat vielleicht eine andere Idee, wie ich das umsetzen könnte, vielleicht ist meine Idee ja für die Katz’!?!
Bitte um Hilfe und schon jetzt vielen Dank!
S. Güder

10
Beiträge zum Forumthread
Beiträge zu diesem Forumthread

Betreff
Datum
Anwender
Anzeige
AW: hier der Link zum alten Threat
15.08.2005 11:09:04
Hajo_Zi
Hallo Sinan,
es braucht kein neuer Thread eröffnet werden. In diesem Forum gibt es den Schalter offen.
Bitte keine Mail, Probleme sollten im Forum gelöst werden.
Microsoft MVP für Excel
Das Forum lebt auch von den Rückmeldungen.
Betriebssystem Windows 2000 SP4 und Excel Version 2000 SP3.


AW: hier der Link zum alten Threat
15.08.2005 13:03:34
Sinan
Hallo Hajo,
danke für den Tipp! Werde ich mir merken...
Aber en Beitrag "hier der Link zum alten Threat - von Sinan? am 15.08.2005 um 10:42:21" habe ich nicht geschrieben?!? Geschieht das automatisch?
Anzeige
AW: hier der Link zum alten Threat
15.08.2005 14:09:40
Hajo_Zi
Hallo Sinan,
der wurde auch von Sinan? geschrieben. Hier im Forum sind die Mailadressen geschützt und nicht der Name.
Da hat wohl jemand Zeit gehabt und hat den alten Beitrag gesucht.
Gruß Hajo
Das Forum lebt auch von den Rückmeldungen.
AW: hier der Link zum alten Threat
15.08.2005 14:12:05
Sinan!
Hallo,
ja, da hat sich jemand die Zeit genommen, damit nicht 10 andere Leute ihre Zeit für sowas verschwenden.
AW: hier der Link zum alten Threat
15.08.2005 15:29:47
Sinan
Dann danke ich diesem "Jemand"... ;-)
Sinan
AW: Bildung von zwei homogenen Gruppen
15.08.2005 13:51:33
zwei
Hallo Sinan,
hab die Sache mal händisch gelöst...
einfach Deine Tabelle absteigend nach Gruppengröße sortiert und dann jeweils so den beiden Gruppen zugeordnet, dass die entstehenden Gruppenstärken jeweils möglichst nahe beieinander liegen.
Dabei kommt schonmal bei der Vorliegenden Aufteilung auf jedenfall eine Gleichgroße Gruppenstärke heraus, da jede Klasse belegt ist und im unterenen Bereich die werte auch mehrfach vorkommen.
https://www.herber.de/bbs/user/25642.xls
Da die Dateigröße mit allen Formeln zu groß war, habe ich nur die ersten beiden Zeilen gefüllt.
diese mußt Du einfach nach unten kopieren bis Zeile 998!!!
Es ist zwar eine reine Formellösung, aber Du kannst ja mal schauen, ob Du damit schonmal was anfangen kannst.
Gruß Ingo
PS eine Rückmeldung wäre nett...

Anzeige
AW: Bildung von zwei homogenen Gruppen
15.08.2005 15:28:43
zwei
Hi Ingo,
vielen Dank für Deine Lösung! Da hast Du Dir aber einige Gedanken dazu gemacht... WOW!
Leider kann ich damit nicht ganz so viel anfangen, da meine Kriterien zur Auswahl der Test- und Kontrastgruppe (leider) nicht nur von der Gruppengröße abhängt, sondern auch von den zwei anderen Variablen....
Ich habe mir Deine Excel-Datei angeschaut und dabei ist mir aufgefallen, dass die Auswahl in Testgruppe bzw. Kontrastgruppe tatsächlich nur von der Formel mit dem Vergleich beider Basissummen bis zur letzten Zeile abhängt. Für die beiden Variablen werden die Werte nach Auswahl "nur" mitgenommen...
In dieser Verteilung passt Deine Vorgehensweise aber auch ganz gut, was für Deinen Lösungsweg spricht und was auch der Vergleich der Gesamtmittelwerte mit denen aus Deinen gebildeten Gruppen zeigt. Die Gruppen sind gleich groß, die Mittelwerte liegen nicht so weit auseinander... (scheinbar) perfekt!
Aber gesetzt den Fall, dass ich Ausreisser habe, bzw. zufälligerweise genau die Grüppchen für die Testgruppe höhere Variablenwerte bei gleicher Basis haben, dann könnte ich diesen Lösungsweg nicht weiter verwenden...
Ich denke eine VBA-Lösung wäre nach wie vor das Einfachste, weil sie allgemeingültig und beliebig erweiterbar (durch zusätzliche Variablen!) sein kann... Ich lese mich auch schon eifrig rein, gefunden habe ich aber bisher noch nix...
Für Deine Vorgehensweise finde ich trotz allem Verwendung. Dies kann mich bei einem anderen Problem unterstützen. Vielen Dank für Deine Hilfe. Falls Du noch Tipps hast: Gerne!
Viele Grüße
Sinan
Anzeige
AW: Bildung von zwei homogenen Gruppen
15.08.2005 16:20:00
zwei
Hallo Sinan,
so war es auch gemeint...
in diesem Fall waren deine Vorgaben mit der erreichten Verteilung alle erfüllt.
als Freiheitsgrad hast Du nun die Möglichkeit jeweils 2 Zeilen aus einer Klasse (gruppengröße) miteinander zu vertauschen um noch näher an ein optimales Ergebnis heranzukommen.
Dies ist jedoch mit einer KI mE nur mit relativ großem aufwand zu erreichen.
Ich habe für ein anderes Problem einmal ein Programm geschrieben, dass Summanden für ein vorgegebenes Ergebnis (hier 3750) aus einer Liste von (positiven) Zahlen (hier die 997 Gruppenstärken) heraussucht...
leider ist jedoch bei ca 50 Zahlen Schluß, da der Algorithmus jede mögliche Kombination abprüft und die Summe die dabei entsteht mit dem Sollergebnis vergleicht.
bei 997 Zahlen währen das 2^997-1 möglichkeiten die überprüft werden müssen.
dafür ist die rechenpower nicht ausreichend (nicht, dass ich es nicht versucht hätte...
;-))
Sollte mir zu dem Thema noch etwas einfallen, melde ich mich hier noch mal
Gruß Ingo
Anzeige
nicht mal meinen Namen kann ich schreiben oT ;-)
15.08.2005 16:22:46
ingoG
.

Beliebteste Forumthreads (12 Monate)

Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Anzeige