Mehrfachbezug und -vergleich
Hansi
nachdem ich in dem Forum gestern eine Superhilfe bekommen habe, möchte ich mich mit einem weiteren Problem an Euch wenden, das ich mit meinen Kenntnissen nicht in den Griff bekomme.
Zur Ausgangssituation: Ich habe eine Excel-Tabelle, die Angaben über Verwandtschaftsverhältnisse einer Gruppe von Personen beinhaltet. Sie besteht aus drei Spalten, wobei Spalte A die (durchlaufende) ID einer Person beinhaltet, Spalte B eine Zahl, die angibt, von wem Person aus Spalte A abstammt (mit anderen Worten enthält sie die ID des Vaters) und Spalte C das Alter der Person aus Spalte A (sofern bekannt, ansonsten "n/a"). Beispiel:
A B C
1 1 n/a
2 1 n/a
3 1 55
4 1 34
5 2 n/a
6 5 n/a
Erläuterung:
Person 1 hat keine(n) registrierten Vorfahren, stammt somit quasi von sich selbst ab (ist für Weiterverarbeitung relevant), Alter unbekannt.
Person 2 ist der Sohn von Person 1, Alter unbekannt.
Person 3 ist 55-Jährigen (und damit ältester nachweisbarer) Sohn von Person 1, ebenso wie Person 4, die 34 Jahre alt ist.
Person 5 wiederum stammt von Person 2 ab, Person 6 von Person 5 - in allen Fällen ist das Alter unbekannt.
Ich würde nun gerne in Spalte D (ff.) das Alter einer Person schätzen, wenn dieses nicht bekannt ist. Dabei möchte ich von einem Generationenabstand von 30 Jahren zum (nachweislich) ältesten Sohn ausgehen. Grundsätzlich soll das Alter einer Person aber nicht geschätzt werden, wenn es exakt bekannt ist (wie im Falle der Personen 3 und 4).
Im obigen Falle wäre also folgende Tabelle für weitere wissenschaftliche Analysen extrem hilfreich:
A B
1 1 85
2 1 n/a
3 1 55
4 1 34
5 2 n/a
6 5 n/a
Nun liegen mir knapp 5000 Datensätze vor. Wie kann ich hier am besten verfahren, um zu dem o. g. oder einem ähnlichen Ergebnis zu gelangen?
Vielen Dank für die Hilfe!