Ich schreibe momentan meine Bachelorarbeit im Bereich Data Mining. Grundlage dazu ist eine relativ umfangreiche Excel Tabelle, die ich natürlich zu Beginn auswerten muss. Ein Auszug aus der Tabelle befindet sich im Anhang. Es handelt sich um Daten aus einem onlineshop. Das Attribut cMinPrice bezeichnet das günstigte angesehene Produkt. bMinPrice bezeichnet das günstigste Produkt im Warenkorb. Ich möchte die Entwicklung dieser Werte und der Werte cMaxPrice und bMaxPrice im Laufe einer Session abbilden. Ich habe zuerst nur versucht, den Ersten und den Letzen Eintrag einer Session zu nehmen und eine Entwicklungin Prozent auszurechnen, aber das verfälscht die Erebnisse.
Deshalb würde ich gerne zwei Trends haben. Zwischen dem ersten und einem mittleren Wert und diesem mittleren und dem Letzen. Wie ihr seht hat nicht jede Session gleich viele Zeilen. Zudem sind sie alle sehr unterschiedlich lang (Attribut Duration). Hat Jemand deshalb eine Idee wie ich jeweils die mittlere Zeile einer Session finden kann. Also beispielsweise bei einer Session mit 10 Datensätzen den 5.? Ich wäre für jede Hilfe sehr dankbar, da auch mein Betreuer keine Idee zur Lösung dieses Problems hat.
Beste Grüße
Christian
https://www.herber.de/bbs/user/105739.xlsx