Hallo alle,
ich verfasse diese Frage, weil ich nichtmal die Begriffe kenne, die die Lösung zu meinem Problem sein können.
Die Datensätze sind folgendermassen:
Jede Zelle in Spalte 1 bezeichnet eine bestimmte Funktion in einer Körperzelle. Für diese Funktion sind mehrere Gene nötig. Jede nachfolgende Zelle einer Reihe beinhaltet die Namen solcher Gene, die in dieser Funktion eine Rolle spielen.
Weil es ca. 20.000 menschliche Gene gibt, wird mir das zu bunt mit dem Zählen.
Ich würde gerne wissen:
a - wie oft ein bestimmtes Wort in dem Datensatz vorkommt (Name des Gens)
b - eine Auflistung der Funktionen, in der dieses Gen eine Rolle spielt.
Im Endeffekt muss ich von den 20.000 Genen 100 Stück aussuchen, die ich im Labor testen möchte. Als Entscheidungshilfe würde ich gerne aus mehreren Datensätzen, die gewonnen wurden nachdem ein bestimmter Selektionsdruck ausgeübt wurde, ein Muster herauslesen das mir andeutet, welche zellulären prozesse unter diesem bestimmten Druck eine Rolle spielen (Anreicherung quasi).
Falls ich hier total falsch bin...vielleicht kann ja jemand eine Software empfehlen? Wie gesagt - ich wusste nicht wonach ich suchen soll, die Schlagworte fehlen mir. Auch dafür bin zum gezielteren Suchen für Hilfe dankbar, gerne auch einfach per link falls so etwas ähnliches im Forum bereits besteht.
Dankeschön!
Mathias