Live-Forum - Die aktuellen Beiträge
Datum
Titel
24.04.2024 19:29:30
24.04.2024 18:49:56
Anzeige
Archiv - Navigation
1088to1092
Aktuelles Verzeichnis
Verzeichnis Index
Übersicht Verzeichnisse
Vorheriger Thread
Rückwärts Blättern
Nächster Thread
Vorwärts blättern
Anzeige
HERBERS
Excel-Forum (Archiv)
20+ Jahre Excel-Kompetenz: Von Anwendern, für Anwender
Inhaltsverzeichnis

Doppelte Werte + unterschiedliche Schreibweisen

Doppelte Werte + unterschiedliche Schreibweisen
Marcel
Hallo,
gibt es eine Möglichkeit, neben den bekannten Funktionen wie
- Bedingte Formatierung (ZÄHLENWENN($A$1;$A$18;A1)Größer1)
- WENN(VERGLEICH(A4;A:A;0)=ZEILE();"";"Doppelt")
sich doppelte Einträge eder Zellen einer Spalte Anzeigen zu lassen (10.000 Datensätze), wenn unterschiedliche Schreibweisen existieren.
Beispiel:
Max Müller
Max_Müller
Max Mueller
Besteht die Möglichkeit dreier oder vierer Buchstabenkombinationen zusätzlich als Bedingung zu definieren? Diese allerdings als unbestimmte variable (Zufallsystem)...da ja nicht alle Datensätze z.B. mit *Max* beginnen.
Wenn nicht mit einer Funktion lösbar, dann evtl. mit einem VBA-Code?
Gruß
Marcel
AW: Doppelte Werte + unterschiedliche Schreibweisen
22.07.2009 13:47:42
Helmut
Hallo Marcel,
google mal nach soundex oder Levenstein. Das mag Dir weiterhelfen.
Gruß
Helmut
AW: Doppelte Werte + unterschiedliche Schreibweise
22.07.2009 14:31:05
Marcel
Hallo Helmut,
für den ersten Step ein super Hinweis. Die Themen die ich im Netz finde sind jedoch sehr komplex :-(
In meinem Fall reicht es, wenn die Werte der Spalte A untersucht werden und in Spalte B ein Hinweis
z.B. "Doppelte" vermerkt wird.
Ich muss ja zugeben, dass mir da grad die Idee fehlt... oder hast du evtl. einen fertigen VBA-code?
Gruß
AW: Doppelte Werte + unterschiedliche Schreibweise
22.07.2009 14:54:28
Helmut
Ich habe viel mit derartigen Algorithmen herumprobiert, bin aber nie zu einem zufriedenstellenden Resultat gelangt. Wenn man eine große Menge von Namen untersucht, erhält man zu viele false positives.
Meinen eigenen Code habe ich nicht mehr, aber hier ist etwas kopiertes
Function SOUNDEX(Surname As String) As String
' Developed by Richard J. Yanco
' This function follows the Soundex rules given at
' http://home.utah-inter.net/kinsearch/Soundex.html
Dim Result As String, c As String * 1
Dim Location As Integer
Surname = UCase(Surname)
' First character must be a letter
If Asc(Left(Surname, 1)) 90 Then
SOUNDEX = ""
Exit Function
Else
' St. is converted to Saint
If Left(Surname, 3) = "ST." Then
Surname = "SAINT" & Mid(Surname, 4)
End If
' Convert to Soundex: letters to their appropriate digit,
' A,E,I,O,U,Y ("slash letters") to slashes
' H,W, and everything else to zero-length string
Result = Left(Surname, 1)
For Location = 2 To Len(Surname)
Result = Result & Category(Mid(Surname, Location, 1))
Next Location
' Remove double letters
Location = 2
Do While Location If Mid(Result, Location, 1) = Mid(Result, Location + 1, 1) Then
Result = Left(Result, Location) & Mid(Result, Location + 2)
Else
Location = Location + 1
End If
Loop
' If category of 1st letter equals 2nd character, remove 2nd character
If Category(Left(Result, 1)) = Mid(Result, 2, 1) Then
Result = Left(Result, 1) & Mid(Result, 3)
End If
' Remove slashes
For Location = 2 To Len(Result)
If Mid(Result, Location, 1) = "/" Then
Result = Left(Result, Location - 1) & Mid(Result, Location + 1)
End If
Next
' Trim or pad with zeroes as necessary
Select Case Len(Result)
Case 4
SOUNDEX = Result
Case Is SOUNDEX = Result & String(4 - Len(Result), "0")
Case Is > 4
SOUNDEX = Left(Result, 4)
End Select
End If
End Function
Private Function Category(c) As String
'   Returns a Soundex code for a letter
Select Case True
Case c Like "[AEIOUY]"
Category = "/"
Case c Like "[BPFV]"
Category = "1"
Case c Like "[CSKGJQXZ]"
Category = "2"
Case c Like "[DT]"
Category = "3"
Case c = "L"
Category = "4"
Case c Like "[MN]"
Category = "5"
Case c = "R"
Category = "6"
Case Else 'This includes H and W, spaces, punctuation, etc.
Category = ""
End Select
End Function

Anzeige
AW: Doppelte Werte + unterschiedliche Schreibweise
22.07.2009 15:06:00
Marcel
Hallo Helmut,
genau den habe ich bereits versucht anzuwenden. Mit einem schlechten Ergebnis.
Teilweise wurden eindeutige Begriffe nicht gefunden. Hmm... wie würdest du denn den Code in einer Arbeitsmappe einbauen, wenn die zu suchenden Namen in Spalte A stehen, der Soundex code in B und in spalte C sollen mögliche Doppelte angezeigt werden ("Doppelt")
Es beschäftigen sich viele Leute mit dem Thema aber irgendwie gibt es keine Musterlösung für diese Listendarstellung :-(
Wäre super, wenn du mir dabei helfen könntest.
Gruß
marcel
AW: Doppelte Werte + unterschiedliche Schreibweise
22.07.2009 15:21:00
Helmut
Gegebenenfalls sind länderspezifische Änderungen an den soundex Parametern vorzunehmen. Aber da hast Du ein weites Feld vor Dir. Sollte das von besonderer Bedeutung sein, empfehle ich den Einsatz von Standardsoftware zur Address-/ Namensvalidierung, i.e. Uniserve
https://www.herber.de/bbs/user/63355.xlsm
Anzeige
AW: Doppelte Werte + unterschiedliche Schreibweise
22.07.2009 16:09:36
Marcel
Ja, da hast du wohl recht, dass ohne eine Standardsoftware nie das Ziel einer 100%igen Stammdaten DB erreicht werden kann. Dennoch finde ich es super, dass du mir helfen konntest.
Vielen Dank. Ich denke, dass ich deine Lösung erstmal verwursten kann. Alle weiteren komplexeren Lösungen können wir dann wohl nicht in Eigenleistung machen.
Viele Grüße
Marcel

301 Forumthreads zu ähnlichen Themen

Anzeige
Anzeige
Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige

Beliebteste Forumthreads (12 Monate)

Anzeige
Anzeige
Anzeige