Power Query, einfaches Ähnlichkeitsmaß, Fuzzy simple

Mit folgender benutzerdefinierten Language M Funktion können zwei Worte
bezüglich ihrer Ähnlichkeit überprüft werden.
Dabei wird ein Faktor als Maß für die Ähnlichkeit gebildet.

Ein Faktor >= 0.75 kann dabei als hinreichend genaues Maß für die Ähnlichkeit zweier Worte
angenommen werden.

Selbstverständlich entbindet dieses Ähnlichkeitsmaß nicht von der fachlich / inhaltlichen Prüfung.
Dennoch hilft es, die verfügbare Datenqualität zu kategorisieren.



---- SCHNIPP ---

//Faktor als Indikator für Ähnlichkeit zweier Wörter
(words1 as text, words2 as text) as number =>
let
 
    Zaehler = 2 * List.Count(List.Intersect({Text.ToList(Text.Clean(Text.Trim(Text.Lower(words1)))), Text.ToList(Text.Clean(Text.Trim(Text.Lower(words2))))})),
    Fuzzy = Zaehler / (Text.Length(Text.Clean(Text.Trim(words1))) + Text.Length(Text.Clean(Text.Trim(words2))))
in
    Fuzzy

--- SCHNAPP ---

siehe auch Umlaute

Kommentare

Beliebte Posts aus diesem Blog

Vergleich mit 2 Bedingungen, INDEX(), VERGLEICH()

Dropdown Liste mit Mehrfachauswahl

nützliche Text Funktionen in Power Query