Power Query, einfaches Ähnlichkeitsmaß, Fuzzy simple
Mit folgender benutzerdefinierten Language M Funktion können zwei Worte
bezüglich ihrer Ähnlichkeit überprüft werden.
Dabei wird ein Faktor als Maß für die Ähnlichkeit gebildet.
Ein Faktor >= 0.75 kann dabei als hinreichend genaues Maß für die Ähnlichkeit zweier Worte
angenommen werden.
Selbstverständlich entbindet dieses Ähnlichkeitsmaß nicht von der fachlich / inhaltlichen Prüfung.
Dennoch hilft es, die verfügbare Datenqualität zu kategorisieren.
---- SCHNIPP ---
//Faktor als Indikator für Ähnlichkeit zweier Wörter
(words1 as text, words2 as text) as number =>
let
Zaehler = 2 * List.Count(List.Intersect({Text.ToList(Text.Clean(Text.Trim(Text.Lower(words1)))), Text.ToList(Text.Clean(Text.Trim(Text.Lower(words2))))})),
Fuzzy = Zaehler / (Text.Length(Text.Clean(Text.Trim(words1))) + Text.Length(Text.Clean(Text.Trim(words2))))
in
Fuzzy
--- SCHNAPP ---
siehe auch Umlaute
bezüglich ihrer Ähnlichkeit überprüft werden.
Dabei wird ein Faktor als Maß für die Ähnlichkeit gebildet.
Ein Faktor >= 0.75 kann dabei als hinreichend genaues Maß für die Ähnlichkeit zweier Worte
angenommen werden.
Selbstverständlich entbindet dieses Ähnlichkeitsmaß nicht von der fachlich / inhaltlichen Prüfung.
Dennoch hilft es, die verfügbare Datenqualität zu kategorisieren.
---- SCHNIPP ---
//Faktor als Indikator für Ähnlichkeit zweier Wörter
(words1 as text, words2 as text) as number =>
let
Zaehler = 2 * List.Count(List.Intersect({Text.ToList(Text.Clean(Text.Trim(Text.Lower(words1)))), Text.ToList(Text.Clean(Text.Trim(Text.Lower(words2))))})),
Fuzzy = Zaehler / (Text.Length(Text.Clean(Text.Trim(words1))) + Text.Length(Text.Clean(Text.Trim(words2))))
in
Fuzzy
--- SCHNAPP ---
siehe auch Umlaute
Kommentare
Kommentar veröffentlichen