Posts

Es werden Posts vom Dezember, 2018 angezeigt.

Power Query, einfaches Ähnlichkeitsmaß, Fuzzy simple

Bild
Mit folgender benutzerdefinierten Language M Funktion können zwei Worte bezüglich ihrer Ähnlichkeit überprüft werden. Dabei wird ein Faktor als Maß für die Ähnlichkeit gebildet. Ein Faktor >= 0.75 kann dabei als hinreichend genaues Maß für die Ähnlichkeit zweier Worte angenommen werden. Selbstverständlich entbindet dieses Ähnlichkeitsmaß nicht von der fachlich / inhaltlichen Prüfung. Dennoch hilft es, die verfügbare Datenqualität zu kategorisieren. ---- SCHNIPP --- //Faktor als Indikator für Ähnlichkeit zweier Wörter (words1 as text, words2 as text) as number => let       Zaehler = 2 * List.Count(List.Intersect({Text.ToList(Text.Clean(Text.Trim(Text.Lower(words1)))), Text.ToList(Text.Clean(Text.Trim(Text.Lower(words2))))})),     Fuzzy = Zaehler / (Text.Length(Text.Clean(Text.Trim(words1))) + Text.Length(Text.Clean(Text.Trim(words2)))) in     Fuzzy --- SCHNAPP --- siehe auch Umlaute