April 2009: Cogen setzt den Levenshtein-Algorithmus zur Berechung von Fuzzy-Matches ein
Die Verwendung von Fuzzy-Matches ist eine beliebte Methode zur Nutzung des Inhalts eines Übersetzungsspeichers in Fällen, bei denen die Übereinstimmungen weniger als 100% perfekt, d. h. keine "vollständigen Übereinstimmungen" sind.
Cogen hat seinen Algorithmus für Fuzzy-Matches jetzt neu geschrieben, um die Messung der Bearbeitungsdistanz mit einzubeziehen, wie sie vom russischen Wissenschaftler Vladimir Levenshtein definiert worden ist. Die Levenshtein-Distanz ist eine Kennzahl, die zur Messung des Unterschieds zwischen zwei Sequenzen (d. h. der "Bearbeitungsdistanz") verwendet wird. Sie wird oft eingesetzt, wenn bestimmt werden muss, wie ähnlich bzw. unterschiedlich zwei Zeichenfolgen sind, z. B. bei Rechtschreibprüfungen.
Beim Einsatz von Übersetzungsspeichern bietet der Levenshtein-Algorithmus einige grundlegende Vorteile:
Er ist äußerst präzise bei der Berechnung des Übereinstimmungsprozentwerts. Bei unserem Algorithmus ist die Übereinstimmungsschwelle auf 60% eingestellt: Sobald 60% des Inhalts übereinstimmen, werden zwei Segmente als Fuzzy-Match betrachtet, wobei die Übersetzungsgebühr um 50% reduziert wird. Damit ist unsere Übersetzungsgebühr für Fuzzy-Matches günstiger als es in der Übersetzungsbranche üblich ist.
Der Algorithmus ist perfekt für logographische Schreibsysteme wie Chinesisch und Japanisch geeignet.
Er erhöht die Wiederverwendbarkeit von Inhalten des Übersetzungsspeichers, reduziert die Übersetzungszeit und verbessert die Übersetzungsqualität.
Wenn Sie ein Exemplar von Cogens Informationsblatt zum Levenshtein-Algorithmus erhalten möchten, wenden Sie sich bitte an:
Jean Mandron, Business Development Manager (+33 1 46 91 89 14,
Diese E-Mail-Adresse ist gegen Spambots geschützt, Du musst JavaScript aktivieren, damit Du sie sehen kannst.
)
Hélène Keufgens, Geschäftsführerin (+32 6789 2514,
Diese E-Mail-Adresse ist gegen Spambots geschützt, Du musst JavaScript aktivieren, damit Du sie sehen kannst.
)
|