April 2009: Cogen använder Levenshtein-algoritmen för beräkning av ofullständiga träffar
Att använda ofullständiga träffar är en populär metod för att balansera textinnehåll från ett översättningsminne, där träffarna är mindre än 100 % korrekta, dvs. inte är "fullständiga träffar".
Cogen har nu skrivit om algoritmen för ofullständiga träffar för att även innehålla redigeringsavståndsmätning, så som det definieras av den ryske vetenskapsmannen Vladimir Levenshtein. Levenshtein-avstånd är ett värde som används för att mäta skillnaden mellan två sekvenser (dvs. "redigeringsavståndet"). Detta används ofta när man behöver avgöra hur lika eller olika två teckensträngar är – som till exempel stavningskontroll.
När det gäller översättningsminnen ger Levenshtein-algoritmen vissa stora fördelar:
Den är mycket exakt vid uträkning av matchningsprocenten. I vår algoritm ställs tröskeln för “ofullständiga träffar” in på 60 %: När 60 % av innehållet matchar anses två segment vara en ofullständig träff, vilket sänker översättningskostnaden med 50 %. Följaktligen kostnaderna för ofullständiga lägre jämfört med den standard som används inom översättningsbranschen.
Algoritmen är mycket lämplig för logografiska skrivsystem, så som kinesiska och japanska.
Det höjer graden av återanvändning av minnet, vilket minskar tiden för översättning och förbättrar översättningens kvalitet.
För att erhålla en kopia av Cogens vitbok om Levenshtein-algoritmen, kontakta:
Jean Mandron, affärsutvecklingschef (+33 1 46 91 89 14,
Den här e-postadressen är skyddad från spam bots, du måste ha Javascript aktiverat för att visa den
)
Hélène Keufgens, CEO (+32 6789 2514,
Den här e-postadressen är skyddad från spam bots, du måste ha Javascript aktiverat för att visa den
)
|