April 2009 : Cogen inför Levenshtein-algoritmen för beräkning av nära matchningar
Nära matchning är en ofta använd metod för att utnyttja text i översättningsminnen, där matchningen inte är till 100 % exakt, dvs. inte är ”helmatchningar”.
Cogen har skrivit om sin nära matchalgoritm så att den nu omfattar redigeringsavståndet som det definierats av den ryske forskaren Vladimir Levenshtein. Levenshtein-avståndet anger skillnaden mellan två sekvenser (dvs. ”redigeringsavståndet”). Den används ofta när man behöver avgöra hur lika eller olika två teckensträngar är – bland annat vid stavningskontroller.
Levenshtein-algoritmen ger flera stora fördelar när den används tillsammans med översättningsminnen:
Den är oerhört exakt vid beräkningen av matchningsprocenten. I vår algoritm har vi satt ”nära match-tröskeln” till 60 %. När 60 % av texten matchar anses de två segmenten vara nära match, och då halveras översättningspriset. Översättningskostnaden för nära matchningar är därför lägre än vad som är standard i översättningsbranschen.
Algoritmen fungerar perfekt för logografiska skriftspråk som kinesiska och japanska.
Den ökar återanvändningen av översättningsminnet och ger kortare leveranstid och högre kvalitet på översättningen.
Vill du ha ett exemplar av Cogens avhandling om Levenshtein-algoritmen kontaktar du:
Jean Mandron, affärsutvecklingschef (+33 1 46 91 89 14,
Den här e-postadressen är skyddad från spam bots, du måste ha Javascript aktiverat för att visa den
)
Hélène Keufgens, verkställande direktör (+32 6789 2514,
Den här e-postadressen är skyddad från spam bots, du måste ha Javascript aktiverat för att visa den
)
|