Auch wenn verschiedene CAT-Tools ähnlich aufgebaut sind, so gibt es von Programm zu Programm doch gewisse Unterschiede, die es vor der Auswahl zu berücksichtigen gilt.
Grundsätzlich gibt es zwei verschiedene Arten von CAT-Tools: Translation-Memory-Systeme, die für die Übersetzung von Fließtexten entwickelt wurden und vor allem Dateiformate in den Bereichen der Textverarbeitung (MS Office) und des Desktop Publishing, wie InDesign oder FrameMaker, sowie Web-Dokumente in HTML oder XML unterstützen, und Software-Lokalisierungsprogramme, die sich für die Übersetzung von Dateien mit Oberflächentexten aus Software-Programmen eignen und je nach Programmiersprache zum Beispiel die Dateiformate EXE, DLL, NET RESX, RC oder XML unterstützen.
Dieser Artikel konzentriert sich auf die Eigenschaften und Unterschiede der marktführenden TM-Systeme SDL Trados, across und memoQ.
Besonderheiten von SDL Trados
- Im Gegensatz zur integrierten Terminologieverwaltung anderer CAT-Tools können mit SDL Trados Informationsfelder im externen Terminologieverwaltungsprogramm SDL MultiTerm selbst definiert werden.
- Hyperlinks können wahlweise als „nicht bearbeitbar“, „nur der sichtbare Text bearbeitbar“ oder „Text und Link bearbeitbar“ eingelesen werden.
- Mit der Funktion QuickPlace können Formatierungen automatisch und schnell übertragen werden.
- Die Vorschau des Zieltextes während der Übersetzung ist auf die Formate DOCX, XML, HTML und PDF beschränkt.
Besonderheiten von across
- Alle Einträge in Translation Memory (TM) und Terminologiedatenbank (TB) werden zentral in einer gemeinsamen Datenbank gespeichert. Um relevante Einträge finden und zuordnen zu können, müssen ihnen Attribute wie Fachgebiet oder Kunde zugeteilt werden.
- Im Übersetzungs-Editor wird der Text in der Originalformatierung angezeigt.
- In Grafiken eingebettete Texte können mit across importiert und übersetzt werden.
- Nach dem Import eines Textes erfolgt die Vorübersetzung (das Einfügen von Übersetzungen bereits gespeicherter Segmente) automatisch und muss nicht erst händisch durchgeführt werden.
Besonderheiten von memoQ
- Aufgrund der einfachen, intuitiven Oberfläche kann das Übersetzen mit memoQ besonders schnell erlernt werden.
- Im Übersetzungseditor ist auch die Bearbeitung des Ausgangstexts möglich, wodurch Fehler im Ausgangstext nicht im Translation Memory gespeichert werden, sondern korrigiert werden können.
- Die externen Tags in HTML-Dateien werden im Übersetzungs-Editor nicht angezeigt, wodurch diese während der Übersetzung nicht beschädigt werden können.
- Es gibt ein separates Fenster für die Vorschau des Original- und Zieltextes direkt im Übersetzungs-Editor.
Unterschiedliche Analysen von CAT-Tools
Man sollte sich darüber im Klaren sein, dass sich die Ergebnisse der Ausgangstext-Analyse je nach CAT-Tool stark unterscheiden können. Hier einige Beispiele für unterschiedliche Ergebnisse:
Anzahl der Wörter: Um die Anzahl der Wörter zu berechnen, muss definiert sein, welche Zeichen Wörter trennen. Während Leerzeichen, Punkt oder Beistrich im Allgemeinen als worttrennende Zeichen gelten, ist dies etwa bei Apostrophen und Bindestrichen nicht einheitlich definiert. Der Satz „Here‘s the multi-word example“ kann also je nach Zählweise 4, 5 oder 6 Wörter beinhalten.
Zahlen: Zahlen werden in manchen Tools als Wörter gezählt, in anderen nicht. Es macht auch einen Unterschied, ob eine Zahl allein steht, Teil eines Wortes ist oder ob mehrere Zahlen durch andere Zeichen getrennt werden (50er Jahre, 50 Jahre, 01.02.2015).
Anzahl der Segmente: Auch Zeichen, die das Ende eines Segments markieren, sind nicht einheitlich. Während ein Punkt in allen Tools ein Segmentende bedeutet (außer nach einer Zahl), bezeichnen Doppelpunkt und Tabulator nicht in allen Programmen ein Segmentende.
Berechnung der Match-Raten: Auch die Match-Raten werden unterschiedlich berechnet, je nachdem, worauf Bezug genommen wird (Wörter, Buchstaben, unterschiedliche Segmentierung etc.).
Datenaustausch zwischen CAT-Tools
Die in CAT-Tools verwendeten und erstellten Daten können exportiert und in andere Tools importiert werden. Ein Arbeitsprozess kann also auch mehrere CAT-Tools beinhalten. Jedoch sollte man bei der Datenübertragung genau kontrollieren, ob alle relevanten Daten übertragen werden können.
Der Austausch von Translation Memories erfolgt im Austauschformat TMX (Translation Memory eXchange), welches auf XML-Sprache basiert. Diese Sprache ist ein offener Standard, weshalb TMX-Dateien nicht in allen CAT-Tools gleich gebaut sind und unterschiedliche Akronyme aufweisen.
Im TM können neben den Übersetzungseinheiten auch Kommentare, Metadaten oder Match-Raten gespeichert werden. Je nach CAT-Tool können Teile dieser Daten beim Import beziehungsweise Export verloren gehen.
Terminologiedatenbanken können ebenfalls aus CAT-Tools exportiert und dann in Programmen wie Excel geöffnet oder in andere CAT-Tools importiert werden. Ebenso ist es möglich, Glossare, die z.B. in Excel erstellt wurden, in TBs zu importieren. Auch für TBs gibt es ein XML-basiertes Austauschformat: TBX (TermBase eXchange). Beim Import von Excel-Glossaren ist zu beachten, dass diese vor dem Import als Unicode 8 im CSV- oder TXT-Format gespeichert werden müssen. SDL Multiterm exportiert TBs im SDLTB-Format. Um CSV-Dateien in MultTerm zu importieren, müssen diese zuvor über das Konvertierungstool SDL MultiTerm Convert in eine XML-Datei konvertiert werden.
Weitere Informationen zu diesen Übersetzungstechnologien finden Sie auf der Website von Interlingua.
Teil 1: Wie funktionieren CAT-Tools und welche Vorteile bieten sie für die technische Redaktion?
© Beitragsbild: nicotombo – Fotolia.com
- CAT-Tools im Vergleich - 25. Februar 2015