среда, 19. децембар 2012.

Рад на сложеним пројектима

Прво питање које себи можете поставити овом приликом јесте - "Шта су то сложени пројекти?" Дефиниција сложеног је опширна и сигурно има различита значења за различите лингвисте.

То могу бити:

- велики обим текста
- егзотични формати изворних докумената
- велики број изворних докумената
- већи број лингвиста (преводилаца, лектора, редактора) који раде на документу - евентуално истовремено (у случају рада преко сервера)
- рад у различитим окружењима за превођење (сваки од лингвиста користи другачији програм за рад - од једноставног Word-а, преко различитих алата CAT који постоје на тржишту, нпр. memoQ, SDL Trados, Déjà Vu, итд.)
- посебни делови документа које треба превести (а друге делове изоставити)
- све ово наведено заједно

Овом приликом ћемо се сконцентрисати на пример рада на документима који испуњавају следеће услове: велики број докумената, велики обим текста, лингвиста ради у преводилачком окружењу (memoQ) које је другачије од оног у коме је клијент припремио документе за рад (Trados), а у цео посао су укључени и други лингвисти који раде у истом или другачијем окружењу (memoQ, Trados, Word).

Алат који користим у раду и који највише одговара мојим (не малим) потребама и преференцијама је memoQ. Са једним великим клијентом сам раније, кад сам знао мање, направио једну кључну грешку у обради документа која ме је коштала значајног умањења од око 200 евра - на које сам пристао, иако смо се и ја и клијент намучили око документа и изгубили и време и живце. Радило се о томе да је клијент користио, а и даље у свом раду користи Trados (захтевали су да радим на њиховом серверу, такође користећи Trados).

Будући да ми рад са Традосом, поготову са верзијом 7 није одговарао због немогућности коришћења различитих филтера и опција закључавања сегмената, као и слаб увид у "велику слику", одлучио сам да документе које сам добио у .ttx формату директно учитам у memoQ, преведем и пошаљем клијенту. ГРЕШКА! Документе је прво потребно припремити за рад у другом програму. Ево како:

У Translator's Workbench, одаберите опцију Options -> Translation Memory Options... (Опције за преводилачку меморију):


На картици General (Опште), штиклирајте поље Copy source on no match (Копирај изворни текст у поље за циљни текст у случају да у преводилачкој меморији већ не постоји одговарајуће решење - тј. да сегмент већ није преведен). Кликните на ОК.


Затим, одаберите опцију Tools (Алати) и у оквиру ње опцију Translate (Преведи). Ово се још зове пре-сегментација (pre-segmenting), односно припрема сегмената изворног текста за накнадну обраду.


Штиклирајте поље Segment unknown sentences (Изврши сегментирање непознатих реченица) и означите опцију Update document (Ажурирај документ). Затим кликните на дугме Add (Додај) у горњем левом углу и одаберите документ који желите да припремите са одговарајуће локације на вашем рачунару.


Дозволите програму да изврши обраду. 


Пошто је реч о сложеним пројектима, закомпликоваћемо ствари додатно учитавањем још фајлова (да бисмо добили на броју докумената и обиму текста). Поновићемо кораке након додавања документа. Можете одабрати више докумената истовремено.


Погледајмо за тренутак исти овај документ у Trados TagEditor-у. Поставиио сам курсор испред броја 22000198 и притиснуо комбинацију тастера Alt+Home, да бих отворио сегмент за превођење. Trados TagEditor је прескочио све бројеве који стоје самостално (ово је разлика у односу на memoQ који учитава и све бројеве у документу) и отворио први следећи сегмент који садржи бар једно слово.


 Овај претходни екран сам вам приказао да бисте знали зашто ћемо приликом учитавања у memoQ морати да штиклирамо опцију Import unsegmented content (Увези несегментирани садржај). Тај несегментирани садржај су управо бројеви. Ово је важно јер у супротном може доћи до некомпатибилне верзије документа након извоза (експортовања) документа обрађеног у програму memoQ или било ком другом програму.

Када учитате своје документе у memoQ, програм ће аутоматски препознати да је реч о .ttx филтеру и појавиће се следећи прозор (видите да су сви документи учитани и да поред њих стоји зелени штиклирани знак - дакле, memoQ је препознао тип фајла).


Међутим, у овом случају, мораћемо да променимо филтер и конфигурацију (кликните на опцију у доњем левом углу означену бројем 1 и уоквирену (Change filter and configuration for all). Појавиће се прозор који је у првом плану на слици: штиклирајте опцију Import unsegmented content (то је оно што смо раније поменули):



Сачувајте овај филтер (са подешавањима која сте одабрали претходно) за будуће сличне ситуације тако што ћете кликнути на зелени знак плус. Ја сам га назвао TagEditor Presegmented да би ме подсетило да је реч о документима чија је припрема одрађена у TagEditor-у.


Сада су документи учитани и можете почети да радите на преводу. Оно што ћете приметити када отворите један од тих докумената је следеће:


Неки сегменти ће бити преведени (означени плавом бојом и процентом тачности од 100%). То је зато што смо током пре-сегметнације користили преводилачку меморију клијента која је већ садржала одређене преводе. Видите да је у случају бројева циљно поље празно (зато што Традос не сегментира бројеве) али су они свеједно учитани (јер смо одабрали опцију за увоз несегментираног садржаја). У осталим случајевима, у пољу за превод текст је исти као у изворном тексту.

Уколико извршимо анализу докумената, видећемо следеће резултате:


Исти ти резултати, само графички обрађени (из дела Project Home -> Settings -> Analysis -> Create report):


Оно што ћемо сада урадити јесте да потврдимо све сегменте који су 100% тачни (на основу меморије клијента). Идите на опцију Operations (Операције) и одаберите Confirm and Update Rows... (Потврди и ажурирај редове):


Штиклирајте само кућицу 100% or 101% pre-translated (100% или 101% претходно преведени):



Када кликнете на ОК, појављује се следећи прозор - извештај. Кликните на Close (Затвори).



Видећете да је проценат завршености одређених докумената промењен:


Следећи корак (ово није нужан корак, али помаже значајно у случају да има много докумената и да се одређени садржаји у сваком од њих понављају) јесте да креирамо један виртуелни документ који ће садржати све сегменте из свих ових докумената. То се ради тако што ћете у доњем десном углу програма memoQ кликнути на опцију Create view (Креирај приказ). Појављује се следећи прозор:


Име приказа одредите сами. У овај приказ желим да укључим само оне редове, тј. сегменте који нису потврђени. Одаберите одговарајућу опцију као што је приказано на слици горе. Кликните на ОК.

На картици Views појављује се документ под горе наведеним именом. Отворите га и погледајте како изгледа.

Врло брзо, увиђате да у документу има доста шифара производа које следе одређени шаблон - низ бројева, словне вредности, низ бројева.


Да не бисте губили време и ризиковали да погрешно унесете шифру у превод, постоји једна изузетно корисна, иако врло компликована опција - таговања, односно, закључавања одређеног текста који се појављује у документу и који следи одређени шаблон. Опција за то је Regex Tagger, при чему Regex значи Regular Expressions.

Али о томе следећи пут.




2 коментара:

  1. Odličan članak, sve je detaljno objašnjeno. Sigurna sam da će mnogima pomoći.


    A ne tako davno, za dobar prevod je od prevodilačkog alata bila dovoljna "pametna glavica" i par rečnika :(

    ОдговориИзбриши
  2. И даље је за добар превод потребно то исто, али је опис посла проширен (све ово може да се избегне и људи успешно избегавају да користе ове алате). Међутим, штета је јер не чине услугу ни себи ни клијенту. Ускоро наставак и мало приче о конвертовању шаблонских низова у тагове. Кад то завршим, прећи ћу на ведрије теме :)

    ОдговориИзбриши