Allineamento
L’allineamento di file crea da coppie di file di testo simili o uguali , ma in lingue diverse, un unico file bilin- gue.
I programmi di allineamento procedono alla segmentazione dei testi e al successivo confronto dei singoli segmenti nelle due lingue. L’operazione viene svolta in modo automatico dal programma, che propone una prima associazione di segmenti in base al loro formato, struttura e posizione nel testo. La persona del tradut- tore ne valuta la correttezza e può decidere per la conferma o per la modifica delle unità traduttive proposte. Alla fine del lavoro di revisione si avrà un unico file bilingue, che potrà essere utilizzato per creare una me- moria di traduzione. I più recenti programmi propongono il salvataggio del file bilingue in formato standard XLIFF, basato su XML, che ne garantisce l’interoperabilità.
Banca dati terminologica
Raccolta di termini, provenienti da settori diversi, curati da organismi nazionali e internazionali, aziende, università ecc., consultabili via internet. Solitamente i termini sono presentati in schede terminologiche che contengono informazioni relative alla gestione delle schede e al termine.
Per la gestione delle schede si ha, di solito, nome del compilatore, data di compilazione o dell’aggiornamento. Per il termine, invece , oltre al termine stesso, si hanno informazioni sulla lingua, la categoria grammaticale, settore di appartenenza, eventuali sinonimi, dominio di impiego, definizione, conte- sto definitorio, note, fonti e grado di affidabilità. Queste raccolte terminologiche sono database informatici, in genere gestiti e alimentati all’interno dell’intranet di un’organizzazione, e successivamente resi pubblici. In internet, sono disponibili numerosi servizi per la consultazione di importanti raccolte terminologiche in ambito specialistico. IATE, per esempio, è la banca dati dell’Unione europea, con schede in 23 lingue. Il rapido sviluppo di questo tipo di offerta testimonia del valore strategico delle risorse terminologiche come capitale intellettuale e fattore di sviluppo nell’economia globale. Per assicurare l’interoperabilità dei dati nella gestione dei database terminologici,lo standard raccomandato è TBX, basato su XML.
Concordancer
È un programma che serve per la ricerca e l’analisi linguistica in un corpus, ovvero a creare in modo automa- tico concordanze. È usato, cioè, per verificare le relazioni tra le parole di un testo e dare accurate informa- zioni circa il modo in cui sono usate nel loro contesto.
Può essere usato per l’analisi di corpora paralleli, bilingui, o anche come programma all’interno di un siste- ma di memoria di traduzione, per verificare come una parola o parte di una frase sono state tradotte in conte- sti simili. Un concordancer, di norma, analizza un corpus (un’ampia raccolta di testi su un argomento, di solito salvata in formato solo testo) dando la possibilità di cercare combinazioni di parole all’interno di una gamma specificata o anche solo parti di parole. Una volta terminato, propone una lista di parole ordinate alfabeticamente, inserite in una frase di contesto, o altri dati di carattere linguistico. Questi dati possono esse- re usati in vario modo, come, per esempio, per studiare le collocazioni( gli abbinamenti frequenti di parole), verificare l’uso delle preposizioni o più semplicemente la frequenza delle occorrenze di una data parola. Tra i più comuni concordancer, usati in ambito linguistico, ricordiamo: AntConc, ApSIC Xbench, BootCat, Cor- pusEye, GlossaNet, MonoConc e WordSmith.
Corpus elettronico
Collezione di testi digitalizzati raccolti per lingue,
per ambiti settoriali (letteratura, filosofia, scienze, stampa ecc.) o periodi storici, selezionati e organizzati per facilitare le analisi
linguistiche. Attraverso strumenti di analisi
quantitativa e statistica, un c.e. permette
di indagare le regolarità
linguistiche che emergono
dai testi e che costituiscono la base per la descrizione della struttura del linguaggio. La disciplina che studia il linguag-
gio attraverso i corpora
è nota come àLinguistica dei corpora.
Oltre che dagli studiosi
di linguistica, i corpo-
ra sono usati frequentemente nell’ambito della lessicografia, della traduzione o dell’insegnamento delle lin- gue. Esempi noti di c.e. consultabili via web sono il àBritish National Corpus per l’inglese o il corpus riferi- to al quotidiano “La Repubblica” per l’italiano.
Corrispondenza esatta
Indica il massimo grado di somiglianza tra due segmenti. durante la traduzione interattiva con programmi di
àtraduzione assistita (CAT). E’ il risultato della ricerca nella àmemoria di traduzione di una
àcorrispondenza al àsegmento da tradurre tra i segmenti già tradotti.
Una corrispondenza esatta indica, quindi, la perfetta identità tra due segmenti in lingua originale. La relativa traduzione, proposta dal programma, non necessita, quindi, di modifiche. In alcuni programmi, la corrispon- denza esatta viene ulteriormente qualificata da indicazioni di contesto. Se, per esempio, la corrispondenza esatta, trovata nella memoria, riguarda anche il segmento immediatamente precedente, allora aumenta il gra- do di affidabilità della traduzione proposta e viene chiamata ICE, In Exact Context match, oppure Context match o Guaranteed match.
Corrispondenza parziale
Indica una parziale somiglianza tra due segmenti. durante la traduzione interattiva con programmi di
àtraduzione assistita (CAT). E’ il risultato della ricerca nella àmemoria di traduzione di una
àcorrispondenza al àsegmento da tradurre. È il contrario di àcorrispondenza esatta.
Una corrispondenza parziale (fuzzy match) tra due segmenti in lingua originale viene indicata generalmente con un valore in percentuale: man mano, che scende il valore diminuisce la somiglianza. Viene data entro il valore di soglia, impostato dall’utente. I segmenti possono differire, per esempio, per alcune parole, per un ordine diverso delle stesse, per dei dati numerici in esso contenuti o, anche, solo per diversa formattazione. La relativa traduzione, proposta dal programma, necessita di un adattamento, se non di una riscrittura, nei casi di percentuali di corrispondenza troppo basse.
Déjà Vu
Applicazione per la traduzione assistita (CAT) della società Atril di Madrid. Non molto diffuso tra le agen- zie, ma molto apprezzato tra i freelancer, per la compatibilità con àSDL Trados, leader del mercato, e per la facilità d’uso.
Offre un ambiente di lavoro unificato per la gestione di database di memoria, terminologici e di progetto. Progetti complessi, costituiti da un gran numero di file, anche in formati diversi, possono essere visualizzati in un unico file in una unica finestra, dove si possono applicare operazioni di ricerca e sostituzione, filtro e propagazione. Con la funzione EBMT (example-based machine translation, traduzione automatica basata su esempi) un àfuzzy match può essere integrato con il supporto fornito dalle basi dati terminologiche, arri- vando, in molti casi, alla traduzione corretta.
Desktop-publishing
Editoria elettronica; impiego dei computer per le attività di composizione e impaginazione di testi e grafica. Le più avanzate applicazioni software per il DTP consentono, tra l’altro, di realizzare testi combinando diver- si font e misure dei caratteri.
Dizionario online
Raccolte di vocaboli,
termini di settori specifici o nozioni
relative a particolari materie consultabili in rete. Queste risorse possono
essere molto eterogenee, sia per quanto riguarda la struttura, sia per quanto riguarda
le modalità di funzionamento e di consultazione. Si va dalla semplice scansione di opere cartacee o elenchi
di termini in ordine alfabetico, alla trasposizione online di dizionari
su cd-rom, alle àbanche dati
terminolo- giche fino ai
cosiddetti metadizionari , motori di ricerca
che consultano simultaneamente numerosi altri di- zionari. Molti sono gratuiti, mentre altri sono consultabili previo acquisto di un abbonamento (per esempio
Zanichelli o la piattaforma eLexico). Sull’onda del web 2.0 si diffondono sempre più i cosiddetti dizionari collaborativi che, seguendo la strada tracciata da Wikipedia, invitano gli utenti ad aggiungere lemmi, defini- zioni o traduzioni.
Estrazione terminologica
Estrazione di un elenco di termini potenziali, o candidati, da un insieme di testi in formato digitale allo lo scopo di creare o allargare un glossario terminologico. Si realizza in modo semi-automatico con applicativi specializzati, con l’attenta revisione di un terminologo o traduttore.
L’estrazione di termini può essere sia monolingue sia bilingue. Nel primo caso si analizzano testi in una sola lingua, nel secondo caso vengono analizzati testi bilingui, a partire da quelli in lingua di partenza, con lo scopo di identificare i potenziali termini e i loro equivalenti, con una successiva procedura di
àallineamento. Gli applicativi di tipo linguistico cercano i termini candidati in combinazioni di parole che corrispondono a strutture del discorso (per es., sostantivo + aggettivo o sostantivo + sostantivo), lavorando su una sola lingua o su lingue estremamente affini. In quelli di tipo statistico s’identificano, invece, le sequenze ripetute di segmenti lessicali. Si ha, però, una gran quantità di noise (segnalazioni non idonee) e di silence (termini non identificati). In genere i due tipi vengono combinati in applicativi ibridi. Difficoltà possono sorgere dall’estrarre termini senza un ampio contesto, che possa fornire informazioni sul concetto in questio- ne. Un’ulteriore difficoltà deriva dal fatto che l’estrazione terminologica parte dal termine per descriverne il concetto legato ad esso (approccio semasiologico), mentre nella terminologia si segue un approccio onoma- siologico, cioè, partendo da un dato concetto, se ne descrivono i termini.
File bilingue
È un tipo di file intermedio creato durante il processo di traduzione con programmi di traduzione assistita (CAT). Contiene i segmenti in lingua di partenza e d’arrivo e include, nella maggior parte dei casi, la struttu- ra del documento originale.
I file da tradurre, che possono essere in origine nei più vari formati di file, sono convertiti in formato bilingue per essere letti dagli strumenti CAT. Dopo la traduzione, di solito, si preferisce provvedere alla revisione della traduzione sul file bilingue, prima di produrre il file tradotto e importarlo nella memoria di traduzione definitiva. I formati di file bilingui di tipo proprietario, a lungo ostacolo alla compatibilità tra i vari prodotti, sono stati sostituiti dallo standard XLIFF, basato su XML.
Fuzzy match
Corrispondenza parziale tra due segmenti di testo, ossia corrispondenza non esatta tra un segmento di parten- za da tradurre ed un segmento di partenza archiviato nella memoria di traduzione.
Grado di corrispondenza
Grado di somiglianza, espresso in percentuale, tra un segmento del testo di partenza che deve essere tradotto ed una unità di traduzione recuperata dalla memoria di traduzione.
Google Traduttore
Interfaccia in italiano di Google Translate, il servizio di àtraduzione automatica offerto dalla società Google Inc., per tradurre in modo istantaneo parole, termini, frasi o intere pagine web tra decine di coppie lingui- stiche.
Dal 2007 G.T. usa un software di traduzione proprio basato su un approccio di traduzione chiamato
àtraduzione automatica statistica. Ciò significa che il sistema cerca modelli in centinaia di milioni di docu- menti per scegliere la migliore traduzione da offrire all’utente. Individuando i modelli in documenti che sono già stati tradotti da esseri umani, G.T. è in grado di fare congetture intelligenti sulla presumibile correttezza di una traduzione.
Di G.T. fa uso anche Google Translator Toolkit, un servizio di àtraduzione assistita, lanciato nel 2009, pro- gettato per permettere a chiunque di correggere o integrare più facilmente le traduzioni che G.T. genera au- tomaticamente ed essere di ausilio a chi traduce. Google Translator Toolkit permette ai traduttori di organiz- zare il loro lavoro e usare come basi una memoria di traduzione globale, in cui confluiscono le traduzioni validate dai singoli utenti, àmemorie di traduzione personali in formato àTMX e glossari. Il sistema per- mette di caricare e tradurre documenti nei formati Microsoft Word, OpenOffice, RTF, HTML, testi in forma- to .txt e articoli di Wikipedia e di Knol.
HTML (Hypertext Markup Language)
Linguaggio di marcatura utilizzato per definire il formato dei documenti destinati ad essere pubblicati sul World Wide Web. Le pagine web sono costruite con i tag HTML, ossia simboli di marcatura inseriti nel testo. Il linguaggio HTML definisce il layout della pagina, i font, gli elementi grafici ed i collegamenti iper- testuali con altri documenti disponibili in rete.
IATE
È la banca dati terminologica multilingue dell’Unione europea, redatta in tutte le 23 lingue ufficiali. Racco- glie la terminologia e il gergo specifico delle istituzioni comunitarie, nonché di settori più generali, come per es. diritto, agricoltura, tecnologie dell’informazione, ecc.
Ha iniziato ad operare nel 1999 con l’obiettivo di fornire un’infrastruttura basata sul web per tutte le risorse terminologiche comunitarie e favorirne l’uso e la standardizzazione. Incorpora i dati delle precedenti banche dati terminologiche delle istituzioni europee: EURODICAUTOM (Commissione), EUTERPE (Parlamento), TIS (Consiglio), EUROTERMS (Centro traduzioni), CDCTERM (Corte dei conti). Contiene 8,4 milioni di termini, di cui circa 540000 abbreviazioni e 130000 frasi. Costantemente aggiornata, la banca dati è libera- mente consultabile in Rete.
Internazionalizzazione
È l’adattamento o ingegnerizzazione di prodotti digitali per un potenziale utilizzo al di fuori del mercato per cui sono stati progettati, rendendo tecnicamente facile la àlocalizzazione degli stessi. Spesso indicato con I18n, dove 18 sono le lettere sottintese per Internationalization.
Normalmente si procede separando i dati testuali dai dati dipendenti dall’ambiente di utilizzo, ovvero dal codice del programma. In questo modo la futura attività di localizzazione riguarderà solo una parte delle risorse del programma, separate dal codice del programma. In fase di sviluppo, per es. di un’ applicazione, si deve prevedere che in fase di esecuzione dell’applicazione stessa vengano selezionate le corrette risorse lin- guistiche richieste dall’utente. Una applicazione internazionalizzata deve poter modificare il suo aspetto non solo per la lingua utilizzata nell’interfaccia, ma anche il suo comportamento (modalità di formattazione dell’output), in funzione dell’area linguistica in cui il programma viene mandato in esecuzione. Per es., per quelle lingue, dove il verso di scrittura è inverso rispetto alle lingue occidentali, anche le finestre di interfac- cia dovranno adattarsi graficamente a questa necessità. Allo stesso modo, specialmente per le lingue dell’est e quelle asiatiche, l’ambiente di sviluppo deve prevedere un corretto supporto della codifica Unicode, per una corretta rappresentazione dei caratteri. In genere i sistemi operativi e gli ambienti di sviluppo prevedono alcune librerie particolari per il supporto internazionale.
LISA
Acronimo per Localisation Industry Standards Association. Fondata nel 1990 e chiusa nel 2011, LISA è stata il principale forum internazionale per le organizzazioni operanti nel mercato globale. È fonte autorevole per le procedure di localizzazione e pubblicazione di documenti multilingue per il settore IT.
Vi aderivano
oltre 240 importanti aziende ICT, fornitori di soluzioni globali e un numero crescente
di socie- tà, che operano
su mercati verticali, ma con una forte presenza
strategica internazionale orientata al web, oltre a enti governativi, ministeri e organizzazioni del commercio. Tra gli aderenti
si contavano aziende co-
me, per es., Adobe, Hewlett Packard, Xerox, Nokia ma anche Coca Cola, McDonald, oltre a istituzioni e organizzazioni come Banca mondiale, Unione europea, ISO, ma anche enti di formazione e associazioni di traduttori, ecc. Piuttosto che agire come un ente di normazione tradizionale a sé, i membri si consideravano come un gruppo orientato all’attuazione, concentrandosi sul miglioramento dei risultati e dei costi per le atti- vità di localizzazione. Quattro volte l’anno, il Forum LISA riuniva i professionisti della localizzazione per discutere di costi di prodotto e di traduzione, controllo di qualità e procedure di internazionalizzazione. Gruppi di speciale interesse (detti SIG) erano incaricati di elaborare, per settori individuati, tecnologie stan- dard. Tra questi ricordiamo àOSCAR, per l’elaborazione di standard per tecnologie di traduzione.
Localizzazione
Rendere un prodotto digitale linguisticamente e culturalmente appropriato per la versione locale di destina- zione (paese/regione e lingua), in cui sarà utilizzato e venduto. Il termine deriva dall’inglese locale ed è spes- so indicato come L10n, dove 10 sono le lettere sottintese per Localization.
È un’attività legata all’espansione dei mercati internazionali globali, in cui un identico servizio o prodotto deve essere reso fruibile da parte di un ampio parco di utenti. L’adattamento di un servizio o di un prodotto digitale (sito web, videogame, programma o anche un impaginato) avviene per un bacino di utenza geo- linguistico (in inglese, locale). Nella localizzazione gli aspetti linguistici e tecnici sono interdipendenti. Gran parte del processo di localizzazione, difatti, riguarda la traduzione dell’interfaccia utente, i messaggi di siste- ma e la documentazione . L’adattamento traduttivo deve garantire, quindi, il perfetto funzionamento del pro- dotto. Per questo, già in fase di realizzazione del prodotto originale, viene prevista l’àinternazionalizzazione, che è la premessa tecnica delle future localizzazioni di prodotto. Le scelte di lo- calizzazione coinvolgono:
- lingua e scelta della sua varietà regionale
- sistema di scrittura e codifica dei caratteri
- convenzioni di scrittura (formati di data, ora,valuta, numeri, numeri di telefono, indirizzi, nomi, re- gole di punteggiatura)
- convenzioni culturali legate a colori, forme, immagini, suoni.
L’indicazione di locale è data da un identificatore di lingua (in minuscolo) e da un identificatore di regione (in maiuscolo) secondo gli standard ISO 639 (lingua) e ISO 3166 (Paese): per es., it/IT sta per italiano/Italia, mentre it/CH per italiano/Svizzera.
Logiterm
Applicazione per la traduzione assistita (CAT) di Terminotix, piccola società di Montreal, Canada. Poco conosciuta in Italia, l’applicazione riunisce una serie di funzioni linguistiche: ricerca full-text, creazione di file bilingui e memorie di traduzione, l’estrazione di terminologia, ecc. Funziona per sistemi Windows e la- vora con formati standard per la traduzione, basati su XML (TMX, TBX, XLIFF). Apprezzabile la parte relativa alla terminologia: offre funzioni di estrazione automatica di sequenze di parole da un testo o un gruppo di testi e di ricerca su fonti esterne, quali Termium, GDT, TransSearch, OnTerm e Google diretta- mente dall’applicazione. La stessa società commercializza anche SynchroTerm, un programma di estrazione terminologica bilingue, con supporto per greco, nederlandese, ungherese, norvegese, polacco e turco.
Memoria di traduzione
Nelle applicazioni di àtraduzione assistita (CAT) è il database dove sono archiviate le coppie di àsegmenti origi-nali e tradotti
da un traduttore umano. Nel corso della traduzione interattiva di un nuovo testo, con un’applicazione CAT, la memoria
di traduzione viene automa-ticamente consultata per riutilizzare parti di testo già tradotte precedentemente. Vengono infatti confrontati i nuovi segmenti
da tradurre, con quelli pre- cedentemente tradotti e archiviati, cercando tra essi una possibile àcorrispondenza esatta o anche parziale
(àfuzzy match). L’applicazione segnala al traduttore con precisione, oltre al grado di somiglianza, le diffe- renze riscontrate. Il traduttore deciderà di volta in volta, se confermare la traduzione trovata nella memoria,
riadattarla o scriverne una nuova. In base al contenuto della memoria si può provvedere alla pretraduzione del testo per i segmenti con corrispondenza esatta. Man mano che si lavora con esse, le memorie crescono e diventano uno patrimonio di lavoro, di cui avere grande cura. Esistono vari formati di memorizza-zione pro- prietari legati a differenti programmi: per es., TMW è stato il formato tipico di àSDL Trados, programma tra i più diffusi. Attualmente per garantire l’interoperabilità e la sopravvivenza nel tempo delle memorie, i programmi più aggiornati supportano il formato standard àTMX, basato su àXML. In questo formato il DGT, direttorato di traduzione, dell’Unione europea ha reso disponibile sul web l’Acquis communautaire, l’intero corpo delle leggi europee nelle 22 lingue ufficiali.
Multiterm
Prodotto di àSDL Trados per la gestione terminologica, ovvero per la creazione e gestione di àglossari. Gestisce singoli termini o singole espressioni, come avviene normalmente con i glossari, interfacciandosi con gli altri programmi SDL Trados per la àtraduzione assistita (CAT). Crea database terminologici, detti ter- mbase: per ogni termine è possibile specificare fino a 20 lingue di destinazione ed è possibile eseguire la ricerca in qualsiasi lingua di destinazione. L’interfaccia di Multiterm può essere considerata come una rac- colta di schede, ciascuna delle quali contiene tutte le informazioni relative a un termine. Il programma si interfaccia in tempo reale con la suite SDL Trados per la traduzione assistita (CAT), permettendo l’inserimento controllato della corretta terminologia durante la traduzione interattiva.
OmegaT
Applicazione open-source per la traduzione assistita (CAT), multipiattaforma. Attualmente è l’unica soluzio- ne che può essere installata su sistemi Windows , Macintosh OS X e Linux. Sviluppato da un gruppo infor- male internazionale di volontari, è un marchio registrato in Germania.
Le sue caratteristiche includono segmentazione personalizzabili tramite espressioni regolari, memoria di traduzione con fuzzy match e propagazione dei match, controllo dei termini su glossario e dizionario, tradu- zioni automatiche da Apertium, Belazar e Google Translate. Supporta preferibilmente file in formati basati su XML con codifica UTF-8. Consigliato l’uso con OpenOffice, che viene utilizzato convertire i file MS Word versione 1997-2003. Crea memorie di traduzione in formato standard TMX e file bilingui in XLIFF.
OSCAR
Acronimo per Open Standards for Container/content Allowing Reuse. È l’organismo àLISA, per gli stan- dard aperti per l’industria della traduzione e della localizzazione. Sviluppa e mantiene gli standard tecnici relativi alle esigenze linguistiche di aziende internazionali.
Gli standard OSCAR sono relativi a àmemoria di traduzione, gestione della terminologia, l’elaborazione della traduzione, conteggio delle parole, analisi del volume di lavoro e gestione di contenuti multilingue. Al riguardo gli standard elaborati sono: àTMX, formato per memorie di traduzione; SRX, regole per la seg- mentazione del testo da tradurre, TBX, formato per lo scambio di dati terminologici; xml:tm, per l’inclusione di memorie in documenti XML; GMX-V, standard per il conteggio dei caratteri e delle parole.
Post – editing
Revisione, eseguita da un traduttore o da un correttore di bozze, del testo prodotto da un sistema di traduzio- ne automatica.
Pre-editing
Attività di preparazione del testo da sottoporre a traduzione automatica al fine di ottenere
traduzioni di quali- tà buona o quanto meno accettabile. Essa consiste essenzialmente nel semplificare
il linguaggio e conformar- lo allo standard
gestibile del programma (attività, quindi, che si inserisce tra la redazione e la traduzione vera e propria) oppure
a “predisporre” il testo seguendo
delle linee guida per redattori
tecnici (manualistica).
Pretraduzione
Confronto tra un intero testo di partenza e una memoria di traduzione al fine di inserire automaticamente la traduzione di tutti i match esatti trovati all’interno della memoria. Il risultato di tale processo è un testo ibrido che contiene sia segmenti pretradotti sia segmenti non tradotti.
Revisione
Verifica dell’accuratezza di una traduzione, con particolare riferimento agli errori di trasposizione, alle omis- sioni e alle aggiunte, alla resa di nomi e titoli, alla presentazione di dati, cifre e tabelle, ecc.
Riconoscimento di termini
Processo di individuazione automatica, all’interno di una base terminologica, di tutti i termini che ricorrono nella parte di testo su cui il traduttore sta lavorando.
N.B.: Riconoscimento ed estrazione di termini sono due concetti diversi.
Ripetizioni esterne
Segmenti che compaiono più di una volta all’interno di due o più testi di partenza ma che non sono stati an- cora tradotti, non sono cioè ancora stati archiviati nella memoria di traduzione sotto forma di unità di tradu- zione. Vedere anche: ripetizioni interne, match esatto e analisi statistica del testo di partenza.
Ripetizioni interne
Segmenti che compaiono più di una volta nel testo di partenza ma che non sono stati ancora tradotti, non sono cioè ancora stati archiviati nella memoria di traduzione sotto forma di unità di traduzione. Vedere an- che: ripetizioni esterne, match esatto e analisi statistica del testo di partenza.
Scheda terminologica (anche: voce terminologica)
Voce che contiene tutta l’informazione terminologica relativa a un singolo concetto. Ciò significa che tutte le informazioni relative allo stesso concetto (compresi, per esempio, i sinonimi) sono raccolte in un’unica entra- ta terminologica. Le informazioni relative a concetti diversi devono essere invece archiviate sotto voci diver- se.
SDL TRADOS
Azienda leader nel settore delle applicazioni di àtraduzione assistita. Nasce dalla fusione tra Trados Gmbh e SDL, che in passato avevano prodotti concorrenti: la suite Trados e SDLX. La suite SDL Trados è composta da più applicazioni, con diverse funzioni pensate per supportare il traduttore.
In SDL Trados Studio 2009, suite offerta in più versioni standalone o server, sono comprese in un unico interfaccia il sistema di gestione delle àmemorie di traduzione, un editor testuale e il sistema di gestione del progetto. Il formato di file delle memorie è SDLTM, e quello dei àfile bilingui è SDLXLIFF, ambedue ba- sati su àXML. Include anche un tool specifico, SDL Passolo, per la gestione di file di progetti di localizza- zione (file risorse, eseguibili, html della guida in linea). La gestione terminologica si realizza con
àMultiterm, che interagisce in tempo reale con gli altri strumenti di traduzione assistita. La precedente ver- sione del software, SDL Trados 2007, è inclusa nella licenza del nuovo prodotto per permettere l’accesso e la conversione di precedenti memorie e file bilingui, mentre Winalign, strumento per l’àallineamento di file, sopperisce alla mancanza di un analogo strumento nella nuova versione.
Segmento
Nei programmi di àtraduzione assistita (CAT) è l’unità minima di traduzione, che nella maggior parte dei casi coincide con una frase. Il programma
opera la segmentazione, dividendo il testo in base alla punteggia- tura o ai segni di a capo,
tabulazioni o anche
àtag
nei
linguaggi di marcatura.
Il traduttore può controllare questo processo in base al tipo di testo, aspetto grafico o formato di file del do- cumento da tradurre. Successivamente ad ogni segmento originale, in lingua di partenza (o source), viene abbinato un segmento tradotto, in lingua d’arrivo (target). La coppia di segmenti forma l’unità di traduzione (translation unit, TU), che verrà salvata nella memoria di traduzione. La possibilità di riciclare segmenti già tradotti nasce dalla creazione di regole di segmentazione ragionevolmente efficaci per individuare porzioni di testo sufficientemente piccole, ma sintatticamente sensate.
Tag
Sorta di etichetta associata a un elemento e contenente informazioni relative allo stesso (per esempio infor- mazioni riguardo alla natura dell’elemento stesso o al modo in cui dovrebbe essere visualizzato). Un insieme di tag viene talvolta denominato marcatura; nei linguaggi di marcatura come l’HTML e l’XML i tag vengono racchiusi tra i segni di minore e maggiore (per esempio <CORSIVOà).
Termine
Parola, locuzione, espressione o simbolo usato in un settore ben definito per designare un determinato ogget- to o concetto.
Term-mining
Insieme delle attività di individuazione ed estrazione automatica o semiautomatica di termini specialistici e dei loro contesti da testi o àcorpora testuali. Più in generale il T.M. comprende anche tutte le attività e le tecniche di ricerca terminologica nel web attraverso l’uso di motori di ricerca generali o specializzati, la con- sultazione di banche dati terminologiche, testi specialistici, àcorpora elettronici ecc.
L’estrazione di termini può essere sia monolingue sia multilingue. L’estrazione monolingue ha come obietti- vo l’identificazione e l’estrazione di termini contenuti in singoli testi o all’interno di corpora testuali creati in vari formati (.txt, .rtf, .html o file esportati con strumenti di traduzione assistita) con l’ausilio di specifici strumenti di estrazione terminologica o di àconcordancer.
L’estrazione multilingue analizza invece i testi delle diverse versioni linguistiche con lo scopo di identificare i potenziali termini e i loro equivalenti.
TMX (Translation Memory eXchange format)
Formato standard per memorie di traduzione sviluppato dalla LISA (Localization Industry Standards Asso- ciation) al fine di facilitare lo scambio delle memorie tra i vari sistemi software e/o tra i fornitori di servizi di localizzazione. Per ulteriori informazioni consultare la homepage del TMX.
Traduzione assistita
È l’insieme degli strumenti e delle tecnologie software, che aiutano il traduttore nel processo di traduzione con l’obiettivo della memorizzazione e del riciclo della traduzione e del controllo della terminologia, produ- cendo significativi guadagni in termini di tempo ed efficienza. Non va confusa con la traduzione automatica o machine translation (MT), dove la traduzione è affidata esclusivamente al programma. Con la traduzione assistita (CAT) il fattore umano resta comunque fondamentale.
Secondo alcuni, nella dizione CAT, andrebbero inclusi anche dizionari elettronici, spell checker, OCR, stru- menti per la concordanza e per la ricerca nel testo. In senso stretto, seppur diversi tra loro e con funzionalità specifiche , i programmi CAT condividono elementi fondamentali quali:
- la suddivisione in àsegmenti del testo sorgente;
- l’associazione delle coppie di segmenti sorgenti e tradotti in un àfile bilingue
- -la memorizzazione e il riutilizzo del materiale tradotto;
Questi programmi vengono offerti come suite ovvero raccolta di applicazioni specializzate, ognuna dedicata a un aspetto
differente del lavoro traduttivo,
che interagiscono tra di loro in tempo
reale.
Le applicazioni riguardano principalmente:
- àmemoria di traduzione (translation memory) e recupero di testi paralleli con l’àallineamento di file
- gestione della terminologia (terminology management)
- gestione del progetto (project management)
Il settore della traduzione, che più si avvantaggia di questi strumenti è quello della traduzione professionale, studi e agenzie di traduzione, dove si lavora in team contemporaneamente allo stesso progetto per ridurre i tempi di consegna. In questo settore i testi da tradurre sono di carattere tecnico-scientifico o normativo (ma- nuali, documentazione tecnica, schede di prodotto, ecc.). Sono pubblicazioni soggette a frequenti aggiorna- menti, i cui testi sono basati su un linguaggio standard, controllato, necessariamente ripetitivo. L’uso degli strumenti CAT permette di assicurare il controllo della terminologia e la coerenza stilistica all’interno degli stessi testi tradotti in caso di aggiornamenti e, più in generale, di tutti i testi relativi a quel cliente, creando per essi una memoria globale.
Traduzione automatica
Processo in cui è il computer provvede alla traduzione di un testo. Un traduttore umano può intervenire nel processo svolgendo compiti di pre- o post-editing, ma è il computer, e non il traduttore, a svolgere una prima bozza di traduzione.
Trattamento automatico del linguaggio
Settore della àlinguistica computazionale che si occupa dello sviluppo e dell’applicazione di risorse, siste- mi, tecnologie, modelli e metodologie relativi all’elaborazione automatica del linguaggio naturale scritto e parlato. Si pone obiettivi come la comprensione del linguaggio umano per servizi quali il reperimento di informazioni, la àtraduzione automatica e l’interazione vocale uomo-computer.
Le aree di ricerca del TAL comprendono, per esempio, la comprensione del significato di testi scritti e l’estrazione di informazioni rilevanti anche in lingue diverse, l’acquisizione dinamica di nuovi elementi di conoscenza su un certo dominio (àtext mining), la gestione e l’organizzazione dei documenti trovati per una condivisione ottimale delle conoscenze, il riconoscimento del parlato e del parlante, la conversione di testi scritti in messaggi vocali (àsintesi vocale), la produzione, il riassunto e la àtraduzione automatica di testi.
XML (eXtensible Markup Language)
Linguaggio di marcatura che serve a migliorare la funzionalità del web fornendo modalità di identificazione dell’informazione più flessibili e adattabili. Viene detto extensible (“estensibile”) perché non è un formato fisso come l’HTML, che è invece un linguaggio di marcatura chiuso e non modificabile). Con l’XML, che in effetti è un “metalinguaggio”, un linguaggio usato cioè per descrivere altri linguaggi, è possibile al contrario definire una marcatura personalizzata che si adatti a un numero infinito di documenti diversi.