Feeds:
Articoli
Commenti

Archive for the ‘strumenti’ Category

{Interessanti novità dalla banca dati terminologica europea IATE (InterActive Terminology for Europe) che da alcune settimane ha messo a disposizione una versione scaricabile della sua vasta raccolta terminologica, fatta di oltre 8 milioni di termini nelle 24 lingue europee.

IATE

In questo articolo vedremo insieme come trasformare il materiale fornito da IATE in un semplice glossario bilingue (formato Excel o TXT “tab-delimited”) da importare successivamente nel nostro CAT preferito. Questo ci permetterà di accedere alla terminologia IATE anche senza una connessione internet.

Il file, che si può scaricare da questa pagina, è in formato TBX (TermBase eXchange) e pesa oltre 2GB. Come spiegato sul sito, si tratta di una versione ridotta della banca dati, nel senso che non contiene i commenti né altri campi che sono presenti nella versione online (la terminologia è invece presente integralmente). Nella tabella che segue una panoramica del materiale che si trova nel file:

Language

Number of terms

Bulgarian

           29288  

Czech

           26202  

Danish

           568998  

German

           982209  

Greek

           500253  

English

           1285247  

Spanish

           576790  

Estonian

           32472  

Finnish

           306922  

French

           1244893  

Irish

           57490  

Croatian

           8257  

Hungarian

           47420  

Italian

           659906  

Lithuanian

           50313  

Latvian

           28844  

Maltese

           35284  

Dutch

           644824  

Polish

           54299  

Portuguese

           506583  

Romanian

           34820  

Slovak

           33844  

Slovenian

           41800  

Swedish

           290879  

Latin

           61383  

Multilinugal

           4892  

 All

     
8114112  

Sebbene TermBase eXchange sia uno dei formati che vengono letti ad es. da MultiTerm Convert:

MultiTerm Convert

il file è talmente pesante che dopo pochi minuti su un PC con 16GB di RAM l’operazione si interrompe per un problema di memoria:

System Out Of Memory

Meglio così, perché pensandoci bene cosa ce ne facciamo di un glossario in 24 lingue? Il glossario completo potrebbe al massimo essere interessante per un’agenzia, alla quale consiglio di leggere questo articolo in cui Paul Filkin propone una soluzione (abbastanza macchinosa e non gratuita) per convertire l’intera banca dati IATE in un glossario MultiTerm. Ma per noi traduttori professionisti nella maggior parte dei casi è sufficiente creare un semplice glossario bilingue nella nostra combinazione di lavoro (o al massimo 2 o 3 glossari se lavoriamo con più lingue).

Per farlo dobbiamo ricorrere a Xbench di ApSIC, un software abbastanza noto nel nostro ambiente, apprezzato soprattutto per le sue potenti funzioni di assicurazione della qualità da usare in combinazione con quei CAT che non le hanno. Per gestire file di grandi dimensioni come quello fornito da IATE dobbiamo scaricare da questa pagina la versione a 64-bit di Xbench 3.0 – Build 1243 (con la versione a 32-bit non funziona).

Una volta scaricato e installato il programma, dobbiamo specificare il nostro indirizzo e-mail per registrarci (la versione trial funziona per 30 giorni) e quindi creare un nuovo progetto:

Creazione di un nuovo progetto

Nella finestra Project Properties clicchiamo sul pulsante Add…, selezioniamo il formato del glossario (TBX/MARTIF) e clicchiamo su Next:

Selezione del formato

Nella scheda successiva File List clicchiamo sul pulsante Add File…, selezioniamo il file TBX che abbiamo scaricato dal sito IATE e clicchiamo su Next:

Selezione del file

Nella scheda successiva Properties spuntiamo la casella davanti all’opzione Remove duplicates e clicchiamo su Next:

Remove duplicates

Il passaggio successivo è un po’ più lungo, perché dopo aver cliccato su Next Xbench carica l’elenco delle lingue. Essendo il file molto pesante, questa operazione può durare anche diversi minuti:

Caricamento delle lingue

Una volta che Xbench ha caricato l’elenco delle lingue nella scheda Language Settings, togliamo il segno di spunta dall’opzione Include segment even if source or target text is missing (perché nel nostro glossario vogliamo importare solo i termini di una lingua per i quali esiste anche un corrispondente nell’altra lingua), selezioniamo la lingua Source, la lingua Target e clicchiamo sul pulsante OK:

Selezione delle lingue

A questo punto la finestra Add Files to Project si chiude e nella finestra Project Properties vediamo che è stato caricato il glossario IATE:

Xbench pronto per l'estrazione

Cliccando sul pulsante OK in alto a destra viene avviata l’estrazione della terminologia nella coppia di lingue da noi scelta. Anche la finestra Project Properties si chiude e Xbench inizia a lavorare. Cliccando su See Details è possibile seguire in tempo reale quanti termini vengono estratti da Xbench:

Dettagli dell'estrazione

Una volta terminata l’estrazione, la barra verde in alto scompare e in basso viene visualizzato il numero totale di termini estratti:

468.600 termini estratti

Bene, ora manca solo più un passaggio, cioè l’esportazione dei termini estratti in un file Excel che ci permetterà poi di caricare la terminologia nel nostro CAT preferito. Per farlo, dobbiamo selezionare dal menu Tools la voce Export Items…:

Esportazione dei termini estratti

Nella finestra Export Items, mettiamo il segno di spunta davanti alla voce All items in a glossary e quindi selezioniamo il glossario appena estratto dal sottostante elenco (cliccare sulla freccia rivolta in basso). Poi nell’area Output selezioniamo il formato XLSX, diamo un nome al file (cliccare sul pulsante con i tre puntini) e spuntiamo la casella Add a header in first row. Controlliamo ancora una volta che tutte le impostazioni siano corrette e clicchiamo sul pulsante OK:

Impostazioni di esportazione

Xbench procede così all’esportazione dei dati nel file Excel:

Esportazione dei dati

Nel mio esempio, quando ho aperto il file Excel ho visto che erano stati esportati 441.354 termini. I 27.246 termini mancanti sono probabilmente le ripetizioni che Xbench ha eliminato automaticamente durante l’esportazione:

File Excel creato da Xbench

Oltre alle due colonne delle lingue, nel file Excel ne ho trovate altre 35, la maggior parte delle quali vuote e le rimanenti di scarso interesse per me. Prima di importare i dati in MultiTerm, ho eliminato tutte le colonne e tenuto solo quelle delle due lingue. Quindi ho convertito il file Excel in un file XLM con MultiTerm Convert e poi importato il file XML in MultiTerm. Durante questo ultimo passaggio, MultiTerm ha importato solo circa 330 mila termini al primo giro. Allora ho creato un nuovo file con i 111.000 termini che aveva saltato e di questi ne sono avanzati altri 4000 circa che ho importato al terzo giro, per un totale di 441.350:

Glossario MultiTerm de-it

Per convertire il file Excel in un file TXT con termini separati da tabulatore (ad es. per WordFast o DejaVu), dal menu File di Excel cliccare su Save As…, selezionare il formato Text (Tab delimited) (*.txt) e cliccare sul pulsante Save:

Conversione Excel - Tab delimited

Questo sistema con Xbench mi sembra – al momento – la soluzione più veloce e interessante, soprattutto perché permette di creare glossari bilingui in qualsiasi combinazione linguistica immaginabile.

Buon divertimento!

Stefano

Read Full Post »

{ È uscita da poco una nuova guida in inglese di Trados Studio, molto completa ed esaustiva, scritta dal collega svedese Mats Dannewitz Linder. La guida in formato PDF è disponibile in due versioni separate, una per Trados Studio 2009 e l’altra per Trados Studio 2011.

La copertina del nuovo manuale di Trados Studio

Chiara e facilmente comprensibile perché scritta da un traduttore, la guida illustra su oltre 300 pagine tutto ciò che serve veramente per sfruttare al meglio il programma. Oltre a fornire descrizioni dettagliate, contiene anche numerosi screenshot e link a risorse esterne, come ad es. le poco conosciute “app” di OpenExchange, che rendono Trados Studio ancora più interessante.

Completa la guida un ricco indice analitico che ci consente di trovare velocemente ciò che stiamo cercando.

La guida può essere ordinata al prezzo di € 34,– ($ 45,–) a questo indirizzo, dove sono reperibili anche ulteriori informazioni.

Stefano

Read Full Post »

{ Segnalato dal collega Claudio Porcellana nel suo gruppo Tricks for translators su LinkedIn, ho scoperto da poco Archivarius 3000, un tool molto veloce e potente per cercare stringhe di testo in numerosi tipi di file presenti sul PC, disponibile in prova per 30 giorni e poi pagando una piccola licenza. Avendo una vasta collezione di glossari e altre risorse nei più svariati formati possibili, ero da tempo alla ricerca di un software come questo, in grado di trovare in pochi istanti quello che mi interessava in questo marasma digitale fatto di PDF, DOC, TXT, PPT, HTML, ZIP e chi più ne ha ne metta.

Il risultato di una ricerca fatta con Archivarius 3000

Archivarius 3000 è veloce perché si basa sul sistema dell’indicizzazione. Un volta installato il programma, bisogna infatti creare i cosiddetti indici, cioè specificare le varie cartelle in cui dovrà essere effettuata la ricerca. Quando si crea un indice, Archivarius 3000 legge tutti i file contenuti nelle cartelle selezionate, ne estrapola i testi e li salva in un file di indice che verrà usato per trovare velocemente ciò che cerchiamo. Oltre all’indice con le cartelle contenenti tutti i glossari che mi interessavano, ho creato ad es. anche un indice con la cartella Projects di Trados Studio, in modo da poter eventualmente estendere la ricerca anche alle memorie di traduzione e ai glossari di altri progetti già tradotti prima (indipendentemente dal CAT in uso).

Finestra Crea un nuovo indice

La praticità degli indici è evidente: le cartelle selezionate vengono lette fisicamente dal programma una volta sola quando viene creato l’indice (velocità di indicizzazione: circa 1 ora per 2GB) e i risultati della ricerca visualizzati immediatamente. Questo sistema ci permette di indicizzare anche il materiale che abbiamo ad es. salvato su un CD o DVD e poi di includerlo nella ricerca senza bisogno di inserire ogni volta il DVD nel lettore. Gli indici creati possono essere aggiornati periodicamente con il comodo Pianificatore integrato.

Archivarius 3000 è potente perché supporta un nutrito numero di file, è in grado di cercare anche nei più popolari file di archivio, riconosce le chiavi di ricerca in 18 diverse lingue e genera automaticamente tutte le forme delle parole. Inserendo ad es. la parola tedesca gleich, Archivarius 3000 cerca anche le forme simili gleiche, gleicher, gleichem, ecc.

Un altro cavallo di battaglia di Archivarius 3000 è la sua facile integrabilità in IntelliWebSearch. Quello che segue è il codice per lanciare una ricerca in modalità frase esatta (con chiave di ricerca tra virgolette) da IWS:

Label=Archivarius3000
Start=C:\Program Files\Archivarius 3000\Archivarius3000.exe
Finish={F3}{Tab 2}@{Enter}
Window Title=Archivarius 3000 (4.53/x64) - Sistema di ricerca
Notes=Advanced Search by Claudio Porcellana
Quotes Off=No
Pluses Off=No
Encoding=UTF-8
Interword Separator=
Case=1
Copy Key=
Cmd before returning=

Per importare il codice in IWS: selezionalo e copialo nella Clipboard, apri la finestra Search settings di IWS e, dal menu Share, seleziona l’opzione Import from clipboard. Nota: il codice è basato sulla versione italiana del programma e sul percorso specificato nel campo Start=.

Caratteristiche principali

  • Ricerca testuale istantanea di documenti ed e-mail in 18 lingue
  • Supporto per LAN (rete locale) e dischi removibili (CD, DVD e altri)
  • Supporto di grandi volumi di documenti ed e-mail
  • Supporto di numerosi formati di documenti (>50)
  • Ricerca nei più comuni file di archivio (>500)
  • Prezzo contenuto

Punti deboli: supporto tecnico che lascia a desiderare e assenza di un forum. Maggiori informazioni sono disponibili sul sito multilingue del produttore likasoft.com.

Stefano

Read Full Post »

{ Google Translate fa un bilancio dei suoi primi 11 anni di vita. In un interessante articolo pubblicato alcuni giorni fa da Franz Och, uno dei principali artefici del traduttore automatico più famoso e criticato del mondo, vengono snocciolati alcuni dati:

  • Nel 2001 erano disponibili otto lingue, oggi sono 64
  • La qualità dei testi tradotti è nettamente aumentata
  • Gli utenti attivi sono 200 milioni al mese
  • Ogni giorno viene tradotto quello che i traduttori professionisti traducono in un anno
  • L’uso dell’applicazione mobile è quadruplicata rispetto all’anno scorso

Lo stesso Orch ammette che per i testi di una certa qualità, quella del traduttore professionista è e sarà sempre una figura chiave:

We believe that as machine translation encourages people to speak their own languages more and carry on more global conversations, translation experts will be more crucial than ever.

Prossimo obiettivo di Google Translate: abbattere le barriere linguistiche entro sei anni. Ce la farà?

Stefano

Read Full Post »

{ È di alcuni giorni fa la notizia che la Commissione europea Directorate-General for Translation ha rilasciato una nuova versione aggiornata della sua Translation Memory of the Acquis Communautaire (DGT-TM). L’acquis comunitario, cioè l’insieme dei diritti e degli obblighi giuridici e degli obiettivi politici che accomunano e vincolano gli stati membri dell’Unione Europea, comprende:

  • i principi, gli obiettivi politici e ciò che è disposto dai trattati e la legislazione applicativa degli stessi;
  • la giurisprudenza della Corte di giustizia europea;
  • le dichiarazioni e le risoluzioni adottate nell’Unione;
  • gli atti riguardanti la giustizia e gli affari interni;
  • gli atti inerenti alla politica estera e di sicurezza comune;
  • gli accordi internazionali fatti dalla Comunità e quelli conclusi dagli Stati membri tra essi nei settori di competenza dell’Unione.

Questo impressionante corpus di translation unit nelle 22 lingue ufficiali dell’Unione Europea è ora disponibile in una release aggiornata, nella quale sono confluiti anche tutti i dati dal 2004 al 2010. L’intera raccolta può essere scaricata gratuitamente da questa pagina (punto 7 Download the DGT Translation Memory), dove sono contenute anche tutte le necessarie informazioni.

Ecco una breve guida in italiano:

Per convertire questa TM in formato TMX e importarla nel nostro strumento CAT preferito, è necessario scaricare dalla stessa pagina, oltre ai file ZIP dei dati, anche l’apposito programma TMXtract e la relativa libreria a collegamento dinamico (file DLL). Il programma di estrazione ci consente di creare una translation memory bilingue per la o le nostre combinazioni di lavoro.

Una volta scaricato tutto il materiale (i 25 file dei dati DGT-TM-2011, il file TMXtract.exe e il file swt-win32-3218.dll), è necessario spostarlo in un’unica cartella. I file dei dati non devono essere decompressi, perché il programma di estrazione accede direttamente agli ZIP. Lanciando il file TMXtract.exe, si apre questa finestra:

La finestra di TMXtract
Procedere in questo ordine:

  1. Selezionare i file source (i 25 file ZIP DGT-TM-2011 scaricati)
  2. Specificare il file di destinazione in cui verrà salvata la TM
  3. Selezionare la lingua source della nuova TM
  4. Selezionare la lingua target della nuova TM
  5. Controllare che tutte le impostazioni siano corrette e fare clic su Start

A questo punto, il file estratto in formato TMX può essere importato in una nuova TM creata ad hoc. ATTENZIONE: vista l’enorme mole di dati, il processo di importazione nello strumento CAT può durare svariate ore!

Maggiori informazioni in inglese sono reperibili in questa pagina. Sul sito del collega Bruno Ciola è possibile scaricare una serie di file TMX già estratti e di dizionari Autosuggest (per Trados Studio). I dati contenuti in questi file sono quelli della vecchia release DGT-TM-2007, ma possono servire p.es. per fare qualche prova prima di scaricare tutto il malloppo aggiornato da 2GB. Disponibile anche un articolo dettagliato con istruzioni passo-passo in tedesco.

Stefano

Fonte acquis comunitario: Wikipedia

Read Full Post »

{ Oggi pubblichiamo un nuovo articolo dedicato a iReader, un vecchio componente aggiuntivo di Firefox che non era più compatibile con la nuova versione del browser e che è stato recentemente aggiornato. .

iReader è un pratico plug-in per visualizzare meglio il testo contenuto in una pagina web. Durante i nostri frequenti pellegrinaggi virtuali alla ricerca di riferimenti e informazioni, spesso ci imbattiamo in pagine a più colonne, piene di banner e gadget, in cui il testo dell’articolo principale è scritto con un carattere piccolo, che ci costringe a sforzare gli occhi per leggerlo. Con questo plug-in basta un clic per estrapolare il testo dall’articolo e presentarcelo in un formato chiaro e ben leggibile..

Dopo aver installato iReader e riavviato il browser, ogni qualvolta che visitate una pagina che contiene una sufficiente quantità di testo, nella barra di navigazione comparirà un nuovo pulsante.

.

Nuovo pulsante di iReader nella barra di navigazione

.

Facendo clic su questo pulsante, si apre una finestra all’interno del browser che visualizza esclusivamente il contenuto che ci interessa, nello stile e nelle dimensioni del carattere che desideriamo. Ecco la stessa finestra di Firefox prima e dopo l’attivazione del componente aggiuntivo.

.

Stessa pagina prima e dopo l'attivazione di iReader

.

Come si può vedere dallo screenshot, il testo è ora ben leggibile e i nostri occhi non devono sforzarsi troppo. Spostando il cursore nella parte inferiore della finestra di iReader, compare la barra delle opzioni con la quale si può configurare il pug-in in base alle nostre preferenze.

.

Barra delle opzioni di iReader

.

Maggiori informazioni con screenshot dettagliati sono reperibili in questo articolo di Daniel González (in spagnolo), che ringraziamo per la segnalazione.

Scarica iReader.

..

Stefano

..

.

Read Full Post »

{ Oggi voglio parlarvi di un’applicazione gratuita sviluppata in AIR. L’ambiente AIR è una specie di browser che fa girare sul desktop di qualsiasi sistema operativo applicazioni molto leggere scritte in Html, Ajax, Pdf, Flash e Flex. Una di queste è appunto Klok, che serve a tenere conto del tempo impiegato per svolgere una qualsiasi attività. A noi traduttori può servire per tracciare con precisione le ore trascorse su una lunga revisione o necessarie per un lavoro di ricerca terminologica, la durata di una telefonata fatta all’estero per conto del cliente, oppure anche per scopi statistici: vedere per esempio quanto tempo trascorriamo al telefono o quanto ci mettiamo a tradurre 1000 parole di un argomento che conosciamo bene e 1000 di un altro che affrontiamo per la prima volta.

Per scaricare il programma, fate clic sulla seguente immagine:

Come già accennato all’inizio, l’applicazione è stata sviluppata in un ambiente che richiede la presenza sul proprio computer di AdobeAIR. Se ancora non ce l’avete, verrà installato automaticamente prima di Klok:

Una volta installato, Klok si presenta con questa interfaccia:

Sulla sinistra (a) troviamo l’elenco dei nostri progetti suddivisi in cartelle, nell’area centrale (b) il grafico della settimana con i giorni e le ore, in alto (c) i pulsanti per cambiare vista o consultare i report e in basso (d) le opzioni per archiviare o eliminare i nostri progetti.

Per iniziare a usare Klok, dobbiamo prima di tutto aggiungere un nuovo progetto. A tal fine facciamo clic su Add Project in alto a sinistra:

Dopo aver scelto un modello di progetto tra i tre proposti, il programma aggiunge una nuova cartella all’elenco e passa alla Project View. Nell’area destra si apre la scheda Properties dove possiamo specificare tutti i dettagli del progetto:

Se lavoriamo a progetti diversi, è bene selezionare un colore differente per ognuno di essi, in modo da non fare confusione nella vista settimanale. Una volta inseriti tutti i dati, facciamo clic sul pulsante Update e poi in alto su Week View per tornare alla vista settimanale.

Quando siamo pronti per iniziare il nostro lavoro e vogliamo far partire il conteggio del tempo, non dobbiamo far altro che trascinare la cartella del progetto interessato e rilasciarla sulla scritta Currently working on: nothing in alto:

Come si vede nello screeshot successivo, la scritta Currently working on: nothing è diventata Currently working on: Cliente A e a fianco è iniziato il conteggio del tempo:


Contemporaneamente, in corrispondenza dell’ora del giorno in cui abbiamo iniziato questo lavoro compare una sottile barra dello stesso colore del progetto, che aumenta di spessore man mano che trascorre il tempo.

Una volta che ci siamo accertati che è tutto impostato correttamente e che il conteggio è iniziato, facciamo clic sul pulsante Collapse view in alto a destra:

La finestra del programma si riduce così in una finestra più piccola che rimane in primo piano e quindi sempre ben visibile. Ecco uno screenshot di Word con la finestra ridotta di Klok in primo piano:

Questa della riduzione è un’operazione molto importante: ricordatevi sempre di farla, perché solo la finestra piccola rimane costantemente in primo piano. Se rimane aperta la finestra intera, rischiate di non vederla più e di dimenticarvene.

Quando avete finito il vostro lavoro (o se dovete interromperlo), fate clic sul pulsante Stop per terminare il conteggio:

Se aprite la finestra intera di Klok, noterete che la scritta è tornata Currently working on: nothing e la sottile barra gialla è diventata più spessa perché visualizza tutta la fascia oraria (nell’esempio dalle 11:00 alle 12:00):

Facendo doppio clic su uno qualsiasi di questi segmenti colorati si apre una finestra in basso nella quale è possibile aggiungere dei commenti relativi al lavoro svolto:

La funzione Reports permette di accedere ai grafici settimanali o mensili con la suddivisione del tempo tra i vari clienti:

I report possono essere esportati in Excel facendo clic sulla scritta View/Export Weekly Timesheet che si trova sopra al cestino:

Stefano

.

Read Full Post »

Older Posts »

%d blogger hanno fatto clic su Mi Piace per questo: