Feeds:
Articoli
Commenti

Archive for the ‘download’ Category

{Interessanti novità dalla banca dati terminologica europea IATE (InterActive Terminology for Europe) che da alcune settimane ha messo a disposizione una versione scaricabile della sua vasta raccolta terminologica, fatta di oltre 8 milioni di termini nelle 24 lingue europee.

IATE

In questo articolo vedremo insieme come trasformare il materiale fornito da IATE in un semplice glossario bilingue (formato Excel o TXT “tab-delimited”) da importare successivamente nel nostro CAT preferito. Questo ci permetterà di accedere alla terminologia IATE anche senza una connessione internet.

Il file, che si può scaricare da questa pagina, è in formato TBX (TermBase eXchange) e pesa oltre 2GB. Come spiegato sul sito, si tratta di una versione ridotta della banca dati, nel senso che non contiene i commenti né altri campi che sono presenti nella versione online (la terminologia è invece presente integralmente). Nella tabella che segue una panoramica del materiale che si trova nel file:

Language

Number of terms

Bulgarian

           29288  

Czech

           26202  

Danish

           568998  

German

           982209  

Greek

           500253  

English

           1285247  

Spanish

           576790  

Estonian

           32472  

Finnish

           306922  

French

           1244893  

Irish

           57490  

Croatian

           8257  

Hungarian

           47420  

Italian

           659906  

Lithuanian

           50313  

Latvian

           28844  

Maltese

           35284  

Dutch

           644824  

Polish

           54299  

Portuguese

           506583  

Romanian

           34820  

Slovak

           33844  

Slovenian

           41800  

Swedish

           290879  

Latin

           61383  

Multilinugal

           4892  

 All

     
8114112  

Sebbene TermBase eXchange sia uno dei formati che vengono letti ad es. da MultiTerm Convert:

MultiTerm Convert

il file è talmente pesante che dopo pochi minuti su un PC con 16GB di RAM l’operazione si interrompe per un problema di memoria:

System Out Of Memory

Meglio così, perché pensandoci bene cosa ce ne facciamo di un glossario in 24 lingue? Il glossario completo potrebbe al massimo essere interessante per un’agenzia, alla quale consiglio di leggere questo articolo in cui Paul Filkin propone una soluzione (abbastanza macchinosa e non gratuita) per convertire l’intera banca dati IATE in un glossario MultiTerm. Ma per noi traduttori professionisti nella maggior parte dei casi è sufficiente creare un semplice glossario bilingue nella nostra combinazione di lavoro (o al massimo 2 o 3 glossari se lavoriamo con più lingue).

Per farlo dobbiamo ricorrere a Xbench di ApSIC, un software abbastanza noto nel nostro ambiente, apprezzato soprattutto per le sue potenti funzioni di assicurazione della qualità da usare in combinazione con quei CAT che non le hanno. Per gestire file di grandi dimensioni come quello fornito da IATE dobbiamo scaricare da questa pagina la versione a 64-bit di Xbench 3.0 – Build 1243 (con la versione a 32-bit non funziona).

Una volta scaricato e installato il programma, dobbiamo specificare il nostro indirizzo e-mail per registrarci (la versione trial funziona per 30 giorni) e quindi creare un nuovo progetto:

Creazione di un nuovo progetto

Nella finestra Project Properties clicchiamo sul pulsante Add…, selezioniamo il formato del glossario (TBX/MARTIF) e clicchiamo su Next:

Selezione del formato

Nella scheda successiva File List clicchiamo sul pulsante Add File…, selezioniamo il file TBX che abbiamo scaricato dal sito IATE e clicchiamo su Next:

Selezione del file

Nella scheda successiva Properties spuntiamo la casella davanti all’opzione Remove duplicates e clicchiamo su Next:

Remove duplicates

Il passaggio successivo è un po’ più lungo, perché dopo aver cliccato su Next Xbench carica l’elenco delle lingue. Essendo il file molto pesante, questa operazione può durare anche diversi minuti:

Caricamento delle lingue

Una volta che Xbench ha caricato l’elenco delle lingue nella scheda Language Settings, togliamo il segno di spunta dall’opzione Include segment even if source or target text is missing (perché nel nostro glossario vogliamo importare solo i termini di una lingua per i quali esiste anche un corrispondente nell’altra lingua), selezioniamo la lingua Source, la lingua Target e clicchiamo sul pulsante OK:

Selezione delle lingue

A questo punto la finestra Add Files to Project si chiude e nella finestra Project Properties vediamo che è stato caricato il glossario IATE:

Xbench pronto per l'estrazione

Cliccando sul pulsante OK in alto a destra viene avviata l’estrazione della terminologia nella coppia di lingue da noi scelta. Anche la finestra Project Properties si chiude e Xbench inizia a lavorare. Cliccando su See Details è possibile seguire in tempo reale quanti termini vengono estratti da Xbench:

Dettagli dell'estrazione

Una volta terminata l’estrazione, la barra verde in alto scompare e in basso viene visualizzato il numero totale di termini estratti:

468.600 termini estratti

Bene, ora manca solo più un passaggio, cioè l’esportazione dei termini estratti in un file Excel che ci permetterà poi di caricare la terminologia nel nostro CAT preferito. Per farlo, dobbiamo selezionare dal menu Tools la voce Export Items…:

Esportazione dei termini estratti

Nella finestra Export Items, mettiamo il segno di spunta davanti alla voce All items in a glossary e quindi selezioniamo il glossario appena estratto dal sottostante elenco (cliccare sulla freccia rivolta in basso). Poi nell’area Output selezioniamo il formato XLSX, diamo un nome al file (cliccare sul pulsante con i tre puntini) e spuntiamo la casella Add a header in first row. Controlliamo ancora una volta che tutte le impostazioni siano corrette e clicchiamo sul pulsante OK:

Impostazioni di esportazione

Xbench procede così all’esportazione dei dati nel file Excel:

Esportazione dei dati

Nel mio esempio, quando ho aperto il file Excel ho visto che erano stati esportati 441.354 termini. I 27.246 termini mancanti sono probabilmente le ripetizioni che Xbench ha eliminato automaticamente durante l’esportazione:

File Excel creato da Xbench

Oltre alle due colonne delle lingue, nel file Excel ne ho trovate altre 35, la maggior parte delle quali vuote e le rimanenti di scarso interesse per me. Prima di importare i dati in MultiTerm, ho eliminato tutte le colonne e tenuto solo quelle delle due lingue. Quindi ho convertito il file Excel in un file XLM con MultiTerm Convert e poi importato il file XML in MultiTerm. Durante questo ultimo passaggio, MultiTerm ha importato solo circa 330 mila termini al primo giro. Allora ho creato un nuovo file con i 111.000 termini che aveva saltato e di questi ne sono avanzati altri 4000 circa che ho importato al terzo giro, per un totale di 441.350:

Glossario MultiTerm de-it

Per convertire il file Excel in un file TXT con termini separati da tabulatore (ad es. per WordFast o DejaVu), dal menu File di Excel cliccare su Save As…, selezionare il formato Text (Tab delimited) (*.txt) e cliccare sul pulsante Save:

Conversione Excel - Tab delimited

Questo sistema con Xbench mi sembra – al momento – la soluzione più veloce e interessante, soprattutto perché permette di creare glossari bilingui in qualsiasi combinazione linguistica immaginabile.

Buon divertimento!

Stefano

Annunci

Read Full Post »

{ È di alcuni giorni fa la notizia che la Commissione europea Directorate-General for Translation ha rilasciato una nuova versione aggiornata della sua Translation Memory of the Acquis Communautaire (DGT-TM). L’acquis comunitario, cioè l’insieme dei diritti e degli obblighi giuridici e degli obiettivi politici che accomunano e vincolano gli stati membri dell’Unione Europea, comprende:

  • i principi, gli obiettivi politici e ciò che è disposto dai trattati e la legislazione applicativa degli stessi;
  • la giurisprudenza della Corte di giustizia europea;
  • le dichiarazioni e le risoluzioni adottate nell’Unione;
  • gli atti riguardanti la giustizia e gli affari interni;
  • gli atti inerenti alla politica estera e di sicurezza comune;
  • gli accordi internazionali fatti dalla Comunità e quelli conclusi dagli Stati membri tra essi nei settori di competenza dell’Unione.

Questo impressionante corpus di translation unit nelle 22 lingue ufficiali dell’Unione Europea è ora disponibile in una release aggiornata, nella quale sono confluiti anche tutti i dati dal 2004 al 2010. L’intera raccolta può essere scaricata gratuitamente da questa pagina (punto 7 Download the DGT Translation Memory), dove sono contenute anche tutte le necessarie informazioni.

Ecco una breve guida in italiano:

Per convertire questa TM in formato TMX e importarla nel nostro strumento CAT preferito, è necessario scaricare dalla stessa pagina, oltre ai file ZIP dei dati, anche l’apposito programma TMXtract e la relativa libreria a collegamento dinamico (file DLL). Il programma di estrazione ci consente di creare una translation memory bilingue per la o le nostre combinazioni di lavoro.

Una volta scaricato tutto il materiale (i 25 file dei dati DGT-TM-2011, il file TMXtract.exe e il file swt-win32-3218.dll), è necessario spostarlo in un’unica cartella. I file dei dati non devono essere decompressi, perché il programma di estrazione accede direttamente agli ZIP. Lanciando il file TMXtract.exe, si apre questa finestra:

La finestra di TMXtract
Procedere in questo ordine:

  1. Selezionare i file source (i 25 file ZIP DGT-TM-2011 scaricati)
  2. Specificare il file di destinazione in cui verrà salvata la TM
  3. Selezionare la lingua source della nuova TM
  4. Selezionare la lingua target della nuova TM
  5. Controllare che tutte le impostazioni siano corrette e fare clic su Start

A questo punto, il file estratto in formato TMX può essere importato in una nuova TM creata ad hoc. ATTENZIONE: vista l’enorme mole di dati, il processo di importazione nello strumento CAT può durare svariate ore!

Maggiori informazioni in inglese sono reperibili in questa pagina. Sul sito del collega Bruno Ciola è possibile scaricare una serie di file TMX già estratti e di dizionari Autosuggest (per Trados Studio). I dati contenuti in questi file sono quelli della vecchia release DGT-TM-2007, ma possono servire p.es. per fare qualche prova prima di scaricare tutto il malloppo aggiornato da 2GB. Disponibile anche un articolo dettagliato con istruzioni passo-passo in tedesco.

Stefano

Fonte acquis comunitario: Wikipedia

Read Full Post »

{ L’articolo che ho scritto alcuni giorni fa su Wingloss e i famigerati glossari Microsoft mi ha messo la classica pulce nell’orecchio…
Oggi ho quindi deciso di vedere se questi benedetti glossari erano ancora disponibili da qualche parte in internet. Per prima cosa ho fatto una ricerca con Google, ma non mi ha dato alcun risultato soddisfacente. Quindi sono andato a recuperare il vecchio indirizzo del server FTP dove una volta poteva essere scaricata tutta la terminologia del gruppo di Redmont e che avevo salvato da qualche parte.

Qui ho però trovato solo un documento di testo:

I glossari, dice, sono stati convertiti in un formato migliore e trasferiti al “Microsoft download center”, in modo da facilitarne l’accessibilità. Sarà, ma quando poi vado all’indirizzo specificato nel file TXT, scopro che per scaricare i glossari completi in formato CSV bisogna essere iscritti a MSDN o a TechNet:

Mi sembra quindi un’operazione che, piuttosto che facilitare l’accesso ai glossari, lo ostacola. Allo stesso indirizzo si legge poi dell’esistenza del nuovo “Microsoft Language Portal” con tanto di search tool che permette l’accesso al database terminologico e alle stringe software di alcuni programmi:

La pagina è molto curata, niente da dire, ma i contenuti non sono un granché. Per prima cosa, l’unica lingua source selezionabile è l’inglese, quindi la ricerca online è possibile solo per chi traduce dall’inglese verso un’altra lingua. Peccato, perché da una società come Microsoft mi attendevo un super programma in grado non solo di cercare da e verso tutte le lingue, ma di offrire anche funzioni fantascientifiche. In secondo luogo, dal sottotitolo e dai risultati di alcune ricerche effettuate, sembra che sia disponibile solo la terminologia delle versioni più recenti di Windows. Speriamo quindi in eventuali miglioramenti futuri.

==================================

Nota del 15.01.2010
Come segnala oggi Licia nel suo commento in fondo all’articolo, che ringrazio per la precisazione, effettivamente è possibile selezionare anche una qualsiasi altra lingua source. Basta infatti fare clic su Ricerca termini nel menu in alto a sinistra per accedere alla pagina di ricerca con più opzioni:

Selezionando un’altra lingua source da questa pagina, la ricerca viene però fatta esclusivamente verso l’inglese. Quindi per scoprire per esempio come è stato tradotto Gespräch beenden in italiano, dobbiamo prima fare una ricerca dal tedesco all’inglese = End the call e poi dall’inglese all’italiano = Termina la chiamata. Un po’ macchinoso, ma sempre meglio che niente… 🙂

==================================

Per chi fosse interessato, tempo fa avevo scaricato qualcosa dal server FTP di Microsoft, inclusa una copia del file della terminologia generale “Microsoft_Terminology_20070130.CSV” (datato 30.01.2007, 12421 righe x 60 lingue, 10MB), che potete scaricare qui (file ZIP da 2,8MB). Ho poi anche due file ZIP (italiano e tedesco), contenenti ciascuno una novantina di file CSV, con tutte le stringhe di altri programmi Microsoft. Se vi serve, contattatemi che ve li mando volentieri.

Stefano

.

Read Full Post »

{ Oggi mi voglio occupare di un programmino tanto semplice quanto geniale che si chiama Wingloss. Si tratta di un software molto leggero, formato da un unico file, che gira già da un’eternità in rete (sviluppato nel 1996 da un certo Alex) e che molti di voi sicuramente conosceranno. Suppongo fosse stato creato per facilitare la ricerca di un termine nei lunghi e pesanti file Excel in cui una volta Microsoft stipava tutta la terminologia di Windows. Wingloss permette infatti di effettuare una ricerca molto veloce su una serie di file TXT e CSV presenti sul disco fisso. I file TXT e CSV in questione possono essere per esempio i famigerati glossari Excel di Microsoft, dei glossari che abbiamo scaricato da internet, un glossario esportato dal cliente che ci ha mandato l’agenzia insieme al lavoro, oppure anche un semplice file di testo nostro personale che aggiorniamo di tanto in tanto con termini nuovi.

Il vantaggio principale di Wingloss è quello di poter predefinire praticamente una serie infinita di glossari su cui poter poi effettuare una ricerca globale e super veloce da un’interfaccia unica. A chi non è mai capitato? Stiamo traducendo e incontriamo un termine che abbiamo di sicuro già visto in uno dei 212 glossari che vegetano da anni nella nostra cartella C:/Documenti/Glossari. Bene, ma… quale dei 212? Se non è un termine ultra-specifico, vi assicuro che possono passare anche delle ore prima di ritrovarlo! Con Wingloss, invece, tutto si svolge in automatico e questi benedetti 212 glossari potranno, forse, servire a qualcosa.

Per installare Wingloss sul vostro computer, potete scaricarlo qui.

Una volta scaricato il file ZIP, create prima di tutto una nuova cartella “C:/Programmi/Wingloss”. Poi aprite il file ZIP e copiate i due file che si trovano al suo interno Wingloss.exe e readme.txt nella cartella “C:/Programmi/Wingloss” appena creata. In realtà servirebbe solo il file Wingloss.exe – che è il programma vero e proprio – ma consiglio di conservare anche il file delle istruzioni readme.txt per eventuali consultazioni future. Poi fate click con il pulsante destro del mouse sul file Wingloss.exe che avete estratto dallo ZIP e copiato nella cartella “C:/Programmi/Wingloss” e, dal menu popup che appare, selezionate l’opzione “Invia a…” > “Desktop (crea collegamento)”. Verrà così creato un collegamento al programma direttamente sul desktop del vostro computer, in modo da potervi accedere rapidamente quando serve. Avendolo installato manualmente e senza uno dei cosiddetti installer, Wingloss non compare infatti nel menu “Start” > “Tutti i programmi”.

Ora fate doppio clic sul collegamento del desktop per lanciare Wingloss, che si presenta con questa interfaccia grafica:

Per prima cosa, dovete creare una sorta di nuovo progetto in cui mettere tutti i file TXT e CVS che intendete includere nella ricerca. Qui ovviamente potete creare sia vari progetti suddivisi per argomento (p.es. tutti i glossari di medicina, di architettura, ecc.), sia un unico grande progetto con tutti i glossari che avete sul computer. Questa ultima scelta è quella consigliata: visto che dovete trovare qualcosa, cercatela direttamente in tutto il cercabile. Per creare questo progetto, dal menu “File” selezionate l’opzione “Glossary Files…”:

per visualizzare la seguente finestra “Glossary Files” di selezione dei file:

Nell’area superiore della finestra (evidenziata dal cerchio rosso nello screenshot qui in alto) dovete ora cercare sul vostro computer i file TXT e CSV che vi interessano. Ogni volta che nell’area superiore della finestra viene visualizzato un file che può essere incluso nella ricerca (1), fate clic sul pulsante “Add” (2) sulla destra per aggiungerlo all’area inferiore della finestra (3):

Sotto al pulsante “Add” c’è anche un pulsante “Add All”, molto comodo, che però non funziona 😛
Una volta che avete selezionato tutti i glossari del vostro computer e che li avete spostati nell’area inferiore della finestra premendo 212 volte il pulsante “Add”, chiudete la finestra (“Close”) per tornare alla homepage di Wingloss. Dal menu “File” selezionate “Save as…” e salvate questo file di progetto con l’estensione *.wgl in un posto sicuro e facilmente accessibile:

Per creare altri progetti specifici, ripetere la procedura descritta sopra.

Una volta conclusa la procedura di selezione dei file, chiudete Wingloss e rilanciatelo per fare una prova. Innanzitutto il programma si apre sempre con l’ultimo progetto caricato. Quindi nella barra superiore dovrebbe esserci il nome dell’ultimo progetto (nell’esempio gloss_gen.wgl):

Se non c’è il progetto che vi interessa, dal menu “File” selezionate l’opzione “Open” per andare a cercare il file *.wgl e aprirlo.
A questo punto non vi resta che inserire il termine da ricercare nel campo “Find”. I risultati vengono visualizzati, in tempo reale mentre scrivete, nell’area inferiore della finestra (preceduti dal nome del file in cui ricorrono), come si può vedere bene in questo screenshot:

In conclusione: uno strumento un po’ vecchiotto, ma leggero (può viaggiare comodamente anche nella chiavetta USB), estremamente veloce e ancora utilissimo per la ricerca locale.

Sul sito proz.com c’è anche un articolo con ulteriori istruzioni.

Spero vi sia utile!

Stefano

.

Read Full Post »

%d blogger hanno fatto clic su Mi Piace per questo: