Wednesday, May 25, 2005

Ultimate Wiktionary e OmegaT

Sto appena traducendo l'interfaccia utente di OmegaT in tedesco - negli ultimi giorni c'erano tante idee su OmegaT e Ultimate Wiktionary, tante coincidenze ... devo proprio scriverne.

Martin Wunderlich, un membro del gruppo di OmegaT che questa volta localizzerà insieme a me la versione tedesca (grazie!!!) è presso l'università di Limerick in Irlanda (anche questa una coincidenza - tempo fa ho scritto qualche cosina per la loro revista sulla localizzazione). Lui ha l'immagine di un gigantesco database, una Translation Memory disponibile per tutti e un Glossario disponibile per tutti integrando l'accesso a questi dati in un CAT Open Source del tipo OmegaT. Ultimate Wiktionary avrà la possibilità di esportare dati in formato tbx ovvero farli accessibili tramite rss feed. Se si avrebbe poi la TM gigante a disposizione in formato TBX sarebbe tutto davvero ottimo.

Poi parlando con Gerard Meijssen, con il quale stiamo creando Ultimate Wiktionary, ovvero lui si occupa del lato tecnico e di coordinare un po' tutto, mentre io faccio di più lavori nel retro, siamo arrivati alla conclusione che non sarebbe poi tanto difficile avere un accesso diretto da OmegaT all'Ultimate Wiktionary - cioè di vedere i dati in tempo reale - di vedere se le voci sono state verificate, cercare terminologia dall'interno di OmegaT. E avere comunque anche la possibilità di scaricare i dati sul proprio computer quando si deve lavorare offline.

Poi ieri è stato da Kennisnet, quelli che hanno pagato i 5000 Eur per programmare l'Ultimate Wiktionary, per trovare un modo di collegare http://commons.wikimedia.org localizzando i contenuti e cioè traducendo le categorie e le parole chiavi per la ricerca in tante lingue - combinando logicamente tutto con l'Ultimate Wiktionary.

Parlando con delle persone lì ha trovato anche uno che utilizza OmegaT :-) quindi di nuovo si incontra tutto.

Con un po' di immaginazione le potenzialità sono enormi ...

E tutto andrà proprio nella direzione giusta ...

Non so perché, ma quando ho visto per la prima volta OmegaT - e quando Marc Prior mi ha parlato sul "com'è nato il progetto e perché si chiama OmegaT" ho sentito che era "quella cosa" da seguire anche se nel frattempo ho lavorato (e per certi progetti tuttora lavoro) con DéjàVu.

Sono curiosa delle vostre opinioni - potete aggiungere una nota qui.

Ciao, Sabine

Tuesday, May 10, 2005

Wikipedia per traduttori - e Wiktionary?

Su Langit ora ho visto una domanda:

salve, ragazzi e ragazze!
ho appena "scoperto" 'sto website plurilingue ma, sinceramente, non mi ci raccapezzo!
qualcuno/a di voi se ne sirve gia'?
quale la sua applicazione per il nostro lavoro da traduttori, almeno bilingui?
gia.
daniele
Grazie Daniele! Mi da la possibilità di fare qualche nota.

Su Wikipedia trovi soprattutto informazioni enciclopediche, ma puoi anche trovare singole traduzioni.

Mettiamo che stai cercando la parola "cristianesimo" (per prendere una dov'è presente un glossario su wiktionary).

Su wikipedia per l'italiano devi inserire http://it.wikipedia.org/wiki/Cristianesimo
quando poi sei sulla pagina troverai una lunga descrizione. Se vuoi leggere che cosa esiste in un altra lingua trovi sul lato sinistro dei link che dicono "Deutsch, English, Espanol - scusate il tilde che manca - ecc." cliccando su loro trovi la corrispondente pagina in un'altra lingua.

Se non c'è la lingua che vuoi puoi anche provare ad inserire la voce direttamente. Così p.e. per la wikipedia tedesca sarebbe http://de.wikipedia.org/wiki/Christentum
Come si vede: wikipedia (e anche Wiktionary) utilizzano i codici iso 639-1, 639-2, 639-3 per la denominazione della relativa versione di lingua.

Per ricerche terminologiche esiste wiktionary. Quello inglese è quello più completo, ma solo perché esiste da qualche anno in più di quello italiano.

Sul wiktionary hai p.e. una completa categoria di terminologia sul cristianesimo http://it.wiktionary.org/wiki/Categoria:Cristianesimo

Lì trovi i sottogruppi per lingua o nella pagina principale tutte le parole mischiate - così è più facile trovarne una quando non sai quale lingua è.

Se p.e. vuoi vedere il singolo termine lo puoi anche inserire direttamente:
http://it.wiktionary.org/wiki/cristianesimo
In basso poi trovi le categorie alle quali appartiene questo termine.

Attualmente Wiktionary non è al pieno delle sue potenzialità - la versione che davvero sarà utilissima per noi traduttori è in preparazione - l'Ultimate Wiktionary che dovrebbe andare online in estate. Per quella versione abbiamo già avuto donazioni di terminologia da parte di istituzioni Europee come la European Environmental Agency con GEMET, l'European Multilingual Thesaurus on Healt Promotion ecc. ecc. Non ha senso caricarli adesso, perché multiplicherebbe il lavoro. Invece cerchiamo a creare glossari di base in questo momento per dare rilevanza a dati presenti che necessitano qualche aggiunta e lavoriamo su quello.

Ieri p.e. ci hanno inviato un glossario medico (scritto da medici) NL-EN che sarà caricato su wiktionary (http://nl.wiktionary.org)

Con l'ultimate wiktionary sarà possibile caricare dati in formato xml (tbx) e scaricarli per nostro uso nei nostri software cat sempre in xml (tbx). Visto che tutto è sotto GNU FDL la distribuzione sotto indicazione della fonte è lecito ed anche desiderato.

Una cosa ancora: su ogni wiktionary e wikipedia si può cambiare la lingua dell'interfaccia utente dopo aver effettuato il login - nelle preferenze - il link si trova in alto a destra. Per chi abbia problemi a farlo, basta una breve nota a me.

E per concludere: chi abbia terminologia che vuole mettere a disposizione: saremmo contenti includere la vostra terminologia, logicamente con il vostro nome - non dimenticate: quando create un login potete anche aggiungere dati sulla vosta pagina utente ...

Auguro una buona giornata!

Sabine

Saturday, May 07, 2005

Wiktionary e le "cattive parole!

Strano, proprio negli ultimi giorni avevamo una discussione sul "quali parole non vanno in Wiktionary", perché un membro aveva inserito una parola "offensiva" inserendo però abbastanza etimologia e quindi per me andava bene. Oggi su Langit c'era la richiesta terminologica che riguardava proprio le parole offensive, facevano parte di atti processuali. Da qui si può vedere quanto siano importanti queste parole - non sono da considerare offensive, ma semplicemente parole che non servono solo per la traduzione di letteratura (e lì molto probabilmente servono spesso), ma anche per traduzioni legali.

Buon fine settimana!

Sabine