{ Nuovo articolo dedicato a IntelliWebSearch, l’utile programma freeware sviluppato da Michael Farrell. Se non conoscete ancora IWS, leggete gli altri articoli per saperne di più e per scaricarlo. Oggi vi farò vedere come si fa ad aggiungere una nuova fonte di ricerca online che abbiamo trovato durante le nostre ricerche in internet. L’articolo spiega anche come utilizzare IWS per effettuare una ricerca negli archivi di LANGIT o nell’utilissimo glossario multilingue dell’Agenzia europea dell’ambiente (due fonti di ricerca che al momento non sono ancora incluse nel gruppo predefinito di IWS). Dalla versione 3.1 del programma è stato introdotto un pratico Wizard che permette di aggiungere nuove fonti in modo semiautomatico. Prima vedremo quindi come utilizzare questo Wizard e successivamente come invece effettuare l’aggiunta manualmente, se per esempio il Wizard fallisce o se vogliamo capire meglio come funzionano i meccanismi di ricerca di un motore.
Per utilizzare il Wizard dobbiamo fare clic con il pulsante destro del mouse sulla “i” rossa nell’area di notifica della barra delle applicazioni e, dal menu popup che compare, selezionare l’opzione Wizard:
Nella finestra Fase 1/7 di IWS dobbiamo specificare l’URL del nuovo motore che vogliamo aggiungere, poi inserire una parola e una coppia di parole negli altri due campi:
Una volta aver confermato con il pulsante OK, la pagina del motore specificato si apre nel browser insieme a una finestra con un elenco di cose da fare:
A questo punto basta seguire esattamente le istruzioni che compaiono nella varie finestre (interagendo anche con il browser), in modo da giungere poi all’ultima finestra Fase 7/7 che ci consente di aggiungere la nuova fonte di ricerca al programma:
Come si può notare, i due campi Inizio e Fine non possono più essere modificati, perché contengono già le stringhe giuste che IWS ha impostato in base alle nostre istruzioni specificate nelle finestre precedenti. In questa finestra dobbiamo solo più dare un nome (che qui viene chiamato Designazione) a questa nuova fonte di ricerca, eventualmente selezionare altre opzioni (spuntare per esempio la casella Ricerca multipla) e poi salvarla nell’elenco premendo il pulsante Salva e chiudi in basso a sinistra.
Nei casi in cui il Wizard dovesse fallire perché non è in grado di estrarre i dati necessari, viene visualizzato un messaggio di errore che fornisce utili informazioni per l’eventuale configurazione manuale (senza il Wizard). Una descrizione dettagliata su cosa fare in questi casi è contenuta in questa pagina.
Prima di vedere come funziona l’aggiunta manuale, è necessario fare una premessa: per cercare i termini da noi specificati nel loro database, i motori di ricerca, dizionari ed enciclopedie online utilizzano due metodi: GET o POST. Il primo è quello più frequente e facile da implementare, il secondo invece è più complicato e richiede l’installazione di altri programmi. Capire quale dei due metodi viene utilizzato è molto semplice: con il metodo GET, i termini della ricerca sono visibili nella stringa dell’indirizzo (URL) della pagina dei risultati. Con il metodo POST, invece, non sono visibili.
Facciamo due esempi pratici. Apriamo la homepage di Google e cerchiamo per esempio il termine Mulch:
Come si può vedere bene nello screenshot in alto, l’indirizzo (URL) della pagina dei risultati contiene il termine che abbiamo cercato:
http://www.google.com/search?q=Mulch&ie=utf-8&oe=utf-8&aq=t
Questo significa che Google utilizza il metodo GET. Per il momento teniamo aperta questa scheda del browser e ne apriamo un’altra con la homepage del glossario dell’Agenzia europea dell’ambiente. Qui dobbiamo prima di tutto selezionare la lingua source che ci interessa (nel nostro esempio tedesco):
Poi proviamo anche qui a cercare la parola Mulch, che però non compare nell’URL della pagina dei risultati, anche se è stata trovata nel glossario:
Ciò significa che questo sito utilizza il metodo POST. Proprio mentre facevo le prove per questo articolo, tuttavia, mi sono accorto che quando puntavo il cursore sulla parola mulch, nell’URL di destinazione era incluso anche il termine:
Siamo stati fortunati, perché in questo caso la problematica del metodo POST è facilmente aggirabile. Selezioniamo quindi il termine mulch in modo da visualizzare la pagina dei risultati con le varie traduzioni:
Ora che abbiamo le due pagine dei risultati di Google e del glossario dell’Agenzia europea dell’ambiente aperte nel nostro browser, siamo finalmente pronti per aggiungere queste due nuove fonti di ricerca in IWS.
Facciamo il solito clic con il pulsante destro del mouse sulla “i” rossa nell’area di notifica della barra delle applicazioni e, dal menu popup che compare, selezioniamo l’opzione Impostazioni Ricerche:
Dal menu Modifica della finestra Impostazioni Ricerche selezioniamo l’opzione Aggiungi nuova ricerca:
Si apre così la finestra Nuovo con i vari campi da compilare:
Quelli che ci interessano sono evidenziati in rosso. Nel campo Inizio dobbiamo inserire la porzione di URL che precede la parola mulch, nei nostri due esempi:
- Google: http://www.google.com/search?q=
- Glossario AEA: http://glossary.de.eea.europa.eu/terminology/concept_html?term=
Nel campo Fine dobbiamo invece inserire la porzione di URL che si trova dopo la parola mulch, cioè:
- Google: &ie=utf-8&oe=utf-8&aq=t
- Glossario AEA: (questo campo rimane vuoto perché dopo il termine non c’è nulla)
Il campo Codifica serve a definire in che modo i caratteri speciali vengono inviati al motore di ricerca. Se per esempio utilizziamo IWS per cercare la parola Datenträger e vediamo che nella pagina dei risultati c’è scritto invece Datenträger, vuol dire che il carattere speciale ä non è stato interpretato correttamente dal motore. In questi casi dobbiamo quindi modificare l’opzione Codifica in modo che l’interpretazione sia corretta.
Questo per esempio è lo screenshot della finestra Nuovo con tutti i principali campi compilati per il glossario dell’Agenzia europea dell’ambiente, che possiamo così salvare e avere a disposizione ogni volta che lanciamo una ricerca multipla:
Nota importante: per il glossario dell’Agenzia europea dell’ambiente, le stringhe da inserire nei campi Inizio e Fine variano da lingua a lingua e quelle utilizzate negli esempi sopra vanno bene per cercare termini dal tedesco in tutte le altre lingue. Per effettuare una ricerca da un’altra lingua, seguite le varie operazioni illustrate sopra, partendo però dalla homepage del glossario nella lingua source che vi interessa.
Ora facciamo ancora un rapidissimo esempio con gli archivi LANGIT, così prima di fare una richiesta in lista vediamo se il termine era già stato trattato precedentemente. Ricordo che gli archivi della mailing list dei traduttori e interpreti italiani LANGIT contengono tutti i messaggi scambiati in lista dal 2005 a oggi. L’esempio che segue va bene per qualsiasi lingua.
Dopo aver fatto il login con l’indirizzo e-mail che avevamo utilizzato per iscriverci alla mailing list, facciamo clic sul link Search Archives:
Nella pagina di ricerca specifichiamo il termine da ricercare nel campo String (nel nostro esempio Auslandvernehmung) e poi lanciamo la ricerca premendo il pulsante Search per visualizzare questa pagina:
In questo caso sono stati trovati 5 risultati e l’URL della pagina ha questo aspetto:
http://list.cineca.it/cgi-bin/wa?S2=LANGIT&X=7EB7A35521F246FB5C&Y=email%40email.com&q=auslandvernehmung&s=&f=&a=&b=
Stringhe per IWS:
- Inizio: http://list.cineca.it/cgi-bin/wa?S2=LANGIT&X=7EB7A35521F246FB5C&Y=email%40email.com&q=
- Fine: &s=&f=&a=&b=
L’unica variabile in questa stringa è l’indirizzo e-mail (in grassetto nelle due stringe sopra), che varia da utente a utente. L’importante è inserire nel campo Inizio tutta la porzione di URL che si trova davanti alla parola che abbiamo cercato (che contiene anche il vostro indirizzo e-mail) e nel campo Fine tutto il resto che si trova dopo la parola. Ricordatevi che dovete prima fare il login negli archivi LANGIT, altrimenti non è possibile effettuare una ricerca.
Come abbiamo visto, la procedura di aggiunta è molto semplice se il motore utilizza il metodo GET. Con il metodo POST (fortunatamente molto più raro) è invece più complessa e richiede l’installazione di altri software. Ricordo ancora che esiste un gruppo chiamato IntelliWebSearch Users, dove potete per esempio condividere con altri colleghi le nuove fonti di ricerca e stringhe che avete trovato voi stessi.
Stefano
.
Rispondi