Un suggerimento per il Suggeritore (A suggestion for the Suggester)

 

Alfredo Tifi

ITIS Divini, map.dschola.it

Email tifialf@tin.it

 

Abstract

In questa recensione prenderemo in esame alcuni aspetti del Suggeritore, uno strumento che entrerà in uso in Cmaptools, e proporremo una possibile modalità per migliorarne l’efficienza: la presenza di un nodo specializzato, o “focus node”, per la domanda focale, che sia riconosciuto dal suggeritore.

 

Introduzione

Il suggeritore (suggester) è una delle nuove e interessanti funzioni di CmapTools, implementata nella versione beta 4.0. Alberto Cañas [1] ha presentato quest’applicazione il 17 settembre 2004 al CMC di Pamplona.

Mentre l’utente costruisce la sua mappa con cmaptools, il suggeritore effettua una ricerca in background di termini potenzialmente rilevanti per tale mappa, utilizzando il motore di Google. I termini sono proposti in un elenco verticale, ordinato in corrispondenza alla gerarchia della mappa, e continuamente aggiornato man mano che si aggiungono nuovi nodi e si modifica la struttura della mappa.

 

Impatto metodologico

L’utilità nello studio, di questo promettente strumento, potrà essere pienamente riconosciuta solo attraverso la sperimentazione e l’osservazione del suo utilizzo da parte degli studenti.

È certa invece la sua utilità per il lavoro di preparazione e programmazione dell’insegnante, poiché il suggeritore facilita l’introduzione di conoscenze condivise all’interno di una rete di conoscenze specialistiche e accademiche, tendenti alla staticità. L’interesse per un dato argomento di studio può dipendere in modo critico dalla presenza di aspetti rilevanti e aggiornati del mondo reale, che non necessariamente sono posseduti da una rete di concetti legati da criteri esclusivamente logici, scientifici ed epistemologici. L’introduzione di tali aspetti “non conservativi”, d’altra parte, non altera lo scheletro base della mappa e i criteri scientifici con cui essa viene costruita, fin dall’inizio, dall’esperto.

Questo processo è ben diverso dalla generazione di una mappa mentale, con legami associativi riferibili all’idea centrale, come nel brainstorming e nel metodo Sewcom (è interessante in ogni modo considerare come il suggeritore potrebbe essere efficace anche in questo caso).

Il punto di vista può anche essere ribaltato: invece di vedere il suggeritore come uno strumento per estrarre dal Web concetti utili alla costruzione di mappe concettuali, l’insieme CmapTools + suggeritore + Mappa concettuale può essere considerato un supporto per organizzare ricerche di informazioni complesse nel Web in modo sistematico e capillare.

 

Descrizione – funzionamento (traduzione da 1)

Il processo utilizzato dal Suggester per preparare la lista di concetti suggeriti è costituito dalle seguenti fasi:

 

a)       Analisi della mappa parzialmente costruita per preparare un’interrogazione (query) mirata per la ricerca nel web;

b)       Riportare documenti rilevanti dal Web;

c)       Estrarre i concetti rilevanti dalle pagine Web selezionate;

d)       Presentare i concetti all’utente.

 

1. Analisi della mappa parzialmente costruita

Questa fase consiste nell’estrarre dalla mappa concettuale un insieme limitato di parole che rappresentano il contesto della mappa, da usare come query per il motore che effettua la meta-ricerca.

 

Nella ricerca tradizionale delle informazioni, si analizza la frequenza come criterio per individuare le parole da estrarre da un testo. La natura concisa della mappa distorcerebbe la frequenza di ripetizione delle parole, inoltre, poiché in una buona mappa i concetti non sono ripetuti, tutti i termini avrebbero in pratica la stessa frequenza.

 

Il nostro approccio consiste nell’effettuare un’analisi grafica della mappa parziale per identificare i concetti chiave, che giocano un ruolo importante nel contesto. In particolare cerchiamo di identificare i concetti[2] che si riferiscono alla domanda focale (focus question), caratterizzante l’argomento (topic) della mappa[3], e i concetti che sono nodi “autorevoli” (authority nodes).

 

Idealmente un concetto dovrebbe consistere di una sola parola, o di un piccolo gruppo di parole. In pratica durante il processo di costruzione di una mappa è usuale trovare concetti consistenti di una maggior numero di parole, o anche piccole frasi. Per ciascun nodo cerchiamo di identificare i termini più rilevanti, rimuovendo gli elementi grammaticali e di connessione (articoli, ausiliari ecc) o stop words. Se ne risultano ancora tre o più parole, o se rimane un nodo vuoto, esso sarà escluso dal rimanente processo.

 

Ad ogni fase dello sviluppo, il concetto di partenza (root node) costituisce solitamente una buona rappresentazione dell’argomento complessivo della mappa, o domanda focale. Il nodo di partenza è acquisito come nodo importante, e la sua etichetta è inclusa come parte della query, almeno finché essa consista di meno di tre parole una volta eliminate tutte le stop words.

 

I nodi influenti sono quelli con il più elevato numero di collegamenti (link) in uscita verso altri nodi. Assumendo che tali relazioni indichino l’ulteriore elaborazione di questi concetti, otteniamo un indicazione della loro rilevanza nel contesto della mappa. L’algoritmo seleziona, tra tutti i concetti non esclusi, quelli aventi il maggior numero di legami in uscita. A parità di numero di link in uscita si includono tutte le etichette nella query.

 

Il processo consiste dunque nella scansione della mappa concettuale allo scopo di localizzare il concetto radice e i nodi centrali. Il numero complessivo di concetti recuperati dipende dalle dimensioni della mappa. Grandi mappe potrebbero contenere molti nodi autorevoli, che potrebbero sfociare in un maggior numero di concetti chiave suggeriti. Date la restrizione ai concetti aventi meno di tre parole, il processo potrebbe portare a una lista di richiesta vuota per tutti i nodi, nel qual caso il suggeritore non produrrebbe nessun suggerimento. La query è costruita dai concetti risultanti senza un ordine particolare.

 

2. Recupero dei documenti rilevanti

Utilizziamo la query assemblata con i concetti chiave del passaggio precedente, per recuperare e ordinare le pagine Web e costruire la nostra raccolta di documenti, da cui estrarre i concetti.

 

Abbiamo sviluppato un meccanismo per meta-ricerca che si basa principalmente su Google (Brin & Lawrence, 1998[4]), allo scopo di recuperare un insieme iniziale di documenti dall’Internet pubblico. Il meccanismo in oggetto restituisce un piccolo insieme di 10-20 indirizzi, a seconda della query.

 

Avendo i documenti recuperati, analizzati, filtrati dagli stop terms, ordinati in un indice, procediamo alla prossima fase, l’effettiva estrazione dei concetti rilevanti.

 

3. Estrazione dei concetti rilevanti

Il nostro attuale approccio per estrarre i concetti rilevanti è semplice: si cercano, in tutti i documenti recuperati dal Web, tutti i termini non scartati della mappa. Ogni volta che un concetto è riscontrato in una mappa, tutte le parole vicine (escluse le stop word) sono salvate in una tabella temporanea. Una parola si considera vicina se nel testo fa parte della stessa frase e se si trova entro una certa distanza massima, attualmente fissata in tre parole, dal concetto. Tutte le parole vicine hanno un peso equivalente nell’attuale implementazione, e sono candidate potenziali al ruolo di suggerimento.

 

Il risultato della ricerca di tutti i concetti della mappa in tutti i documenti del web consiste in un’ampia collezione di termini che nei vari testi confinano con i concetti della mappa. Questa lista è poi etichettata come parte-del-discorso (tagged as part-of-speech (POS); tagged si usa tradurre con “taggata”) e ordinata in base alla frequenza. La lista di concetti suggeriti consiste in definitiva di 15 etichette ed è composta dai primi 5 nomi nella lista ordinata, seguiti dai cinque verbi e dai 5 termini che seguono nella graduatoria. Il suggeritore adatta automaticamente questa suddivisione in proporzione delle dimensioni del sottoinsieme di termini da mostrare all’utente.

 

 

 

 

Discussione

 

Lo strumento è stato sottoposto a sperimentazione per accertare quanto i concetti suggeriti fossero effettivamente rilevanti per i soggetti che costruivano mappe concettuali su un dato argomento. Per concetto rilevante si intendeva un concetto o variazione di esso che potesse essere aggiunto alla mappa, che potesse andare a sostituire un concetto già presente allo scopo di migliorare la portata della mappa, oppure un termine che stimolasse la ricerca di informazioni utili per estendere o migliorare la mappa. I risultati ottenuti indicano che lo strumento è efficace. Comunque gli autori rilevano che, al crescere delle dimensioni della mappa, l’algoritmo diviene meno efficace nel trovare termini rilevanti. L’algoritmo stesso cerca di determinare “di cosa tratta la mappa”. Finché la mappa concettuale è di ridotte dimensioni, è relativamente semplice selezionare i concetti chiave. Man mano che la mappa cresce i concetti chiave divengono via via più dispersi in essa, rendendo sempre più difficile per l’algoritmo la determinazione del focus della mappa. Inoltre, con l’aumentare delle dimensioni, l’utente tende a lavorare su un segmento di mappa alla volta. Conseguentemente, affinché i concetti suggeriti siano credibilmente rilevanti, essi dovrebbero essere selezionati a partire dal contesto di quella data porzione di mappa, e non basandosi sull’intera mappa.

Perciò gli autori1 propongono che l’algoritmo sia adattato per tenere conto della dinamica della costruzione della mappa.

 

Sperimentazione

 

Abbiamo sperimentato il suggeritore con una celebre mappa campione su “perché ci sono le stagioni”, di Joseph Novak. L’applicazione è stata ripetuta su un’analoga mappa concettuale che inserisce i concetti necessari a spiegare le differenze stagionali all’interno di un contesto più ampio, avente come concetto radice i moti di rotazione della Terra. In entrambi i casi abbiamo valutato l’azione del suggeritore dopo l’introduzione dei primi cinque concetti e a mappa ultimata, considerando uno sviluppo dall’alto verso il basso. Per le caratteristiche del web, l’efficacia del suggeritore è notevolmente inferiore se questo si basa sui termini in italiano, perciò abbiamo lasciato la lingua originaria, in inglese.

 

1. Il suggeritore entra in azione automaticamente non appena si inizia a costruire una mappa nuova o a modificare una mappa preesistente. Il suo lavoro “silente” è evidenziato solo dalla piccola icona a forma di fumetto con punti rossi sul bordo destro della finestra della mappa. Cliccando su tale icona si apre la lista dei suggerimenti. Ovviamente la funzione richiede la connessione ad internet.

 


Fig. 1. Primi 5 concetti (di 11) della mappa di Novak, rispondente alla domanda focale “perché ci sono le stagioni” e lista dei concetti estratti dal web e proposti dal suggeritore.

 

Tra i 15 termini proposti abbiamo quelli di solstizio, equinozio, asse (di rotazione), emisfero (boreale/australe), inclinazione e orbita, tutti certamente rilevanti, e anche altri da scartare. Se abbiamo un suggerimento che non siamo in grado di valutare, basta cliccare su di esso e si apre immediatamente la finestra di ricerca di Google, che consente di accertare la pertinenza del concetto proposto. In questo caso cliccando su solstice (solstizio) si apre la finestra seguente:

 

 

Fig. 2 Pagine scelte dal suggeritore nel web, in base alla presenza di termini autorevoli della mappa adiacenti ai termini solstice e seasons. È sufficiente cliccare sul termine solstice (solstizio) per avere tale videata.

 

La parola “Seasons” è associata nella ricerca su Google a tutte le parole della mappa, poiché il concetto di stagione è stato riconosciuto dal suggeritore come concetto radice in base alla struttura geometrica della mappa.

Va notato che la ricerca del suggeritore nel web non utilizza risorse del computer dell’utente, ma impegna un server di rete dedicato allo scopo. Il browser dell’utente si attiva solo per visualizzare le ricerche quando lo si desidera. È evidente che tali ricerche aprono all’utente una grande ricchezza di opportunità di approfondimento critico, relativamente alla questione focale cui si sta dedicando, ma anche una serie di idee fortuite (effetto serendipity) che può essere interessante approfondire, ma che non erano state, né erano preventivabili.

 

2. La lista dei suggerimenti si modifica ad ogni cambiamento della mappa. Per esempio il suggerimento 2020 (Fig. 3) è stato introdotto con l’aggiunta della frase legame “Slightly Further in June to” (“leggermente più lontano, in Giugno, dal”), tra i due concetti preesistenti “Position in Orbit” (posizione nell’orbita) e “Sun” (Sole), dimostrando che il meccanismo di ricerca si basa anche sul contenuto delle parole legame. Ci si potrebbe chiedere che cosa potrebbe mai accadere alle stagioni nel 2020; per soddisfare questa curiosità, basta cliccare sull’etichetta 2020 e si troverà un sito della marina americana che contiene tutte le date e gli orari esatti di tutti gli equinozi e dei solstizi, passati, e futuri fino al 2020. Tra le altre cose si nota che le date dell’afelio sono successive di una quindicina di giorni a quelle del solstizio d’estate, pertanto il momento in cui la Terra passa a maggior distanza dal Sole cade ai primi di Luglio.

 

 

Fig. 3 La mappa originaria di Novak è stata ultimata (comprendendo anche alcuni dei suggerimenti apparsi durante la sua elaborazione). La lista attuale dei suggerimenti consentirebbe di controllare alcune proposizioni della mappa o di ampliarla ulteriormente associando ad essa altri concetti rilevanti e risorse.

 

 

Fig. 4 Pagina della marina militare rintracciata dalla voce 2020 della lista dei suggerimenti, contenente informazioni accurate sulle date di inizio e fine stagione.

 Costruzione di mappe con il focus inserito in un appropriato contesto

 

Le seguenti mappe (fig. 5) evidenziano un approccio alternativo che, nel rispondere alla stessa domanda focale (perché ci sono le stagioni), e utilizzando gli stessi concetti della mappa precedente,

a)      rispetta maggiormente il criterio di inclusività

b)      inserisce il focus all’interno di una cornice costituita da concetti più sovraordinati di quello dominante nella domanda focale (stagioni).

I concetti sovraordinati in questione non si estendono a tutto il dominio astronomico (moto orbitale terrestre), scelto per contestualizzare la mappa e rispondere alla domanda focale, ma costituiscono sempicemente il sub-dominio più vicino al problema da affrontare. Per agevolare la comparazione le due mappe sono presentate affiancate.

 

 

Fig. 5 Mappe rispondenti alla stessa domanda focale sulla natura delle stagioni. Quella di sinistra (Novak 1995) è centrata sul concetto radice, quella di destra (A. Tifi, 2004) si inserisce nel contesto.

 

Il confronto evidenzia che, mentre la mappa a sinistra ha alla radice il concetto di stagioni, la mappa di destra possiede come concetto radice i “Moti rotazionali terrestri”: quello di rivoluzione che segna il succedersi delle stagioni, e quello di rotazione su se stessa, che determina lo spostamento parallelo dell’asse polare e l’esposizione al Sole. I due moti terrestri determinano le stagioni e sono, pertanto, concetti più inclusivi di quelli utilizzati per descrivere le differenti insolazioni e caratteristiche stagionali (in giallo). La presenza di una cornice strutturata e di un numero di concetti conseguentemente maggiore, rende la mappa di destra leggermente più complessa, se la comparazione si effettua sull’insieme. Ma se ci si limita a osservare il gruppo di concetti in giallo, utilizzati per rispondere alla domanda focale, si nota una rete di relazioni più semplice e lineare nel caso della mappa basata sul contesto. È interessante notare come, in questo caso particolare, l’etichetta della domanda focale, il concetto di stagione, non è inclusa nella mappa che spiega perché ci sono le stagioni!

La filosofia che ci sembra di seguire è che nessuna cosa può essere spiegata solo per se stessa, come non si può risolvere alcun problema non banale rimanendo ancorati al punto di vista del problema. Perciò siamo tutti costretti ad allargare la visuale: lo ha fatto Novak nell’inserire i concetti di inclinazione dell’asse polare e di posizione nell’orbita, lo abbiamo fatto noi nell’aggiungere il non allineamento tra i due assi di rotazione e rivoluzione e anche un principio fisico che garantisce lo spostamento parallelo di tali assi di rotazione. La differenza consiste nell’intenzionalità con cui si prepara la struttura di sostegno per i concetti, che poi entrano in gioco nel rispondere alla domanda focale, distinguendo i due momenti. Il criterio della contestualizzazione si può conciliare con quello di ridurre al massimo la complessità e il livello di astrazione, che ha guidato la mappa di Novak.

Il criterio di collocare il concetto dominante del focus nella posizione di partenza della mappa, genera invece delle forzature nella costruzione delle relazioni. Per esempio, nella proposizione “la quantità di luce solare è determinata dall’altezza del sole sull’orizzonte” il concetto sovraordinato (causale) di “Altezza del Sole” viene a trovarsi in posizione subordinata, gerarchicamente e geometricamente, alla propria conseguenza. Parallelamente, allo stesso livello, abbiamo la proposizione che la “Quantità di luce solare” –causa--> “Variazioni di temperatura” dove sussiste un corretto rapporto di inclusività (causale) tra i due. Il risultato è che le differenze di temperatura (effetto) vengono a trovarsi sullo stesso livello della “altezza del Sole sull’orizzonte”, che è la causa efficiente comune.

La mappa di Novak fa ricorso anche più avanti alla “inclusività inversa” (“A (sopra) è determinato da B (sotto)”), nel giustificare la collocazione dei concetti, sovraordinati, di “posizione lungo l’orbita” e “inclinazione di 23,5 ° dell’asse”, inferiormente ai concetti subordinati di “lunghezza del giorno” e di “altezza del Sole sull’orizzonte”. Infine, il concetto di Sole nella mappa di Novak si trova nel punto più basso, anziché spiccare tra le prime posizioni in alto.

 

Suggerimenti per l’utilizzo della domanda focale, con le mappe basate sul contesto e col suggeritore

È interessante confrontare i diversi “comportamenti” del suggeritore durante la costruzione progressiva delle due mappe sulle stagioni. Si presentano quindi, anche per la mappa basata sul contesto, i suggerimenti ottenuti dopo l’inserimento dei primi 5 concetti, a partire dalla radice, poco prima della conclusione e alla fine. La mappa è nuovamente costruita in inglese per sfruttare al massimo le potenzialità del suggeritore e del web.

 

 

 

 

polo

periodo

pianeta

si muove

ciclo

crea

si trova

rispetta o osserva

unisce

radiante

ruota

attività

quattrino ???

dondolio (nutazione)

 

Fig. 6 Termini suggeriti durante la fase iniziale della costruzione della mappa basata sul contesto e loro traduzione.

 

Come era probabile aspettarsi, gli unici tre concetti significativi si riferiscono al contesto astronomico dei moti orbitali terrestri (periodo, ciclo e nutazione) e non al problema delle stagioni.

Vediamo che la situazione non migliora sensibilmente introducendo i concetti sulle stagioni.

 

 

polo

attività

periodo

superficie

equatore

si muove

si trova

Venere?

implica

unisce

monetina (?)

pianeta

ruota

dondolio (nutazione)

 

Fig 7. Mappa basata sul contesto, una volta inserito il contesto e i principali concetti relativi alla domanda focale. Il suggeritore fornisce ben pochi concetti utili a rispondere alla domanda focale.

 

Il suggeritore ha aggiunto solo i concetti significativi di “superficie” (surface), che potrebbe essere rilevante se intesa come illuminata, e di equatore (equator), che potrebbero essere implicati in un’estensione della mappa. I concetti di “pianeta”, “ciclo” e “radiante” sono invece scesi nella graduatoria e scomparsi dall’elenco dei quindici. Ultimando la mappa con i concetti accessori la situazione non può migliorare (fig. 8). Riappare solo il concetto di “observe”, al posto di “venu”.

 

Per ottenere che:

 

  1. Anche costruendo mappe concettuali nella modalità basata sul contesto, l’utente possa trarre vantaggio dal suggeritore;
  2. L’esplicitazione della domanda focale acquisti maggiore rilevanza per lo studente;
  3. Il suggeritore sia facilitato nell’individuazione della/delle diverse domande focali che si succedono e dei concetti “autorevoli” che si disperdono in mappe molto grandi.

 

proponiamo che in cmaptools ci sia la possibilità di inserire, in un apposito nodo a comparsa/scomparsa dal menu, una domanda focale in formato testuale, tale che il suggester ricavi automaticamente da tale testo i termini per costruire la query di ricerca su Google.  In presenza di una specificazione all’interno di tale “nodo specializzato”, o “focus node”il concetto radice sarebbe considerato allo stesso livello degli altri concetti “autorevoli”, cioè contenenti parecchi link in uscita.

Anche il criterio della frequenza potrebbe essere usato perché i concetti usati nella domanda focale normalmente si ripeterebbero. La domanda focale stessa potrebbe essere una “mini-mappa” fatta con alcuni “focus node”.

 

Altri suggerimenti minori, che non siano già stati fatti dagli stessi Autori, sono, a) di consentire al suggester l’identificazione dei termini col trattino come singoli concetti della mappa (es: “momento-angolare”), per evitare l’eventuale esclusione dalla lista di ricerca; b) dare la possibilità all’utente di copiare la lista e, c) scegliere di visualizzare più o meno di 15 suggerimenti.

 

 

Fig. 8. Mappa basata sul contesto. Anche una volta completata, i suggerimenti non sono pertinenti alla domanda focale

 

 

 



[1] A.J. Cañas, M. Carvalho, M. Arguedas; Mining the web to suggest concepts during concept map construction; Proceedings of the First International Conference on Concept Mapping. Pamplona: Universidad Pùblica de Navarra.

[2] Ho accertato che la ricerca agisce sia sui nodi dei concetti, sia sui termini delle frasi legame (NdT)

[3] Il suggerimento proposto più avanti riguarda le situazioni in cui la domanda focale della mappa non corrisponde con il concetto radice.

[4] Brin, S., & Lawrence, P. (1998). The Anatomy of a Large-Scel Hypertextual Web Search. Paper presented at the 7th WWW Conference.