Articoli

Raggruppamento di un social network medievale da SOM utilizzando una misura della distanza basata sul kernel

Raggruppamento di un social network medievale da SOM utilizzando una misura della distanza basata sul kernel


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Raggruppamento di un social network medievale da SOM utilizzando una misura della distanza basata sul kernel

Di Nathalie Villa e Romain Boulet

Atti di ESANN 2007 (Bruges, 2007)

Introduzione: I social network sono stati studiati intensamente attraverso i grafici negli ultimi anni: esempi di tali studi sono forniti per il World Wide Web, le reti scientifiche o le reti P2P. La maggior parte di questi grafici proviene dai moderni social network, mentre qui ci proponiamo di analizzare l'organizzazione sociale di una comunità contadina medievale prima della Guerra dei Cent'anni. Questo social network è stato costruito da un corpus di contratti agrari.

Un primo studio indaga questo problema utilizzando le proprietà algebriche di un grafo non pesato. Proponiamo qui un nuovo approccio, utilizzando un metodo neuronale automatico e più precisamente un adattamento della Kohonen Self Organizing Map (SOM) su dati descritti da una matrice di dissomiglianza. L'algoritmo SOM, introdotto per la prima volta da Kohonen, è un metodo non supervisionato che consente sia il clustering che la visualizzazione. I dati originali, che di solito vivono in uno spazio ad alta dimensione, sono proiettati in modo non lineare in uno spazio a bassa dimensione (generalmente, la dimensione di proiezione è impostata su 1 o 2) chiamata mappa; sono suddivisi in diversi cluster preservando la loro topologia iniziale. Questo algoritmo è stato recentemente adattato a dati non vettoriali; ci concentriamo qui sull'adattamento proposto in; una variante di questa Dissimilarity SOM (o mediana SOM) è stata introdotta e utilizzata per il Web Usage Mining in e viene quindi descritta una versione più veloce. L'algoritmo che proponiamo è quello descritto in ma stiamo usando una distanza definita su un grafico dal kernel di diffusione.

Il documento è organizzato come segue. Nella sezione 2, richiamiamo l'algoritmo Dissimilarity SOM (sezione 2.1) e descriviamo come le distanze basate su un kernel possono essere utilizzate per produrre un algoritmo di classificazione non supervisionato per grafi pesati (sezione 2.2). Nella sezione 3, ci concentriamo sul set di dati medievali: dopo averlo descritto (sezione 3.1), spieghiamo come applichiamo il nostro metodo in modo efficiente e come costruiamo una classificazione finale (sezione 3.2). Infine, nella sezione 3.3, confrontiamo questa classificazione con la conoscenza precedente algebrica o storica: alcune somiglianze dimostrano che i risultati sono coerenti con il lavoro precedente.

Il grafico su cui abbiamo testato il nostro approccio è stato ottenuto da un database di circa 10 000 contratti agrari di quattro signorie del Lot e del Tarn-et-Garonne (sud-ovest della Francia). Questi contratti furono stipulati tra il 1240 e il 1520. Gli storici si occupano principalmente dell'analisi della socialità dei paesi durante il Medioevo, ma la base di dati è troppo grande per uno studio esaustivo, quindi sono necessari strumenti di data mining.

Qui ci concentriamo su una parte di questo database, con sede presso la signoria di Castelnau-Montratier (Lot) tra il 1240 e il 1350 (prima della Guerra dei Cent'anni). Sulla base di questa base di dati, abbiamo costruito un grafo ponderato con 226 vertici (i contadini) che sono collegati tra loro se compaiono nello stesso contratto. I pesi erano semplicemente il numero di contratti comuni in cui due contadini apparivano insieme. Abbiamo ripulito il grafico cancellando le nobiltà perché erano citate in quasi tutti i contratti (come autorità legali).


Guarda il video: Geografia - Lezione 33 Da un grafico alla tabella di dati: un esercizio guidato (Potrebbe 2022).