The paper presents a survey of the different strategies for indexing and document retrieval. On the one hand, the Information retrieval, the probabilistic models based on the terms frequency and the models elaborated to calculate the similarity degree among the documents and the user queries, improved by Natural language processing techniques to enhance the results, such as the parsing and the syntactic phrases analysis. On the other hand, the semantic indexing, which allows to retrieve relevant documents using document content analysis. To conclude, it is pointed out that digital libraries and the DELOS model, adopted indexing strategies based on Vector space model and Information retrieval models, and have resolutely left the content analysis of books.
Nell’intervento viene presentato un esame delle diverse strategie per l’indicizzazione e il ritrovamento dei documenti. Da un lato, l‘Information retrieval e l’impiego di modelli probabilistici basati sulla frequenza dei termini nei testi, oltre ai modelli per la determinazione del grado di similarità tra documenti e richieste degli utenti, affinati con l’uso di tecniche di Natural language processing, come il parsing e l’analisi sintattica delle frasi, per migliorare i risultati. Dall’altro lato, l’indicizzazione semantica approfondita che permette il ritrovamento dei documenti rilevanti sulla base dell’analisi contenutistica dei documenti. Si mette infine in evidenza come le biblioteche digitali e il modello internazionale DELOS abbiano adottato strategie di indicizzazione basate su Vector space model e modelli di ricerca dei documenti incentrati sull’Information retrieval, ed abbiano definitivamente rifiutato l’analisi contenutistica.
Organizzazione della conoscenza, esigenze della ricerca e soluzioni informatiche / Biagetti, Maria Teresa. - STAMPA. - (2015), pp. 187-202. (Intervento presentato al convegno Noetica vs Informatica tenutosi a Roma).
Organizzazione della conoscenza, esigenze della ricerca e soluzioni informatiche.
BIAGETTI, Maria Teresa
2015
Abstract
The paper presents a survey of the different strategies for indexing and document retrieval. On the one hand, the Information retrieval, the probabilistic models based on the terms frequency and the models elaborated to calculate the similarity degree among the documents and the user queries, improved by Natural language processing techniques to enhance the results, such as the parsing and the syntactic phrases analysis. On the other hand, the semantic indexing, which allows to retrieve relevant documents using document content analysis. To conclude, it is pointed out that digital libraries and the DELOS model, adopted indexing strategies based on Vector space model and Information retrieval models, and have resolutely left the content analysis of books.File | Dimensione | Formato | |
---|---|---|---|
Biagetti_Organizzazione_2015.pdf
solo gestori archivio
Tipologia:
Versione editoriale (versione pubblicata con il layout dell'editore)
Licenza:
Tutti i diritti riservati (All rights reserved)
Dimensione
1.03 MB
Formato
Adobe PDF
|
1.03 MB | Adobe PDF | Contatta l'autore |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.