The paper presents a survey of the different strategies for indexing and document retrieval. On the one hand, the Information retrieval, the probabilistic models based on the terms frequency and the models elaborated to calculate the similarity degree among the documents and the user queries, improved by Natural language processing techniques to enhance the results, such as the parsing and the syntactic phrases analysis. On the other hand, the semantic indexing, which allows to retrieve relevant documents using document content analysis. To conclude, it is pointed out that digital libraries and the DELOS model, adopted indexing strategies based on Vector space model and Information retrieval models, and have resolutely left the content analysis of books.

Nell’intervento viene presentato un esame delle diverse strategie per l’indicizzazione e il ritrovamento dei documenti. Da un lato, l‘Information retrieval e l’impiego di modelli probabilistici basati sulla frequenza dei termini nei testi, oltre ai modelli per la determinazione del grado di similarità tra documenti e richieste degli utenti, affinati con l’uso di tecniche di Natural language processing, come il parsing e l’analisi sintattica delle frasi, per migliorare i risultati. Dall’altro lato, l’indicizzazione semantica approfondita che permette il ritrovamento dei documenti rilevanti sulla base dell’analisi contenutistica dei documenti. Si mette infine in evidenza come le biblioteche digitali e il modello internazionale DELOS abbiano adottato strategie di indicizzazione basate su Vector space model e modelli di ricerca dei documenti incentrati sull’Information retrieval, ed abbiano definitivamente rifiutato l’analisi contenutistica.

Organizzazione della conoscenza, esigenze della ricerca e soluzioni informatiche / Biagetti, Maria Teresa. - STAMPA. - (2015), pp. 187-202. (Intervento presentato al convegno Noetica vs Informatica tenutosi a Roma).

Organizzazione della conoscenza, esigenze della ricerca e soluzioni informatiche.

BIAGETTI, Maria Teresa
2015

Abstract

The paper presents a survey of the different strategies for indexing and document retrieval. On the one hand, the Information retrieval, the probabilistic models based on the terms frequency and the models elaborated to calculate the similarity degree among the documents and the user queries, improved by Natural language processing techniques to enhance the results, such as the parsing and the syntactic phrases analysis. On the other hand, the semantic indexing, which allows to retrieve relevant documents using document content analysis. To conclude, it is pointed out that digital libraries and the DELOS model, adopted indexing strategies based on Vector space model and Information retrieval models, and have resolutely left the content analysis of books.
2015
Noetica vs Informatica
Nell’intervento viene presentato un esame delle diverse strategie per l’indicizzazione e il ritrovamento dei documenti. Da un lato, l‘Information retrieval e l’impiego di modelli probabilistici basati sulla frequenza dei termini nei testi, oltre ai modelli per la determinazione del grado di similarità tra documenti e richieste degli utenti, affinati con l’uso di tecniche di Natural language processing, come il parsing e l’analisi sintattica delle frasi, per migliorare i risultati. Dall’altro lato, l’indicizzazione semantica approfondita che permette il ritrovamento dei documenti rilevanti sulla base dell’analisi contenutistica dei documenti. Si mette infine in evidenza come le biblioteche digitali e il modello internazionale DELOS abbiano adottato strategie di indicizzazione basate su Vector space model e modelli di ricerca dei documenti incentrati sull’Information retrieval, ed abbiano definitivamente rifiutato l’analisi contenutistica.
Information science, knowledge organization, information retrieval.
04 Pubblicazione in atti di convegno::04b Atto di convegno in volume
Organizzazione della conoscenza, esigenze della ricerca e soluzioni informatiche / Biagetti, Maria Teresa. - STAMPA. - (2015), pp. 187-202. (Intervento presentato al convegno Noetica vs Informatica tenutosi a Roma).
File allegati a questo prodotto
File Dimensione Formato  
Biagetti_Organizzazione_2015.pdf

solo gestori archivio

Tipologia: Versione editoriale (versione pubblicata con il layout dell'editore)
Licenza: Tutti i diritti riservati (All rights reserved)
Dimensione 1.03 MB
Formato Adobe PDF
1.03 MB Adobe PDF   Contatta l'autore

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11573/604804
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact