Data iniziale del documento



[0035] In un’applicazione in linea con i principi dell’invenzione la data iniziale di un documento può essere usata per generare (o modificare) il punteggio associato al documento stesso. Il termine “data” è usato in modo generico e può quindi includere sia misurazioni di date che di tempo. Come descritto più avanti ci sono diverse tecniche per calcolare la data iniziale di un documento. Alcune di queste tecniche sono “parziali”, nel senso che possono essere influenzate da terze parti allo scopo di migliorare il punteggio associato al documento, altre no. Ciascuna di queste tecniche, o combinazione di esse, o altre tecniche ancora, possono essere utilizzate per determinare la data iniziale di un documento.

[0036] In una implementazione la data iniziale di un documento può essere determinata dalla data in cui il motore di ricerca apprende dell’esistenza del documento oppure lo indicizza. Il motore può apprendere dell’esistenza del documento attraverso l’esplorazione (passaggio degli spider), la segnalazione del documento (o comunque un suo riassunto o sommario) al motore da una fonte esterna, una combinazione di esplorazione o tecniche di indicizzazione basate sulla segnalazione o in altri modi. In alternativa la data iniziale di un documento può essere determinata dalla data in cui il motore di ricerca trova per la prima volta un link che punta al documento.

[0037] In un’altra implementazione, la data nella quale è stato registrato il dominio che ospita il documento può essere usata come indicazione della data iniziale del documento. In un’ulteriore implementazione la prima volta che un documento è referenziato in un altro, per esempio in un articolo di news, newsgroup, mailing list, oppure una combinazione di due o più di questi documenti possono essere usate come indicazione della data iniziale del documento. In un’altra implementazione la data in cui il documento include almeno un determinato numero di pagine può essere usata come indicazione della data iniziale del documento. In un’ulteriore implementazione la data iniziale di un documento può essere quella del “time-stamp” associato al documento sul server che lo ospita. Altre tecniche non specificatamente menzionate in questa sede, o combinazioni di esse possono essere usate per determinare la data iniziale del documento.

[0038] Il motore di ricerca può usare la data iniziale del documento per assegnare un punteggio al documento stesso. Per esempio si può assumere che un documento con una data iniziale abbastanza recente non riceva un numero significante di link da altri documenti (backlink). Per le attuali tecniche di assegnazione di punteggi basate sui link che puntano ai documenti questo documento recente può avere un punteggio più basso di un documento più vecchio a cui puntano molti più link. Quando le date iniziali dei documenti sono considerate, d’altro canto, i punteggi dei documenti possono essere modificati (sia positivamente che negativamente) basandosi su tali date.

[0039] Consideramo per esempio un documento con la data iniziale di ieri che è referenziato da 10 backlink. Questo documento può ricevere dal motore di ricerca un punteggio maggiore di un un documento con una data iniziale di 10 anni prima e referenziato da 100 backlink perché il ritmo di crescita dei backlink del primo è relativamente più alto di quella dell’ultimo. Un’alto ritmo di crescita del numero dei backlink può essere un fattore usato dal motore di ricerca per assegnare un punteggio ad un documento ma può anche segnalare un tentativo di effettuare spam verso il motore. In accordo con questa situazione il motore può infatti abbassare il punteggio di un documento per redurre l’effetto del tentativo di effettuare spam.

[0040] Pertanto in un’applicazione in linea con i principi dell’invenzione il motore di ricerca può usare la data iniziale di un documento per determinare il ritmo al quale i vengono creati link che puntano al documento (per esempio una media per unità di tempo basata sul numero di link creati a partire dalla data iniziale fino al momento presente o in una finestra di tempo interna a tale periodo). Questo ritmo può essere usato per assegnare più peso ai documenti verso i quali i link vengono generati più spesso.

[0041] In un’implementazione il motore di ricerca può modificare il punteggio basato sui link di un documento come segue:

H=L/log(F+2)

[0042] Dove la H si riferisce al punteggio modificato basato sui link, L è un punteggio basato sui link che può essere calcolato utilizzando qualsiasi tecnica di calcolo già conosciuta (per esempio quella descritta nel brevetto U.S. Pat. No. 6,285,999) (il pagerank N.D.T.) che assegna un punteggio al documento basandosi sui link entranti/uscenti e F può riferirsi all’intervallo di tempo calcolato a partire dalla data iniziale fino al momento presente (o in una finestra di tempo interna a tale periodo).

[0043] Per alcune ricerche, i documenti più vecchi possono essere più favoriti di quelli nuovi. Per questo può essere benefico aggiustare il punteggio di un documento basandosi sulla differenza (in età) dall’età media dei documenti restituiti dalla ricerca. In altre parole il motore di ricerca può calcolare l’età di ciascuno dei risultati restituiti da una ricerca (per esempio usando la loro data iniziale), determinare l’età media di tali documenti e modificare i punteggi dei documenti (positivamente o negativamente) basandosi sulla differenza fra l’età del documento e l’età media.

A cura di :
Stefano Becheroni di Posizionamento Web
Francesco Iamurri di Motori e Ricerca

“Tutti i testi e i contenuti originali del documento sono di proprietà dei rispettivi autori. Il presente documento è pubblicato secondo la licenza di utilizzo di Creative Commons , qui riassunta , per facilitarne la diffusione. Stefano Becheroni e Francesco Iamurri non si assumono alcuna responsabilità nel caso di eventuali errori contenuti negli articoli o di errori in cui si fosse incorso nella loro riproduzione sul sito.”

Versione 1.02

Annunci sponsorizzati:
Condividi su Facebook Condividi su Twitter!
Pinterest