ESB Forum
ISSN: 2283-303X |
||
3.1 Prima del "come" ... quanto?Un elemento altamente opinabile resta sempre quello relativo alla quantità
di informazioni realmente indicizzate e disponibili. Come si vede dagli
esempi elencati, le unità di misura sono piuttosto difformi anche
se forse, al di là della terminologia usata, si tende ad indicare
cose analoghe: "documents" e "pages", URL, siti e "resources"
e così via. Webcrawler -------------> 145.166 servers WWWW Worm --------> 3 milioni di URL Open Text ---------------> 10 miliardi di parole LYCOS -------------------> 91% dei siti WEB Excite ---------------------> 11,5 milioni di pagine Altavista -----------------> 30 milioni di pagine Inktomi ------------------> documents Harvest ------------------> objects / pages NetFirst -----------------> resources Sia nell'uno che nell'altro caso, molti non dichiarano niente e forse é meglio. Alcuni motori propongono ricerche sulle proprie selezioni attraverso delle raccolte di"reviews" (recensioni). Gli autori del motore Excite a tale riguardo sono molti chiari dichiarando di indicizzare effettivamente l'intero contenuto delle pagine WEB; a differenza di altri, inoltre, non calcolano tra le pagine indicizzate i vari "legami" ad altre pagine. E, a proposito di chi si comporta diversamente, dichiarano:
Excite
|
| © ESB Forum | a cura di Riccardo Ridi | |