Schema della lezione:
- PageRank
- Google: struttura ed architettura Google
Cluster
Materiale bibliografico:
-
"The PageRank Citation Ranking: Bringing Order to the Web", di L.
Page, S. Brin, R. Motwani, T. Winograd, a
http://dbpubs.stanford.edu:8090/pub/showDoc.Fulltext?lang=en&doc=1999-66&format=pdf&compression=&name=1999-66.pdf
(par. 1 e 2 (ma solo per la definizione del funzionamento base di
PageRank, fino alla Definition 1 esclusa))
-
La definizione (corretta) di Pagerank viene presa da "Deeper
inside PageRank", di Amy N. Langville and Carl D. Meyer, ACM Internet
Mathematics, vol.1, n.3, a
http://www.internetmathematics.org/volumes/1/3/Langville.pdf
(solo paragrafi 1, 2, 3)
-
Luiz Barroso, Jeffrey Dean, and Urs Hoelzle, "Web
Search for a Planet: The Google Cluster Architecture", IEEE Micro, vol. 23 (2003), pp. 22-28.
Altri link interessanti:
- "The anatomy of a large-scale Hypertextual Web Search Engine" di Sergey
Brin e Lawrence Page a
http://www-db.stanford.edu/~backrub/google.html
- Dany Sullivan, "Search Engines Size" da Search Engine Watch (28/1/2005) a
http://searchenginewatch.com/reports/article.php/2156481 con alcuni
aggiornamenti a
http://blog.searchenginewatch.com/blog/041111-084221
- Danny Sullivan, "Nielsen NetRatings Search Engine Ratings" (24/1/2006) a
http://searchenginewatch.com/reports/article.php/2156451: i risultati piu'
recenti di maggio: Google rappresenta il 50% delle query negli US a
http://www.nielsen-netratings.com/pr/pr_060525.pdf
- First International Workshop on Adversarial Information Retrieval on the
Web (Airweb 2005) a
http://airweb.cse.lehigh.edu/2005/
- La pagina di Wikipedia su PageRank
http://en.wikipedia.org/wiki/PageRank
- Google History a
http://www.google.com/corporate/history.html
- Le ultime mosse di Google nel supercomputing a "Google's
not-so-very-secret weapon" su International Herald Tribune del 31/6/2006 di J.
Markoff e S. Hansell a
http://www.iht.com/articles/2006/06/14/technology/web.0614search.php
- HITS e PageRank sono molto simili e appartengono ad una unica categoria di
algoritmi: "PageRank, HITS and a Unified Framework for Link Analysis" di
C.Ding, X. He, P. Husbands, H.Zha, H.Simon a
http://www.siam.org/meetings/sdm03/proceedings/sdm03_24.pdf
- Lista delle pagine con un alto PageRank a
http://en.wikipedia.org/wiki/List_of_websites_with_a_high_PageRank
-
http://en.wikipedia.org/wiki/Search_engine_optimization
con molti link
- Un sito con alcune simulazioni (in Excel) ed alcune discussioni
http://www.pagerank.dk/
- Alcune tecniche di redirection in Javascript:
A
Taxonomy of JavaScript Redirection Spam
Kumar Chellapilla and Alexey Maykov, Third
Workshop on Adversarial Information Retrieval on the Web (AIRWeb)
2007.
- Dany Sullivan, "Search Engines Size" da Search Engine Watch (28/1/2005) a
http://searchenginewatch.com/reports/article.php/2156481 con alcuni
aggiornamenti a
http://blog.searchenginewatch.com/blog/041111-084221
- Danny Sullivan, "Nielsen NetRatings Search Engine Ratings" (24/1/2006) a
http://searchenginewatch.com/reports/article.php/2156451: i risultati piu'
recenti di maggio: Google rappresenta il 50% delle query negli US a
http://www.nielsen-netratings.com/pr/pr_060525.pdf
- First International Workshop on Adversarial Information Retrieval on the
Web (Airweb 2005) a
http://airweb.cse.lehigh.edu/2005/
- La lista delle pubblicazioni dei "googlers" a
http://research.google.com/pubs/papers.html
- Un sito tedesco che raccoglie alcune informazioni (compreso
recenti applicazioni sulla toolbar, calcolo manuale
http://pr.efactory.de/
Alcune domande di riepilogo:
Domande di esame (scritto):
|