3 L’ACCESSO AL WEB

3 L’ACCESSO AL WEB

Il World Wide Web

Il WWW è una rete mondiale che utilizza i server e i client collegati in Internet per consentire la condivisione di ipertesti.


Un ipertesto è un documento di testo che contiene dei collegamenti ipertestuali (link). Un link è una parola, una frase, un’immagine ecc. che, se cliccata, rimanda ad altri documenti, ipertesti, immagini, audio, video ecc. (▶ unità 8).

Una pagina  web è un ipertesto ricco di contenuti, perché può includere anche immagini o altri elementi multimediali.

Un sito web è un insieme di pagine web residenti su un computer (server), al quale altri computer (client) possono collegarsi attraverso un software, chiamato browser. Il browser fa una richiesta al software presente sul server (server web) utilizzando l’URL della risorsa cui vuole accedere.


Ogni risorsa (documento, immagine, video, pagina web) viene identificata da un indirizzo Internet univoco detto URL ( Uniform Resource Locator), formato da:

  • nome del protocollo;
  • due punti e doppia  barra;
  • indirizzo simbolico;

e opzionalmente da:

  • barra separatrice;
  • percorso per raggiungere la pagina del sito (o la risorsa).

Il protocollo standard utilizzato per la trasmissione degli ipertesti è l’HTTP (Hyper Text Transfer Protocol), ma esiste anche l’HTTPS. Nel primo tutte le comunicazioni avvengono “in chiaro”, senza alcun genere di sicurezza; nell’HTTPS, invece, viene creato un canale di comunicazione crittato, per garantire la riservatezza dei dati. Quando è richiesto un certo grado di sicurezza come per gli acquisti online o la lettura dei messaggi di posta elettronica, si utilizza il secondo.


Muoversi da un server all’altro o da una pagina all’altra su Internet utilizzando link ipertestuali o URL prende il nome di navigazione web.

 >> pagina 296

Il browser

Il browser è il programma eseguito sul client che visualizza le pagine web in modalità grafica.


Il browser può essere usato anche offline per la consultazione di documenti in formato html (▶ unità 10) salvati su disco. I browser più diffusi sono: Google Chrome, Mozilla Firefox, Microsoft Edge, Apple Safari (per Mac o per Windows) e Opera.

Per rendere la navigazione più veloce, il browser salva sul disco del client le pagine web visitate durante la navigazione e le immagini in esse contenute. L’area di disco utilizzata si chiama cache ed è una zona in cui le informazioni vengono memorizzate “temporaneamente”. L’utente può impostarne la dimensione e il browser, quando la cache è piena, cancella le informazioni più vecchie (o quelle usate meno frequentemente, in base all’algoritmo utilizzato) e le sostituisce con quelle più recenti. Per liberare spazio su disco può essere utile cancellare periodicamente i file temporanei contenuti nella cache.


Alcuni siti web memorizzano informazioni sull’utente o sulle modalità di consultazione delle pagine, in modo da poter personalizzare la visualizzazione delle pagine del sito web alla visita successiva. Queste informazioni vengono salvate in un file di testo di piccole dimensioni, detto  cookie, direttamente nell’hard disk del computer dell’utente. I cookie salvati nel computer possono essere letti solo dal sito web che li ha creati. Dato che i cookie potrebbero accedere a informazioni personali senza il consenso dell’utente, è possibile bloccarli totalmente o in parte, oppure cancellarli.


I pop-up sono finestre (o riquadri) che compaiono automaticamente durante l’uso di un’applicazione (per esempio messaggi di errore o di notifica), di solito per attirare l’attenzione dell’utente. Esistono anche sui browser, ma oggi il loro utilizzo è spesso più irritante o dannoso che utile. Spesso contengono pubblicità o pagine di siti web non richiesti. Si sovrappongono alla pagina web consultata complicandone la lettura e, talvolta, sono addirittura rischiosi perché aprono pagine web di siti potenzialmente malevoli. L’utente ha quindi facoltà di disattivare la loro apertura ed, eventualmente, di indicare da quali siti web ricevere pop-up.

Il motore di ricerca

Un motore di ricerca è un sito Internet che ha la funzione di aiutare gli utenti a trovare le informazioni di loro interesse (normalmente contenute in altri siti).


I motori di ricerca più utilizzati sono Google, Bing, Yahoo e Ask.

Generalmente un motore di ricerca contiene una casella di ricerca, all’interno della quale l’utente inserisce le parole chiave (cioè parole ritenute significative per il determinato argomento) e un pulsante Cerca, per mezzo del quale viene avviata la ricerca.


I motori di ricerca effettuano un lavoro strutturato in tre fasi:

1. analisi dei contenuti della rete: di solito viene eseguita in modo automatico da un software chiamato  spider (o crawler), che “si aggira” periodicamente nel web per “scovare” siti nuovi o modificati dalla sua ultima visita;

2. catalogazione del materiale ottenuto: il contenuto dei siti trovati dallo spider viene analizzato, elaborato e memorizzato nei database del motore di ricerca con criteri che variano per ogni motore di ricerca (indicizzazione del sito web). Se il sito non è ancora stato individuato automaticamente, gli sviluppatori possono velocizzare il processo di indicizzazione notificando manualmente ai motori di ricerca l’esistenza del sito web;

3. risposta alle richieste dell’utente: le pagine che contengono i risultati dei motori di ricerca si chiamano SERP (Search Engine Result Pages). Al loro interno il motore di ricerca elenca i siti trovati, in ordine di rilevanza rispetto alla richiesta ricevuta. Innanzitutto il sito deve contenere le parole chiave inserite dall’utente, poi ciascun motore di ricerca utilizza degli algoritmi per classificare le pagine web, per esempio:

  • quante volte viene ripetuta la parola chiave nel sito;
  • in quali punti della pagina sono inserite le parole chiave;
  • quanti link contiene quel documento, verso altri siti;
  • quanti altri siti contengono link verso quella pagina;
  • quante volte gli utenti visitano quel sito dopo una ricerca;
  • quanto frequentemente viene aggiornato il sito.

Il posizionamento di un sito web fa riferimento alla sua ubicazione nella SERP.


Qualunque sito può essere catalogato dai motori di ricerca in modo gratuito (indicizzazione). Questo però non garantisce che il sito compaia fra i primi risultati nella SERP (posizionamento).

Normalmente i siti effettivamente visitati dagli utenti sono quelli all’inizio della SERP ed è per questo che esiste la possibilità di migliorare il posizionamento attraverso:

  • SEO (Search Engine Optimization): attività di ottimizzazione del sito web intraprese dagli sviluppatori;
  • annunci: servizi a pagamento offerti dai motori di ricerca.

I moderni algoritmi utilizzati dai motori di ricerca iniziano a basare il loro funzionamento sul significato delle parole: per esempio sono in grado di distinguere la parola “pesca” in base al contesto in cui è utilizzata, per capire se si tratta del frutto o della disciplina sportiva.

Lo sapevi che

Il pulsante Mi sento fortunato  di Google apre il primo sito trovato durante la ricerca. Facendo invece clic sull’icona del microfono è possibile attivare l’Assistente Google per eseguire ricerche vocali.

  prova tu

Durante la fase di analisi del motore di ricerca un software chiamato:

  • spider si aggira nella rete alla ricerca di siti nuovi.
  • crawler indicizza i siti web caricati in Internet.
  • crawler ricerca i siti richiesti con le parole chiave.

Clic!
Clic!
Tecnologie informatiche per il primo biennio