Insoddisfatto dalla risposta di google alla sitemap inviata attraverso il modulo XMLsitemap, ho approfondito il suo funzionamento e la cosa mi ha sollevato alcuni dubbi che sarei grato se qualcuno volesse aiutarmi a chiarire.
A quanto ho potuto capire:
l'attivazione pura e semplice del solo modulo XMLsitemap genera una sitemap con il solo URL della home page;
il sottomodulo XMLsitemap: Node, se attivato, aggiunge alla sitemap anche gli URL di tipo h ttp://.../?q=node/nid di tutti i node esistenti;
il sottomodulo XMLsitemap: Term, se attivato, aggiunge alla sitemap anche gli URL di tipo h ttp://..../?q=taxonomy/term/nid di tutti i termini della tassonomia esistenti.
Finora ho passato a google la sitemap generata da XMLsitemap con entrambi i sottomoduli attivati, ossia con l'URL della homepage, gli URL di tutti i node e gli URL di tutti i term della tassonomia.
Non so però se vada tanto bene, anche perchè in questo modo si producono parecchie duplicazioni di contenuto, e mi sa che google non apprezza.
Qualcuno ha avuto qualche esperienza in proposito?
Adesso sto provando a mandare la sitemap con i soli nodi senza i term della tassonomia.
Però il sito è organizzato soprattutto in base a view collegate alle diverse voci di menu, e non mi sembra che ci sia la possibilità di inserire nella XMLsitemap l'url di una certa view, a meno di aggiungerla a mano nel setting di XMLsitemap.
Infine, un'ultima cosa. Il readme di XMLsitemap suggerisce la possibilità di creare sitemap personalizzate attraverso l'uso di view, idea che così a occhio sembrerebbe ottima, perchè consentirebbe anche di filtrare i nodi da passare al motore di ricerca.
Però poi la sitemap generata attraverso la view, a quanto pare contiene solo ed esclusivamente i node, e tra l'altro neppure la homepage (e non la vede neppure se aggiunta a mano nel setting).
O forse sono io che sbaglio qualcosa.
Sarei interessato a conoscere le esperienze di qualcun altro in merito.
Puoi aggiungere più sitemap per il sito a google.
Per quanto riguarda i path di nodi e termini, il contenuto della pagina sarà diverso, quindi non ci dovrebbero essere problemi per Google (&c.)
PS: mi pare di capire che non usi i clean url e path (e quindi pathauto), dagli un occhi e buon SEO :D
Ciao
Marco
--
My blog
Working at @agavee
Sì, l'invio di più sitemap risolverebbe alcune cose, anche se in genere con google preferisco la via più semplice e finchè il sito non supera le 50.000 pagine preferirei usarne una sola.
Per quanto riguarda i contenuti delle pagine dei termini, è vero che sono diversi, però insomma il testo di base è sempre quello e non sapendo il criterio di google per riconoscere le duplicazioni, un atteggiamento lievemente paranoide potrebbe non essere sbagliato.
A tale proposito, dopo aver usato il modulo pathauto per recuperare come alias alcuni nodi che avevo cancellato (vedi discussione Come (ri)associo un certo nid a un contenuto?) ho fatto brusca retromarcia quando mi sono accorto che la XMLsitemap elencava sia gli URL dei nodi reali che gli URL alias, col rischio che google li veda come URL duplicati (anzi, mi pare che dovrebbe vederli sicuramente come duplicazioni: essendo due URL diversi con lo stesso contenuto, se sbaglio qualcosa nel ragionamento pregherei di dirmelo).
Rispetto alla funzione di clean url, se non ho capito male l'unica cosa che fa è togliere la stringa "?q=" dall'URL, cosa che se non sbaglio, salvo casi particolari non dovrebbe fare molta differenza, almeno per google.
Ringrazio per la risposta e chiedo scusa ma davvero il rapporto con google è per me fonte di una certa preoccupazione (peraltro abbastanza giustificata e condivisa, dato che non si conoscono i criteri con cui opera). D'altra parte con google si cammina sempre sulle uova e le uniche informazioni vengono dalle esperienze di altri webmaster, come quella di mancio82 (Sito non più presente su google...) che non è proprio rassicurante.
Ciao
Marco
--
My blog
Working at @agavee
Grazie, in ogni caso i clean url li avevo abilitati e dev'essere sicuramente come dici tu.
Ho verificato nuovamente l'output di XMLsitemap ed effettivamente vedo che i nodi alias non figurano, per cui non dovrebbero esserci duplicazioni.
Anche per le pagine dei termini non credo che ci siano problemi.
Lo dico con una certa serenità adesso che il sito è tornato ad essere indicizzato normalmente e le pagine sono tornate nelle giuste posizioni.
Il fatto è che google non mi indicizzava le nuove pagine da un paio di settimane e registravo una serie di anomalie che mi stavano preoccupando molto, ma ho potuto appurare che si trattava di un problema diffuso di indicizzazione di google (a quanto pare normalizzatosi proprio stanotte, secondo conferme avute anche da altri webmaster).