Ciao ragazzi, avrei bisogno di una mano perchè non riesco ancora a trovare la soluzione.
Devo ripulire la sitemap generata con il modulo XML Sitemap e contenente oltre ai nodi anche i termini della tassonomia ottenuti abilitando XML sitemap taxonomy. XML sitemap taxonomy è abilitato per ora solo in test, in quanto, non utilizzando ancora Pathauto in produzione, gli Url generati per la tassonomia erano nella forma taxonomy/term/numero, non bello per i motori di ricerca. Comunque, senza Pathauto, vengono sempre visualizzati taxonomy/term/numero quando si accede ad un tag della pagina e questo penso che non sia bello e può essere dannoso dal punto di vista SEO.
In test, con una buona configurazione di Pathauto e con XML sitemap taxonomy ottengo una sitemap pulita (con tutti gli alias generati al posto di taxonomy/term/...) ed anche gli indirizzi dei vari tag sono puliti (contengono l' indirizzo dell' alias e non più l' indirizzo con taxonomy/term/...
Nasce quì il problema (che sarebbe anche la soluzione ad alcune pagine non trovate sempre presenti).
Delle circa 1400 url generate tra nodi reali e tassonomia ce ne sono circa una quarantina con il famoso taxonomy/term/... che puntano tutti ad una pagina inesistente (dovrebbero essere i famosi orfani dei tag prima creati e poi eliminati).
Riuscendo ad eliminare gli url con taxonomy/term/... non dovrei quindi più avere errori di pagina non trovata.
Ma come fare ?
Ho provato ad eliminare questi tid (term id) sia dalla tabella xmlsitemap_taxonomy che dalla tabella xmlsitemap_term, ma la sitemap genera sempre gli url taxonomy/term/.... anche se eliminati. In quale ulteriore tabella devo agire ?
Naturalmente sto facendo tutto questo in test.
Un grazie a tutti quelli che possono aiutarmi a trovare la soluzione.
[Risolto]Come ripulire una sitemap dai termini obsoleti
Sab, 12/02/2011 - 10:48
#1
[Risolto]Come ripulire una sitemap dai termini obsoleti
Complimenti Giovanni questo è un argomento veramente utile.
Pensa che a volte ho dovuto fare tutto a manina: scoprire il link vuoto e rifarlo..una barba :(
Le tabelle coinvolte finora trovate sono:
xmlsitemap
xmlsitemap_taxonomy
xmlsitemap_term
url_alias
Sicuramente ce ne vuole almeno un' altra.
es. page perse
http://giovanni/sites/default/files/giovanninews/Fabrizio%20De%20Andr%E8...
http://giovanni/../../../../../../debussy
http://giovanni/../../../../../../chaminade
http://giovanni/../../../../../../mozart
http://giovanni/../../../../../../prokofiev
---------------------
esempi di timeout
http://segnalo.alice.it/post.html.php?url=http%3A%2F%2Fgiovanni%2Fmusica...
----------
eh vabbè : ti sei perso un pò di cantanti .. ma non vedo 40 pagine, sono meno.
Risolto.
Le tabelle coinvolte sono 3:
xmlsitemap per taxonomy/term/...
xmlsitemap_taxonomy e xmlsitemap_term per i tid
Dopo averle ripulite è necessario eliminare la cache di xmlsitemap e ricrearla.
Particolare attezione va fatta sull' uso di Pathauto (la generazione automatica degli alias) nella quale bisogna indicare il vocabolario per generare gli alias (per evitare eventuali duplicati).
Domani passo in produzione.
Scusate, ma la tabella è solo xmlsitemap dove bisogna eliminare il taxonomy/term/... cercandolo per il campo loc.
Avvisatemi se sto facendo qualche cavolata.
http://edicola-virtuale.blogspot.com/
http://giovanninews.com/sites/default/files/u1/standard-accessibilit%E0.jpg
http://dailymotion.virgilio.it/swf/x49kiy_sur-un-marche-persan-orchestru...
ecc.. ecc..
= not found
------------------
http://gnolia.com/bookmarklet/add?url=http%3A%2F%2Fgiovanninews.com%2Fmu...
http://gnolia.com/bookmarklet/add?url=http%3A%2F%2Fgiovanninews.com%2Fin...
http://gnolia.com/bookmarklet/add?url=http%3A%2F%2Fgiovanninews.com%2Fin...
http://gnolia.com/bookmarklet/add?url=http%3A%2F%2Fgiovanninews.com%2Fri...
http://gnolia.com/bookmarklet/add?url=http%3A%2F%2Fgiovanninews.com%2Fpa...
http://gnolia.com/bookmarklet/add?url=http%3A%2F%2Fgiovanninews.com%2Fse...
http://gnolia.com/bookmarklet/add?url=http%3A%2F%2Fgiovanninews.com%2Fsh...
http://gnolia.com/bookmarklet/add?url=http%3A%2F%2Fgiovanninews.com%2Fbe...
http://gnolia.com/bookmarklet/add?url=http%3A%2F%2Fgiovanninews.com%2Fys...
ecc ecc.
= time out
Il primo 404 lo conosco e mi va bene così (anzi, lo tolgo).
Il secondo non lo conoscevo (lo vedo domani).
Il bookmark di Magnolia l' ho appena tolto grazie a te; sarà una modifica che dovrà fare il manutentore del modulo service_links.
Ho qualche 301 ed un -110 che sistemerò dopo il passaggio di domani; sarà una mattinata lunga.
Mi piacerebbe sapere come li hai trovati.
Ciao.
Fatto un giro:
Le pennette sono timeout
http://giovanninews.com/sites/default/files/u1/Penne/Penne36G.jpg
e gli arrosticini sono cancelled
--
i Not Found che restano :
http://giovanninews.com/sites/default/files/u1/colori-C%E9zanne-La-Maiso...
http://mavimo.org/varie/installazione_configurazione_xampp
http://giovanninews.com/sites/default/files/u1/standard-accessibilit%E0.jpg
http://giovanninews.com/../../../../../../debussy
http://giovanninews.com/../../../../../../edward-elgar-baronetto-della-m...
http://giovanninews.com/../../../../../../faure
http://giovanninews.com/../../../../../../grainger
http://giovanninews.com/../../../../../../grieg
http://giovanninews.com/../../../../../../haydn
http://giovanninews.com/../../../../../../mendelssohn
http://giovanninews.com/../../../../../../prokofiev
ci sono parecchi timeout : connessione lenta (del momento) o colpa di contenuti pesanti (video, ecc..) ma sono cmq problemi minori per un portale cosi ampio.
Ci saranno problemi con Netsons.
Gli unici che confermo sono Mavimo (problema suo) e l' immagine che contiene caratteri speciali (mi sa che devo rivedere la configurazione di Pathauto).
Comunque forse Google si è incazzato.
P.S. L' indirizzo corretto è
http://giovanninews.com/sites/default/files/u1/C%C3%A9zanne-La-Maison-du...
Come fai a visualizzare l' altro ?
Gio' : i dati sono giusti, quelli indicati ci sono : ti ho spazzolato tutto il sito .... se questo non è Ammore...
Ricambio l' affetto, ma me lo spieghi come lo hai spazzolato se io non li vedo ? Se c' è qualche segreto dimmelo in privato (prova a pulire la cache del tuo pc).
agente86 sà quando Giò elimina arrosticini.

Vabbè, non ti vuoi sbottonare.
Adesso dovrebbe andare meglio, anche se probabilmente qualche 404 ci sarà ancora.
@Lorenzo
The Crown ha apprezzato la tua analisi
http://drupal.org/node/1063372
eh, allora se serve ancora:
qui abbiamo l'agente Smart (a part time).