Exclude by Field NOINDEX error

Post Reply
michel.weber
Posts: 256
Joined: Sat Oct 08, 2005 12:40 pm

Exclude by Field NOINDEX error

Post by michel.weber »

Hi

I have a problem with one of our profiles
Some pages are not indexed and i really can't see why.
When i do 'List/Edit URLs' they show up in the url list but all the text fields (title , description, body, ...) containe '-None-'
and the Error field says : Error: Exclude by Field NOINDEX

I have defined 'Exclude by Field' as follows :
Metamorph Query : Index of /tnews
Field : HTML
Meta Field :
Exclude : Pages only

The idea is to exclude pages that contain the string "Index of /tnews".
Could this be a regex problem?

Below is the html of one of the offending pages:
---------------------------------------------------
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<html>
<head>
<meta http-equiv="content-type" content="text/html; charset=utf-8">
<!-- Template for Tnews Article -->
<title>Une aide en ligne pour le moteur de recherche</title>
<meta name="description" content="<p>Pour une utilisation plus efficace du moteur et des options de recherche avancée, une aide en ligne est disponible à partir du bouton &quot;Aide&quot;</p>"/>
<meta name="keywords" content="DIT,DGAL"/>
<meta name="Content-Language" content="fr">
<meta name="Last-modified" content="Fri, 01 Feb 2008 10:02:44">
<meta name="dimDocType" content="docNews">
</head>
<body>
<div id="data" class="Content">
<img class="fleft" src="/tnews/fr/portal/articles/DIT/article_1730/photo_article.jpg" title="Moteur de recherche situé sur le portail Intranet " alt="Moteur de recherche situé sur le portail Intranet ">

<span>
<h3>Une aide en ligne pour le moteur de recherche</h3>
<p class="date">Publié le 01/02/2008</p>
<p>
<p style="text-align:left;">Le moteur de recherche situé sur le portail Intranet (en haut à droite), mis en oeuvre par la DIT et la DC, utilise une technologie du type "google".</p> <p style="text-align:left;">Il permet de faire des recherches simples et avancées sur les sites* de l'Organisation qui y sont référencés, ainsi que dans les news parues sur les portails.</p> <p style="text-align:left;"><br /> Pour une utilisation plus efficace du moteur et des options de recherche avancée, une aide en ligne est disponible à partir du bouton "Aide".</p> <p style="text-align:left;">* Liste des sites indexés dans le moteur de recherche :<br /> - Portails intranet et internet<br /> - Les news du portail intranet<br /> - CPT : Site du Comité européen pour la Prévention de la Torture<br /> - Congress : Site du Congrès des Pouvoirs locaux et régionaux<br /> - Conventions : Site du Bureau des Traités<br /> - ECHR : Site de la Cour européenne des Droits de l'Homme<br /> - WCD : Web Cube Documentaire : système de gestion documentaire contenant le manuel administratif, les textes réglementaires, les documents du CM, etc.</p>

</p>
</span>
<div class="BLOCKlist">
<h2 id="boxTitle">Liens associés</h2>
<div class="BOX_2">
<ul>
<li><a href='http://intranet.coe.int/jahia/Jahia/sit ... d=Advanced' title='moteur de recherche'>moteur de recherche</a></li>
</ul>

</div>
</div>
</div id="data">
</body>
</html>
---------------------------------------------------
User avatar
mark
Site Admin
Posts: 5513
Joined: Tue Apr 25, 2000 6:56 pm

Exclude by Field NOINDEX error

Post by mark »

Yes, the query is the problem
Index of /tnews
means any page containing the word "index" and the string "tnews" anywhere in the html of the page. You probably meant
"Index of /tnews"
to treat it as one phrase.
michel.weber
Posts: 256
Joined: Sat Oct 08, 2005 12:40 pm

Exclude by Field NOINDEX error

Post by michel.weber »

Thanks that works
Post Reply