{"id":1379,"date":"2011-09-01T09:56:59","date_gmt":"2011-09-01T07:56:59","guid":{"rendered":"http:\/\/www.laurentmarot.fr\/wordpress\/?p=1379"},"modified":"2011-09-01T10:40:50","modified_gmt":"2011-09-01T08:40:50","slug":"do-you-scrap-appel-a-la-deletion","status":"publish","type":"post","link":"https:\/\/www.laurentmarot.fr\/wordpress\/?p=1379","title":{"rendered":"Do you scrap ? Appel \u00e0 la d\u00e9lation."},"content":{"rendered":"<div id=\"attachment_1387\" style=\"width: 310px\" class=\"wp-caption alignleft\"><a href=\"http:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping.jpg\" rel=\"lightbox[1379]\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-1387\" class=\"size-medium wp-image-1387\" title=\"Interface de d\u00e9nociation de scrapping de Google\" src=\"http:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping-300x177.jpg\" alt=\"Interface de d\u00e9nociation de scrapping de Google\" width=\"300\" height=\"177\" srcset=\"https:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping-300x177.jpg 300w, https:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping-1024x605.jpg 1024w, https:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping.jpg 1111w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/a><p id=\"caption-attachment-1387\" class=\"wp-caption-text\">Interface de d\u00e9nociation de scrapping de Google<\/p><\/div>\n<p>Je r\u00e9pondis sur l&rsquo;<a title=\"Google lutte contre les scrapers et encourage la d\u00e9nonciation\" href=\"http:\/\/actu.abondance.com\/2011\/08\/google-lutte-contre-les-scrapers-et.html\" target=\"_blank\">article d&rsquo;Olivier Andrieu<\/a> sur le site Abondance \u00e0 propos du nouveau outil de signalement de duplication de contenus que Google a mis en place. Je scrappe ici m\u00eame cet article afin de faire le \u00ab\u00a0test\u00a0\u00bb de d\u00e9nonciation:<\/p>\n<p>&lt;abondance&gt;<\/p>\n<h2>Google propose un formulaire permettant d&rsquo;indiquer  des sites scrapant un contenu, c&rsquo;est-\u00e0-dire volant un texte dans une page pour  l&rsquo;int\u00e9grer sur son site sans autorisation pr\u00e9alable&#8230;<\/h2>\n<p>Google veut  lutter contre les scrapers (les sites qui \u00ab\u00a0pillent\u00a0\u00bb le web pour en copier\/coller  le contenu sur leurs pages sans autorisation) et vient de mettre en ligne <a href=\"https:\/\/docs.google.com\/spreadsheet\/viewform?formkey=dGM4TXhIOFd3c1hZR2NHUDN1NmllU0E6MQ\" target=\"_blank\">un formulaire de d\u00e9nonciation<\/a> qui vous incite \u00e0 lui indiquer  la requ\u00eate qui renvoie un contenu \u00ab\u00a0scrap\u00e9\u00a0\u00bb, les URL des pages originale et  copi\u00e9e ainsi que des commentaires \u00e9ventuels. Tout cela sera ensuite vis\u00e9 et  analys\u00e9 par l&rsquo;\u00e9quipe \u00ab\u00a0Quality Search\u00a0\u00bb qui doit avoir bien du travail en ce  moment&#8230;<\/p>\n<p>Il est indiqu\u00e9 sur ce formulaire que les donn\u00e9es fournies ne  sont pas consid\u00e9r\u00e9es comme un \u00ab\u00a0spam report\u00a0\u00bb (et donc que les sites en question  ne devraient, logiquement, pas \u00eatre p\u00e9nalis\u00e9s) mais plut\u00f4t comme des exemples  qui seront utilis\u00e9s \u00e0 fin de test par Google pour am\u00e9liorer  l&rsquo;algorithme.<\/p>\n<p>Rappelons qu&rsquo;en plus des probl\u00e8mes l\u00e9gaux (copie de contenu  sans autorisation), le scraping g\u00e9n\u00e8re des probl\u00e8mes de <em>duplicate content<\/em> pouvant faire passer un contenu \u00ab\u00a0scrap\u00e9\u00a0\u00bb devant  votre site dans les r\u00e9sultats du moteur sur certaines requ\u00eates.  Emb\u00eatant&#8230;<br \/>\n&lt;\/abondance&gt;<\/p>\n<p>Comme d&rsquo;habitude Google, qui fait semblant de s&rsquo;excuser devant notre possible interpr\u00e9tation de ses objectifs, nous prend pour des grands enfants. Il semble bien \u00e9vident que pour la pertinence de ses r\u00e9ponses, Google a tout int\u00e9r\u00eat a d\u00e9grad\u00e9 le r\u00e9f\u00e9rencement d&rsquo;un contenu scrapp\u00e9 et qu&rsquo;il ne se g\u00eanera certainement pas pour le faire. Cet int\u00e9r\u00eat est tout \u00e0 fait l\u00e9gitime&#8230; de l\u00e0 \u00e0 faire appel \u00e0 la grande g\u00e9n\u00e9rosit\u00e9 des internautes pour l&rsquo;atteindre il y a un pas minuscule que Google ne se prive pas d&rsquo;utiliser, en veillant \u00e0 ne froisser personne (Panda en a d\u00e9j\u00e0 irrit\u00e9 suffisamment) \ud83d\ude42<\/p>\n<p>Allez, faisons le test :<\/p>\n<p>&#8211; premier point positif, ma page wordpress est index\u00e9e quelques minutes apr\u00e8s sa cr\u00e9ation :<\/p>\n<div id=\"attachment_1388\" style=\"width: 310px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping2.jpg\" rel=\"lightbox[1379]\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-1388\" class=\"size-medium wp-image-1388\" title=\"D\u00e9tection du scrapping\" src=\"http:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping2-300x102.jpg\" alt=\"D\u00e9tection du scrapping\" width=\"300\" height=\"102\" srcset=\"https:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping2-300x102.jpg 300w, https:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping2-1024x350.jpg 1024w, https:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping2.jpg 1092w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/a><p id=\"caption-attachment-1388\" class=\"wp-caption-text\">D\u00e9tection du scrapping<\/p><\/div>\n<p>&#8211; je soumets donc ma requ\u00eate au formulaire de signalement:<\/p>\n<div id=\"attachment_1390\" style=\"width: 310px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping4.jpg\" rel=\"lightbox[1379]\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-1390\" class=\"size-medium wp-image-1390\" title=\"Envoi du formulaire de signalement\" src=\"http:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping4-300x186.jpg\" alt=\"Envoi du formulaire de signalement\" width=\"300\" height=\"186\" srcset=\"https:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping4-300x186.jpg 300w, https:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping4-1024x635.jpg 1024w, https:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping4.jpg 1145w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/a><p id=\"caption-attachment-1390\" class=\"wp-caption-text\">Envoi du formulaire de signalement<\/p><\/div>\n<p>On notera au passage que le premier champ est bien obligatoire \ud83d\ude42<\/p>\n<p>&#8211; la r\u00e9ponse de Google<\/p>\n<div id=\"attachment_1391\" style=\"width: 310px\" class=\"wp-caption aligncenter\"><a href=\"http:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping5.jpg\" rel=\"lightbox[1379]\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-1391\" class=\"size-medium wp-image-1391\" title=\"R\u00e9ponse de Google au signalement\" src=\"http:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping5-300x90.jpg\" alt=\"R\u00e9ponse de Google au signalement\" width=\"300\" height=\"90\" srcset=\"https:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping5-300x90.jpg 300w, https:\/\/www.laurentmarot.fr\/wordpress\/wp-content\/uploads\/2011\/09\/CaptureScrapping5.jpg 540w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/a><p id=\"caption-attachment-1391\" class=\"wp-caption-text\">R\u00e9ponse de Google au signalement<\/p><\/div>\n<p>H\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9\u00e9&#8230;. Google aurait pu me cr\u00e9diter d&rsquo;un ch\u00e8que de 75 \u20ac Adwords pour cette d\u00e9nonciation. Bref, attendons le r\u00e9sultat avec angoisse mais sale temps en perspective pour les \u00ab\u00a0<a title=\"L\u2019\u00e8re des \u201ccurators\u201d aurait-elle sonn\u00e9?\" href=\"http:\/\/owni.fr\/2010\/11\/26\/l%E2%80%99ere-des-%E2%80%9Ccurators%E2%80%9D-aurait-elle-sonne\/\" target=\"_blank\">curators<\/a>\u00ab\u00a0. Pourvu que cela ne plombe pas mon PageRank \ud83d\ude42<\/p>\n\n","protected":false},"excerpt":{"rendered":"<p>Je r\u00e9pondis sur l&rsquo;article d&rsquo;Olivier Andrieu sur le site Abondance \u00e0 propos du nouveau outil de signalement de duplication de contenus que Google a mis en place. Je scrappe ici m\u00eame cet article afin de faire le \u00ab\u00a0test\u00a0\u00bb de d\u00e9nonciation: &lt;abondance&gt; Google propose un formulaire permettant d&rsquo;indiquer des sites scrapant un contenu, c&rsquo;est-\u00e0-dire volant un [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[7],"tags":[],"_links":{"self":[{"href":"https:\/\/www.laurentmarot.fr\/wordpress\/index.php?rest_route=\/wp\/v2\/posts\/1379"}],"collection":[{"href":"https:\/\/www.laurentmarot.fr\/wordpress\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.laurentmarot.fr\/wordpress\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.laurentmarot.fr\/wordpress\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.laurentmarot.fr\/wordpress\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=1379"}],"version-history":[{"count":9,"href":"https:\/\/www.laurentmarot.fr\/wordpress\/index.php?rest_route=\/wp\/v2\/posts\/1379\/revisions"}],"predecessor-version":[{"id":1382,"href":"https:\/\/www.laurentmarot.fr\/wordpress\/index.php?rest_route=\/wp\/v2\/posts\/1379\/revisions\/1382"}],"wp:attachment":[{"href":"https:\/\/www.laurentmarot.fr\/wordpress\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=1379"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.laurentmarot.fr\/wordpress\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=1379"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.laurentmarot.fr\/wordpress\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=1379"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}