Handleiding voor beginners over het voorkomen van schrapen van bloginhoud in WordPress
Als je dag in dag uit originele inhoud schrijft, ben je je er al van bewust dat je berichten binnen enkele dagen en soms zelfs enkele minuten op een heleboel SPAM-sites terechtkomen. Sommige gebruikers merkten zelfs op dat de site met gestolen inhoud de oorspronkelijke post overtrof. Het is erg frustrerend als een website-eigenaar om te zien dat iemand je inhoud steelt zonder toestemming, inkomsten genereert, je overtreft in SERPs en je publiek steelt. Content Scraping is tegenwoordig een enorm probleem, aangezien het zo gemakkelijk is voor iemand om je inhoud te stelen. In dit artikel bespreken we wat inhoud schrapen met blogs, hoe je inhoudschrapers kunt vangen, hoe je moet omgaan met inhoudschrapers, hoe je inhoudschrapen kunt verminderen en voorkomen, hoe je kunt profiteren van inhoudschrapen, hoe je geld kunt verdienen met inhoudschrapers , en is inhoud schrapen altijd goed?
Wat is Blog Content Scraping?
Inhoudschrapen met blogs is een handeling die meestal wordt uitgevoerd met scripts die inhoud uit verschillende bronnen halen en deze naar één site slepen. Het is nu zo eenvoudig dat iedereen een WordPress-site kan installeren, een gratis of commercieel thema kan plaatsen en een paar plug-ins kan installeren die inhoud van geselecteerde blogs kunnen weghalen en schrapen, zodat het op hun site kan worden gepubliceerd.
Waarom stelen ze mijn inhoud?
Sommige van onze gebruikers hebben ons gevraagd waarom stelen ze mijn inhoud? Het simpele antwoord is omdat je GEWELDIG bent. De waarheid is dat deze inhoudschrapers bijbedoelingen hebben. Hieronder volgen enkele redenen waarom iemand uw inhoud zou schrapen:
- Affiliate commissie - Er zijn wat vuile affiliate marketeers die het systeem willen exploiteren om maar een paar euro extra te verdienen. Zij zullen uw inhoud en de inhoud van anderen gebruiken om verkeer naar hun site te brengen via de zoekmachine. Deze sites zijn meestal gericht op een specifieke niche, dus hebben ze gerelateerde producten die ze promoten.
- Lead Generation - Vaak zien we advocaten en makelaars dit doen. Ze willen industriële leiders lijken in hun kleine gemeenschappen. Ze hebben niet de bandbreedte om kwaliteitsinhoud te produceren, dus gaan ze erop uit en schrapen ze inhoud van andere bronnen. Soms weten ze dit niet eens omdat ze scumbag $ 30 / maand betalen om content toe te voegen en hen te helpen betere SEO te krijgen. We zijn in het verleden nogal wat hiervan tegengekomen.
- Advertentieinkomsten - Sommige mensen willen gewoon een 'knooppunt' van kennis creëren. Een one-stop-shop voor gebruikers in een specifieke niche. Als ik een cent had voor elke keer dat iemand dit met onze inhoud heeft gedaan, dan zouden we een paar honderd pennies hebben. Vaak merken we dat onze site-inhoud wordt geschraapt. De schraper antwoordt altijd, ik deed dit voor het welzijn van de gemeenschap. Behalve de site is volgestouwd met advertenties.
Dit zijn slechts enkele redenen waarom iemand uw inhoud zou stelen.
Hoe inhoudscrapers te vangen?
Het vangen van inhoudschrapers is een vervelende klus en kan veel tijd kosten. Er zijn maar weinig manieren om inhoudschrapers te vangen.
Zoek Google met uw berichttitels
Ja, dat is zo pijnlijk als het klinkt. Deze methode is waarschijnlijk niet de moeite waard, vooral als je schrijft over een zeer populair onderwerp.
Trackbacks
Als u interne links in uw berichten toevoegt, ziet u een trackback als een site uw inhoud steelt. Op deze manier is de schraper zo ongeveer dat hij je inhoud schraapt. Als u Akismet gebruikt, worden veel van deze trackbacks weergegeven in de map SPAM. Nogmaals, dit werkt alleen als je interne links in je berichten hebt.
Webmasterhulpprogramma's
Als u Google Webmasterhulpprogramma's gebruikt, bent u waarschijnlijk op de hoogte van de links naar uw site. Als u onder 'Verkeer' kijkt, ziet u een pagina met links naar uw site. De kans bestaat dat je scrapers tot de top behoren. Ze hebben honderden, zo niet duizenden links naar uw pagina's (gezien het feit dat u interne links heeft).
FeedBurner ongewoon gebruik
Als u Feedburner voor uw WordPress-blog hebt ingesteld, ziet u enkele ongewoon gebruik. In het tabblad Analyseren onder Feedstatistieken ziet u "Somsgebruik". Daar zie je een lijst met sites.
Hoe om te gaan met Content Scrapers
Er zijn weinig benaderingen die mensen nemen bij het omgaan met inhoudschrapers. The Do Nothing Approach, Kill them all approach, Profiteer van hen.
De Do Nothing Approach
Dit is veruit de gemakkelijkste aanpak die u kunt nemen. Meestal raden de meest populaire bloggers dit aan omdat het VEEL tijd kost om met de scrapers te vechten. Deze aanpak beveelt eenvoudigweg aan dat u "in plaats van ze te bestrijden, uw tijd besteedt aan het produceren van nog meer inhoud van hoge kwaliteit en plezier". Het is duidelijk dat als het een bekende blog is zoals Smashing Magazine, CSS-Tricks, Problogger of anderen, ze zich daar geen zorgen over hoeven te maken. Het zijn autoriteitssites in de ogen van Google.
Tijdens de Panda Update weten we echter dat sommige goede sites als scrapers zijn gemarkeerd omdat Google dacht dat hun scrapers originele inhoud waren. Dus deze benadering is volgens ons niet altijd de beste.
Dood ze allemaal
Precies het tegenovergestelde van de "Do Nothing Approach". In deze benadering neemt u eenvoudig contact op met de scraper en vraagt u hen om de inhoud te verwijderen. Als ze dit weigeren of simpelweg niet op uw verzoeken reageren, dient u een DMCA (Digital Millennium Copyright Act) in bij hun host. In onze ervaring, heeft de meerderheid van de schavende websites geen contactformulier beschikbaar. Als ze dat doen, gebruik het dan. Als ze het contactformulier niet hebben, moet je een Whois Lookup doen.
U kunt de contactgegevens bekijken van de beheerder. Gewoonlijk is het administratieve en technische contact hetzelfde. De whois toont ook de domeinregistreerder. De meeste bekende webhostingbedrijven en domeinregistreerders hebben DMCA-formulieren of e-mails. U kunt zien dat deze specifieke persoon bij Hostgator is vanwege hun naamservers. HostGator heeft een formulier voor DMCA-klachten. Als de nameserver zoiets als ns1.theirdomain.com is, moet je dieper graven door reverse IP-lookups uit te voeren en naar IP's te zoeken.
U kunt ook een service van derden voor DMCA.com gebruiken voor verwijderingen.
Jeff Starr suggereert in zijn artikel dat je de IP's van de slechterik moet blokkeren. Open uw logboeken voor hun IP-adres en blokkeer het met zoiets in uw root .htaccess-bestand:
Weigeren van 123.456.789
Je kunt ze ook omleiden naar een dummy-feed door iets als dit te doen:
RewriteCond% REMOTE_ADDR 123 \ .456 \ .789 \. RewriteRule. * Http://dummyfeed.com/feed [R, L]
Je kunt hier heel creatief worden, zoals Jeff suggereert. Stuur ze naar echt grote tekstfeeds vol met Lorem Ipsum. Je kunt ze wat walgelijke beelden van slechte dingen sturen. Je kunt ze ook rechtstreeks naar hun eigen server sturen, waardoor een oneindige lus ontstaat waardoor hun site vastloopt.
De laatste benadering die we volgen, is ervan profiteren.
Hoe te profiteren van Content Scrapers
Dit is onze benadering van het omgaan met inhoudschrapers, en dat komt vrij goed uit. Het helpt onze SEO en helpt ons extra geld verdienen. Meerderheid van de scrapers gebruikt uw RSS-feed om uw inhoud te stelen. Dit zijn dus enkele dingen die u kunt doen:
- Interne koppeling - U moet de CRAP uit uw berichten koppelen. Met de interne koppelingsfunctie in WordPress 3.1 is het nu eenvoudiger dan ooit. Wanneer u interne links in uw artikel heeft, helpt dit u om paginaweergaves te vergroten en het bouncepercentage op uw eigen site te verlagen. Ten tweede krijg je backlinks van de mensen die je inhoud stelen. Ten slotte kunt u hiermee hun publiek stelen. Ben je een getalenteerde blogger, dan begrijp je de kunst van het intern linken. U moet uw links op interessante zoekwoorden plaatsen. Maak het verleidelijk voor de gebruiker om erop te klikken. Als je dat doet, zal het publiek van de schraper er ook op klikken. Je nam zomaar een bezoeker van hun site en bracht ze terug naar waar ze in de eerste plaats hadden moeten zijn.
- Auto Link-trefwoorden met gelieerde koppelingen - Er zijn weinig plug-ins zoals Ninja Affiliate en SEO Smart Links die automatisch toegewezen trefwoorden zullen vervangen door affiliate links. Bijvoorbeeld: HostGator, StudioPress, MaxCDN, Gravity Forms << These all will be auto-replaced with affiliate links when this post goes live.
- Wees creatief met RSS-voettekst - U kunt de RSS-voettekst of WordPress SEO van Yoast Plugin gebruiken om aangepaste items aan uw RSS-voettekst toe te voegen. Je kunt hier bijna alles toevoegen wat je wilt. We kennen enkele mensen die hun eigen producten graag promoten bij hun RSS-lezers. Dus zullen ze banners toevoegen. Raad eens wat, nu zullen die banners ook op deze scraper's website verschijnen. In ons geval voegen we altijd een kleine disclaimer onder aan onze berichten in onze RSS-feeds. Het leest simpelweg als "Hoe zet je je WordPress-site op als alleen-lezen staat voor sitemigraties en onderhoud is een bericht van: WPBeginner dat niet mag worden gekopieerd op andere sites." Hierdoor krijgen we een backlink naar het originele artikel van de scraper-site waarmee google en andere zoekmachines weten dat we autoriteit hebben. Het laat hun gebruikers ook weten dat de site onze inhoud steelt. Als je goed bent met codes, dan kun je helemaal gek worden. Zoals het toevoegen van gerelateerde berichten alleen voor uw RSS-lezers, en een heleboel andere dingen. Bekijk onze handleiding voor het volledig manipuleren van uw WordPress RSS-feed.
Hoe u de inhoud van bloginhoud kunt verminderen en mogelijk voorkomen
Als je kijkt naar onze aanpak van veel interne koppelingen, affiliat links toevoegt, rss-banners en dergelijke kansen zijn, dan zul je het schrapen van inhoud tot een goed einde brengen. Als je de suggestie van Jeff Starr neemt om inhoudscrawlers om te leiden, zal ook dat die scrapers tegenhouden. Afgezien van wat we hierboven hebben gedeeld, zijn er nog enkele andere trucjes die je kunt gebruiken.
Volledige versus samenvatting RSS-feed
Er is in de blogcommunity gediscussieerd of er een volledige RSS-feed of een samenvatting van de RSS-feed is. We gaan niet in op veel details over dat debat, maar een van de voordelen van het hebben van alleen RSS-feed is dat je inhoudschrapen voorkomt. U kunt de instellingen wijzigen door naar uw WordPress-adminpaneel te gaan en onder Instellingen »Lezen te gaan. Wijzig vervolgens de instelling Voor elk artikel in een feedshow: Samenvatting.
Opmerking: we hebben volledige feed omdat we meer om onze RSS-lezers geven dan de spammers.
Trackback SPAM
Trackbacks en Pingbacks hadden echter zeker geweldige toepassingen, maar ze worden nu voortdurend misbruikt. Vaak geven thema's trackbacks en pingbacks weer onder of tussen de opmerkingen. Dit geeft de spammer een stimulans om uw site te schrapen en trackbacks te verzenden. Als u dit ten onrechte goedkeurt, krijgen ze een backlink en vermelding van uw site. Hier leest u hoe u trackbacks op alle toekomstige berichten kunt uitschakelen. Hier is een artikel dat u laat zien hoe u trackbacks en pings op bestaande WordPress-berichten kunt uitschakelen.
Is inhoud schrapen ooit goed?
Het kan zijn. Als je ziet dat je geld verdient van de site van de scraper, dan kan dat zeker. Als u veel verkeer van een scraper's site ziet, dan kan dat zijn. In de meeste gevallen is dit echter niet het geval. Probeer altijd je inhoud te laten verwijderen. Maar je zult je realiseren dat als je blog groter wordt, het bijna onmogelijk is om alle inhoudschrapers bij te houden. We sturen nog steeds DMCA-klachten, maar we weten dat er talloze andere sites zijn die onze inhoud stelen die we gewoon niet bij kunnen houden.
hoe denk jij erover? Gebruik je andere mechanismen om te voorkomen dat content wordt geschraapt? Zou het leuk vinden om je gedachten te horen.