Content Scrapers के बारे में क्या आपको चिंतित होना चाहिए?

0
158
Should You Be Worried About Content Scrapers?

क्या आपने ऐसी वेबसाइट (Website) देखी है जिसने आपके द्वारा हाल ही में प्रकाशित किए गए लेख (Article) के ऊपर से नीचे तक ठीक वही लेख पोस्ट (Post) किया हो?

यह जानकर गुस्सा आ सकता है कि अन्य लोग उस सामग्री से लाभ उठाने की कोशिश कर रहे हैं, जिस पर आपने बिना आपकी अनुमति (Without your permission) के कड़ी मेहनत की थी और सामग्री लिखी थी।

यदि आप एक उच्च-गुणवत्ता वाली वेबसाइट (High-quality website) के मालिक हैं, जिस पर अच्छी संख्या में ट्रैफ़िक (Traffic) आ रहा है, तो आप सबसे अधिक संभावना सामग्री स्क्रैपर्स (Content scraping) के शिकार हैं।

सामग्री स्क्रैपिंग (Content scraping) उच्च गुणवत्ता वाले स्रोतों से सामग्री की प्रतिलिपि बनाने और उन्हें अपने स्वयं के रूप में प्रकाशित करने की अवैध प्रक्रिया है।

कंटेंट स्क्रैपिंग कोई नई बात नहीं है और यह असामान्य भी नहीं है। वास्तव में, मैं समय-समय पर SEO Hacker से स्क्रैपिंग करने वाली वेबसाइटों की खोजते है, और (Content scraping) करते है।

सामग्री स्क्रैपिंग कैसे काम करता है?
How does Content Scraping Work?

जिस तरह से लोग अन्य वेबसाइटों से सामग्री को Scrape करते हैं, वह भिन्न होता है। वे इसे मैन्युअल रूप से कर सकते हैं या वे सॉफ़्टवेयर (Manually or they use software that automatically) का उपयोग करते हैं जो नई सामग्री के लिए वेबसाइटों को स्वचालित रूप से क्रॉल करता है और इसकी एक प्रति (Copy) बनाता है। यदि आप ऐसा सॉफ़्टवेयर देखते हैं जो ऐसा करता है, तो आप ऐसे Content scraping दूर रहें।

सामग्री स्क्रैपर्स (Content scraping) का लक्ष्य भी भिन्न होता है। कुछ लोग जो सामग्री को Scraping करते हैं, वे शायद अपनी वेबसाइट के पृष्ठों की संख्या बढ़ाना चाहते हैं। वे आम तौर पर आपकी वेबसाइट से लिंक करते हैं और आपको इसे प्रकाशित (Publish) करने का श्रेय (Credit) देते हैं और कुछ मामलों में, वे आपकी वेबसाइट पर उसी पृष्ठ की ओर इशारा करते हुए एक विहित टैग (Canonical tag) का उपयोग करेंगे।

अन्य सामग्री स्क्रैपर्स (Content scraping) आपकी सामग्री को स्पष्ट रूप से पूर्ण रूपसे बदल देंगे। Content scraping करनेवाले लेख लिखने का श्रेय लेते हैं और उपयोगकर्ताओं (Users) को भ्रमित करते हैं। वे आमतौर पर अपनी वेबसाइट के लिए अधिक विज्ञापन राजस्व (Ad revenue) प्राप्त करने के लिए ऐसा करते हैं।

क्या सामग्री स्क्रैपर्स आपकी वेबसाइट को नुकसान पहुंचा सकते हैं?
Can Content Scrapers Hurt your Website?

स्क्रैप की गई सामग्री (Content scraping) ब्लैक हैट एसईओ (Black hat SEO) है और यह Google के दिशानिर्देशों के सख्त खिलाफ है।

यह न केवल कुछ मामलों में कॉपीराइट उल्लंघन (Copyright infringement) का गठन करता है बल्कि यह डुप्लिकेट सामग्री (Duplicate content) भी है।

यदि आप अपनी वेबसाइट पर स्क्रैप की गई सामग्री (Content scraping) का उपयोग कर रहे हैं, तो सबसे अधिक संभावना है कि आपको दंडित (Penalized) किया जाएगा या यदि नहीं, तो पहले से ही दंडित (Penalized) किया गया है।

Google इन वेबसाइटों को हटाने का बहुत अच्छा काम करता है। स्क्रैप की गई सामग्री पर भरोसा करने वाली अधिकांश वेबसाइटें रैंक (Rank) नहीं करती हैं और उन्हें कोई ट्रैफ़िक (Traffic) नहीं मिलता है।

अच्छी खबर यह है कि अगर लोग आपकी वेबसाइट से सामग्री चुरा रहे हैं, तो आपको बिल्कुल भी चिंतित नहीं होना चाहिए।

Google हमेशा उन वेबसाइटों को पुरस्कृत करता है जो मूल उच्च गुणवत्ता वाली सामग्री (Google always rewards websites that publish original high-quality content) प्रकाशित करती हैं। इसलिए ऐसे मामलों में जहां लोग आपकी सामग्री की Copy बनाते हैं, आप सुनिश्चित हो सकते हैं कि Google उन पर ध्यान नहीं देगा और आपकोही प्रमोट करेगा।

Google का एल्गोरिथम (Google’s algorithm) यह पहचानने में सक्षम है कि किसी लेख का मूल प्रकाशक कौन (Original publisher of an article) है, भले ही वह अनलिंक हो या कॉपी किए गए लेख में मूल प्रकाशक का कोई उल्लेख न हो।

इसलिए आपको चिंता नहीं करनी चाहिए कि यदि कई वेबसाइटें आपकी सामग्री को स्क्रैप कर रही हैं तो Google उस वेबसाइट को दंडित करेगा।

क्या आपको सामग्री स्क्रैपर्स से लिंक को अस्वीकार करना चाहिए?
Should you Disavow Links from Content Scrapers?

कुछ सामग्री स्क्रैपर्स (Content scrapers) आपकी वेबसाइट से लिंक होंगे। आमतौर पर, वे Google द्वारा दंडित किए जाने से बचने के लिए मूल की वेबसाइट से लिंक करते हैं।

मैंने देखा है कि लोग आस-पास पूछते हैं कि क्या उन्हें इन वेबसाइटों के लिंक को अस्वीकार कर देना चाहिए क्योंकि उनमें से अधिकांश, यदि नहीं, तो निम्न-गुणवत्ता वाली वेबसाइटें (Low-quality websites) हैं।

इन वेबसाइटों के लिंक को अस्वीकार करना आवश्यक नहीं है क्योंकि कभी-कभी, यह आपकी वेबसाइट की मदद कर सकता है, यहाँ तक कि थोड़े से के लिए भी।

यदि आप खराब एंकर टेक्स्ट (Anchor texts), बेहद खराब वेबसाइट गुणवत्ता (Low Quality Websites), वयस्क सामग्री (Adult Content) इत्यादि जैसे सामग्री स्क्रैपर्स से लिंक को अस्वीकार करने पर विचार कर सकते हैं।

जब तक आप अपनी वेबसाइट पर मूल सामग्री प्रकाशित (Original content) करते हैं, तब तक आप यह जानकर रात को बेहतर नींद ले सकते हैं कि आपकी वेबसाइट उन लोगों से प्रभावित नहीं होगी जो आपकी नकल करते हैं। Google को अपना निजी अभिभावक (Google as your personal guardian) समझें। वे इन सामग्री स्क्रैपर्स से आपकी रक्षा करेंगे।

हमेशा अन्य वेबसाइटों से सामग्री की प्रतिलिपि बनाने से बचें, चाहे वह एक लेख हो, एक अनुच्छेद हो, या सामग्री स्क्रैपिंग के माध्यम से अवैध रूप से एक वाक्य हो।

आप अपने द्वारा लिखे जा रहे मूल लेख के हिस्से के रूप में हमेशा अन्य वेबसाइटों का हवाला दे सकते हैं। और उन्हें लिंक करके और उन्हें क्रेडिट देकर उन्हें ठीक से उद्धृत करना याद (Giving them credits) रखें।

LEAVE A REPLY

Please enter your comment!
Please enter your name here