Սարդեր եւ վեբ սողուններ. Ինչ դուք պետք է իմանաք, կայքի տվյալների պաշտպանությունը
Spiders- ը, որոնք նաեւ կոչվում են «վեբ սարդակներ», որոնում են վեբը, եւ ոչ բոլորն էլ իրենց մտերիմ են:
Spammers Spider Websites հավաքելու տեղեկատվություն
Google, Yahoo!
եւ այլ որոնման համակարգերը միակ չեն, որոնք շահագրգռված են վեբ կայքերի համար, այնպես էլ scammers- ը եւ spammers- ը:
Spiders- ը եւ այլ ավտոմատացված գործիքները օգտագործվում են սպամերների կողմից, վեբ-կայքերում էլեկտրոնային փոստի հասցեները գտնելու համար (այդ պրակտիկան սովորաբար կոչվում է «բերքահավաք») եւ այնուհետեւ դրանք օգտագործում են սպամ ցուցակների ստեղծման համար:
Սարդերը նաեւ որոնման համակարգերի կողմից օգտագործված գործիք են, ձեր կայքի մասին ավելի շատ տեղեկություններ ստանալու համար, բայց չհրապարակված են, առանց կայքի թույլտվության առանց կայքի թույլտվության (կամ «թույլտվություններ»), որը կարող է ներկայացնել տեղեկատվական անվտանգության մեծ ռիսկեր: Ուղղորդողները ճանապարհորդում են հետեւյալ հղումներով, եւ նրանք շատ վարպետ են գտնել տվյալների բազաների, ծրագրային ֆայլերի եւ այլ տեղեկությունների որոնում, որոնցից դուք չեք կարող նրանց մուտք ունենալ:
Webmasters- ն կարող է դիտել տեղեկամատյանները `տեսնելով, թե ինչ են պատրաստված spiders եւ այլ ռոբոտներ այցելել իրենց կայքերը: Այս տեղեկատվությունը օգնում է վեբ-վարպետներին, թե ով է ինդեքսավորում իրենց կայքը եւ որքան հաճախ:
Այս տեղեկատվությունը օգտակար է, քանի որ այն թույլ է տալիս վեբ վարպետներին կատարելապես կարգավորել իրենց SEO- ը եւ թարմացնել robot.txt ֆայլերը `արգելելու որոշ ռոբոտներին ապագայում իրենց կայքի տարածումը:
Ձեր կայքէջը պաշտպանելու վերաբերյալ խորհուրդներ անցանկալի ռոբոտների ծուղակներից
Կա միանգամայն պարզ եղանակ, որ ձեր կայքից հեռացնեք անցանկալի ծխողներ: Նույնիսկ եթե դուք չեք մտահոգված վնասակար թրթուրներով, ձեր վեբկայքը քողարկողը (գաղտնալսող էլփոստի հասցեն չի պաշտպանում ձեզ ամենաքիչ ծղրիդներից), անհրաժեշտ է նաեւ ապահովել որոնման համակարգերը կարեւոր հրահանգներով:
Բոլոր կայքերը պետք է ունենան ֆայլ `roots directory- ում, որը կոչվում է robots.txt: Այս ֆայլը Ձեզ թույլ է տալիս հրահանգել վեբ բեռնաթափիչները, որտեղ դուք ցանկանում եք դրանք նայել ինդեքս էջեր (եթե այլ բան նշված չէ կոնկրետ էջի մետա տվյալների մեջ, ինդեքսավորված չլինելու դեպքում), եթե դրանք որոնման համակարգ են:
Ճիշտ այնպես, ինչպես դուք կարող եք հայտնաբերել խուզարկուների փնտրտուքներ, որտեղ դուք ցանկանում եք նրանց դիտել, կարող եք նաեւ ասել, թե որտեղ նրանք չեն կարող գնալ եւ նույնիսկ արգելափակել հատուկ սայթաքերներ ձեր ամբողջ կայքում:
Կարեւոր է հաշվի առնել, որ robots.txt ֆայլը լավ է դարձնում որոնման համակարգերի համար եւ կարող է նույնիսկ լինել ձեր կայքի գործունեության բարելավման առանցքային տարր, սակայն որոշ ռոբոտների տարրեր դեռեւս անտեսում են ձեր հրահանգները: Այդ իսկ պատճառով կարեւոր է պահել ձեր բոլոր ծրագրաշարը, պլագինները եւ ծրագրերը մինչեւ ամեն օր:
Related Articles եւ տեղեկություններ
Անհամար (սպամ) նպատակներով օգտագործվող տեղեկատվության հավաքման տարածվածության պատճառով օրենսդրությունը ընդունվել է 2003 թվականին `որոշակի պրակտիկայում ապօրինի գործողություններ կատարելու համար: Այս սպառողների պաշտպանության մասին օրենքները ներառում են 2003 թ. CAN-SPAM ակտը:
Կարեւոր է, որ ժամանակն անցնեք CAN-SPAM Act- ում կարդալու համար, եթե ձեր բիզնեսը զբաղվի որեւէ զանգվածային փոստով կամ տեղեկատվության հավաքագրմամբ:
Դուք կարող եք ավելին իմանալ հակահայկական սպամի օրենքների եւ ինչպես վարվել spammers- ի հետ, եւ այն, ինչ դուք որպես բիզնեսի սեփականատեր չեք կարող անել, կարդալով հետեւյալ հոդվածները.
- CAN-SPAM Act 2003
- CAN-SPAM- ի օրենքը առեւտրային կազմակերպությունների համար
- 5 ԿԱՐՈՂ-ՍՊԱՄ-ի կանոնները Փոքր բիզնեսի սեփականատերերը պետք է հասկանան