• 2024-06-30

Definition af Web Spidering og Web Crawlers

SCIENTIFICALLY ACCURATE ™: SPIDER-MAN

SCIENTIFICALLY ACCURATE ™: SPIDER-MAN

Indholdsfortegnelse:

Anonim

Edderkopper er programmer (eller automatiserede scripts), der 'kryber' via internettet på udkig efter data. Edderkopper rejser gennem webadresser og kan trække data fra websider som e-mail-adresser. Edderkopper er også vant til at foder information fundet på hjemmesider til søgemaskiner.

Edderkopper, der også omtales som "web crawlere" søger på internettet og ikke alle er venlige i deres hensigt.

Spammere Spider Websites at indhente oplysninger

Google, Yahoo! og andre søgemaskiner er ikke de eneste, der er interesseret i at gennemgå websites - det er også svindlere og spammere.

Edderkopper og andre automatiserede værktøjer bruges af spammere til at finde e-mail-adresser (på internettet er denne praksis ofte omtalt som "høsting") på websteder og derefter bruge dem til at oprette spamlister.

Edderkopper er også et værktøj, der bruges af søgemaskiner for at finde ud af mere information om dit websted, men efterladt ukontrolleret, kan et websted uden instruktioner (eller "tilladelser") om, hvordan man gennemgår dit websted, udgøre store informationssikkerhedsrisici. Edderkopper rejser ved at følge links, og de er meget dygtige til at finde links til databaser, programfiler og andre oplysninger, som du måske ikke vil have, at de har adgang til.

Webmastere kan se logfiler for at se, hvilke edderkopper og andre robotter har besøgt deres websteder. Disse oplysninger hjælper webmastere med at vide, hvem der indekserer deres websted, og hvor ofte.

Disse oplysninger er nyttige, fordi det giver webmastere mulighed for at finjustere deres SEO og opdatere robot.txt-filer for at forbyde visse robotter at krybe deres websted i fremtiden.

Tips til beskyttelse af dit websted fra uønskede robotkrydsere

Der er en ret simpel måde at holde uønskede crawlere ud af din hjemmeside. Selvom du ikke er bekymret for ondsindede edderkopper, der gennemsøger dit websted (forvirrende e-mail-adresse beskytter dig ikke for de fleste crawlere), skal du stadig give søgemaskinerne vigtige instruktioner.

Alle websteder skal have en fil placeret i rodmappen kaldet en robots.txt-fil. Denne fil giver dig mulighed for at instruere webcrawlere, hvor du vil have dem til at kigge på indekssider (medmindre andet er angivet i en bestemt sides meta-data, der ikke er indekseret), hvis de er en søgemaskine.

Ligesom du kan fortælle ønskede crawlere, hvor du vil have dem til at surfe, kan du også fortælle dem, hvor de måske ikke går, og endda blokere specifikke crawlere fra hele din hjemmeside.

Det er vigtigt at huske på, at en godt sammensat robots.txt-fil vil have stor værdi for søgemaskiner og kunne endda være et centralt element i forbedringen af ​​din websteds ydeevne, men nogle robotkrydsere vil stadig ignorere dine instruktioner. Af denne grund er det vigtigt at holde al din software, plugins og apps opdateret til enhver tid.

Relaterede artikler og oplysninger

På grund af forekomsten af ​​informationshøst brugt til falske (spam) formål blev lovgivningen vedtaget i 2003 for at gøre visse former for praksis ulovlig. Disse forbrugerbeskyttelseslove falder ind under CAN-SPAM Act fra 2003.

Det er vigtigt, at du tager dig tid til at læse om CAN-SPAM-loven, hvis din virksomhed engagerer sig i massemail eller informationshøst.

Du kan finde ud af mere om anti-spam love og hvordan du håndterer spammere, og hvad du som virksomhedsejer måske ikke gør ved at læse følgende artikler:

  • CAN-SPAM Act 2003
  • CAN-SPAM Act Regler for nonprofits
  • 5 CAN-SPAM Regler Small Business Owners skal forstå

Interessante artikler

Farerne ved at sidde og sunde vaner for forfattere

Farerne ved at sidde og sunde vaner for forfattere

Skrivning er normalt en stillesiddende bestræbelse. Modvirker den store sundhedsfare i skrivesektoren - sidder - med disse tip.

Hvorfor målindstilling oftest mislykkes

Hvorfor målindstilling oftest mislykkes

Målindstilling kan antænde din entusiasme og give solid retning. Disse tips fortæller dig, hvordan du når dine mål og hvordan du undgår fejl.

Oversigt over forsvarssproginstituttet

Oversigt over forsvarssproginstituttet

Den primære fremmedsprogsuddannelsesinstitution inden for forsvarsministeriet gennemfører fuldtidsuddannelse i fremmedsprog.

Skrive tegn i fiktion

Skrive tegn i fiktion

Lær om tegn i fiktion og hvordan de kan udvikles dybt eller overfladisk, afhængigt af hvilken rolle de spiller i din historie.

Definitionen af ​​retsmedicinsk videnskab

Definitionen af ​​retsmedicinsk videnskab

Lær om retskriminalitetens rolle i straffesager og civilretlige sager. Find ud af, om en karriere på dette område passer til dig.

Army Re-Enlistment og andre bonusser

Army Re-Enlistment og andre bonusser

Lær mere om re-enlistment og andre former for bonusser, der stimulerer soldater til at blive i hæren.