• 2024-10-31

Definition af Web Spidering og Web Crawlers

SCIENTIFICALLY ACCURATE ™: SPIDER-MAN

SCIENTIFICALLY ACCURATE ™: SPIDER-MAN

Indholdsfortegnelse:

Anonim

Edderkopper er programmer (eller automatiserede scripts), der 'kryber' via internettet på udkig efter data. Edderkopper rejser gennem webadresser og kan trække data fra websider som e-mail-adresser. Edderkopper er også vant til at foder information fundet på hjemmesider til søgemaskiner.

Edderkopper, der også omtales som "web crawlere" søger på internettet og ikke alle er venlige i deres hensigt.

Spammere Spider Websites at indhente oplysninger

Google, Yahoo! og andre søgemaskiner er ikke de eneste, der er interesseret i at gennemgå websites - det er også svindlere og spammere.

Edderkopper og andre automatiserede værktøjer bruges af spammere til at finde e-mail-adresser (på internettet er denne praksis ofte omtalt som "høsting") på websteder og derefter bruge dem til at oprette spamlister.

Edderkopper er også et værktøj, der bruges af søgemaskiner for at finde ud af mere information om dit websted, men efterladt ukontrolleret, kan et websted uden instruktioner (eller "tilladelser") om, hvordan man gennemgår dit websted, udgøre store informationssikkerhedsrisici. Edderkopper rejser ved at følge links, og de er meget dygtige til at finde links til databaser, programfiler og andre oplysninger, som du måske ikke vil have, at de har adgang til.

Webmastere kan se logfiler for at se, hvilke edderkopper og andre robotter har besøgt deres websteder. Disse oplysninger hjælper webmastere med at vide, hvem der indekserer deres websted, og hvor ofte.

Disse oplysninger er nyttige, fordi det giver webmastere mulighed for at finjustere deres SEO og opdatere robot.txt-filer for at forbyde visse robotter at krybe deres websted i fremtiden.

Tips til beskyttelse af dit websted fra uønskede robotkrydsere

Der er en ret simpel måde at holde uønskede crawlere ud af din hjemmeside. Selvom du ikke er bekymret for ondsindede edderkopper, der gennemsøger dit websted (forvirrende e-mail-adresse beskytter dig ikke for de fleste crawlere), skal du stadig give søgemaskinerne vigtige instruktioner.

Alle websteder skal have en fil placeret i rodmappen kaldet en robots.txt-fil. Denne fil giver dig mulighed for at instruere webcrawlere, hvor du vil have dem til at kigge på indekssider (medmindre andet er angivet i en bestemt sides meta-data, der ikke er indekseret), hvis de er en søgemaskine.

Ligesom du kan fortælle ønskede crawlere, hvor du vil have dem til at surfe, kan du også fortælle dem, hvor de måske ikke går, og endda blokere specifikke crawlere fra hele din hjemmeside.

Det er vigtigt at huske på, at en godt sammensat robots.txt-fil vil have stor værdi for søgemaskiner og kunne endda være et centralt element i forbedringen af ​​din websteds ydeevne, men nogle robotkrydsere vil stadig ignorere dine instruktioner. Af denne grund er det vigtigt at holde al din software, plugins og apps opdateret til enhver tid.

Relaterede artikler og oplysninger

På grund af forekomsten af ​​informationshøst brugt til falske (spam) formål blev lovgivningen vedtaget i 2003 for at gøre visse former for praksis ulovlig. Disse forbrugerbeskyttelseslove falder ind under CAN-SPAM Act fra 2003.

Det er vigtigt, at du tager dig tid til at læse om CAN-SPAM-loven, hvis din virksomhed engagerer sig i massemail eller informationshøst.

Du kan finde ud af mere om anti-spam love og hvordan du håndterer spammere, og hvad du som virksomhedsejer måske ikke gør ved at læse følgende artikler:

  • CAN-SPAM Act 2003
  • CAN-SPAM Act Regler for nonprofits
  • 5 CAN-SPAM Regler Small Business Owners skal forstå

Interessante artikler

Vanity Presses og Self Publishing i dag

Vanity Presses og Self Publishing i dag

Mens vanitypresser har længe eksisteret, gør dagens teknologier det lettere at oprette og distribuere selvudgivne bøger til markedet.

Hvorfor arbejdsgivere tilbyder variabel betaling for at beholde medarbejderne

Hvorfor arbejdsgivere tilbyder variabel betaling for at beholde medarbejderne

Variabel løn bruges til at anerkende og belønne medarbejderbidrag. Det er nøglen i en ydelsespakke, der vil tiltrække de bedste medarbejdere. Lær mere.

Ver-a-Fast Jobs - Profil af Verafast Home Call Center Jobs

Ver-a-Fast Jobs - Profil af Verafast Home Call Center Jobs

Opkaldscenter Vir Ver-a-Fast ansætter agenter til at arbejde hjemme hjemme som uafhængige entreprenører. Læs mere om Verafast i denne virksomheds profil.

Hvad skal man vide om luftfartssikkerhedsaktionsprogrammet

Hvad skal man vide om luftfartssikkerhedsaktionsprogrammet

Luftfartssikkerhedsaktionsprogrammet (ASAP) er et frivilligt rapporteringsprogram, hvor flyselskaber samarbejder med FAA for at forbedre flyvesikkerheden.

Verbal kommunikation er en væsentlig blød færdighed

Verbal kommunikation er en væsentlig blød færdighed

Verbal kommunikation er en væsentlig blød færdighed for effektivt at kommunikere på arbejdspladsen.

Verbal kommunikationsfærdigheder liste og eksempler

Verbal kommunikationsfærdigheder liste og eksempler

Hvad er verbal kommunikation, hvorfor arbejdsgivere værdsætter det, og eksempler på verbal kommunikationsfærdigheder til brug i CV'er, dækbreve og jobsamtaler.