For nylig var eruditionen til en god pris. Men i dag er kendskabet til alle verdens hovedstæder og de mindste historiske detaljer absolut ubrugelig. I stedet for at fylde din hjerne til ingen med de nødvendige fakta, er det nok bare at vide, hvilken slags søgemaskiner der er på internettet. Alt andet vil løse den smarteste softwarealgoritme.

KORT BESKRIVELSE AF SØGNINGER

Søgemaskinen er et softwaresystem, der er beregnet til at søge efter information i World Wide Web. Resultaterne af anmodningen som regel præsenteres i form af en side af udstedelse bestående af et dusin kort tekstblokke (uddrag) i kombination med multimedieindhold.

I dag er der omkring et og et halvt dusin internationale data søgeværktøjer. Alle arbejder efter de samme principper:

  1. Ansvarlig for indsamling af oplysninger krauleler. - robot (lettere - et specielt program), som "crawls" fra webstedet til webstedet og går ind i indekset forskellige typer data (sideindhold, software scenarier, meta tags osv.);
  2. Efter at have tilføjet til indekset bliver oplysningerne tilgængelige for en almindelig bruger gennem søgestrengens grænseflade;
  3. Udstedelsen på resultatsiden er rangeret på en særlig måde. Nøgleindikatoren er relevans. - Overholdelse af den oprindelige anmodning.

Sådan bruges søgemaskinen?

Udviklerne af disse systemer gjorde deres bedste for at arbejde sammen med dem alle, selv et barn. Og du skal sige, de lykkedes:

  1. For at henvise til søgemaskinen er det nok at gå til hendes officielle hjemmeside. Udformningen af \u200b\u200bstartsiderne kan variere, men linjen for indtastning af teksten vil nødvendigvis være på det mest fremtrædende sted;
  2. En endnu nemmere måde er at opgave anmodningen via adresselinjen i browseren. De fleste moderne browsere understøtter denne funktion;
  3. Hvis teksten i en bestemt situation er vanskelig eller umulig, kan du bruge Voice Input-funktionen (begynder ved at trykke på ikonet med mikrofonen);
  4. Efter en splittet sekund efter cirkulation udsteder systemet resultater;
  5. Du kan bruge logiske operatører til at accelerere søgningen. Således tilføjer et "minus" tegn før ordet udelukker det fra udstedelse, "plus" -tegnet - informere søgemaskinen, at dette ord skal være i den kunstneriske tekst, og sætningen i citater lancerer søgningen efter en præcis sætning;
  6. Hvis du ikke har fundet de nødvendige oplysninger, er du ikke problemer. Ingen generer at drage fordel af en anden tjeneste. Vi vil gennemgå de vigtigste aktører på dette marked.

Gennemse Key Services.

Ved århundredet havde næsten alle staterne sin egen nationale søgemaskine. Men efter et par år har konkurrencen kun efterladt flere globale spillere:

  • Google. - Uundgåelig markedsleder. Det tegner sig for løvens andel af verdenssøgningstrafikken. I udviklede lande varierer dens andel fra 80 til 90%. I Rusland er maskinens succeser ikke så imponerende: kun 40% andel;
  • Yandex. - Hovedkonkurrenten for Google i Rusland er i øjeblikket besat af et ledende sted, i henhold til ændringen af \u200b\u200bsøgealgoritmen i 2017 begyndte gradvist at miste sin position;
  • - Rangerede tredje i runet (ca. 5%), søgningen fra det berømte russiske selskab er en del af Mail.ru Group, som ejer de sociale netværk "Vkontakte", "odnoklassniki", søgemaskine Nigma (beskriver det nedenfor), Qiwi Betaling system og en masse andre.
  • Bing. - Service fra Microsoft. De bedste resultater giver primært på engelsk. Det russisktalende segment er praktisk taget ikke udviklet. Dette forhindrer imidlertid ikke Bing til at være et søgemaskine nummer 2 i verden (7%);
  • Dernæst følger en lille margin et kinesisk selskab "Baid"som tjener på hovedmarkederne i Østasien (Kina og Japan). I Vesten og i Rusland er det kendt lille;
  • Yahoo! - stod ved oprindelsen af \u200b\u200bden moderne kugle af høje teknologier, men tabt i en konkurrencedygtig kamp. I dag bruger beslutningen fra "Microsoft";
  • Nigma. - Når den populære søgemaskine, der blev grundlagt af russiske programmører i 2005, er nu næsten mistet en brøkdel af trafikken;
  • Duckduckgogo. - Poster sig selv som en tjeneste, omhyggeligt relateret til brugerdata for brugere (der er ingen cache-samling og personalisering).

Yandex: "Vores alle" i runet

Samtalen om søgningen efter information om netværket ville være ufuldstændigt uden at nævne en nøgleafspiller på det russiske marked - Yandex. Hendes grundlæggere af Arkady Volozh og Ilya Segalovich lancerede et joint venture, før det nye Google-mærke vises. I mange årtier har søgemaskinen udgivet i toppen af \u200b\u200bden største i verden (№4 siden 2014).

Hovedårsagen til et sådant fænomen er den højeste kvalitet af tjenesten:

  • Yandex lancerede først en søgning med russisk morfologi. Denne innovation tillod ham i 2001 at zounce den daværende Giant af IT-industrien af \u200b\u200bRambler;
  • Siden 2009 er tjenesten begyndt at tage hensyn til brugerens område. Takket være dette modtog regionale steder en impuls til udvikling;
  • I samme år blev matrixnets maskinindlæringsalgoritme lanceret, hvilket signifikant øgede hastigheden og kvaliteten af \u200b\u200btjenesten betydeligt;
  • Parallelt blev det engelsktalende websted udviklet, for hvilket Yandex lejede et kontor i Californien;
  • I 2012 begyndte resultaterne af anmodningen at tage hensyn til de personlige præferencer hos en bestemt bruger.

Systemets popularitet vokser konstant: Fra 2001 til 2017 steg trafikmængden 280 gange. Men som vi skrev tidligere, efter den kardinale ændring af algoritmen i 2017, begyndte Yandex at miste andelen af \u200b\u200bsine besøgende til fordel for Google, for at se de fulde statistikker over ROUNT-trafikken i øjeblikket ved reference.

Sådan slettes oplysninger om dig selv fra søgemaskinen?

Internettet er ikke kun en velsignelse for hele menneskeheden, men også en potentiel trusselskilde. Nogle af dem skaber en betydelig fare for personlige data fra almindelige brugere. Efter indtastning af netværket er selv den mest offensive information umulig.

Så i det mindste var det indtil for nylig. Fra januar 2016 i Rusland er der en lov "i retten til Oblivion". Nu kan hver person, der ikke passer til sit ry i den virtuelle verden, rense den med en helt lovlig måde. Til dette har du brug for:

  1. Indsende en passende erklæring organisation, der leverer søgetjenester
  2. Vedhæft alle mulige tegn på forfalskning og irrelevansen af \u200b\u200bde data, der foreslås at blive fjernet fra udstedelsen
  3. De fleste søgemaskiner letter brugerens opgave. Du kan sende den rigtige anmodning via en særlig online formular (for Yandex);
  4. I ti dage vil selskabet kontrollere ansøgningen om tilstedeværelse af juridiske grunde;
  5. Med et positivt resultat skal oplysningerne fjernes fra indekset;
  6. Hvis begrundelsen for fjernelse ikke er etableret, skal organisationen underrette ansøgeren om dette.

Yuri Vymeminskys permanente ledende program i et af de nævnte interviews, da Bulgakova opdagede et usædvanligt ord på Bulgakov og forsøgte at finde sin betydning. Arbejdet i biblioteket tog hele året (!). I dag er det umuligt at indsende denne situation: Der er mange søgemaskiner på internettet. Et klik - og alle kan forbinde til verdens sind.

Video Review Anonym Search Engines

I denne video vil Anton Morozov fortælle dig, hvilken slags søgemaskiner, der bevarer den fulde brugers fortrolighed, er:

Ved første øjekast kan det synes at være bedre end Google kun kan "Yandex", og selv det er ikke en kendsgerning. Disse virksomheder investerer store mængder i innovation. Har nogen engang en chance for ikke kun at konkurrere med ledere, men også at vinde? LifeHaker's svar: "Ja!" Der er flere søgemaskiner, der lykkedes. Lad os se på vores helte.

Hvad er det

Dette er en temmelig velkendt open source søgemaskine. Servere er i USA. Ud over sin egen robot bruger søgemaskinen resultaterne af andre kilder: Yahoo! Søg chef, wikipedia, wolfram | alpha.

Des bedre

Duckduckgo stiller sig selv som en søgning, der giver maksimal privatliv og fortrolighed. Systemet indsamler ikke nogen brugerdata, gemmer ikke logfiler (ingen søgehistorik), brugen af \u200b\u200bcookies er begrænset som muligt.

Duckduckgo indsamler ikke personlige oplysninger fra brugere og er ikke opdelt af den. Dette er vores privatlivspolitik.
Gabriel Weinberg (Gabriel Weinberg), Grundlægger Duckduckgo

Hvorfor har du brug for

Alle større søgemaskiner forsøger at personliggøre søgeresultater baseret på en persons data foran skærmen. Dette fænomen blev kaldt "filterboblen": Brugeren ser kun de resultater, der er i overensstemmelse med sine præferencer, eller som systemet anser dem.

Duckduckgo udgør et objektivt billede, der ikke afhænger af din tidligere adfærd på netværket, og eliminerer Google og Yandex's tematiske reklame baseret på dine anmodninger. Ved hjælp af Duckduckgo er det nemt at søge information på fremmedsprog: Google og Yandex standardindstillinger foretrækker russiske talende websteder, selvom anmodningen er indtastet på et andet sprog.

Hvad er det

"" - Det russiske metapoisk system udviklet af MSU kandidater Viktor Lavrenko og Vladimir Chernyshov. Søgninger efter Google, Bing, Yandex indekser og andre, og har også sin egen søgning algoritme.

Des bedre

Søgning efter indekser af alle større søgemaskiner giver dig mulighed for at danne relevant udstedelse. Derudover bryder Nigma resultaterne i flere tematiske grupper (klynger) og giver brugeren at indsnævre søgefeltet, kaste unødig eller fremhæve prioritet. Takket være matematik og kemi moduler er det muligt at løse matematiske opgaver direkte i søgelinjen og anmode om resultaterne af kemiske reaktioner.

Hvorfor har du brug for

Sikrer behovet for at kigge efter samme forespørgsel i forskellige søgemaskiner. Cluster-systemet giver dig mulighed for nemt at manipulere søgeresultater. For eksempel indsamler NIGMA resultater fra onlinebutikker til en separat klynge. Hvis du ikke har til hensigt at købe noget, skal du blot udelukke denne gruppe. Ved at vælge en klynge "engelsktalende websteder", vil du kun modtage udstedelse på engelsk. Moduler "Matematik" og "Chemistry" vil hjælpe til skolebørn.

Desværre udvikler projektet i øjeblikket ikke, da udviklerne har flyttet deres aktivitet til det vietnamesiske marked. Ikke desto mindre er Nigma ikke kun ikke forældet endnu, men i nogle ting giver stadig Googles hoveder. Lad os håbe, at udviklingen vil genoptage.

Hvad er det

ikke ondt er et søgeord for et anonymt tor netværk. For at bruge, skal du gå til dette netværk, for eksempel at køre en specialiseret browser med samme navn. Ikke ondt er ikke den eneste søgemaskine på sin egen måde. Der er et udseende (standardsøgningen i TOR-browseren er tilgængelig fra det sædvanlige internet) eller fakkel (en af \u200b\u200bde ældste søgemaskiner i TOR-netværket) og andre. Vi stoppede ved ikke ondt på grund af det utvetydige antydning af Google selv (bare se på startsiden).

Des bedre

Leder du efter, hvor Google, Yandex og andre søgemaskiner er lukket i princippet.

Hvorfor har du brug for

I TOR-netværket, mange ressourcer, der ikke kan findes i det lovlydige internet. Og da kontrollen mellem myndighederne over netværket er hårdere, vil deres antal vokse. Tor er en slags netværk inde i netværket: med deres samfund, torrent trackers, medier, handelsplatforme, blogs, biblioteker og så videre.

Yacy.

Hvad er det

Yacy er en decentraliseret søgemaskine, der opererer på P2P-netværksprincippet. Hver computer, hvor hovedsoftwaremodulet er installeret, scanner internettet uafhængigt, det vil sige en analog af søgerobotten. Resultaterne samles i en fælles base, at alle deltagere i Yacacy anvendes.

Des bedre

Det er svært at tale her, det er bedre eller værre, da Yacy er en helt anden tilgang til organisationen af \u200b\u200bsøgningen. Fraværet af en enkelt server og ejerens firma gør resultaterne helt uafhængige af en persons præferencer. Autonomien i hver node eliminerer censur. Yacacy er i stand til at søge i deep web og ikke-indekserede fælles netværk.

Hvorfor har du brug for

Hvis du er en tilhænger af åben software og gratis internet, ikke påvirket af statslige organer og store virksomheder, så er Yacy dit valg. Det kan også bruges til at organisere en søgning inden for et corporate eller andet offline netværk. Og selvom YACY ikke er for nyttigt for nu, er det et værdigt alternativ til Google fra søgeprocesens synspunkt.

Pipl.

Hvad er det

Pipl er et system designet til at finde oplysninger om en bestemt person.

Des bedre

Forfatterne af pipl hævder, at deres specialiserede algoritmer søger mere effektive end "almindelige" søgemaskiner. Navnlig er de prioriterede informationskilder sociale netværksprofiler, kommentarer, deltagere lister og forskellige databaser, som offentliggør oplysninger om mennesker, som f.eks. Basis af retsafgørelser. Pipl lederskab på dette område bekræftes af estimaterne af Lifehacker.com, TechCrunch og andre publikationer.

Hvorfor har du brug for

Hvis du har brug for at finde oplysninger om en person, der bor i USA, vil Piplen være meget mere effektiv end Google. Database af russiske domstole, tilsyneladende ikke tilgængelig for søgemaskinen. Derfor, med borgere fra Rusland, klare han ikke så godt.

Hvad er det

En anden specialiseret søgemaskine. Leder du efter forskellige lyde (hus, natur, biler, folk og så videre) i åbne kilder. Tjenesten understøtter ikke anmodninger på russisk, men der er en imponerende liste over russisktalende tags, som du kan søge.

Des bedre

I udstedelse kun lyde og intet overflødigt. I søgningsindstillingerne kan du indstille det ønskede format og lydkvalitet. Alle fundne fundet er tilgængelige til download. Der er en søgning efter prøve lyde.

Hvorfor har du brug for

Hvis du hurtigt har brug for at finde lyden af \u200b\u200bet muscutty skud, blæser en Dyatla-pølse eller et Gomer Simpson, så denne tjeneste er for dig. Og jeg valgte det kun fra overkommelige russisktalende anmodninger. På engelsk er spektret endnu bredere. Og hvis det er seriøst, involverer den specialiserede tjeneste et specialiseret publikum. Men pludselig vil du komme til nytte?

Livet på alternative søgemaskiner er ofte et køretøj. For de langsigtede udsigter for sådanne projekter spurgte LifeHaker den tidligere generaldirektør for den ukrainske gren af \u200b\u200bYandex, Sergei Petrenko.

Hvad angår skæbnen hos alternative søgemaskiner, er det enkelt: at være meget nicheprojekter med et lille publikum, derfor uden klare kommercielle udsigter eller tværtimod med en fuldstændig klarhed om deres fravær.

Hvis du ser på eksemplerne i artiklen, kan det ses, at sådanne søgemaskiner enten er specialiseret i en smal, men efterspurgt niche, som muligvis ikke er vokset så meget at være mærkbar på Google Radar eller Yandex, eller Test den oprindelige hypotese i ranking, som ikke gælder i den sædvanlige søgning.

For eksempel, hvis søgningen af \u200b\u200bTOR pludselig viser sig at være efterspurgt, det vil sige, at resultaterne herfra vil være nødvendige i det mindste en procentdel af Googles publikum, så vil almindelige søgemaskiner selvfølgelig begynde at løse problemet, hvordan Find dem og vis dem. Hvis publikums adfærd viser, at en mærkbar andel af brugere i mærkbare forespørgsler synes at være mere relevante, vil data uden hensyntagen til de brugerafhængige faktorer, så YANDEX eller Google vil begynde at give sådanne resultater.

"For at være bedre" i sammenhæng med denne artikel betyder ikke "være bedre i alt". Ja, i mange aspekter er vores helte langt fra Google, og Yandex (selv til Bing er fjernt). Men dette giver hver af disse tjenester brugeren noget, som søgningsindustrien giganter ikke kan tilbyde.

Søgemaskiner (PS) er allerede anstændigt tid er en obligatorisk del af internettet. I dag er de enorme og mest komplicerede mekanismer, der ikke kun er et redskab til at finde nogen nødvendige oplysninger, men også ret spændende områder for erhvervslivet.


Mange søgningsbrugere har aldrig tænkt på principperne om deres arbejde, om, hvordan man håndterer brugeranmodninger, hvordan systemdataene er bygget og fungerer. Dette materiale vil hjælpe folk, der er involveret i optimering og forstår enheden og de grundlæggende funktioner i søgemaskiner.

Funktioner og koncept PS

Søgesystem - Dette er en hardware- og softwarepakke, der er beregnet til at implementere internetsøgningsfunktionen, og reagere på en brugerforespørgsel, der normalt er angivet som en tekst sætning (eller mere præcis søgeforespørgsel), der udsteder en referenceliste til informationskilder udført af relevans. De mest almindelige og store søgesystemer: Google, Bing, Yahoo, Baidu. I runet - yandex, mail.ru, rambler.

Overvej mere detaljeret værdien af \u200b\u200bselve søgeforespørgslen, idet du f.eks. Tager YANDEX SYSTEMET.

Anmodningen skal formuleres af brugeren i fuld overensstemmelse med emnet for hans søgning, så enkelt som muligt og kort. For eksempel ønsker vi at finde oplysninger i denne søgemaskine: "Sådan vælger du en bil til dig selv." For at gøre dette skal du åbne hovedsiden og indtaste en anmodning om at søge "Sådan vælger du en bil." Derefter reduceres vores funktioner for at indtaste linkene til informationskilder, der leveres på netværket.




Men selv at handle på denne måde, kan du og ikke få de oplysninger, du har brug for. Hvis vi fik et lignende negativt resultat, skal du bare reformere din anmodning, eller i søgedatabasen er der virkelig ingen nyttige oplysninger om denne type anmodning (sådan er helt mulig på de specificerede "smalle" forespørgselsparametre, som f.eks. , "Sådan vælger du en bil i Anadyri").

Den mest grundlæggende opgave for hver søgemaskine er at levere til folk præcis den type information, de har brug for. Og for at forpligte brugere at oprette "korrekt" type anmodninger om søgemaskiner, det vil sige sætninger, der vil svare til deres principper for arbejde, praktisk taget umuligt.

Derfor gør søgemaskineudviklingsspecialister sådanne principper og algoritmer af deres arbejde, der vil give brugerne mulighed for at finde deres oplysninger. Det betyder, at systemet skal "tænke", ligesom en person mener, når du finder de nødvendige oplysninger på internettet.

Når han går ind i sin anmodning til søgemaskinen, ønsker han at finde det, han har brug for, så let som muligt og hurtigere. Efter at have modtaget resultatet, tegner brugeren sin vurdering af systemet, der styres af flere kriterier. Fik han til at finde de nødvendige oplysninger? Hvis ikke, hvor mange gange skulle det reformere teksten til forespørgslen for at finde den? Hvor relevante oplysninger blev de opnået? Hvor hurtigt har søgemaskinen behandlet sin anmodning? Hvor komfortable var søgeresultater? Var det nødvendige resultat først, eller var placeret på et 30. plads? Hvor mange "skrald" (unødvendige oplysninger) blev fundet med nyttige oplysninger? Vil der være en relevant information til det, når du bruger PS, om en uge eller i en måned?




For at få de rigtige svar på sådanne spørgsmål forbedrer søgemaskinerne konstant principperne om rangering og dets algoritmer, tilføjer dem nye muligheder og funktioner, og ethvert middel forsøger at gøre systemet hurtigere.

Hovedkarakteristika for søgemaskiner

Angiv de vigtigste søgegenskaber:

Fylde.

Fullens er en af \u200b\u200bde vigtigste søgegenskaber, det er forholdet mellem de numre, der blev fundet på anmodning af informationsdokumenter til deres samlede antal på internettet vedrørende denne anmodning. For eksempel er der 100 sider med udtrykket "Sådan vælger du en bil", og i samme forespørgsel var der kun 60 ud af alt, så i dette tilfælde er søgningen fuld af 0,6 0,6. Det er klart, at jo større søger selv, desto større sandsynlighed for, at brugeren vil finde præcis det dokument, han har brug for, selvfølgelig, hvis han overhovedet eksisterer.

Nøjagtighed.

En anden grundlæggende funktion af søgemaskinen er nøjagtighed. Det bestemmer graden af \u200b\u200boverholdelse af brugerens anmodning om de fundne sider på netværket. For eksempel, hvis nøglefrasen "Sådan vælger du en bil", er der hundrede dokumenter, i halvdelen af \u200b\u200bdem indeholder denne sætning, og i resten har du simpelthen sådanne ord (hvordan man vælger en bilradio og installerer den i bil "), så søge nøjagtighed svarende til 50/100 \u003d 0,5.

Than the Search er mere præcis, jo hurtigere vil brugeren finde de oplysninger, du har brug for, desto mindre forskelligt "affald" vil mødes blandt resultaterne, de mindre dokumenter, der ikke er fundet at svare til betydningen af \u200b\u200banmodningen.

Relevans.

Dette er en betydelig del af søgningen, hvilket kendetegner tiden fra øjeblikket for at offentliggøre information på internettet, indtil den er offentliggjort i søgemaskineindeksbase.

For eksempel, den næste dag efter oplysningerne om udgivelsen af \u200b\u200bden nye iPad, vendte mange brugere til søgningen med de tilsvarende typer af anmodninger. I de fleste tilfælde er oplysninger om denne nyhed allerede tilgængelig i søgningen, selvom meget lidt er gået siden udseendet. Dette skyldes tilstedeværelsen af \u200b\u200b"hurtig base" fra store søgemaskiner, som opdateres flere gange om dagen.

Søg hastighed.

Denne funktion, da søgehastigheden er tæt relateret til den såkaldte "stabilitet af belastninger". Hver anden søgning er trukket af et stort antal mennesker, en sådan arbejdsbyrde kræver en betydelig reduktion i tide til at håndtere en anmodning. Her er interesserne for både søgemaskinen og brugeren sammenfaldende: Besøgende ønsker at få resultater så hurtigt som muligt, og søgemaskinen skal fungere så hurtigt som muligt, for ikke at bremse behandlingen af \u200b\u200befterfølgende anmodninger.

Visualitet.

En visuel repræsentation af resultaterne er et væsentligt element i søge bekvemmelighed. Ifølge en lang række anmodninger finder søgemaskinen tusindvis, og i nogle tilfælde millioner af forskellige dokumenter. På grund af fuzziness of the compilation af nøgle sætninger til søgning eller dens ikke nøjagtighed, har selv de allerførste forespørgselsresultater ikke altid kun de nødvendige oplysninger.

Det betyder, at en person ofte har sin egen søgning blandt de leverede resultater. En række komponenter i PS-udstedende sider hjælper med at navigere i søgeresultater.

Historien om udviklingen af \u200b\u200bsøgemaskiner

Da internettet begyndte at udvikle, var antallet af de faste brugere små, og mængden af \u200b\u200binformation for adgang var relativt lille. For det meste havde adgang til dette netværk kun specialister af forskningsområder. På det tidspunkt var opgaven med at finde oplysninger ikke så relevant som nu.

En af de allerførste metoder til at organisere bred adgang til informationsressourcer var oprettelsen af \u200b\u200bwebstedskataloger, og referencerne til dem begyndte at gruppere på emner. Så det første projekt var ressourcen Yahoo.com, som åbnede i foråret 1994. Efterfølgende, når antallet af websteder i Yahoo-mappen steg betydeligt, blev muligheden for at finde de nødvendige oplysninger om kataloget tilføjet. Det har endnu ikke været en søgemaskine, da området for en sådan søgning kun var begrænset af websteder, der er inkluderet i denne mappe, og ikke absolut alle ressourcer på internettet. Link kataloger blev ganske udbredt tidligere, men i øjeblikket mistede næsten fuldt ud deres popularitet.

Når alt kommer til alt, selv i dag, har store kataloger oplysninger om lidt del af hjemmesiderne på internettet. Det mest berømte og store katalog i verden har information om fem millioner websteder, når Google Base indeholder oplysninger om mere end 25 milliarder sider.




Den allerførste rigtige søgemaskine var Webcrawler, som opstod i 1994. år.

Næste år optrådte AltaVista og Lycos. Desuden var den første førende i søgen efter information en lang tid.




I 1997 oprettede Sergey Brin sammen med Larry Page en søgemaskine Google som et forskningsprojekt i Standford University. I dag, Google, den mest populære og populære søgemaskine i verden.




I september 1997 blev Yandex annonceret (officielt), som i øjeblikket er det mest populære søgesystem i runet.




Ifølge N. September 2015.Andelen af \u200b\u200bsøgemaskiner i verden fordeles som følger:
  • Google - 69,24%;
  • Bing - 12,26%;
  • Yahoo! - 9,19%
  • Baidu - 6,48%;
  • AOL - 1,11%;
  • Spørg - 0,23%
  • Excite - 0,00%


Ifølge N. december 2016., Tegn på søgemaskiner i runet:

  • Yandex - 48,40%
  • Google - 45,10%
  • Search.Mail.ru - 5,70%
  • Rambler - 0,40%
  • Bing - 0,30%
  • Yahoo - 0,10%

Principper for søgemaskine

I Rusland er det vigtigste søgesystem Yandex, så Google og derefter [email protected]. Alle store søgeordninger har deres egen struktur, hvilket er meget forskelligt fra andre. Men du kan stadig vælge de vigtigste elementer, der er fælles for alle søgemaskiner.

Indekseringsmodul.

Denne komponent består af tre robotprogrammer:

Edderkop. (på engelsk. Spider) - et program, der er beregnet til at downloade websider. "Spider" downloader en bestemt side, samtidig med at fjerne alle links fra den. HTML-kode downloades med næsten hver side. Til dette bruger robotter HTTP-protokoller.




"Spider" fungerer som følger. Robotten sender en anmodning til serveren "Get / Path / Document" og andre HTTP Query-kommandoer. Som svar modtager robotprogrammet en strøm af tekst, der indeholder oplysningerne om servicetypen og selvfølgelig selve dokumentet.
  • URL på den downloadede side;
  • dato, når siden downloades
  • hTTP Response Server Header;
  • html kode, "krop" sider.
Crawler. ("Rejser" Spider). Dette program går automatisk ind i alle links, der findes på siden, og fremhæver også dem. Hans opgave er at bestemme, hvor i fremtiden i fremtiden skal findes, baseret på disse links eller baseret på den angivne liste over adresser.

Indexer. (Robot Indexer) er et program, der analyserer de sider, som edderkopper, downloades.



Indexeren adskiller sig fuldt ud siden til kompositelementer og analyserer deres analyse, der anvender sine morfologiske og leksikalske typer af algoritmer.

Analysen udføres over forskellige dele af siden, såsom overskrifter, tekst, links, stilistiske og strukturelle træk, HTML-tags osv.

Således gør indekseringsmodulet det muligt at gennemgå referencerne for det angivne antal ressourcer, downloade sider, udtrække referencemassen til nye sider fra de modtagne dokumenter og foretage deres detaljerede analyse.

Database.

Database. (eller søgemaskineindekset) er et sæt datalagring, en række oplysninger, hvor de justerede parametre for hvert behandlet indeksering og downloadet dokument opbevares.

Søg server.

Dette er det vigtigste element i hele systemet, fordi hastigheden og selvfølgelig søgekvaliteten afhænger af algoritmerne, der ligger til grund for dens funktionalitet.

Søgeserveren fungerer som følger:

  • Den anmodning, der kommer fra brugeren, udsættes for morfologisk analyse. Informationsmiljøet for ethvert dokument, der er tilgængeligt i databasen, genereres (det vil fortsat vise som en uddrag, dvs. tekstinformationsfeltet på den tilsvarende anmodning).
  • De opnåede data transmitterer som indgangsparametrene med et specialiseret ranking modul. De behandles i alle dokumenter, og i sidste ende er det for hvert sådant dokument beregnet, hvilket karakteriserer relevansen af \u200b\u200bet sådant dokument som brugerens anmodning og andre komponenter.
  • Afhængigt af betingelserne for den bruger, der er angivet af brugeren, kan denne bedømmelse godt justeres med yderligere.
  • Det genereres derefter af Snippet sig selv, dvs. For ethvert dokument, der findes i den tilsvarende tabel, hentes titlen, annotationen, som de fleste opfylder forespørgslen, hentes, og linket til dette dokument, mens de fundne ordformer og ord er fremhævet.
  • Resultaterne af den modtagne søgning sendes til personen i form af en side, som søgeresultater (SERP) udstedes.
Alle disse elementer er tæt forbundet med hinanden og funktion, interagerer, der danner en særskilt, men ret vanskelig mekanisme til funktionen af \u200b\u200bPS, som kræver enorme omkostninger ved ressourcer.

Den ubetingede leder på anmodninger i verden er Googles søgemaskine. Daglige søgemaskine processer mere end en milliard brugers anmodninger. Virksomheden har den største andel (ca. 62%) af hele søgemaskine markedet og tilbyder brugere en masse online-tjenester og værktøjer, der giver dig mulighed for at etablere udstedelse af de mest hensigtsmæssige resultater. Googles robot scanner omkring 25 milliarder websider om måneden, hvilket også er den største indikator for websøgning. Ifølge nogle rapporter er søgemaskinen i stand til at arbejde med oplysninger, der er udstationeret på internettet på 195 sprog og effektivt implementere det.

Yandex.

Yandex rangerer 4 i verden af \u200b\u200bantallet af forarbejdede anmodninger om dagen.

Den første popularitet af søgemaskinen i Rusland. Indledningsvis bygget på Googles motor, tilbyder Yandex i dag sin egen søgning algoritme, fokuseret på russisk-talende brugere i Rusland og CIS-landene. Søgemaskinen klare med succes med sin opgave og tilbyder både besøgende og webmastere en masse tjenester, der ikke kun kan forbedre kvaliteten af \u200b\u200bde udstedte resultater, men også gøre surfing på internettet mest bekvemme.

Forblive søgesystemer

Der er mange populære søgemaskiner: Yahoo, AOL, Spørg, Mail.ru, Rambler. Nogle søgemaskiner bruger mekanismer lånt fra andre systemer (for eksempel qip.ru bruger Yandex-motoren).

Blandt andre søgemaskiner kan der ikke noteres mindre populære Baidu, hvis hovedposition er placeret i Kina. Søgemaskinen rangerer 3rd i verden af \u200b\u200bantallet af forarbejdede anmodninger. Webstedet har sine egne tjenester, såsom encyklopædi, antivirusprogram, oversætter mv. Bing-projektet fra Microsoft får også stigende popularitet, som også har sin egen andel på markedet og tager 2 plads i verden efter Google i antallet af trafik. Søgemaskinen blev officielt endnu ikke lanceret i Rusland, men det er i stand til at forarbejde russiske talende resultater. Standard Bing Search bruges i Internet Explorer og på telefoner og tabletter, der kører på Windows Phone og Windows 8-platformen.

Der er også højt specialiserede søgemaskiner. For eksempel kan du vælge søgemaskiner (for eksempel Tineye), Grabbers (for eksempel "Geneon", som viser indholdet af andre steder på deres sider). Der er også søger ressourcer med registreringssystemet (DUCKDUCKGO).

Søgemaskinen er et af hovedniveauet på internettet på niveau med indhold og browser. Yandex-Poiskovik eller lignende systemer ("Google", Bing, Duckduckgo og andre) tillader brugeren at søge efter information i World Wide Web, hvilket formulerer en anmodning.

Søgemaskinens arbejde er at finde på denne anmodning (søgeord eller sætning) alle dokumenter, sider, video, det vil sige hele indholdet.

Hvilken søgemaskine er den bedste? Er der nogen alternative muligheder, noget undtagen "Google" og "Yandex"? Hvilken internet søgemaskine er mere egnet til scanning af engelsktalende kilder eller for eksempel musik? Det handler om dette, der vil blive diskuteret i artiklen.

Rating: Market Leaders

Hvis vi taler om verden som helhed, så er "Google" -poiskovik den mest populære søgemaskine. Selskabet tager praktisk talt 70% af markedet. Den anden position af ratingen indtager Bing (andel - 12,26%). Kampen for den anden linje med den udføres af Baidu-systemet (6,48% fra september 2015). Fra tid til anden ændrer de steder.

Så for eksempel blev der i 2014 "Power" distribueret anderledes: Google blev holdt førstepladsen. "Google" -poiskovik fra 68,69%, den anden - Baidu (17,7%), tredje bing med kapitalisering af markedet i 6 , 22%.

Men globale data er meget generaliseret. Hvilken søgemaskine er den bedste?

I Kina, for eksempel en meget lille procentdel af befolkningen scanner "Google", senest den indenlandske SOSO-system. I Sydkorea bruger de fleste beboere deres egen udvikling - NAVER internet søgemaskine. Sandt nok, i de sidste par måneder begyndte antallet af anmodninger i dette system at falde hurtigt.

I Japan og Taiwan bruges brugerne oftere af Yahoo!

Rating: Russian-Speaking Systems

Hvilken søgemaskine er den bedste? I Rusland er søgemaskine rating slet ikke det globale. Markedsføreren i det russisktalende segment af internettet er Yandex, som nyder mere end 55% af brugere.

I andenpladsen "Google" med et resultat på 37,6%. Ifølge LiveInternet-tjenesten blev dækningen af \u200b\u200brussisk-talende søgeforespørgsler i World Wide Web distribueret som følger:

  1. Universal søgemaskiner: "Google" (37,6%), "Bing" (0,3%), Yahoo! (0,1%).
  2. Engelsktalende og international (Askjeeves, for eksempel).
  3. Russian-talende Søgesystemer: "Yandex" (56,2%), mail (5,3%), "Rambler" (0,5%).

Duckduckgo.

En samtale om alternative søgemaskiner er værd at starte med en Duckduckgo-søgemaskine. Dette er et ret velkendt og fælles open source system. Duckduckgo-servere er beliggende i USA. Søgeresultaterne er ganske omfattende, da systemet bruger ikke kun sine egne algoritmer, men også resultaterne af nogle andre kilder, for eksempel "Wikipedia", Bing Search Engine og Yahoo!

Duckduckgo-søgemaskinen sikrer maksimal sikkerhed for brugerens personlige oplysninger, privatlivets fred og fortrolighed. Systemet indsamler ikke nogen brugerdata, gemmer ikke historien og begrænser brugen af \u200b\u200bcookies.

Forskel Duckduckgo er, at dette system ikke personliggør søgeresultaterne, da andre systemer gør. I "Google" eller "Yandex" ser brugeren kun de oplysninger, der er i overensstemmelse med sine præferencer. Men Duckduckgo danner et rigtigt billede og giver dig mulighed for at slippe af med obsessiv specifik reklame. Søg Service søger nemt efter oplysninger på fremmedsprog, mens Yandex og Google giver fortrinsret til russisk-talende kilder som standard, selvom anmodningen introduceres på engelsk, tysk eller anden.

I systemet kan du konfigurere grænsefladen: Du kan ændre farve design, skrifttyper, links og andre parametre på blot et par klik.

Mens denne søgemaskine er langt fra den gigantiske "Google", men duck udvikler sig, så det er muligt, at DUCKDUCKGO i fremtiden vil tage en af \u200b\u200bde førende positioner. Kommandoen har skabt et fremragende produkt, der giver en anonym, hurtig og funktionel søgning, som tager opmærksomhed på brugeren.

Notevil.

Dette er et system, der søger efter det anonyme TOR-netværk. Søgemaskinen er forudindstillet i browseren med samme navn. Hvad er bedre notevil? Han "passerer" hvor "Google" eller "Yandex" -poiskovik ikke kan komme derhen. Generelt er der i TOR-netværket mange ressourcer, der ikke kan besøges i det "almindelige" (lovlydige) internet. Dette er sådan en platform inde i netværket med sine sociale platforme, torrent trackers, medier, blogs, indkøbscentre, fora, biblioteker og så videre.

Forresten er Notevil ikke den eneste søgemaskine. Der er stadig et kig, som som standard er tilgængeligt i samme "Torus" -browser, og fakkel er et af de ældste søgeordninger i et anonymt netværk.

Yacy.

Gratis søgemaskine Yacy er en helt anden tilgang til organisationen af \u200b\u200bsøgningen i World Wide Web. Systemet fungerer på P2P-princippet. Det betyder, at hver computer, som modulet er installeret uafhængigt, scanner internettet, og så samles alle de opnåede resultater i en enkelt base, som alle brugere af Yacy kan nyde.

Systemet er helt uafhængigt, autonomt, sikrer anonymitet af hver bruger. Yacy er egnet til tilhængere af det åbne internet, som ikke er underlagt indflydelse fra store virksomheder og statslige organer.

I hverdagen er søgemaskinen ikke særlig nyttig, men i fremtiden er der et værdigt alternativ til "Google", selv set ud fra at organisere informationssøgningsprocessen.

Pipl.

PiPL er et system designet til at finde oplysninger om en bestemt person. Udviklerne hævder, at søgemaskinens algoritmer søger folk mere effektivt end almindelige Google eller Yandex.

Prioriterede kilder er profiler på sociale netværk Kommentarer, lister over deltagere, databaser, der offentliggør en række data om mennesker, som f.eks. Basis af retsafgørelser. Men der er en ulempe. Russiske databaser er ikke tilgængelige for PiPL, så det vil kun være nyttigt at finde oplysninger om amerikanske borgere.

Findsounds.

Hvilken søgemaskine er den bedste? Hvis du har brug for at finde musik eller lyde, så vil det selvfølgelig være de bedste fundne. Dette er en specialiseret søgemaskine, hvor der er en liste over tags. Her kan du vælge det ønskede lydfilformat eller dets kvalitet. Alle søgeresultater er tilgængelige for download.

Wolfram | Alpha.

Dette system giver ingen sider, hvor der er en information, du har brug for, men et færdigt resultat. For eksempel kort, grafer, tabeller, korte svar. Tjenesten er ikke egnet til beregning af data og søg efter bestemte fakta. Søgemaskinen forstår stadig ikke alle anmodninger, men udvikler sig konstant.

Med Wolfram | Alpha er praktisk, for eksempel sammenligner parametre til indstilling af kameraet, smartphone eller laptop. Beregn også niveauet af alkohol i blodet (systemet anmoder om brugerens vægt og vækst, mængden af \u200b\u200bfuld, tid og derefter rapporterer, efter hvor meget alkohol helt viser fra kroppen).

Værktøjet kan konvertere sko og tøjstørrelser, tælle kalorier, se valutakurser eller tilpasse musikinstrument.

Dogpile.

Dogpile viser resultater fra udstedelsen af \u200b\u200balle almindelige søgemaskiner på én gang. Tjenesten anvender en forbedret algoritme, og som udviklerne forsikrer, udgør den bedste udstedelse på internettet. Derudover er der få reklame. Du kan forsøge at bruge DogPile, hvis de oplysninger, du har brug for, ikke er i standarden "Google" eller "Yandex".

BoardReader.

Dette system søger information om fora, undersøgelser, spørgsmål og svar, sociale samfund, indsnævring af søgefeltet til sociale platforme. Filtre kan indstilles: Sprog og dato for offentliggørelse, webstedets navn og lignende.

Søgemaskinen kan være nyttig til reklame specialister, der er interesserede i publikums mening.

Langt om længe

Ofte er alternative søgemaskiner avl. De vises også hurtigt, som døende. De fleste af de alternative systemer er i dag specialiseret i nogen smal niche eller test den oprindelige algoritme i dannelsen af \u200b\u200bsøgeresultater.

I forbindelse med beskrivelsen af \u200b\u200balternative søgemaskiner betyder kriteriet "bedre" ikke "bedre i alt". Hver af de ovennævnte tjenester giver en bestemt bruger noget, der ikke er i "Google" eller "Yandex". Under alle omstændigheder skal du gøre dig bekendt med de alternative muligheder (på baggrund af, hvad systemet synes at være praktisk talt monopoliseret af søge giganter) interessant og nyttigt for hver bruger.