IPS er Formål og funksjoner til systemer for informasjonsinnhenting

Innholdsfortegnelse:

IPS er Formål og funksjoner til systemer for informasjonsinnhenting
IPS er Formål og funksjoner til systemer for informasjonsinnhenting

Video: IPS er Formål og funksjoner til systemer for informasjonsinnhenting

Video: IPS er Formål og funksjoner til systemer for informasjonsinnhenting
Video: SUSTAINABLE POWER FROM GERMANY: Electric Locomotiv - High-Tech on Rails | WELT Documentary 2024, April
Anonim

Det er vanskelig for et moderne menneske å forestille seg livet uten Internett og nesten umiddelbar tilgang til informasjonskilder. Brukeren tenker sjelden over hvordan søket etter ønsket innhold på nettverket utføres. Men dette er veldig interessant.

Et informasjonsinnhentingssystem (IPS) er et komplekst programvare- og maskinvaresystem som velger informasjon etter brukerens forespørsel. Informasjon lagres på servere i digital form, slik bøker tidligere var i hyllene på bibliotekene. Systemet består av mange delsystemer. Hver utfører sin oppgave i prosessen med å behandle brukerens forespørsel og gi ham informasjon i tekst- eller lydform. Mangfoldet av oppgaver som skal løses bestemmer kompleksiteten i arkitekturen til moderne informasjonsgjenfinningssystemer (en forkortelse av informasjonsgjenfinningssystemet). En slags "svart boks": ved inngangen - teksten i forespørselen, hva som er inni - er ukjent, ved utgangen - omfattende informasjon.

Kortfil i det virkelige liv
Kortfil i det virkelige liv

Inndatastrømmer

Forespørsler om informasjon som en person danner i tekstform på skjermen til gadgeten sin,utgjør en liten del av forespørslene som behandles av søkemotoren. Hovedarrayene med søkespørsmål dannes av roboter som godtar en menneskelig forespørsel og utfører et flertrinnssøk og tilbakemelding med brukeren. Systemer for informasjonsinnhenting inkluderer velkjente Google, Yandex og andre, som behandler millioner av forespørsler daglig.

Kildesøkeobjekter

Set med innledende objekter av interesse for søket er dokumenter, poster, videoer, bilder og mer. De er opprettet utenfor IPS. Det generelle informasjonslagrings- og gjenfinningssystemet bør ha et innebygd bibliografisk system – en slags katalog som lar deg søke etter alle slags objekter.

Objekter eller deres digitale transformasjoner blir en "inngangsressurs" til IPS. Det er blant dem informasjonen brukeren trenger velges.

Søk etter informasjon
Søk etter informasjon

Eksterne kilder

Visningen for informasjonsvalg bruker eksterne kunnskapskilder. Dette er informasjonen brukeren leter etter. Tittelen på filmen, et sitat fra boken og mer. For et datasøk må denne informasjonen oversettes til en spørring på et algoritmisk språk. I IPS gjøres dette ved å bruke blokken for å lage, indeksere og utvikle spørringer.

Ideelt sett bør disse tre prosessene – representasjon, indeksering og utvikling av spørringer – være avhengig av identiske kunnskapskilder, men i praksis er dette ikke mulig.

Kunnskapskilder bør kontinuerlig gjennomgås og oppdateres, og oppdateringen bør være identisk ogsynkronisert. Og en ekstern kunnskapskilde går alltid kronologisk før bruken i søkemotorer for et søk, noen ganger i flere år.

System for innhenting av informasjon
System for innhenting av informasjon

Performances

Representasjoner av de originale objektene består av inngangsdata i en eller annen kombinasjon eller transformert i samsvar med reglene og algoritmene til et bestemt system for informasjonsinnhenting.

Visninger er mer eller mindre transformerte kopier av det originale søkeobjektet. I samlingen av uredigerte fulltekster er hver tekst sin egen representasjon. I samlingen av gjenstander av museumsutstillinger og gjenstander kan representasjonen være en transformert beskrivelse av objektet med dets bilde. I noen tilfeller kan representasjonen delvis være avledet fra det opprinnelige objektet og delvis fra beskrivelsen: i bibliografiske søkemotorer er representasjoner avledet fra objektet - for eksempel vil tittel, forfatternavn bli kombinert med kommentaren til verket.

Finner det du trenger
Finner det du trenger

Søkbar indeks

Siden informasjon i informasjonsinnhentingssystemer lagres i form av en representasjon, er det logisk å anta at søket utføres i henhold til representasjonen og, etter valg, gis til brukeren. I praksis er dette ikke tilfelle. For eksempel begrenser de gjeldende nettbibliotekskatalogene søk til noen få felt: forfatter, tittel og undertekster i en visning som inneholder andre felt som det ikke søkes i. Dette er tilstrekkelig grunn til at det er nødvendig å skilleen visning og en søkbar indeks, som er søkedelen av visningen. Den definerer alt som skal være søkbart. En søkbar indeks, som visningen og kildeobjektet, kan deles opp i separate underindekser for å gi mer presise, målrettede søk

Søkemotorer har vanligvis en syntetisk struktur internt for å matche gyldige søkeresultater. Denne strukturen er den andre komponenten i den søkbare indeksen.

Prosedyremessig kan indekseringsprosessen implementeres på forskjellige måter: en søkbar indeks kan fås ved:

  • kopierer bokstavelig t alt en søkbar representasjon;
  • ved å kopiere visningsdetaljene. Dette kan være deler av eller alle visningene som fysisk bare eksisterer som fragmenter, distribuert i henhold til reglene for å opprette en indeks for søk, som vil bli samlet inn når det er nødvendig.
Søkeadministrasjon
Søkeadministrasjon

Request design-regler og formelle forespørsler

Spørringsteknikk er en funksjon som formidler mellom en brukerspørring og en formell spørring. Den transformerer brukerens spørring, og matcher den med gjenfinningskommandoordbøkene, indeksspesifikasjonen og indeksen før henting. Ved begynnelsen av utviklingen av IPS ble denne rollen tradisjonelt tildelt kvalifiserte IT-spesialister.

Å utvikle datamaskinspørringer som kan matche ordbokspørringer til et søkbart indekssystem, blir ofte referert til som "ordbokinndata"-modulen. Automatisering av denne funksjonen er lovende og gir muligheter for ekspert- og probabilistiske søkemetoder.

En formell forespørsel blir en formell forespørsel etter at brukerens forespørsel er konvertert. Eksempler på slike formelle transformasjoner inkluderer trunkering, substitusjon, normalisering, vektorisering og andre transformasjoner av den "eksterne" representasjonen til de "interne" representasjonene av datamaskinens IPS (dekryptering - informasjonsgjenvinningssystem).

Utpakkede dokumentkoblingssett

Det resulterende settet med informasjonskilder er logisk sett et undersett av visningene som er opprettet av samsvarsreglene som brukes på det formelle søket av en søkbar indeks.

Vanligvis, men ikke nødvendigvis, er det en egen sorteringsprosess for det gjenopprettede settet med informasjon. Online bibliotekkataloger omorganiserer vanligvis mottatte sett alfabetisk etter forfatter før de vises. I systemer for informasjonsinnhenting som produserer strenge rangeringer, går rangeringsrekkefølgen foran enhver ombestilling.

Dataanalyse
Dataanalyse

Utgangsstrømmer

Utdata av søkeresultater gjøres tradisjonelt på skjermen, oftere i form av en strøm av objekter som skal brukes andre steder eller til andre formål, fullfører hovedsøkesløyfen. Slike strømmer kan sendes til visualiseringsenheter, lagring for videre behandling, eller bruk som inputstrømmer til andre utvalgstjenester.

Systemer for informasjonsinnhenting tillater tilbakemelding fraresultatet av enhver utvelgelsesprosess. Resultatet av enhver prosess kan være tilbakemelding til andre prosesser. Tilbakemeldinger kan gi grunnlag for ekspertvurderinger når som helst.

Anbefalt: