Skip to content

Installasjons- og konfigurasjonsguide

Denne guiden tar deg gjennom hele oppsettet av intranett-crawleren, fra første konfigurasjon til at verktøyet er aktivert for assistentene dine. Du trenger administratorrettigheter i Intric og samarbeider vanligvis med IT eller intranettansvarlige.

For en oversikt over funksjoner og sikkerhet, se artikkelen nedenfor.

Før du starter, sørg for at:

  • Du har administratorrettigheter i Intric-tenanten din
  • MCP-modulen er aktivert for tenanten
  • Dere har avklart hvilket intranettinnhold som skal indekseres
  • Dere har opprettet eller valgt en tjenestekonto med passende tilganger på intranettet
  • Intranettet er tilgjengelig over HTTPS
  • Dere forstår intranettets autentiseringskrav

Gå til MCP servers i Intric-administrasjonen.

Klikk Create og gi serveren et beskrivende navn, for eksempel «Bedriftens intranett-crawler» eller «Søk i personalhåndboken».

Posten opprettes. Du kan nå konfigurere tilkoblingsdetaljene.

Trinn 2: Konfigurer server-URL og autentisering

Section titled “Trinn 2: Konfigurer server-URL og autentisering”

Rediger den nye serveren og fyll inn:

Angi HTTPS-endepunktet til intranett-crawlertjenesten. URL-en gis av Intric under oppsettet.

Eksempel: https://crawler.yourcompany.intric.app/mcp

Velg API key som autentiseringstype.

Oppgi API-nøkkelen som ble generert da crawlertjenesten ble satt opp. Nøkkelen brukes når Intric kaller crawleren og lagres kryptert i hvile.

Sikkerhet: Oppbevar nøkkelen trygt. Den vises ikke i grensesnittet etter lagring; det vises bare om en nøkkel er konfigurert.

Legg til en beskrivelse for andre administratorer, for eksempel:

«Indekserer personalhåndbok, HR-retningslinjer og IT-dokumentasjon fra det interne intranettet.»

Lagre konfigurasjonen. Intric oppdager automatisk funksjonene Search Intranet og Correct Intranet (vises under disse navnene i plattformen).

Crawl-mål definerer hvilke sider crawleren skal besøke og indeksere.

I MCP-serverkonfigurasjonen, gå til Crawl targets.

Legg til URL-er for hver del av intranettet som skal indekseres. For hvert mål angir du:

  • URL — Startpunkt for crawling (f.eks. https://intranet.yourcompany.com/handbook)
  • Crawl depth (valgfritt) — Hvor mange nivåer med lenker som skal følges fra start-URL-en
  • URL patterns (valgfritt) — Inkluder eller ekskluder URL-mønstre

Eksempel:

URL: https://intranet.yourcompany.com/handbook
Depth: 2
Include patterns: /handbook/*, /policies/*
Exclude patterns: /archive/*, /draft/*

Dette indekserer håndbokdelen og tilknyttede retningssider, men hopper over arkiv og utkast.

Trinn 4: Konfigurer autentisering for crawleren

Section titled “Trinn 4: Konfigurer autentisering for crawleren”

Crawleren trenger legitimasjon for å nå intranettet. Oppsettet avhenger av autentiseringsmetoden.

Grunnleggende autentisering eller skjema-pålogging

Section titled “Grunnleggende autentisering eller skjema-pålogging”

Oppgi brukernavn og passord for tjenestekontoen.

Viktig: Angi hvilken tjenestekonto som skal brukes, og sørg for at den har:

  • Tilgang til alt innhold som skal indekseres
  • Ikke tilgang til innhold som skal være begrenset
  • Et sterkt, unikt passord
  • Aktivert revisjonslogging der det er relevant

Krever intranettet flere steg (f.eks. passord og sikkerhetsspørsmål), må du samarbeide med Intrics tekniske team om flyten.

Lever:

  • Trinnvise instruksjoner for pålogging
  • Eventuelle sikkerhetsspørsmål og svar
  • Informasjon om økt-utløp

Merk: Flyter med CAPTCHA eller enhetsbasert tofaktorautentisering støttes ikke for øyeblikket.

Bruker intranettet enkel pålogging eller OAuth, kontakt Intric-støtte for veiledning.

Crawleren kan trekke ut og indeksere ulike dokumenttyper på intranettet.

Under Document extraction, angi:

  • Supported file types — PDF, Word, Excel osv.
  • Maximum file size — Større filer hoppes over
  • Text extraction method — Hvordan ulike typer skal behandles

Anbefalte innstillinger:

Supported types: PDF, DOCX, XLSX, TXT
Maximum size: 10 MB
Extract text from: Body content, document metadata, embedded text

Konfigurer hvor ofte intranettinnholdet skal reindekseres.

Standard er én gang per dag (kl. 02:00 UTC), passende for mange organisasjoner. Juster ut fra:

  • Hvor ofte innholdet endres
  • Systembelastning
  • Størrelsen på intranettet

Eksempler:

  • Statisk innhold (håndbøker, retningslinjer): én gang i uken
  • Regelmessig oppdatert innhold (nyheter): én gang per dag
  • Hyppig endring: vurder om crawleren er riktig verktøy

Rate limiting: Crawleren har innebygd begrensning for å unngå å overbelaste intranettserveren. Gjennomgå standardverdier og juster ved behov.

Før produksjon:

  1. Klikk Validate connection for å bekrefte at crawleren når intranettet og kan autentisere
  2. Se på tilkoblingsstatus:
    • OK — Alt fungerer
    • Unauthorized — Sjekk tjenestekonto
    • Failed — Sjekk URL og nettverk
  3. Kjør en manuell test-crawl for å verifisere uttrekk
  4. Gå gjennom crawl-logger
  5. Se etter autentiserings- eller tilgangsfeil

Når konfigurasjonen er testet:

  1. Gå til Tools i administrasjonen
  2. Finn intranett-crawleren i listen
  3. Aktiver den for tenanten din
  4. Konfigurer sikkerhetsklassifisering ved behov

Verktøyet kan nå brukes i assistenter.

For at brukere skal få tilgang:

  1. Åpne eller opprett en assistent i et Space
  2. Gå til assistentens Tools-konfigurasjon
  3. Legg til intranett-crawler-verktøyet
  4. Lagre assistenten

Brukere kan nå be assistenten søke i intranettinnhold i samtaler.

Når brukere foreslår rettelser:

  1. Rettelser vises i adminpanelet Intranet corrections
  2. Vurder hvert forslag
  3. Valg:
    • Accept — Bruk forslaget som det er
    • Modify — Rediger før bruk
    • Reject — Avvis med valgfri tilbakemelding

Godkjente rettelser brukes i søkeindeksen ved neste crawl-syklus.

  • Opprett dedikert konto for crawleren
  • Gi kun nødvendige minstetilganger
  • Bruk sterkt, unikt passord
  • Aktiver revisjonslogging
  • Gjennomgå tilgang jevnlig
  • Velg bevisst hvilke deler som indekseres
  • Ekskluder sensitiv HR-, finans- eller konfidensiell informasjon
  • Bruk URL-mønstre for godkjente områder
  • Gjennomgå indeksert innhold med jevne mellomrom
  • Sett sikkerhetsklassifiseringsregler for intranett-crawleren
  • Begrens hvilke assistenter som har verktøyet
  • Vurder spesialiserte assistenter for sensitive områder
  • Bruk Space-tilganger for hvem som kan bruke intranett-assistenter
ProblemLøsning
”Server URL is not set”Rediger MCP-serveren og oppgi gyldig HTTPS-URL
”Unauthorized” ved valideringVerifiser tjenestekonto og tilganger
Ingen treff i søkSjekk crawl-logger og crawl-mål
Autentisering feiler gjentatte gangerGjennomgå flertrinnsoppsett og økt-utløp
Crawling går tregtReduser dybde eller begrens URL-mønstre; juster rate limiting
Feil innhold indekseresFinjuster include/exclude; sjekk tjenestekonto
Rettelser vises ikkeSørg for at Correct Intranet er aktivert; sjekk brukerrettigheter

Ved problemer eller kompleks autentisering, kontakt Intric-støtte med:

  • Navn på tenant
  • Navn på MCP-server
  • Skjermbilder av feilmeldinger
  • Utdrag fra crawl-logger (der relevant)
  • Beskrivelse av intranettets autentiseringsmetode