Hoppa till innehåll

Guide för installation och konfiguration

Den här guiden tar dig genom hela uppsättningen av intranätscrawlern, från första konfiguration till att verktyget är aktiverat för era assistenter. Du behöver administratörsbehörighet i Intric och arbetar ofta tillsammans med IT eller intranätansvariga.

För en övergripande bild av funktioner och säkerhet, se artikeln nedan.

Innan du börjar, säkerställ att:

  • Du har administratörsbehörighet i er Intric-tenant
  • MCP-modulen är aktiverad för er tenant
  • Ni vet vilket intranätsinnehåll som ska indexeras
  • Ni har skapat eller pekat ut ett tjänstekonto med lämpliga rättigheter på intranätet
  • Intranätet är nåbart över HTTPS
  • Ni förstår hur autentisering på intranätet fungerar

Gå till avsnittet MCP-servrar i Intrics admingränssnitt.

Klicka på Skapa och ange ett beskrivande namn, till exempel ”Företagets intranätscrawler” eller ”Sökning i personalhandboken”.

Serverposten skapas. Du kan nu gå vidare med anslutningsuppgifter.

Steg 2: Konfigurera server-URL och autentisering

Section titled “Steg 2: Konfigurera server-URL och autentisering”

Redigera den nya servern och ange följande:

Ange HTTPS-slutpunkten för intranätscrawlertjänsten. URL:en tillhandahålls av Intric under uppsättningen.

Exempel: https://crawler.yourcompany.intric.app/mcp

Välj API-nyckel som autentiseringstyp.

Ange den API-nyckel som skapades när crawlertjänsten togs i bruk. Nyckeln används när Intric anropar crawlern och lagras krypterat i vila.

Säkerhet: Hantera API-nyckeln varsamt. Den visas inte i gränssnittet efter att du sparat; det visas bara om en nyckel är konfigurerad.

Lägg till en beskrivning så att andra administratörer förstår syftet, till exempel:

”Indexera personalhandboken, HR-policys och IT-dokumentation från det interna intranätet.”

Spara konfigurationen. Intric upptäcker automatiskt crawlerns funktioner Search Intranet och Correct Intranet (som visas under dessa namn i plattformen).

Crawl-mål anger vilka sidor på intranätet som ska besökas och indexeras.

I MCP-serverkonfigurationen, gå till avsnittet Crawl targets (crawl-mål).

Lägg till URL:er för varje del av intranätet som ska indexeras. För varje mål anger du:

  • URL — Startpunkt för crawlning (t.ex. https://intranet.ertforetag.se/handbook)
  • Crawl depth (valfritt) — Hur många nivåer av länkar som ska följas från start-URL:en
  • URL patterns (valfritt) — Inkludera eller exkludera URL-mönster för att avgränsa crawlningen

Exempel:

URL: https://intranet.yourcompany.com/handbook
Depth: 2
Include patterns: /handbook/*, /policies/*
Exclude patterns: /archive/*, /draft/*

Detta indexerar handboksavsnittet och länkade policysidor men hoppar över arkiv och utkast.

Steg 4: Konfigurera autentisering för crawlern

Section titled “Steg 4: Konfigurera autentisering för crawlern”

Crawlern behöver inloggningsuppgifter för att nå intranätet. Konfigurationen beror på hur intranätet autentiserar användare.

Grundläggande autentisering eller formulärsinloggning

Section titled “Grundläggande autentisering eller formulärsinloggning”

Ange användarnamn och lösenord för tjänstekontot.

Viktigt: Ange vilket tjänstekonto som ska användas och säkerställ att det har:

  • Åtkomst till allt innehåll ni vill indexera
  • Ingen åtkomst till innehåll som ska vara avstängt
  • Ett starkt, unikt lösenord
  • Lämplig loggning för granskning

Om intranätet kräver flera steg (t.ex. lösenord följt av säkerhetsfråga) behöver du arbeta med Intrics teknikteam för att konfigurera flödet.

Tillhandahåll:

  • Steg-för-steg-instruktioner för inloggningen
  • Eventuella säkerhetsfrågor och svar
  • Information om sessionstimeout

Observera: Flöden med CAPTCHA eller enhetsbaserad tvåfaktorsautentisering stöds för närvarande inte.

Om intranätet använder enkel inloggning eller OAuth, kontakta Intrics support för rätt konfiguration.

Crawlern kan läsa ut och indexera olika filtyper på intranätet.

Under Document extraction anger du:

  • Supported file types — PDF, Word, Excel med mera
  • Maximum file size — Större filer hoppas över
  • Text extraction method — Hur olika typer ska bearbetas

Rekommenderade inställningar:

Supported types: PDF, DOCX, XLSX, TXT
Maximum size: 10 MB
Extract text from: Body content, document metadata, embedded text

Ställ in hur ofta intranätet ska indexeras om.

Standard är en gång per dag (kl. 02:00 UTC), vilket passar många organisationer. Justera utifrån:

  • Hur ofta innehållet uppdateras
  • Belastning på systemen
  • Intranätets storlek

Exempel:

  • Statiskt innehåll (handböcker, policys): en gång i veckan
  • Innehåll som uppdateras regelbundet (nyheter): en gång per dag
  • Mycket föränderligt innehåll: överväg om crawlern är rätt verktyg

Begränsning av takten: Crawlern har inbyggd begränsning så att intranätsservrar inte överbelastas. Granska standardvärdena och justera vid behov.

Innan produktionssättning, verifiera uppläggningen:

  1. Klicka på Validate connection för att säkerställa att crawlern når intranätet och kan autentisera
  2. Granska anslutningsstatus:
    • OK — Allt fungerar
    • Unauthorized — Kontrollera tjänstekontots uppgifter
    • Failed — Kontrollera URL och nätverksåtkomst
  3. Starta en manuell testcrawl för att verifiera utvinning av innehåll
  4. Läs crawl-loggar och säkerställ att rätt sidor indexeras
  5. Leta efter autentiserings- eller behörighetsfel

När konfigurationen är klar och testad:

  1. Gå till avsnittet Verktyg i admin
  2. Hitta intranätscrawlern i listan
  3. Aktivera den för er tenant
  4. Konfigurera säkerhetsklassning vid behov

Verktyget kan nu användas i assistenter.

För att användare ska kunna använda crawlern:

  1. Öppna eller skapa en assistent i ett Space
  2. Gå till assistentens Verktyg
  3. Lägg till intranätscrawlern
  4. Spara assistenten

Användare kan nu be assistenten söka i intranätet under konversationer.

När användare föreslår korrigeringar:

  1. Förslagen visas i adminpanelen Intranet corrections
  2. Granska varje förslag
  3. Åtgärder:
    • Accept — Verkställ som inskickat
    • Modify — Justera innan verkställning
    • Reject — Avvisa med valfri motivering

Godkända korrigeringar slår igenom i sökindex vid nästa crawl-cykel.

  • Skapa ett dedikerat konto för crawlern
  • Ge minsta möjliga behörighet
  • Använd starkt, unikt lösenord
  • Aktivera loggning för kontot
  • Granska åtkomst regelbundet
  • Välj noggrant vilka delar av intranätet som indexeras
  • Exkludera känslig HR-, finans- eller konfidentiell projektdata
  • Använd URL-mönster för godkända ytor
  • Granska indexerat innehåll med jämna mellanrum
  • Sätt säkerhetsklassning för intranätscrawlern
  • Begränsa vilka assistenter som har verktyget
  • Överväg specialassistenter för känsliga områden
  • Använd Spaces behörigheter för vem som får använda intranätsassistenter
ProblemÅtgärd
”Server URL is not set”Redigera MCP-servern och ange en giltig HTTPS-URL
”Unauthorized” vid valideringKontrollera tjänstekonto och rättigheter
Inget visas i sökresultatLäs crawl-loggar; kontrollera crawl-mål
Autentisering misslyckas upprepade gångerGranska flerstegsflöde och sessionstimeout
Crawlningen går långsamtMinska djup eller avgränsa URL-mönster; justera rate limiting
Fel innehåll indexerasFinjustera include/exclude; kontrollera tjänstekontot
Korrigeringar syns inteSäkerställ att Correct Intranet är aktiverat; kontrollera användarbehörigheter

Vid problem under uppsättning eller vid komplex autentisering, kontakta Intrics support med:

  • Er tenant
  • MCP-serverns namn
  • Skärmdumpar vid felmeddelanden
  • Utdrag ur crawl-loggar (vid behov)
  • Beskrivning av hur intranätet autentiserar