Guide för installation och konfiguration

Den här guiden tar dig genom hela uppsättningen av intranätscrawlern, från första konfiguration till att verktyget är aktiverat för era assistenter. Du behöver administratörsbehörighet i Intric och arbetar ofta tillsammans med IT eller intranätansvariga.

För en övergripande bild av funktioner och säkerhet, se artikeln nedan.

Intranätscrawlern

Läs mer

Förutsättningar

Innan du börjar, säkerställ att:

Du har administratörsbehörighet i er Intric-tenant
MCP-modulen är aktiverad för er tenant
Ni vet vilket intranätsinnehåll som ska indexeras
Ni har skapat eller pekat ut ett tjänstekonto med lämpliga rättigheter på intranätet
Intranätet är nåbart över HTTPS
Ni förstår hur autentisering på intranätet fungerar

Steg 1: Skapa MCP-serverposten

Gå till avsnittet MCP-servrar i Intrics admingränssnitt.

Klicka på Skapa och ange ett beskrivande namn, till exempel ”Företagets intranätscrawler” eller ”Sökning i personalhandboken”.

Serverposten skapas. Du kan nu gå vidare med anslutningsuppgifter.

Steg 2: Konfigurera server-URL och autentisering

Redigera den nya servern och ange följande:

Server-URL

Ange HTTPS-slutpunkten för intranätscrawlertjänsten. URL:en tillhandahålls av Intric under uppsättningen.

Exempel: https://crawler.yourcompany.intric.app/mcp

Autentisering

Välj API-nyckel som autentiseringstyp.

Ange den API-nyckel som skapades när crawlertjänsten togs i bruk. Nyckeln används när Intric anropar crawlern och lagras krypterat i vila.

Säkerhet: Hantera API-nyckeln varsamt. Den visas inte i gränssnittet efter att du sparat; det visas bara om en nyckel är konfigurerad.

Beskrivning (valfritt)

Lägg till en beskrivning så att andra administratörer förstår syftet, till exempel:

”Indexera personalhandboken, HR-policys och IT-dokumentation från det interna intranätet.”

Spara konfigurationen. Intric upptäcker automatiskt crawlerns funktioner Search Intranet och Correct Intranet (som visas under dessa namn i plattformen).

Steg 3: Konfigurera crawl-mål

Crawl-mål anger vilka sidor på intranätet som ska besökas och indexeras.

I MCP-serverkonfigurationen, gå till avsnittet Crawl targets (crawl-mål).

Lägg till URL:er för varje del av intranätet som ska indexeras. För varje mål anger du:

URL — Startpunkt för crawlning (t.ex. https://intranet.ertforetag.se/handbook)
Crawl depth (valfritt) — Hur många nivåer av länkar som ska följas från start-URL:en
URL patterns (valfritt) — Inkludera eller exkludera URL-mönster för att avgränsa crawlningen

Exempel:

URL: https://intranet.yourcompany.com/handbook
Depth: 2
Include patterns: /handbook/*, /policies/*
Exclude patterns: /archive/*, /draft/*

Detta indexerar handboksavsnittet och länkade policysidor men hoppar över arkiv och utkast.

Steg 4: Konfigurera autentisering för crawlern

Crawlern behöver inloggningsuppgifter för att nå intranätet. Konfigurationen beror på hur intranätet autentiserar användare.

Grundläggande autentisering eller formulärsinloggning

Ange användarnamn och lösenord för tjänstekontot.

Viktigt: Ange vilket tjänstekonto som ska användas och säkerställ att det har:

Åtkomst till allt innehåll ni vill indexera
Ingen åtkomst till innehåll som ska vara avstängt
Ett starkt, unikt lösenord
Lämplig loggning för granskning

Flerstegsinloggning

Om intranätet kräver flera steg (t.ex. lösenord följt av säkerhetsfråga) behöver du arbeta med Intrics teknikteam för att konfigurera flödet.

Tillhandahåll:

Steg-för-steg-instruktioner för inloggningen
Eventuella säkerhetsfrågor och svar
Information om sessionstimeout

Observera: Flöden med CAPTCHA eller enhetsbaserad tvåfaktorsautentisering stöds för närvarande inte.

SSO eller OAuth

Om intranätet använder enkel inloggning eller OAuth, kontakta Intrics support för rätt konfiguration.

Steg 5: Konfigurera dokumentutvinning

Crawlern kan läsa ut och indexera olika filtyper på intranätet.

Under Document extraction anger du:

Supported file types — PDF, Word, Excel med mera
Maximum file size — Större filer hoppas över
Text extraction method — Hur olika typer ska bearbetas

Rekommenderade inställningar:

Supported types: PDF, DOCX, XLSX, TXT
Maximum size: 10 MB
Extract text from: Body content, document metadata, embedded text

Steg 6: Ange crawl-schema

Ställ in hur ofta intranätet ska indexeras om.

Standard är en gång per dag (kl. 02:00 UTC), vilket passar många organisationer. Justera utifrån:

Hur ofta innehållet uppdateras
Belastning på systemen
Intranätets storlek

Exempel:

Statiskt innehåll (handböcker, policys): en gång i veckan
Innehåll som uppdateras regelbundet (nyheter): en gång per dag
Mycket föränderligt innehåll: överväg om crawlern är rätt verktyg

Begränsning av takten: Crawlern har inbyggd begränsning så att intranätsservrar inte överbelastas. Granska standardvärdena och justera vid behov.

Steg 7: Testa konfigurationen

Innan produktionssättning, verifiera uppläggningen:

Klicka på Validate connection för att säkerställa att crawlern når intranätet och kan autentisera
Granska anslutningsstatus:
- OK — Allt fungerar
- Unauthorized — Kontrollera tjänstekontots uppgifter
- Failed — Kontrollera URL och nätverksåtkomst
Starta en manuell testcrawl för att verifiera utvinning av innehåll
Läs crawl-loggar och säkerställ att rätt sidor indexeras
Leta efter autentiserings- eller behörighetsfel

Steg 8: Aktivera verktyget för tenanten

När konfigurationen är klar och testad:

Gå till avsnittet Verktyg i admin
Hitta intranätscrawlern i listan
Aktivera den för er tenant
Konfigurera säkerhetsklassning vid behov

Verktyget kan nu användas i assistenter.

Steg 9: Koppla verktyget till assistenter

För att användare ska kunna använda crawlern:

Öppna eller skapa en assistent i ett Space
Gå till assistentens Verktyg
Lägg till intranätscrawlern
Spara assistenten

Användare kan nu be assistenten söka i intranätet under konversationer.

Hantera korrigeringar

När användare föreslår korrigeringar:

Förslagen visas i adminpanelen Intranet corrections
Granska varje förslag
Åtgärder:
- Accept — Verkställ som inskickat
- Modify — Justera innan verkställning
- Reject — Avvisa med valfri motivering

Godkända korrigeringar slår igenom i sökindex vid nästa crawl-cykel.

Säkerhetsrutiner

Tjänstekonto

Skapa ett dedikerat konto för crawlern
Ge minsta möjliga behörighet
Använd starkt, unikt lösenord
Aktivera loggning för kontot
Granska åtkomst regelbundet

Innehållsavgränsning

Välj noggrant vilka delar av intranätet som indexeras
Exkludera känslig HR-, finans- eller konfidentiell projektdata
Använd URL-mönster för godkända ytor
Granska indexerat innehåll med jämna mellanrum

Åtkomstkontroll

Sätt säkerhetsklassning för intranätscrawlern
Begränsa vilka assistenter som har verktyget
Överväg specialassistenter för känsliga områden
Använd Spaces behörigheter för vem som får använda intranätsassistenter

Felsökning

Problem	Åtgärd
”Server URL is not set”	Redigera MCP-servern och ange en giltig HTTPS-URL
”Unauthorized” vid validering	Kontrollera tjänstekonto och rättigheter
Inget visas i sökresultat	Läs crawl-loggar; kontrollera crawl-mål
Autentisering misslyckas upprepade gånger	Granska flerstegsflöde och sessionstimeout
Crawlningen går långsamt	Minska djup eller avgränsa URL-mönster; justera rate limiting
Fel innehåll indexeras	Finjustera include/exclude; kontrollera tjänstekontot
Korrigeringar syns inte	Säkerställ att Correct Intranet är aktiverat; kontrollera användarbehörigheter

Få hjälp

Vid problem under uppsättning eller vid komplex autentisering, kontakta Intrics support med:

Er tenant
MCP-serverns namn
Skärmdumpar vid felmeddelanden
Utdrag ur crawl-loggar (vid behov)
Beskrivning av hur intranätet autentiserar