Leitfaden zur Installation und Konfiguration

Dieser Leitfaden führt dich durch die komplette Einrichtung des Intranet-Crawlers – von der ersten Konfiguration bis zur Freischaltung des Tools für deine Assistenten. Du benötigst Admin-Rechte in Intric und arbeitest typischerweise mit IT oder Intranet-Verantwortlichen zusammen.

Einen Überblick über Funktionen und Sicherheit findest du im folgenden Artikel.

Intranet-Crawler

Voraussetzungen

Bevor du startest, stelle sicher:

Du hast Admin-Berechtigungen in deinem Intric-Tenant
Das MCP-Modul ist für deinen Tenant aktiviert
Ihr wisst, welche Intranetinhalte indexiert werden sollen
Ihr habt ein Dienstkonto mit passenden Rechten auf dem Intranet angelegt oder ausgewählt
Euer Intranet ist per HTTPS erreichbar
Du verstehst die Authentifizierungsanforderungen eures Intranets

Schritt 1: MCP-Server-Eintrag anlegen

Öffne den Bereich MCP-Server in der Intric-Administration.

Klicke auf Erstellen und gib einen aussagekräftigen Namen ein, z. B. „Firmen-Intranet-Crawler“ oder „Handbuchsuche“.

Der Eintrag wird angelegt. Anschließend konfigurierst du die Verbindungsdaten.

Schritt 2: Server-URL und Authentifizierung

Bearbeite den neuen Server und trage Folgendes ein:

Server-URL

Gib die HTTPS-Endpunkt-URL des Intranet-Crawler-Dienstes ein. Intric liefert diese URL während der Einrichtung.

Beispiel: https://crawler.yourcompany.intric.app/mcp

Authentifizierung

Wähle API-Schlüssel als Authentifizierungsart.

Trage den API-Schlüssel ein, der bei der Bereitstellung des Crawler-Dienstes erzeugt wurde. Er authentifiziert Intrics Aufrufe beim Crawler und wird verschlüsselt gespeichert.

Hinweis zur Sicherheit: Bewahre den Schlüssel sicher auf. Nach dem Speichern ist er in der Oberfläche nicht mehr sichtbar; es wird nur angezeigt, ob ein Schlüssel hinterlegt ist.

Beschreibung (optional)

Ergänze eine Beschreibung für andere Admins, z. B.:

„Indexiert Mitarbeiterhandbuch, HR-Richtlinien und IT-Dokumentation aus dem internen Intranet.“

Speichere die Konfiguration. Intric erkennt automatisch die Funktionen Search Intranet und Correct Intranet (so in der Plattform benannt).

Schritt 3: Crawl-Ziele konfigurieren

Crawl-Ziele legen fest, welche Seiten der Crawler besuchen und indexieren soll.

Öffne in der MCP-Server-Konfiguration den Abschnitt Crawl targets.

Füge URLs für jeden zu indexierenden Bereich hinzu. Pro Ziel gibst du an:

URL — Startpunkt des Crawls (z. B. https://intranet.yourcompany.com/handbook)
Crawl depth (optional) — Wie viele Link-Ebenen vom Start aus verfolgt werden
URL patterns (optional) — Muster zum Ein- oder Ausschließen von URLs

Beispiel:

URL: https://intranet.yourcompany.com/handbook
Depth: 2
Include patterns: /handbook/*, /policies/*
Exclude patterns: /archive/*, /draft/*

Damit werden Handbuch und verlinkte Policy-Seiten indexiert, Archiv und Entwürfe übersprungen.

Schritt 4: Authentifizierung für den Crawler

Der Crawler braucht Zugangsdaten für euer Intranet. Die Konfiguration hängt von der Authentifizierungsmethode ab.

Trage Benutzername und Passwort des Dienstkontos ein.

Wichtig: Lege fest, welches Dienstkonto genutzt wird. Es muss haben:

Zugriff auf alle zu indexierenden Inhalte
Keinen Zugriff auf Inhalte, die geschützt bleiben sollen
Ein starkes, einzigartiges Passwort
Passendes Audit-Logging

Mehrstufige Authentifizierung

Erfordert euer Intranet mehrere Schritte (z. B. Passwort und Sicherheitsfrage), arbeitet ihr mit dem technischen Team von Intric an dem Flow.

Bereitstellen:

Schritt-für-Schritt-Anleitung zum Login
Sicherheitsfragen und Antworten
Informationen zu Session-Timeouts

Hinweis: Abläufe mit CAPTCHA oder gerätebasierter Zwei-Faktor-Authentifizierung werden derzeit nicht unterstützt.

SSO oder OAuth

Nutzt euer Intranet Single Sign-On oder OAuth, wende dich für die passende Konfiguration an den Intric-Support.

Schritt 5: Dokumentextraktion

Der Crawler kann verschiedene Dateitypen auf dem Intranet auslesen und indexieren.

Unter Document extraction legst du fest:

Supported file types — PDF, Word, Excel usw.
Maximum file size — Größere Dateien werden übersprungen
Text extraction method — Verarbeitung je Dateityp

Empfohlene Einstellungen:

Supported types: PDF, DOCX, XLSX, TXT
Maximum size: 10 MB
Extract text from: Body content, document metadata, embedded text

Schritt 6: Crawl-Zeitplan

Lege fest, wie oft der Crawler neu indexiert.

Standard ist einmal täglich (02:00 UTC), passend für viele Organisationen. Passe an nach:

Wie oft sich Inhalte ändern
Systemlast
Größe des Intranets

Beispiele:

Statische Inhalte (Handbücher, Policies): einmal pro Woche
Regelmäßig aktualisierte Inhalte (News): einmal täglich
Sehr dynamische Inhalte: Prüfe, ob der Crawler das richtige Tool ist

Rate limiting: Der Crawler drosselt Anfragen, um euer Intranet nicht zu überlasten. Prüfe die Standardwerte und passe sie an eure Infrastruktur an.

Schritt 7: Konfiguration testen

Vor dem produktiven Einsatz:

Klicke auf Validate connection, um Erreichbarkeit und Authentifizierung zu prüfen
Prüfe den Verbindungsstatus:
- OK — Konfiguration passt
- Unauthorized — Dienstkonto prüfen
- Failed — URL und Netzwerk prüfen
Starte einen manuellen Test-Crawl zur Inhaltsextraktion
Sieh dir die Crawl-Logs an
Achte auf Auth- oder Berechtigungsfehler

Schritt 8: Tool für den Tenant aktivieren

Wenn alles getestet ist:

Öffne den Bereich Tools in der Administration
Finde den Intranet-Crawler in der Liste
Aktiviere ihn für euren Tenant
Konfiguriere bei Bedarf die Sicherheitsklassifizierung

Das Tool kann in Assistenten genutzt werden.

Schritt 9: Tool an Assistenten anbinden

Damit Nutzer den Crawler nutzen können:

Öffne oder erstelle einen Assistenten in einem Space
Öffne die Tools-Konfiguration des Assistenten
Füge den Intranet-Crawler hinzu
Speichere den Assistenten

Nutzer können den Assistenten nun bitten, Intranetinhalte zu durchsuchen.

Korrekturen verwalten

Wenn Nutzer Korrekturen vorschlagen:

Die Vorschläge erscheinen im Admin-Bereich Intranet corrections
Prüfe jeden Vorschlag
Optionen:
- Accept — wie eingereicht übernehmen
- Modify — vor dem Übernehmen bearbeiten
- Reject — ablehnen, optional mit Rückmeldung

Akzeptierte Korrekturen gehen im nächsten Crawl-Zyklus in den Suchindex ein.

Sicherheit – Best Practices

Dienstkonto

Eigenes Konto nur für den Crawler
Minimal notwendige Rechte
Starkes, einzigartiges Passwort
Audit-Logging aktivieren
Zugriff regelmäßig prüfen

Inhaltsumfang

Bewusst wählen, welche Bereiche indexiert werden
Sensible HR-, Finanz- oder vertrauliche Projektdaten ausschließen
URL-Muster für freigegebene Bereiche nutzen
Indexierte Inhalte regelmäßig prüfen

Zugriffskontrolle

Sicherheitsklassifizierung für den Intranet-Crawler setzen
Wenige Assistenten mit Crawler-Zugang
Ggf. spezialisierte Assistenten für sensible Bereiche
Space-Berechtigungen für Nutzer intranet-fähiger Assistenten

Fehlerbehebung

Problem	Lösung
”Server URL is not set”	MCP-Server bearbeiten und gültige HTTPS-URL eintragen
”Unauthorized” bei Validierung	Dienstkonto und Rechte prüfen
Keine Suchtreffer	Crawl-Logs prüfen; Crawl-Ziele prüfen
Authentifizierung schlägt fehl	Mehrstufigen Flow und Session-Timeouts prüfen
Crawl zu langsam	Crawl-Tiefe oder URL-Muster einschränken; Rate limiting anpassen
Falsche Inhalte indexiert	Include/Exclude-Muster verfeinern; Dienstkonto prüfen
Korrekturen fehlen	Correct Intranet aktivieren; Nutzerrechte prüfen

Hilfe

Bei Problemen oder komplexer Authentifizierung kontaktiere den Intric-Support mit:

Tenant-Name
Name des MCP-Servers
Screenshots von Fehlermeldungen
Ausschnitten aus Crawl-Logs (falls zutreffend)
Beschreibung der Intranet-Authentifizierung