Leitfaden zur Installation und Konfiguration
Dieser Leitfaden führt dich durch die komplette Einrichtung des Intranet-Crawlers – von der ersten Konfiguration bis zur Freischaltung des Tools für deine Assistenten. Du benötigst Admin-Rechte in Intric und arbeitest typischerweise mit IT oder Intranet-Verantwortlichen zusammen.
Einen Überblick über Funktionen und Sicherheit findest du im folgenden Artikel.
Voraussetzungen
Abschnitt betitelt „Voraussetzungen“Bevor du startest, stelle sicher:
- Du hast Admin-Berechtigungen in deinem Intric-Tenant
- Das MCP-Modul ist für deinen Tenant aktiviert
- Ihr wisst, welche Intranetinhalte indexiert werden sollen
- Ihr habt ein Dienstkonto mit passenden Rechten auf dem Intranet angelegt oder ausgewählt
- Euer Intranet ist per HTTPS erreichbar
- Du verstehst die Authentifizierungsanforderungen eures Intranets
Schritt 1: MCP-Server-Eintrag anlegen
Abschnitt betitelt „Schritt 1: MCP-Server-Eintrag anlegen“Öffne den Bereich MCP-Server in der Intric-Administration.
Klicke auf Erstellen und gib einen aussagekräftigen Namen ein, z. B. „Firmen-Intranet-Crawler“ oder „Handbuchsuche“.
Der Eintrag wird angelegt. Anschließend konfigurierst du die Verbindungsdaten.
Schritt 2: Server-URL und Authentifizierung
Abschnitt betitelt „Schritt 2: Server-URL und Authentifizierung“Bearbeite den neuen Server und trage Folgendes ein:
Server-URL
Abschnitt betitelt „Server-URL“Gib die HTTPS-Endpunkt-URL des Intranet-Crawler-Dienstes ein. Intric liefert diese URL während der Einrichtung.
Beispiel: https://crawler.yourcompany.intric.app/mcp
Authentifizierung
Abschnitt betitelt „Authentifizierung“Wähle API-Schlüssel als Authentifizierungsart.
Trage den API-Schlüssel ein, der bei der Bereitstellung des Crawler-Dienstes erzeugt wurde. Er authentifiziert Intrics Aufrufe beim Crawler und wird verschlüsselt gespeichert.
Hinweis zur Sicherheit: Bewahre den Schlüssel sicher auf. Nach dem Speichern ist er in der Oberfläche nicht mehr sichtbar; es wird nur angezeigt, ob ein Schlüssel hinterlegt ist.
Beschreibung (optional)
Abschnitt betitelt „Beschreibung (optional)“Ergänze eine Beschreibung für andere Admins, z. B.:
„Indexiert Mitarbeiterhandbuch, HR-Richtlinien und IT-Dokumentation aus dem internen Intranet.“
Speichere die Konfiguration. Intric erkennt automatisch die Funktionen Search Intranet und Correct Intranet (so in der Plattform benannt).
Schritt 3: Crawl-Ziele konfigurieren
Abschnitt betitelt „Schritt 3: Crawl-Ziele konfigurieren“Crawl-Ziele legen fest, welche Seiten der Crawler besuchen und indexieren soll.
Öffne in der MCP-Server-Konfiguration den Abschnitt Crawl targets.
Füge URLs für jeden zu indexierenden Bereich hinzu. Pro Ziel gibst du an:
- URL — Startpunkt des Crawls (z. B.
https://intranet.yourcompany.com/handbook) - Crawl depth (optional) — Wie viele Link-Ebenen vom Start aus verfolgt werden
- URL patterns (optional) — Muster zum Ein- oder Ausschließen von URLs
Beispiel:
URL: https://intranet.yourcompany.com/handbookDepth: 2Include patterns: /handbook/*, /policies/*Exclude patterns: /archive/*, /draft/*Damit werden Handbuch und verlinkte Policy-Seiten indexiert, Archiv und Entwürfe übersprungen.
Schritt 4: Authentifizierung für den Crawler
Abschnitt betitelt „Schritt 4: Authentifizierung für den Crawler“Der Crawler braucht Zugangsdaten für euer Intranet. Die Konfiguration hängt von der Authentifizierungsmethode ab.
Basis-Authentifizierung oder Formular-Login
Abschnitt betitelt „Basis-Authentifizierung oder Formular-Login“Trage Benutzername und Passwort des Dienstkontos ein.
Wichtig: Lege fest, welches Dienstkonto genutzt wird. Es muss haben:
- Zugriff auf alle zu indexierenden Inhalte
- Keinen Zugriff auf Inhalte, die geschützt bleiben sollen
- Ein starkes, einzigartiges Passwort
- Passendes Audit-Logging
Mehrstufige Authentifizierung
Abschnitt betitelt „Mehrstufige Authentifizierung“Erfordert euer Intranet mehrere Schritte (z. B. Passwort und Sicherheitsfrage), arbeitet ihr mit dem technischen Team von Intric an dem Flow.
Bereitstellen:
- Schritt-für-Schritt-Anleitung zum Login
- Sicherheitsfragen und Antworten
- Informationen zu Session-Timeouts
Hinweis: Abläufe mit CAPTCHA oder gerätebasierter Zwei-Faktor-Authentifizierung werden derzeit nicht unterstützt.
SSO oder OAuth
Abschnitt betitelt „SSO oder OAuth“Nutzt euer Intranet Single Sign-On oder OAuth, wende dich für die passende Konfiguration an den Intric-Support.
Schritt 5: Dokumentextraktion
Abschnitt betitelt „Schritt 5: Dokumentextraktion“Der Crawler kann verschiedene Dateitypen auf dem Intranet auslesen und indexieren.
Unter Document extraction legst du fest:
- Supported file types — PDF, Word, Excel usw.
- Maximum file size — Größere Dateien werden übersprungen
- Text extraction method — Verarbeitung je Dateityp
Empfohlene Einstellungen:
Supported types: PDF, DOCX, XLSX, TXTMaximum size: 10 MBExtract text from: Body content, document metadata, embedded textSchritt 6: Crawl-Zeitplan
Abschnitt betitelt „Schritt 6: Crawl-Zeitplan“Lege fest, wie oft der Crawler neu indexiert.
Standard ist einmal täglich (02:00 UTC), passend für viele Organisationen. Passe an nach:
- Wie oft sich Inhalte ändern
- Systemlast
- Größe des Intranets
Beispiele:
- Statische Inhalte (Handbücher, Policies): einmal pro Woche
- Regelmäßig aktualisierte Inhalte (News): einmal täglich
- Sehr dynamische Inhalte: Prüfe, ob der Crawler das richtige Tool ist
Rate limiting: Der Crawler drosselt Anfragen, um euer Intranet nicht zu überlasten. Prüfe die Standardwerte und passe sie an eure Infrastruktur an.
Schritt 7: Konfiguration testen
Abschnitt betitelt „Schritt 7: Konfiguration testen“Vor dem produktiven Einsatz:
- Klicke auf Validate connection, um Erreichbarkeit und Authentifizierung zu prüfen
- Prüfe den Verbindungsstatus:
- OK — Konfiguration passt
- Unauthorized — Dienstkonto prüfen
- Failed — URL und Netzwerk prüfen
- Starte einen manuellen Test-Crawl zur Inhaltsextraktion
- Sieh dir die Crawl-Logs an
- Achte auf Auth- oder Berechtigungsfehler
Schritt 8: Tool für den Tenant aktivieren
Abschnitt betitelt „Schritt 8: Tool für den Tenant aktivieren“Wenn alles getestet ist:
- Öffne den Bereich Tools in der Administration
- Finde den Intranet-Crawler in der Liste
- Aktiviere ihn für euren Tenant
- Konfiguriere bei Bedarf die Sicherheitsklassifizierung
Das Tool kann in Assistenten genutzt werden.
Schritt 9: Tool an Assistenten anbinden
Abschnitt betitelt „Schritt 9: Tool an Assistenten anbinden“Damit Nutzer den Crawler nutzen können:
- Öffne oder erstelle einen Assistenten in einem Space
- Öffne die Tools-Konfiguration des Assistenten
- Füge den Intranet-Crawler hinzu
- Speichere den Assistenten
Nutzer können den Assistenten nun bitten, Intranetinhalte zu durchsuchen.
Korrekturen verwalten
Abschnitt betitelt „Korrekturen verwalten“Wenn Nutzer Korrekturen vorschlagen:
- Die Vorschläge erscheinen im Admin-Bereich Intranet corrections
- Prüfe jeden Vorschlag
- Optionen:
- Accept — wie eingereicht übernehmen
- Modify — vor dem Übernehmen bearbeiten
- Reject — ablehnen, optional mit Rückmeldung
Akzeptierte Korrekturen gehen im nächsten Crawl-Zyklus in den Suchindex ein.
Sicherheit – Best Practices
Abschnitt betitelt „Sicherheit – Best Practices“Dienstkonto
Abschnitt betitelt „Dienstkonto“- Eigenes Konto nur für den Crawler
- Minimal notwendige Rechte
- Starkes, einzigartiges Passwort
- Audit-Logging aktivieren
- Zugriff regelmäßig prüfen
Inhaltsumfang
Abschnitt betitelt „Inhaltsumfang“- Bewusst wählen, welche Bereiche indexiert werden
- Sensible HR-, Finanz- oder vertrauliche Projektdaten ausschließen
- URL-Muster für freigegebene Bereiche nutzen
- Indexierte Inhalte regelmäßig prüfen
Zugriffskontrolle
Abschnitt betitelt „Zugriffskontrolle“- Sicherheitsklassifizierung für den Intranet-Crawler setzen
- Wenige Assistenten mit Crawler-Zugang
- Ggf. spezialisierte Assistenten für sensible Bereiche
- Space-Berechtigungen für Nutzer intranet-fähiger Assistenten
Fehlerbehebung
Abschnitt betitelt „Fehlerbehebung“| Problem | Lösung |
|---|---|
| ”Server URL is not set” | MCP-Server bearbeiten und gültige HTTPS-URL eintragen |
| ”Unauthorized” bei Validierung | Dienstkonto und Rechte prüfen |
| Keine Suchtreffer | Crawl-Logs prüfen; Crawl-Ziele prüfen |
| Authentifizierung schlägt fehl | Mehrstufigen Flow und Session-Timeouts prüfen |
| Crawl zu langsam | Crawl-Tiefe oder URL-Muster einschränken; Rate limiting anpassen |
| Falsche Inhalte indexiert | Include/Exclude-Muster verfeinern; Dienstkonto prüfen |
| Korrekturen fehlen | Correct Intranet aktivieren; Nutzerrechte prüfen |
Bei Problemen oder komplexer Authentifizierung kontaktiere den Intric-Support mit:
- Tenant-Name
- Name des MCP-Servers
- Screenshots von Fehlermeldungen
- Ausschnitten aus Crawl-Logs (falls zutreffend)
- Beschreibung der Intranet-Authentifizierung