Guida a installazione e configurazione

Questa guida accompagna l’intera configurazione del crawler intranet, dalla prima impostazione all’abilitazione del tool per i tuoi assistenti. Servono permessi di amministratore in Intric e di solito il coordinamento con IT o chi gestisce l’intranet.

Per una panoramica di funzionalità e sicurezza, vedi l’articolo qui sotto.

Crawler intranet

Prerequisiti

Prima di iniziare, assicurati che:

Tu abbia permessi di amministratore nel tenant Intric
Il modulo MCP sia abilitato per il tenant
Abbiate individuato quali contenuti dell’intranet indicizzare
Abbiate creato o scelto un account di servizio con permessi adeguati sull’intranet
L’intranet sia raggiungibile via HTTPS
Comprendiate i requisiti di autenticazione dell’intranet

Passaggio 1: Crea il record del server MCP

Vai alla sezione MCP servers nell’interfaccia di amministrazione Intric.

Fai clic su Create e assegna un nome descrittivo, ad esempio «Crawler intranet aziendale» o «Ricerca nel manuale del personale».

Il record viene creato. Puoi configurare i dettagli di connessione.

Passaggio 2: Configura URL del server e autenticazione

Modifica il server appena creato e inserisci:

URL del server

Indica l’endpoint HTTPS del servizio crawler intranet. L’URL viene fornito da Intric durante il coordinamento del setup.

Esempio: https://crawler.yourcompany.intric.app/mcp

Autenticazione

Scegli API key come tipo di autenticazione.

Fornisci la chiave API generata durante il provisioning del servizio crawler. Serve a autenticare le richieste di Intric verso il crawler ed è crittografata a riposo.

Nota di sicurezza: Conserva la chiave in modo sicuro. Dopo il salvataggio non sarà visibile nell’interfaccia; si indica solo se una chiave è configurata.

Descrizione (facoltativa)

Aggiungi una descrizione per altri amministratori, ad esempio:

«Indicizza il manuale del personale, le policy HR e la documentazione IT dall’intranet interno.»

Salva la configurazione. Intric rileva automaticamente le funzionalità Search Intranet e Correct Intranet (con questi nomi nella piattaforma).

Passaggio 3: Configura le destinazioni di crawl

Le destinazioni definiscono quali pagine il crawler deve visitare e indicizzare.

Nella configurazione del server MCP, apri la sezione Crawl targets.

Aggiungi gli URL per ogni area da indicizzare. Per ogni destinazione specifica:

URL — Punto di partenza del crawl (es. https://intranet.yourcompany.com/handbook)
Crawl depth (facoltativo) — Quanti livelli di link seguire dall’URL iniziale
URL patterns (facoltativo) — Includi o escludi modelli di URL

Esempio:

URL: https://intranet.yourcompany.com/handbook
Depth: 2
Include patterns: /handbook/*, /policies/*
Exclude patterns: /archive/*, /draft/*

Questa configurazione indicizza il manuale e le pagine policy collegate, escludendo archivio e bozze.

Passaggio 4: Configura l’autenticazione per il crawler

Il crawler necessita di credenziali per accedere all’intranet. La configurazione dipende dal metodo di autenticazione.

Fornisci nome utente e password dell’account di servizio.

Importante: Indica quale account di servizio usare e assicurati che abbia:

Accesso a tutti i contenuti da indicizzare
Nessun accesso a contenuti che devono restare limitati
Password forte e univoca
Logging di audit appropriato ove previsto

Autenticazione a più passaggi

Se l’intranet richiede più passaggi (es. password e domanda di sicurezza), collabora con il team tecnico Intric per configurare il flusso.

Fornisci:

Istruzioni passo passo per l’accesso
Eventuali domande e risposte di sicurezza
Informazioni sui timeout di sessione

Nota: Flussi con CAPTCHA o autenticazione a due fattori basata sul dispositivo non sono attualmente supportati.

SSO o OAuth

Se l’intranet usa single sign-on o OAuth, contatta il supporto Intric per la configurazione corretta.

Passaggio 5: Configura l’estrazione dei documenti

Il crawler può estrarre e indicizzare vari tipi di documento sull’intranet.

Nelle impostazioni Document extraction, specifica:

Supported file types — PDF, Word, Excel, ecc.
Maximum file size — I documenti più grandi vengono ignorati
Text extraction method — Come elaborare i diversi tipi

Impostazioni consigliate:

Supported types: PDF, DOCX, XLSX, TXT
Maximum size: 10 MB
Extract text from: Body content, document metadata, embedded text

Passaggio 6: Imposta la pianificazione del crawl

Configura la frequenza di re-indicizzazione.

L’impostazione predefinita è una volta al giorno (alle 02:00 UTC), adatta a molte organizzazioni. Regola in base a:

Frequenza di aggiornamento dei contenuti
Carico sui sistemi
Dimensione dell’intranet

Esempi:

Contenuti statici (manuali, policy): una volta a settimana
Contenuti aggiornati regolarmente (notizie): una volta al giorno
Contenuti molto dinamici: valuta se il crawler è lo strumento giusto

Rate limiting: Il crawler include limitazione integrata per non sovraccaricare il server intranet. Rivedi i valori predefiniti e adatta all’infrastruttura.

Passaggio 7: Verifica la configurazione

Prima della produzione:

Fai clic su Validate connection per verificare raggiungibilità e autenticazione
Controlla lo stato della connessione:
- OK — Configurazione corretta
- Unauthorized — Verifica credenziali dell’account di servizio
- Failed — Verifica URL e accesso di rete
Avvia un crawl di test manuale per verificare l’estrazione
Esamina i log di crawl
Cerca errori di autenticazione o permessi

Passaggio 8: Abilita il tool per il tenant

Al termine dei test:

Vai alla sezione Tools nell’admin
Trova il crawler intranet nell’elenco
Abilitalo per il tenant
Configura la classificazione di sicurezza se necessario

Il tool è disponibile per gli assistenti.

Passaggio 9: Collega il tool agli assistenti

Per consentire l’uso agli utenti:

Apri o crea un assistente in uno Space
Vai alla configurazione Tools dell’assistente
Aggiungi il tool crawler intranet
Salva l’assistente

Gli utenti possono chiedere all’assistente di cercare contenuti intranet nelle conversazioni.

Gestione delle correzioni

Quando gli utenti suggeriscono correzioni:

Le correzioni compaiono nel pannello admin Intranet corrections
Valuta ogni suggerimento
Opzioni:
- Accept — Applica come inviato
- Modify — Modifica prima di applicare
- Reject — Rifiuta con feedback facoltativo

Le correzioni accettate entrano nell’indice di ricerca al ciclo di crawl successivo.

Procedure di sicurezza consigliate

Account di servizio

Crea un account dedicato al crawler
Concedi solo i permessi minimi necessari
Usa password forte e univoca
Abilita audit logging
Rivedi periodicamente gli accessi

Ambito dei contenuti

Scegli con cura le sezioni da indicizzare
Escludi dati HR sensibili, informazioni finanziarie o progetti riservati
Usa pattern URL per aree approvate
Rivedi periodicamente i contenuti indicizzati

Controllo degli accessi

Imposta regole di classificazione per il tool crawler intranet
Limita quali assistenti possono usare il crawler
Valuta assistenti specializzati per aree sensibili
Usa i permessi dello Space per chi può usare assistenti con intranet

Risoluzione dei problemi

Problema	Soluzione
”Server URL is not set”	Modifica il server MCP e inserisci un URL HTTPS valido
”Unauthorized” in validazione	Verifica credenziali e permessi dell’account di servizio
Nessun risultato di ricerca	Controlla i log di crawl e le destinazioni
Autenticazione che fallisce ripetutamente	Rivedi configurazione multi-step e timeout di sessione
Crawl troppo lento	Riduci profondità o restringi pattern URL; regola rate limiting
Contenuti errati indicizzati	Affina pattern include/exclude; verifica account di servizio
Correzioni assenti	Assicurati che Correct Intranet sia abilitato; verifica permessi utente

Assistenza

Per problemi durante il setup o autenticazioni complesse, contatta il supporto Intric con:

Nome del tenant
Nome del server MCP
Screenshot degli errori
Estratti dai log di crawl (se applicabile)
Descrizione del metodo di autenticazione dell’intranet