Guida a installazione e configurazione
Questa guida accompagna l’intera configurazione del crawler intranet, dalla prima impostazione all’abilitazione del tool per i tuoi assistenti. Servono permessi di amministratore in Intric e di solito il coordinamento con IT o chi gestisce l’intranet.
Per una panoramica di funzionalità e sicurezza, vedi l’articolo qui sotto.
Prerequisiti
Sezione intitolata “Prerequisiti”Prima di iniziare, assicurati che:
- Tu abbia permessi di amministratore nel tenant Intric
- Il modulo MCP sia abilitato per il tenant
- Abbiate individuato quali contenuti dell’intranet indicizzare
- Abbiate creato o scelto un account di servizio con permessi adeguati sull’intranet
- L’intranet sia raggiungibile via HTTPS
- Comprendiate i requisiti di autenticazione dell’intranet
Passaggio 1: Crea il record del server MCP
Sezione intitolata “Passaggio 1: Crea il record del server MCP”Vai alla sezione MCP servers nell’interfaccia di amministrazione Intric.
Fai clic su Create e assegna un nome descrittivo, ad esempio «Crawler intranet aziendale» o «Ricerca nel manuale del personale».
Il record viene creato. Puoi configurare i dettagli di connessione.
Passaggio 2: Configura URL del server e autenticazione
Sezione intitolata “Passaggio 2: Configura URL del server e autenticazione”Modifica il server appena creato e inserisci:
URL del server
Sezione intitolata “URL del server”Indica l’endpoint HTTPS del servizio crawler intranet. L’URL viene fornito da Intric durante il coordinamento del setup.
Esempio: https://crawler.yourcompany.intric.app/mcp
Autenticazione
Sezione intitolata “Autenticazione”Scegli API key come tipo di autenticazione.
Fornisci la chiave API generata durante il provisioning del servizio crawler. Serve a autenticare le richieste di Intric verso il crawler ed è crittografata a riposo.
Nota di sicurezza: Conserva la chiave in modo sicuro. Dopo il salvataggio non sarà visibile nell’interfaccia; si indica solo se una chiave è configurata.
Descrizione (facoltativa)
Sezione intitolata “Descrizione (facoltativa)”Aggiungi una descrizione per altri amministratori, ad esempio:
«Indicizza il manuale del personale, le policy HR e la documentazione IT dall’intranet interno.»
Salva la configurazione. Intric rileva automaticamente le funzionalità Search Intranet e Correct Intranet (con questi nomi nella piattaforma).
Passaggio 3: Configura le destinazioni di crawl
Sezione intitolata “Passaggio 3: Configura le destinazioni di crawl”Le destinazioni definiscono quali pagine il crawler deve visitare e indicizzare.
Nella configurazione del server MCP, apri la sezione Crawl targets.
Aggiungi gli URL per ogni area da indicizzare. Per ogni destinazione specifica:
- URL — Punto di partenza del crawl (es.
https://intranet.yourcompany.com/handbook) - Crawl depth (facoltativo) — Quanti livelli di link seguire dall’URL iniziale
- URL patterns (facoltativo) — Includi o escludi modelli di URL
Esempio:
URL: https://intranet.yourcompany.com/handbookDepth: 2Include patterns: /handbook/*, /policies/*Exclude patterns: /archive/*, /draft/*Questa configurazione indicizza il manuale e le pagine policy collegate, escludendo archivio e bozze.
Passaggio 4: Configura l’autenticazione per il crawler
Sezione intitolata “Passaggio 4: Configura l’autenticazione per il crawler”Il crawler necessita di credenziali per accedere all’intranet. La configurazione dipende dal metodo di autenticazione.
Autenticazione di base o login tramite modulo
Sezione intitolata “Autenticazione di base o login tramite modulo”Fornisci nome utente e password dell’account di servizio.
Importante: Indica quale account di servizio usare e assicurati che abbia:
- Accesso a tutti i contenuti da indicizzare
- Nessun accesso a contenuti che devono restare limitati
- Password forte e univoca
- Logging di audit appropriato ove previsto
Autenticazione a più passaggi
Sezione intitolata “Autenticazione a più passaggi”Se l’intranet richiede più passaggi (es. password e domanda di sicurezza), collabora con il team tecnico Intric per configurare il flusso.
Fornisci:
- Istruzioni passo passo per l’accesso
- Eventuali domande e risposte di sicurezza
- Informazioni sui timeout di sessione
Nota: Flussi con CAPTCHA o autenticazione a due fattori basata sul dispositivo non sono attualmente supportati.
SSO o OAuth
Sezione intitolata “SSO o OAuth”Se l’intranet usa single sign-on o OAuth, contatta il supporto Intric per la configurazione corretta.
Passaggio 5: Configura l’estrazione dei documenti
Sezione intitolata “Passaggio 5: Configura l’estrazione dei documenti”Il crawler può estrarre e indicizzare vari tipi di documento sull’intranet.
Nelle impostazioni Document extraction, specifica:
- Supported file types — PDF, Word, Excel, ecc.
- Maximum file size — I documenti più grandi vengono ignorati
- Text extraction method — Come elaborare i diversi tipi
Impostazioni consigliate:
Supported types: PDF, DOCX, XLSX, TXTMaximum size: 10 MBExtract text from: Body content, document metadata, embedded textPassaggio 6: Imposta la pianificazione del crawl
Sezione intitolata “Passaggio 6: Imposta la pianificazione del crawl”Configura la frequenza di re-indicizzazione.
L’impostazione predefinita è una volta al giorno (alle 02:00 UTC), adatta a molte organizzazioni. Regola in base a:
- Frequenza di aggiornamento dei contenuti
- Carico sui sistemi
- Dimensione dell’intranet
Esempi:
- Contenuti statici (manuali, policy): una volta a settimana
- Contenuti aggiornati regolarmente (notizie): una volta al giorno
- Contenuti molto dinamici: valuta se il crawler è lo strumento giusto
Rate limiting: Il crawler include limitazione integrata per non sovraccaricare il server intranet. Rivedi i valori predefiniti e adatta all’infrastruttura.
Passaggio 7: Verifica la configurazione
Sezione intitolata “Passaggio 7: Verifica la configurazione”Prima della produzione:
- Fai clic su Validate connection per verificare raggiungibilità e autenticazione
- Controlla lo stato della connessione:
- OK — Configurazione corretta
- Unauthorized — Verifica credenziali dell’account di servizio
- Failed — Verifica URL e accesso di rete
- Avvia un crawl di test manuale per verificare l’estrazione
- Esamina i log di crawl
- Cerca errori di autenticazione o permessi
Passaggio 8: Abilita il tool per il tenant
Sezione intitolata “Passaggio 8: Abilita il tool per il tenant”Al termine dei test:
- Vai alla sezione Tools nell’admin
- Trova il crawler intranet nell’elenco
- Abilitalo per il tenant
- Configura la classificazione di sicurezza se necessario
Il tool è disponibile per gli assistenti.
Passaggio 9: Collega il tool agli assistenti
Sezione intitolata “Passaggio 9: Collega il tool agli assistenti”Per consentire l’uso agli utenti:
- Apri o crea un assistente in uno Space
- Vai alla configurazione Tools dell’assistente
- Aggiungi il tool crawler intranet
- Salva l’assistente
Gli utenti possono chiedere all’assistente di cercare contenuti intranet nelle conversazioni.
Gestione delle correzioni
Sezione intitolata “Gestione delle correzioni”Quando gli utenti suggeriscono correzioni:
- Le correzioni compaiono nel pannello admin Intranet corrections
- Valuta ogni suggerimento
- Opzioni:
- Accept — Applica come inviato
- Modify — Modifica prima di applicare
- Reject — Rifiuta con feedback facoltativo
Le correzioni accettate entrano nell’indice di ricerca al ciclo di crawl successivo.
Procedure di sicurezza consigliate
Sezione intitolata “Procedure di sicurezza consigliate”Account di servizio
Sezione intitolata “Account di servizio”- Crea un account dedicato al crawler
- Concedi solo i permessi minimi necessari
- Usa password forte e univoca
- Abilita audit logging
- Rivedi periodicamente gli accessi
Ambito dei contenuti
Sezione intitolata “Ambito dei contenuti”- Scegli con cura le sezioni da indicizzare
- Escludi dati HR sensibili, informazioni finanziarie o progetti riservati
- Usa pattern URL per aree approvate
- Rivedi periodicamente i contenuti indicizzati
Controllo degli accessi
Sezione intitolata “Controllo degli accessi”- Imposta regole di classificazione per il tool crawler intranet
- Limita quali assistenti possono usare il crawler
- Valuta assistenti specializzati per aree sensibili
- Usa i permessi dello Space per chi può usare assistenti con intranet
Risoluzione dei problemi
Sezione intitolata “Risoluzione dei problemi”| Problema | Soluzione |
|---|---|
| ”Server URL is not set” | Modifica il server MCP e inserisci un URL HTTPS valido |
| ”Unauthorized” in validazione | Verifica credenziali e permessi dell’account di servizio |
| Nessun risultato di ricerca | Controlla i log di crawl e le destinazioni |
| Autenticazione che fallisce ripetutamente | Rivedi configurazione multi-step e timeout di sessione |
| Crawl troppo lento | Riduci profondità o restringi pattern URL; regola rate limiting |
| Contenuti errati indicizzati | Affina pattern include/exclude; verifica account di servizio |
| Correzioni assenti | Assicurati che Correct Intranet sia abilitato; verifica permessi utente |
Assistenza
Sezione intitolata “Assistenza”Per problemi durante il setup o autenticazioni complesse, contatta il supporto Intric con:
- Nome del tenant
- Nome del server MCP
- Screenshot degli errori
- Estratti dai log di crawl (se applicabile)
- Descrizione del metodo di autenticazione dell’intranet