Salta ai contenuti

Guida a installazione e configurazione

Questa guida accompagna l’intera configurazione del crawler intranet, dalla prima impostazione all’abilitazione del tool per i tuoi assistenti. Servono permessi di amministratore in Intric e di solito il coordinamento con IT o chi gestisce l’intranet.

Per una panoramica di funzionalità e sicurezza, vedi l’articolo qui sotto.

Prima di iniziare, assicurati che:

  • Tu abbia permessi di amministratore nel tenant Intric
  • Il modulo MCP sia abilitato per il tenant
  • Abbiate individuato quali contenuti dell’intranet indicizzare
  • Abbiate creato o scelto un account di servizio con permessi adeguati sull’intranet
  • L’intranet sia raggiungibile via HTTPS
  • Comprendiate i requisiti di autenticazione dell’intranet

Vai alla sezione MCP servers nell’interfaccia di amministrazione Intric.

Fai clic su Create e assegna un nome descrittivo, ad esempio «Crawler intranet aziendale» o «Ricerca nel manuale del personale».

Il record viene creato. Puoi configurare i dettagli di connessione.

Passaggio 2: Configura URL del server e autenticazione

Sezione intitolata “Passaggio 2: Configura URL del server e autenticazione”

Modifica il server appena creato e inserisci:

Indica l’endpoint HTTPS del servizio crawler intranet. L’URL viene fornito da Intric durante il coordinamento del setup.

Esempio: https://crawler.yourcompany.intric.app/mcp

Scegli API key come tipo di autenticazione.

Fornisci la chiave API generata durante il provisioning del servizio crawler. Serve a autenticare le richieste di Intric verso il crawler ed è crittografata a riposo.

Nota di sicurezza: Conserva la chiave in modo sicuro. Dopo il salvataggio non sarà visibile nell’interfaccia; si indica solo se una chiave è configurata.

Aggiungi una descrizione per altri amministratori, ad esempio:

«Indicizza il manuale del personale, le policy HR e la documentazione IT dall’intranet interno.»

Salva la configurazione. Intric rileva automaticamente le funzionalità Search Intranet e Correct Intranet (con questi nomi nella piattaforma).

Le destinazioni definiscono quali pagine il crawler deve visitare e indicizzare.

Nella configurazione del server MCP, apri la sezione Crawl targets.

Aggiungi gli URL per ogni area da indicizzare. Per ogni destinazione specifica:

  • URL — Punto di partenza del crawl (es. https://intranet.yourcompany.com/handbook)
  • Crawl depth (facoltativo) — Quanti livelli di link seguire dall’URL iniziale
  • URL patterns (facoltativo) — Includi o escludi modelli di URL

Esempio:

URL: https://intranet.yourcompany.com/handbook
Depth: 2
Include patterns: /handbook/*, /policies/*
Exclude patterns: /archive/*, /draft/*

Questa configurazione indicizza il manuale e le pagine policy collegate, escludendo archivio e bozze.

Passaggio 4: Configura l’autenticazione per il crawler

Sezione intitolata “Passaggio 4: Configura l’autenticazione per il crawler”

Il crawler necessita di credenziali per accedere all’intranet. La configurazione dipende dal metodo di autenticazione.

Fornisci nome utente e password dell’account di servizio.

Importante: Indica quale account di servizio usare e assicurati che abbia:

  • Accesso a tutti i contenuti da indicizzare
  • Nessun accesso a contenuti che devono restare limitati
  • Password forte e univoca
  • Logging di audit appropriato ove previsto

Se l’intranet richiede più passaggi (es. password e domanda di sicurezza), collabora con il team tecnico Intric per configurare il flusso.

Fornisci:

  • Istruzioni passo passo per l’accesso
  • Eventuali domande e risposte di sicurezza
  • Informazioni sui timeout di sessione

Nota: Flussi con CAPTCHA o autenticazione a due fattori basata sul dispositivo non sono attualmente supportati.

Se l’intranet usa single sign-on o OAuth, contatta il supporto Intric per la configurazione corretta.

Passaggio 5: Configura l’estrazione dei documenti

Sezione intitolata “Passaggio 5: Configura l’estrazione dei documenti”

Il crawler può estrarre e indicizzare vari tipi di documento sull’intranet.

Nelle impostazioni Document extraction, specifica:

  • Supported file types — PDF, Word, Excel, ecc.
  • Maximum file size — I documenti più grandi vengono ignorati
  • Text extraction method — Come elaborare i diversi tipi

Impostazioni consigliate:

Supported types: PDF, DOCX, XLSX, TXT
Maximum size: 10 MB
Extract text from: Body content, document metadata, embedded text

Configura la frequenza di re-indicizzazione.

L’impostazione predefinita è una volta al giorno (alle 02:00 UTC), adatta a molte organizzazioni. Regola in base a:

  • Frequenza di aggiornamento dei contenuti
  • Carico sui sistemi
  • Dimensione dell’intranet

Esempi:

  • Contenuti statici (manuali, policy): una volta a settimana
  • Contenuti aggiornati regolarmente (notizie): una volta al giorno
  • Contenuti molto dinamici: valuta se il crawler è lo strumento giusto

Rate limiting: Il crawler include limitazione integrata per non sovraccaricare il server intranet. Rivedi i valori predefiniti e adatta all’infrastruttura.

Prima della produzione:

  1. Fai clic su Validate connection per verificare raggiungibilità e autenticazione
  2. Controlla lo stato della connessione:
    • OK — Configurazione corretta
    • Unauthorized — Verifica credenziali dell’account di servizio
    • Failed — Verifica URL e accesso di rete
  3. Avvia un crawl di test manuale per verificare l’estrazione
  4. Esamina i log di crawl
  5. Cerca errori di autenticazione o permessi

Al termine dei test:

  1. Vai alla sezione Tools nell’admin
  2. Trova il crawler intranet nell’elenco
  3. Abilitalo per il tenant
  4. Configura la classificazione di sicurezza se necessario

Il tool è disponibile per gli assistenti.

Per consentire l’uso agli utenti:

  1. Apri o crea un assistente in uno Space
  2. Vai alla configurazione Tools dell’assistente
  3. Aggiungi il tool crawler intranet
  4. Salva l’assistente

Gli utenti possono chiedere all’assistente di cercare contenuti intranet nelle conversazioni.

Quando gli utenti suggeriscono correzioni:

  1. Le correzioni compaiono nel pannello admin Intranet corrections
  2. Valuta ogni suggerimento
  3. Opzioni:
    • Accept — Applica come inviato
    • Modify — Modifica prima di applicare
    • Reject — Rifiuta con feedback facoltativo

Le correzioni accettate entrano nell’indice di ricerca al ciclo di crawl successivo.

  • Crea un account dedicato al crawler
  • Concedi solo i permessi minimi necessari
  • Usa password forte e univoca
  • Abilita audit logging
  • Rivedi periodicamente gli accessi
  • Scegli con cura le sezioni da indicizzare
  • Escludi dati HR sensibili, informazioni finanziarie o progetti riservati
  • Usa pattern URL per aree approvate
  • Rivedi periodicamente i contenuti indicizzati
  • Imposta regole di classificazione per il tool crawler intranet
  • Limita quali assistenti possono usare il crawler
  • Valuta assistenti specializzati per aree sensibili
  • Usa i permessi dello Space per chi può usare assistenti con intranet
ProblemaSoluzione
”Server URL is not set”Modifica il server MCP e inserisci un URL HTTPS valido
”Unauthorized” in validazioneVerifica credenziali e permessi dell’account di servizio
Nessun risultato di ricercaControlla i log di crawl e le destinazioni
Autenticazione che fallisce ripetutamenteRivedi configurazione multi-step e timeout di sessione
Crawl troppo lentoRiduci profondità o restringi pattern URL; regola rate limiting
Contenuti errati indicizzatiAffina pattern include/exclude; verifica account di servizio
Correzioni assentiAssicurati che Correct Intranet sia abilitato; verifica permessi utente

Per problemi durante il setup o autenticazioni complesse, contatta il supporto Intric con:

  • Nome del tenant
  • Nome del server MCP
  • Screenshot degli errori
  • Estratti dai log di crawl (se applicabile)
  • Descrizione del metodo di autenticazione dell’intranet