Asennus- ja määritysopas
Tämä opas käy läpi intranet-crawlerin koko käyttöönoton ensimmäisistä asetuksista siihen, että työkalu on käytössä avustajillasi. Tarvitset järjestelmänvalvojan oikeudet Intricissä ja teet yleensä yhteistyötä IT:n tai intranet-vastaavien kanssa.
Katso kattava kuvaus ominaisuuksista ja turvallisuudesta alla olevasta artikkelista.
Edellytykset
Osio nimeltä “Edellytykset”Ennen aloitusta varmista:
- Sinulla on järjestelmänvalvojan oikeudet Intric-tenantissa
- MCP-moduuli on käytössä tenantilla
- Tiedätte, mikä intranet-sisältö indeksoidaan
- Olette luoneet tai valinneet palvelutilin, jolla on sopivat oikeudet intranetissa
- Intranet on saavutettavissa HTTPS:n yli
- Ymmärrätte intranetin tunnistautumisvaatimukset
Vaihe 1: Luo MCP-palvelintietue
Osio nimeltä “Vaihe 1: Luo MCP-palvelintietue”Siirry kohdassa MCP servers Intricin hallintakäyttöliittymässä.
Napsauta Create ja anna kuvaava nimi, esim. «Organisaation intranet-crawler» tai «Henkilöstöoppaan haku».
Tietue luodaan. Voit jatkaa yhteysasetusten määritystä.
Vaihe 2: Määritä palvelimen URL ja tunnistautuminen
Osio nimeltä “Vaihe 2: Määritä palvelimen URL ja tunnistautuminen”Muokkaa uutta palvelinta ja täytä:
Palvelimen URL
Osio nimeltä “Palvelimen URL”Anna intranet-crawler-palvelun HTTPS-päätepiste. Intric toimittaa URL:n käyttöönoton yhteydessä.
Esimerkki: https://crawler.yourcompany.intric.app/mcp
Tunnistautuminen
Osio nimeltä “Tunnistautuminen”Valitse tunnistautumistyyppi API key.
Anna API-avain, joka luotiin crawler-palvelun käyttöönotossa. Avain todentaa Intricin kutsut crawleriin ja tallennetaan levossa salattuna.
Turvallisuus: Säilytä avain turvallisesti. Tallennuksen jälkeen sitä ei näytetä käyttöliittymässä; näkyy vain, onko avain asetettu.
Kuvaus (valinnainen)
Osio nimeltä “Kuvaus (valinnainen)”Lisää kuvaus muiden ylläpitäjien hyödyksi, esim.:
«Indeksoi henkilöstöoppaan, HR-käytännöt ja IT-dokumentaation sisäisestä intranetista.»
Tallenna määritys. Intric tunnistaa automaattisesti toiminnot Search Intranet ja Correct Intranet (näillä nimillä alustalla).
Vaihe 3: Määritä crawl-kohteet
Osio nimeltä “Vaihe 3: Määritä crawl-kohteet”Crawl-kohteet määrittävät, mitkä sivut crawler käy ja indeksoi.
MCP-palvelimen asetuksissa siirry kohtaan Crawl targets.
Lisää URL-osoitteet jokaiselle indeksoitavalle alueelle. Kullekin kohteelle:
- URL — Crawlin aloituspiste (esim.
https://intranet.yourcompany.com/handbook) - Crawl depth (valinnainen) — Montako linkkitasoa seurataan aloitus-URL:stä
- URL patterns (valinnainen) — Sisällytä tai sulje pois URL-malleja
Esimerkki:
URL: https://intranet.yourcompany.com/handbookDepth: 2Include patterns: /handbook/*, /policies/*Exclude patterns: /archive/*, /draft/*Tämä indeksoi oppaan ja linkitetyt käytännöt, mutta ohittaa arkiston ja luonnokset.
Vaihe 4: Määritä crawlerin tunnistautuminen
Osio nimeltä “Vaihe 4: Määritä crawlerin tunnistautuminen”Crawler tarvitsee tunnukset intranetin käyttöön. Konfiguraatio riippuu tunnistautumistavasta.
Perustunnistautuminen tai lomakkeella kirjautuminen
Osio nimeltä “Perustunnistautuminen tai lomakkeella kirjautuminen”Anna palvelutilin käyttäjätunnus ja salasana.
Tärkeää: Määritä käytettävä palvelutili ja varmista, että sillä on:
- Pääsy kaikkeen indeksoitavaan sisältöön
- Ei pääsyä sisältöön, joka pitää pitää rajattuna
- Vahva, yksilöllinen salasana
- Tarvittaessa tarkastuslokitus
Monivaiheinen tunnistautuminen
Osio nimeltä “Monivaiheinen tunnistautuminen”Jos intranet vaatii useita vaiheita (esim. salasana ja turvallisuuskysymys), tee yhteistyötä Intricin teknisen tiimin kanssa.
Toimita:
- Vaiheittaiset ohjeet kirjautumiseen
- Mahdolliset turvallisuuskysymykset ja vastaukset
- Tiedot istunnon vanhenemisesta
Huom: CAPTCHA- tai laitepohjaista kaksivaiheista tunnistautumista ei tueta tällä hetkellä.
SSO tai OAuth
Osio nimeltä “SSO tai OAuth”Jos intranet käyttää kertakirjautumista tai OAuthia, ota yhteyttä Intricin tukeen.
Vaihe 5: Määritä asiakirjojen poiminta
Osio nimeltä “Vaihe 5: Määritä asiakirjojen poiminta”Crawler voi poimia ja indeksöidä eri tiedostotyyppejä intranetissa.
Kohdassa Document extraction määritä:
- Supported file types — PDF, Word, Excel jne.
- Maximum file size — Suuremmat tiedostot ohitetaan
- Text extraction method — Miten tyypit käsitellään
Suositellut asetukset:
Supported types: PDF, DOCX, XLSX, TXTMaximum size: 10 MBExtract text from: Body content, document metadata, embedded textVaihe 6: Aseta crawl-aikataulu
Osio nimeltä “Vaihe 6: Aseta crawl-aikataulu”Määritä, kuinka usein sisältö indeksoidaan uudelleen.
Oletus on kerran päivässä (klo 02.00 UTC), mikä sopii monille organisaatioille. Säädä:
- Sisällön päivitystiheyden
- Järjestelmäkuorman
- Intranetin koon
Esimerkkejä:
- Staattinen sisältö (oppaat, käytännöt): kerran viikossa
- Säännöllisesti päivittyvä (uutiset): kerran päivässä
- Hyvin muuttuva sisältö: onko crawler oikea työkalu
Rate limiting: Crawlerissa on sisäänrakennettu rajoitus intranet-palvelimen kuorman välttämiseksi. Tarkista oletukset ja säädä tarvittaessa.
Vaihe 7: Testaa määritys
Osio nimeltä “Vaihe 7: Testaa määritys”Ennen tuotantoa:
- Napsauta Validate connection varmistaaksesi yhteyden ja tunnistautumisen
- Tarkista tila:
- OK — Kaikki kunnossa
- Unauthorized — Tarkista palvelutili
- Failed — Tarkista URL ja verkko
- Käynnistä manuaalinen testicrawl sisällön poiminnan varmistamiseksi
- Lue crawl-lokit
- Etsi tunnistautumis- tai oikeusvirheitä
Vaihe 8: Ota työkalu käyttöön tenantilla
Osio nimeltä “Vaihe 8: Ota työkalu käyttöön tenantilla”Kun testit on tehty:
- Siirry hallinnassa kohtaan Tools
- Etsi intranet-crawler luettelosta
- Ota se käyttöön tenantillasi
- Määritä tarvittaessa turvallisuusluokitus
Työkalu on käytettävissä avustajissa.
Vaihe 9: Liitä työkalu avustajiin
Osio nimeltä “Vaihe 9: Liitä työkalu avustajiin”Jotta käyttäjät voivat käyttää crawleria:
- Avaa tai luo avustaja Spacessa
- Siirry avustajan Tools -asetuksiin
- Lisää intranet-crawler-työkalu
- Tallenna avustaja
Käyttäjät voivat pyytää avustajaa hakemaan intranet-sisältöä keskusteluissa.
Korjausten hallinta
Osio nimeltä “Korjausten hallinta”Kun käyttäjät ehdottavat korjauksia:
- Korjaukset näkyvät hallintapaneelissa Intranet corrections
- Arvioi jokainen ehdotus
- Vaihtoehdot:
- Accept — Hyväksy sellaisenaan
- Modify — Muokkaa ennen hyväksyntää
- Reject — Hylkää valinnaisella palautteella
Hyväksytyt korjaukset päivittävät hakemiston seuraavalla crawl-kierroksella.
Turvallisuuden parhaat käytännöt
Osio nimeltä “Turvallisuuden parhaat käytännöt”Palvelutili
Osio nimeltä “Palvelutili”- Luo crawlerille oma tili
- Anna vain välttämättömät oikeudet
- Käytä vahvaa, yksilöllistä salasanaa
- Ota käyttöön lokitus
- Tarkista käyttöoikeudet säännöllisesti
Sisällön rajaus
Osio nimeltä “Sisällön rajaus”- Valitse huolellisesti indeksoitavat alueet
- Jätä pois arkaluontoinen HR-, talous- tai luottamuksellinen aineisto
- Käytä URL-malleja hyväksyttyihin alueisiin
- Tarkista indeksoitu sisältö säännöllisesti
Pääsynhallinta
Osio nimeltä “Pääsynhallinta”- Määritä turvallisuusluokituksen säännöt intranet-crawlerille
- Rajoita, millä avustajilla työkalu on
- Harkitse erikoisavustajia herkille alueille
- Käytä Space-oikeuksia intranet-avustajien käyttäjiin
Vianmääritys
Osio nimeltä “Vianmääritys”| Ongelma | Ratkaisu |
|---|---|
| ”Server URL is not set” | Muokkaa MCP-palvelinta ja anna kelvollinen HTTPS-URL |
| ”Unauthorized” validoinnissa | Tarkista palvelutili ja oikeudet |
| Ei hakutuloksia | Tarkista crawl-lokit ja crawl-kohteet |
| Tunnistautuminen epäonnistuu toistuvasti | Tarkista monivaihemääritys ja istuntojen vanheneminen |
| Crawl on hidas | Pienennä syvyyttä tai rajaa URL-malleja; säädä rate limiting |
| Väärä sisältö indeksoituu | Tarkenna include/exclude-malleja; tarkista palvelutili |
| Korjaukset eivät näy | Varmista Correct Intranet käytössä; tarkista käyttöoikeudet |
Ongelmissa tai monimutkaisessa tunnistautumisessa ota yhteyttä Intricin tukeen ja kerro:
- Tenantin nimi
- MCP-palvelimen nimi
- Kuvakaappaukset virheistä
- Crawl-lokien otteet (tarvittaessa)
- Kuvaus intranetin tunnistautumistavasta