Varför AI-sökmotorer behöver en annorlunda sorts sajt
Traditionella sökmotorer bygger ett ordindex och rankar sidor efter relevans och auktoritet. AI-drivna tjänster som ChatGPT, Perplexity och Googles AI-översikter arbetar på ett annat sätt: de extraherar faktainnehåll, syntetiserar svar och citerar källor direkt. Det innebär att din sajts synlighet i AI-svar beror på hur maskinläsbar din struktur är, inte bara på hur välskrivet innehållet är.
Den här guiden ger dig konkreta steg för att göra din webbplats begriplig för automatiserade system, från strukturerad data till botkontroll i robots.txt.
Strukturerad data med schema.org JSON-LD
Strukturerad data är maskinläsbar metadata som du bäddar in i sidans HTML. Schema.org är det gemensamma vokabulär som Google, Microsoft och Yandex enas kring för att beskriva webbinnehåll. Det rekommenderade formatet är JSON-LD, ett skriptblock som du lägger i sidans <head> utan att ändra synlig HTML.
Dessa typer ger mest utväxling:
- Article – för guider och redaktionellt innehåll. Anger rubrik, publicerings- och uppdateringsdatum samt författare på ett maskinläsbart sätt.
- Organization – för sidor om dig eller ditt företag. Anger namn, logotyp, kontaktuppgifter och sociala profiler.
- FAQPage – för sidor med frågor och svar. AI-system kan extrahera och citera enskilda svar direkt utan att behöva tolka hela sidan.
- BreadcrumbList – för navigeringssökvägar. Hjälper maskiner att förstå sidans plats i sajtstrukturen.
Ett minimalt Article-block ser ut så här:
<script type="application/ld+json">
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "Rubrik på din artikel",
"author": {"@type": "Person", "name": "Namn Namnsson"},
"datePublished": "2025-01-15",
"dateModified": "2025-06-01"
}
</script>
Tydlig metadata
Grundläggande HTML-metadata är fortfarande central för hur maskiner identifierar och kategoriserar dina sidor:
- title: Skriv en unik och beskrivande titel per sida, helst under 60 tecken.
- meta description: Sammanfatta sidans innehåll på ungefär 150 tecken. Citera inte sidtiteln ordagrant.
- canonical: Peka alltid ut den kanoniska URL:en med
<link rel="canonical">så att maskiner vet vilken version av sidan som gäller vid duplicerat innehåll. - lang-attribut: Sätt
lang="sv"på<html>-elementet. Det talar om för modeller och hjälpmedel vilket språk innehållet är på. - Open Graph: Taggar som
og:title,og:descriptionochog:imageanvänds av sociala plattformar och av en del AI-system vid länkförhandsgranskningar.
En logisk rubrikstruktur
Använd exakt en <h1> per sida, och låt den sammanfatta sidans ämne. Under den placerar du <h2> för avsnitt och <h3> för underrubriker i fallande ordning utan hopp i hierarkin. En välordnad struktur gör det enkelt för AI-system att dela upp sidan i meningsfulla segment och hämta rätt avsnitt vid specifika frågor.
llms.txt – en fil riktad till språkmodeller
llms.txt-konventionen föreslår att sajter lägger en Markdown-fil på /llms.txt. Filen innehåller en kort sammanfattning av sajten och curaterade länkar till de viktigaste sidorna. Tanken är att ge språkmodeller ett kompakt startdokument när de behöver förstå en hel webbplats utan att ladda ner tusentals URL:er.
En enkel llms.txt kan se ut så här:
# Sajt AB
> Vi hjälper [målgrupp] med [ämne].
## Viktigt
- [Om oss](/om-oss/)
- [Vanliga frågor](/faq/)
- [Kontakt](/kontakt/)
AI-botar i robots.txt – tillåt eller blockera
Flera AI-företag crawlar webben med egna botar som respekterar robots.txt. Du har ett aktivt val att göra för varje bot:
- GPTBot (OpenAI): samlar data för träning av GPT-modellerna. Robots.txt-token:
GPTBot. - ClaudeBot (Anthropic): bidrar till träningsdata för Claude-modellerna. Token:
ClaudeBot. - PerplexityBot (Perplexity AI): indexerar webbinnehåll för AI-drivna söksvar. Token:
PerplexityBot. - Google-Extended (Google): en separat token för att styra om ditt innehåll används för Gemini-träning och Vertex AI. Påverkar inte din placering i vanliga Google-sökresultat. Token:
Google-Extended. - CCBot (Common Crawl): nonprofit-organisation som bygger ett öppet webbarkiv. Arkivet används av flera AI-projekt som träningskälla. Token:
CCBot.
Viktigt att förstå: träningsbotar och citeringsbotar är inte samma sak. GPTBot och ClaudeBot samlar data för att träna framtida modeller. De botar som styr om din sajt citeras i realtidssvar är andra: OAI-SearchBot driver ChatGPT:s webbsökning och Claude-User hämtar sidor när en användare ber Claude att läsa webben. Vill du synas i AI-svar i dag räcker det alltså inte att tillåta träningsbotarna.
- GPTBot (OpenAI): träningsdata, påverkar framtida modeller.
- OAI-SearchBot (OpenAI): ChatGPT:s webbsökning, påverkar realtidsciteringar.
- ClaudeBot (Anthropic): träningsdata, påverkar framtida modeller.
- Claude-User (Anthropic): användarinitierad läsning, påverkar realtidsciteringar.
Att blockera en bot hindrar att systemet i fråga använder ditt innehåll. Att tillåta det kan öka chansen att ditt innehåll citeras i det systemets svar. Inget av de två valen är objektivt rätt, det beror på din strategi. Exempel som blockerar GPTBot och tillåter allt annat:
User-agent: GPTBot
Disallow: /
Server-renderat innehåll
AI-träningsbotar som GPTBot, ClaudeBot och CCBot kör inte JavaScript, de hämtar bara den råa HTML som servern skickar. Googlebot renderar däremot JavaScript via sin Web Rendering Service, men renderingen sker fördröjt och är opålitlig för innehåll som laddas in dynamiskt. Innehåll som laddas via JavaScript-ramverk (React, Vue, Angular) utan server-rendering är därför osynligt eller försenat för dessa system. Se till att sidans huvudsakliga text finns i den HTML som servern skickar, inte enbart inladdat via klientens webbläsare i efterhand.
E-E-A-T-signaler som bygger trovärdighet
Googles ramverk E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness) är ett sätt att bedöma hur trovärdig en källa är. AI-system gör liknande bedömningar automatiskt. Praktiska steg:
- Ange alltid en synlig författare med namn och kort biografi på varje artikel.
- Visa publicerings- och uppdateringsdatum tydligt på sidan.
- Ha en dedikerad Om-sida och en tydlig Kontakt-sida.
- Länka till dina primärkällor inline i texten, inte bara i en referenslista i sidfoten.
Dessa signaler hjälper automatiserade system att avgöra om din sajt förtjänar att citeras framför en annan.
Vill du se hur din sajt faktiskt presterar på alla dessa punkter? Testa gratis med AI-läsbarhetskollen.