Vi använder AI för att digitalisera. Sedan kommer token-fakturan.
- Vad CEOs ser: "Vi behöver AI. Vi automatiserar och sparar 30% på löner"
- Vad CTOs gör: Vi använder väl OpenAI, Microsoft Copilot eller Google - vad kan gå fel?Vad man missar: Token-kostnader med höga driftskostnader
Exempel Ett företag med 250 anställda tror AI kostar 60 000 kr/år för ChatGPT Plus-licenser. Sedan bygger de automationer via API som sorterar 10 000 mail/dag, bedömer 200 leads/dag i CRM och granskar 80 fakturor/dag. Det blir 460 000 AI-anrop per månad.
Med GPT-4 överallt kostar det 85 000 kr/mån = 1.02M kr/år. Med intelligent routing som använder billiga modeller för enkel sortering och dyra modeller endast för komplex analys kostar samma automation 12 000 kr/mån = 144 000 kr/år. Skillnad: 876 000 kronor per år. Smaka på siffran för det är ett litet företag!
Varför händer det här? Priset mellan AI-modeller varierar 300x. Men de flesta kör “bästa modellen” för allt. Det är som att använda kirurg för att sätta plåster och kostar både pengar och miljö.
Så hur sänker du kostnaderna med 70-90%? -Smart AI routing: Låt användare använda Perplexity och ChatGPT för enkla frågor. Bygg API-automationer endast för repetitiva processer. Använd billiga modeller för klassificering och dyra endast för komplex analys.
- Kör batch-jobb nattetid kl 02:00-06:00 mot svenska datacenter när elpriset är lägst.
- Cacha instruktioner som körs tusentals gånger.
- Koda smartare. Vi byggde en investeringsanalys-agent. Genom att byta till JSON-output minskade kostnaderna med 60%. Samma analys, bråkdel av kostnaden.
Vi har byggt ett smartverktyg AI Cost Center som visar vart pengarna går och hur man stoppar läckaget. Där kan vi simulera olika modeller och API:er Ansvarar du för IT-budget på ett större företag med AI-automation? DM så kör vi ett scenario med er budget, förutsättningar, optimeringar och besparingar på 30 min.
Teoretisk bild: hur vårt system kommer fungera när det är klart.
Tokenoptimering - så vad kan företag göra för att minska kostnaderna för token`?
Intelligent Modell routning för att använda rätt modell -besparing på 72% av tokenkostnader- Få fler att fortsätta använda Google, Perplexity för enklare frågor
- Använd dyra modeller (Opus, GPT-5 Pro) och deep thinking endast för 20% komplexa uppgifter (partner nivå eller management nivå reasoning, analys, övervakning )
- Använd billiga modeller (Flash-Lite, GPT-5 mini) för 80% av enkla uppgifter (associate level av agent exempelvis klassificering, summering)
- OpenAI/Anthropic ger 50% rabatt om man kan vänta på sina resultat (jobb köas)
- Perfekt för rapporter, dataprocessing som inte är tidskritisk
- Anthropic/OpenAI cachar återanvända system prompts
- Cache-träffar kostar ~10% av normalt in-pris (90% billigare!)
- Bra när du har långa system-instruktioner som kan återanvändas
- Kör AI jobb på natten (00:00-06:00) när elpriset är lägre.
- Kör mot datacenters som har låga energikostnader (Sverige sist jag kollade)
- Kortare system-instruktioner
- Använd JSON-läge. När jag ändrade min investeringsagent till json kod så blev det betydligt billigare
- Truncera conversation history
- Tool-responses som returnerar endast nödvändiga fält
Därför byggde vi AI Cost Center Det här leder mig till något vi byggt parallellt: AI Cost Center - en plattform för enterprise cost management av AI-driven verksamhet. Token-priser varierar 300 gånger mellan de dyraste och billigaste modellerna idag. Och de flesta företag har ingen aning om vad deras AI-verktyg faktiskt kostar. AI Cost Center är byggd för CFO:er och ekonomiansvariga Vi har byggt Cost Center - ett verktyg som mäter token- och API-kostnader i realtid, rekommenderar billigaste modell per task, och identifierar besparingsmöjligheter. Är du ett stort företag kör vi din årsredovisning genom deep seek och får fram siffror att simulera. Här finns miljarder att spara.