Skip to Content
🇨🇿Kredity a limity

Kredity a limity Alexe

Alex používá kreditový systém, který zohledňuje náročnost modelu, délku konverzace a množství kontextu, se kterým musí AI pracovat. Cílem je, aby bylo používání transparentní: v panelu vidíte aktuální stav limitu, spotřebu a případné navazující možnosti.

Tato stránka vysvětluje principy spotřeby jednoduše a prakticky. Konkrétní limity se mohou lišit podle vašeho balíčku, nastavení služby a aktivních doplňků.


Co ovlivňuje spotřebu

Každý požadavek může obsahovat více částí:

ČástCo znamená pro spotřebu
Vaše zadáníText, který Alexovi pošlete, včetně přiložených detailů
KontextHistorie konverzace, relevantní paměť, stav serveru, výstupy nástrojů nebo souborů
OdpověďText, analýza, návrh řešení a případné kroky, které Alex provádí
NástrojePráce s konzolí, soubory, logy, webem, sub-agenty nebo dalšími integracemi
CacheOpakované části kontextu, které vybrané modely dokážou zpracovat úsporněji

Spotřeba tedy není jen o počtu odeslaných zpráv. Krátký dotaz bývá úspornější než dlouhá diagnostika, která čte logy, prochází soubory a provádí více kroků.


Jak funguje cache

Některé modely podporují prompt cache. To znamená, že opakované části konverzace nebo systémového kontextu se mohou při dalších požadavcích zpracovat efektivněji.

Cache funguje automaticky. Nemusíte ji zapínat ani ručně nastavovat. Pokud ji model podporuje a situace je pro cache vhodná, Alex ji využije na pozadí.

Kdy cache pomáhá nejvíc

  • Pokračujete ve stejné konverzaci místo zakládání nové.
  • Řešíte jednu oblast postupně, například stejnou aplikaci, stejný server nebo stejný problém.
  • Navazujete na předchozí plán, výsledek kontroly nebo seznam souborů.
  • Neposíláte stále dokola celé dlouhé logy, pokud už je Alex jednou přečetl.
  • Necháte Alexe pracovat s existujícím kontextem místo opakovaného vkládání stejného zadání.

Kdy cache pomáhá méně

  • Každý dotaz začíná novou konverzací.
  • Často měníte téma, server nebo projekt.
  • Do každé zprávy kopírujete velké množství nového textu.
  • Použitý model cache nepodporuje nebo ji pro konkrétní požadavek nemůže využít.

Cache není garance nulové spotřeby. Je to optimalizace, která může snížit náročnost opakovaných částí kontextu.


Jak šetřit kredity a limity

1. Posílejte jasné zadání hned na začátku

Místo postupného doplňování po jedné větě napište cíl, omezení a očekávaný výsledek najednou.

Méně efektivní:

Podívej se na web.

Efektivnější:

Web example.cz vrací 502 po deployi. Zkontroluj nginx, PHP-FPM a poslední logy, najdi příčinu a před změnami mi napiš plán opravy.

2. Pokračujte ve stejné konverzaci

Pokud řešíte jeden problém, zůstaňte ve stejném vlákně. Alex může navázat na historii, plán a předchozí výsledky. U podporovaných modelů tím navíc dáváte cache lepší šanci pracovat úsporně.

3. Neposílejte znovu data, která Alex už vidí

Když Alex jednou načetl log, konfiguraci nebo část projektu, stačí na to odkázat:

Navaž na předchozí kontrolu nginx logu a ověř ještě PHP-FPM.

Nemusíte stejný log kopírovat znovu, pokud se nezměnil.

4. Pro složité úkoly použijte režim plánování

U incidentů, migrací nebo většího debugování zapněte Režim plánování. Alex nejdříve analyzuje situaci a navrhne postup. Snižuje to riziko slepých pokusů a často i zbytečné spotřeby.

5. Vyberte model podle náročnosti

Pro běžné dotazy, kontrolu stavu, jednoduché konfigurace nebo rychlé vysvětlení obvykle stačí běžný model. Silnější modely se vyplatí hlavně pro složitý debugging, architekturu, více souborů najednou nebo rozhodnutí s vyšším rizikem.

6. Rozdělte opravdu velké změny na logické etapy

Jeden dobře připravený úkol je úspornější než mnoho drobných dotazů. U velmi velké práce je ale lepší postupovat po etapách: plán, první část, kontrola, další část. Snáze se hlídá kvalita i spotřeba.


Druhy limitů

Alex může sledovat více typů limitů najednou:

LimitK čemu slouží
Krátkodobé oknoChrání před náhlým přetížením nebo nechtěnou vysokou spotřebou v krátkém čase
Dlouhodobé oknoHlídání celkové spotřeby v rámci vašeho balíčku
Modelová dostupnostNěkteré modely nebo funkce mohou být dostupné jen pro vybrané tarify
Speciální funkceNapříklad generování obrázků nebo vybrané nástroje mohou mít vlastní pravidla

Přesný stav vidíte vždy v panelu. Pokud limit dosáhnete, Alex vás upozorní a zobrazí další možnosti.


Tarify

Váš dostupný limit a funkce závisí na aktivním balíčku a nastavení účtu. Vyšší tarify obvykle nabízejí větší prostor pro náročnější práci, týmové použití nebo premium modely.

Pokud si nejste jistí, který tarif je pro vás vhodný, orientujte se podle způsobu používání:

PoužitíTypicky vhodný přístup
Občasné dotazyBěžný tarif a základní modely
Pravidelná správa serveruVyšší limit a důsledné používání cache-friendly workflow
Vývoj, debugging, incidentyVyšší tarif, plánování a silnější modely podle potřeby
Týmová nebo intenzivní práceTarif s vyšší dostupností a jasně nastaveným rozpočtem

Pay-as-you-go

Pokud máte aktivní pay-as-you-go (PAYG), můžete po vyčerpání vybraného limitu pokračovat podle nastavení vašeho účtu. Spotřeba nad rámec běžného limitu se strhává ze zůstatku a může být omezená stropem, který si nastavíte.

PAYG je vhodné pro situace, kdy nechcete, aby se práce zastavila uprostřed incidentu nebo delší analýzy. Stále ale doporučujeme sledovat spotřebu a používat cache-friendly postupy.


Sledování spotřeby

V chatu

V chatu vidíte aktuální stav limitu, zbývající prostor a upozornění, pokud se blížíte k vyčerpání.

V panelu

V přehledu služby nebo účtu najdete historii spotřeby, použité modely, případné PAYG položky a další informace dostupné pro váš tarif.

U některých modelů může přehled zobrazovat i cache součást spotřeby. Berte ji jako informaci o tom, kolik opakovaného kontextu se podařilo zpracovat efektivněji.


Co se stane po vyčerpání limitu

Pokud limit dosáhnete, Alex vás upozorní přímo v rozhraní. Podle nastavení můžete:

  1. počkat na obnovu limitu,
  2. zvolit úspornější model nebo menší rozsah zadání,
  3. využít dostupný upgrade nebo PAYG,
  4. kontaktovat podporu, pokud jde o urgentní situaci.

Časté otázky

Proč se spotřeba u podobných dotazů liší?

Alex může v jednom případě odpovědět jednoduše, zatímco jindy potřebuje načíst historii, logy, soubory nebo spustit diagnostiku. Spotřebu ovlivňuje i vybraný model a to, zda lze využít cache.

Sníží cache vždy spotřebu?

Ne vždy. Cache pomáhá hlavně u opakovaného nebo stabilního kontextu a u modelů, které ji podporují. Když do každé zprávy přidáte velké množství nového obsahu, cache má menší prostor pomoci.

Mám kvůli cache zakládat méně konverzací?

Ano, pokud řešíte stejný problém nebo projekt. Pokračování ve stejné konverzaci pomáhá Alexovi navázat na kontext a může zlepšit efektivitu. Pro nesouvisející téma je ale lepší založit novou konverzaci, aby se nemíchal kontext.

Co když Alex narazí na chybu?

Pokud požadavek technicky selže, systém spotřebu vyhodnocuje podle skutečného průběhu. V přehledu uvidíte, co bylo započítáno. Při nejasnostech kontaktujte podporu.


Další kroky


Potřebujete navýšit limit nebo máte dotaz? Otevřete support ticket.

Last updated on