Kredity a limity Alexe

Alex používá kreditový systém, který zohledňuje náročnost modelu, délku konverzace a množství kontextu, se kterým musí AI pracovat. Cílem je, aby bylo používání transparentní: v panelu vidíte aktuální stav limitu, spotřebu a případné navazující možnosti.

Tato stránka vysvětluje principy spotřeby jednoduše a prakticky. Konkrétní limity se mohou lišit podle vašeho balíčku, nastavení služby a aktivních doplňků.

Co ovlivňuje spotřebu

Každý požadavek může obsahovat více částí:

Část	Co znamená pro spotřebu
Vaše zadání	Text, který Alexovi pošlete, včetně přiložených detailů
Kontext	Historie konverzace, relevantní paměť, stav serveru, výstupy nástrojů nebo souborů
Odpověď	Text, analýza, návrh řešení a případné kroky, které Alex provádí
Nástroje	Práce s konzolí, soubory, logy, webem, sub-agenty nebo dalšími integracemi
Cache	Opakované části kontextu, které vybrané modely dokážou zpracovat úsporněji

Spotřeba tedy není jen o počtu odeslaných zpráv. Krátký dotaz bývá úspornější než dlouhá diagnostika, která čte logy, prochází soubory a provádí více kroků.

Jak funguje cache

Některé modely podporují prompt cache. To znamená, že opakované části konverzace nebo systémového kontextu se mohou při dalších požadavcích zpracovat efektivněji.

Cache funguje automaticky. Nemusíte ji zapínat ani ručně nastavovat. Pokud ji model podporuje a situace je pro cache vhodná, Alex ji využije na pozadí.

Kdy cache pomáhá nejvíc

Pokračujete ve stejné konverzaci místo zakládání nové.
Řešíte jednu oblast postupně, například stejnou aplikaci, stejný server nebo stejný problém.
Navazujete na předchozí plán, výsledek kontroly nebo seznam souborů.
Neposíláte stále dokola celé dlouhé logy, pokud už je Alex jednou přečetl.
Necháte Alexe pracovat s existujícím kontextem místo opakovaného vkládání stejného zadání.

Kdy cache pomáhá méně

Každý dotaz začíná novou konverzací.
Často měníte téma, server nebo projekt.
Do každé zprávy kopírujete velké množství nového textu.
Použitý model cache nepodporuje nebo ji pro konkrétní požadavek nemůže využít.

Cache není garance nulové spotřeby. Je to optimalizace, která může snížit náročnost opakovaných částí kontextu.

Jak šetřit kredity a limity

1. Posílejte jasné zadání hned na začátku

Místo postupného doplňování po jedné větě napište cíl, omezení a očekávaný výsledek najednou.

Méně efektivní:

Podívej se na web.

Efektivnější:

Web example.cz vrací 502 po deployi. Zkontroluj nginx, PHP-FPM a poslední logy, najdi příčinu a před změnami mi napiš plán opravy.

2. Pokračujte ve stejné konverzaci

Pokud řešíte jeden problém, zůstaňte ve stejném vlákně. Alex může navázat na historii, plán a předchozí výsledky. U podporovaných modelů tím navíc dáváte cache lepší šanci pracovat úsporně.

3. Neposílejte znovu data, která Alex už vidí

Když Alex jednou načetl log, konfiguraci nebo část projektu, stačí na to odkázat:

Navaž na předchozí kontrolu nginx logu a ověř ještě PHP-FPM.

Nemusíte stejný log kopírovat znovu, pokud se nezměnil.

4. Pro složité úkoly použijte režim plánování

U incidentů, migrací nebo většího debugování zapněte Režim plánování. Alex nejdříve analyzuje situaci a navrhne postup. Snižuje to riziko slepých pokusů a často i zbytečné spotřeby.

5. Vyberte model podle náročnosti

Pro běžné dotazy, kontrolu stavu, jednoduché konfigurace nebo rychlé vysvětlení obvykle stačí běžný model. Silnější modely se vyplatí hlavně pro složitý debugging, architekturu, více souborů najednou nebo rozhodnutí s vyšším rizikem.

6. Rozdělte opravdu velké změny na logické etapy

Jeden dobře připravený úkol je úspornější než mnoho drobných dotazů. U velmi velké práce je ale lepší postupovat po etapách: plán, první část, kontrola, další část. Snáze se hlídá kvalita i spotřeba.

Druhy limitů

Alex může sledovat více typů limitů najednou:

Limit	K čemu slouží
Krátkodobé okno	Chrání před náhlým přetížením nebo nechtěnou vysokou spotřebou v krátkém čase
Dlouhodobé okno	Hlídání celkové spotřeby v rámci vašeho balíčku
Modelová dostupnost	Některé modely nebo funkce mohou být dostupné jen pro vybrané tarify
Speciální funkce	Například generování obrázků nebo vybrané nástroje mohou mít vlastní pravidla

Přesný stav vidíte vždy v panelu. Pokud limit dosáhnete, Alex vás upozorní a zobrazí další možnosti.

Tarify

Váš dostupný limit a funkce závisí na aktivním balíčku a nastavení účtu. Vyšší tarify obvykle nabízejí větší prostor pro náročnější práci, týmové použití nebo premium modely.

Pokud si nejste jistí, který tarif je pro vás vhodný, orientujte se podle způsobu používání:

Použití	Typicky vhodný přístup
Občasné dotazy	Běžný tarif a základní modely
Pravidelná správa serveru	Vyšší limit a důsledné používání cache-friendly workflow
Vývoj, debugging, incidenty	Vyšší tarif, plánování a silnější modely podle potřeby
Týmová nebo intenzivní práce	Tarif s vyšší dostupností a jasně nastaveným rozpočtem

Pay-as-you-go

Pokud máte aktivní pay-as-you-go (PAYG), můžete po vyčerpání vybraného limitu pokračovat podle nastavení vašeho účtu. Spotřeba nad rámec běžného limitu se strhává ze zůstatku a může být omezená stropem, který si nastavíte.

PAYG je vhodné pro situace, kdy nechcete, aby se práce zastavila uprostřed incidentu nebo delší analýzy. Stále ale doporučujeme sledovat spotřebu a používat cache-friendly postupy.

Sledování spotřeby

V chatu

V chatu vidíte aktuální stav limitu, zbývající prostor a upozornění, pokud se blížíte k vyčerpání.

V panelu

V přehledu služby nebo účtu najdete historii spotřeby, použité modely, případné PAYG položky a další informace dostupné pro váš tarif.

U některých modelů může přehled zobrazovat i cache součást spotřeby. Berte ji jako informaci o tom, kolik opakovaného kontextu se podařilo zpracovat efektivněji.

Co se stane po vyčerpání limitu

Pokud limit dosáhnete, Alex vás upozorní přímo v rozhraní. Podle nastavení můžete:

počkat na obnovu limitu,
zvolit úspornější model nebo menší rozsah zadání,
využít dostupný upgrade nebo PAYG,
kontaktovat podporu, pokud jde o urgentní situaci.

Časté otázky

Proč se spotřeba u podobných dotazů liší?

Alex může v jednom případě odpovědět jednoduše, zatímco jindy potřebuje načíst historii, logy, soubory nebo spustit diagnostiku. Spotřebu ovlivňuje i vybraný model a to, zda lze využít cache.

Sníží cache vždy spotřebu?

Ne vždy. Cache pomáhá hlavně u opakovaného nebo stabilního kontextu a u modelů, které ji podporují. Když do každé zprávy přidáte velké množství nového obsahu, cache má menší prostor pomoci.

Mám kvůli cache zakládat méně konverzací?

Ano, pokud řešíte stejný problém nebo projekt. Pokračování ve stejné konverzaci pomáhá Alexovi navázat na kontext a může zlepšit efektivitu. Pro nesouvisející téma je ale lepší založit novou konverzaci, aby se nemíchal kontext.

Co když Alex narazí na chybu?

Pokud požadavek technicky selže, systém spotřebu vyhodnocuje podle skutečného průběhu. V přehledu uvidíte, co bylo započítáno. Při nejasnostech kontaktujte podporu.

Další kroky

Alex modely a limity - Jak vybrat model podle náročnosti
Osvědčené postupy - Jak psát zadání a šetřit request units
Paměť Alexe - Jak Alex pamatuje preference a kontext
Interaktivní otázky - Jak Alex pokládá otázky v chatu

Potřebujete navýšit limit nebo máte dotaz? Otevřete support ticket.