Kredity a limity Alexe
Alex používá kreditový systém, který zohledňuje náročnost modelu, délku konverzace a množství kontextu, se kterým musí AI pracovat. Cílem je, aby bylo používání transparentní: v panelu vidíte aktuální stav limitu, spotřebu a případné navazující možnosti.
Tato stránka vysvětluje principy spotřeby jednoduše a prakticky. Konkrétní limity se mohou lišit podle vašeho balíčku, nastavení služby a aktivních doplňků.
Co ovlivňuje spotřebu
Každý požadavek může obsahovat více částí:
| Část | Co znamená pro spotřebu |
|---|---|
| Vaše zadání | Text, který Alexovi pošlete, včetně přiložených detailů |
| Kontext | Historie konverzace, relevantní paměť, stav serveru, výstupy nástrojů nebo souborů |
| Odpověď | Text, analýza, návrh řešení a případné kroky, které Alex provádí |
| Nástroje | Práce s konzolí, soubory, logy, webem, sub-agenty nebo dalšími integracemi |
| Cache | Opakované části kontextu, které vybrané modely dokážou zpracovat úsporněji |
Spotřeba tedy není jen o počtu odeslaných zpráv. Krátký dotaz bývá úspornější než dlouhá diagnostika, která čte logy, prochází soubory a provádí více kroků.
Jak funguje cache
Některé modely podporují prompt cache. To znamená, že opakované části konverzace nebo systémového kontextu se mohou při dalších požadavcích zpracovat efektivněji.
Cache funguje automaticky. Nemusíte ji zapínat ani ručně nastavovat. Pokud ji model podporuje a situace je pro cache vhodná, Alex ji využije na pozadí.
Kdy cache pomáhá nejvíc
- Pokračujete ve stejné konverzaci místo zakládání nové.
- Řešíte jednu oblast postupně, například stejnou aplikaci, stejný server nebo stejný problém.
- Navazujete na předchozí plán, výsledek kontroly nebo seznam souborů.
- Neposíláte stále dokola celé dlouhé logy, pokud už je Alex jednou přečetl.
- Necháte Alexe pracovat s existujícím kontextem místo opakovaného vkládání stejného zadání.
Kdy cache pomáhá méně
- Každý dotaz začíná novou konverzací.
- Často měníte téma, server nebo projekt.
- Do každé zprávy kopírujete velké množství nového textu.
- Použitý model cache nepodporuje nebo ji pro konkrétní požadavek nemůže využít.
Cache není garance nulové spotřeby. Je to optimalizace, která může snížit náročnost opakovaných částí kontextu.
Jak šetřit kredity a limity
1. Posílejte jasné zadání hned na začátku
Místo postupného doplňování po jedné větě napište cíl, omezení a očekávaný výsledek najednou.
Méně efektivní:
Podívej se na web.
Efektivnější:
Web example.cz vrací 502 po deployi. Zkontroluj nginx, PHP-FPM a poslední logy, najdi příčinu a před změnami mi napiš plán opravy.
2. Pokračujte ve stejné konverzaci
Pokud řešíte jeden problém, zůstaňte ve stejném vlákně. Alex může navázat na historii, plán a předchozí výsledky. U podporovaných modelů tím navíc dáváte cache lepší šanci pracovat úsporně.
3. Neposílejte znovu data, která Alex už vidí
Když Alex jednou načetl log, konfiguraci nebo část projektu, stačí na to odkázat:
Navaž na předchozí kontrolu nginx logu a ověř ještě PHP-FPM.
Nemusíte stejný log kopírovat znovu, pokud se nezměnil.
4. Pro složité úkoly použijte režim plánování
U incidentů, migrací nebo většího debugování zapněte Režim plánování. Alex nejdříve analyzuje situaci a navrhne postup. Snižuje to riziko slepých pokusů a často i zbytečné spotřeby.
5. Vyberte model podle náročnosti
Pro běžné dotazy, kontrolu stavu, jednoduché konfigurace nebo rychlé vysvětlení obvykle stačí běžný model. Silnější modely se vyplatí hlavně pro složitý debugging, architekturu, více souborů najednou nebo rozhodnutí s vyšším rizikem.
6. Rozdělte opravdu velké změny na logické etapy
Jeden dobře připravený úkol je úspornější než mnoho drobných dotazů. U velmi velké práce je ale lepší postupovat po etapách: plán, první část, kontrola, další část. Snáze se hlídá kvalita i spotřeba.
Druhy limitů
Alex může sledovat více typů limitů najednou:
| Limit | K čemu slouží |
|---|---|
| Krátkodobé okno | Chrání před náhlým přetížením nebo nechtěnou vysokou spotřebou v krátkém čase |
| Dlouhodobé okno | Hlídání celkové spotřeby v rámci vašeho balíčku |
| Modelová dostupnost | Některé modely nebo funkce mohou být dostupné jen pro vybrané tarify |
| Speciální funkce | Například generování obrázků nebo vybrané nástroje mohou mít vlastní pravidla |
Přesný stav vidíte vždy v panelu. Pokud limit dosáhnete, Alex vás upozorní a zobrazí další možnosti.
Tarify
Váš dostupný limit a funkce závisí na aktivním balíčku a nastavení účtu. Vyšší tarify obvykle nabízejí větší prostor pro náročnější práci, týmové použití nebo premium modely.
Pokud si nejste jistí, který tarif je pro vás vhodný, orientujte se podle způsobu používání:
| Použití | Typicky vhodný přístup |
|---|---|
| Občasné dotazy | Běžný tarif a základní modely |
| Pravidelná správa serveru | Vyšší limit a důsledné používání cache-friendly workflow |
| Vývoj, debugging, incidenty | Vyšší tarif, plánování a silnější modely podle potřeby |
| Týmová nebo intenzivní práce | Tarif s vyšší dostupností a jasně nastaveným rozpočtem |
Pay-as-you-go
Pokud máte aktivní pay-as-you-go (PAYG), můžete po vyčerpání vybraného limitu pokračovat podle nastavení vašeho účtu. Spotřeba nad rámec běžného limitu se strhává ze zůstatku a může být omezená stropem, který si nastavíte.
PAYG je vhodné pro situace, kdy nechcete, aby se práce zastavila uprostřed incidentu nebo delší analýzy. Stále ale doporučujeme sledovat spotřebu a používat cache-friendly postupy.
Sledování spotřeby
V chatu
V chatu vidíte aktuální stav limitu, zbývající prostor a upozornění, pokud se blížíte k vyčerpání.
V panelu
V přehledu služby nebo účtu najdete historii spotřeby, použité modely, případné PAYG položky a další informace dostupné pro váš tarif.
U některých modelů může přehled zobrazovat i cache součást spotřeby. Berte ji jako informaci o tom, kolik opakovaného kontextu se podařilo zpracovat efektivněji.
Co se stane po vyčerpání limitu
Pokud limit dosáhnete, Alex vás upozorní přímo v rozhraní. Podle nastavení můžete:
- počkat na obnovu limitu,
- zvolit úspornější model nebo menší rozsah zadání,
- využít dostupný upgrade nebo PAYG,
- kontaktovat podporu, pokud jde o urgentní situaci.
Časté otázky
Proč se spotřeba u podobných dotazů liší?
Alex může v jednom případě odpovědět jednoduše, zatímco jindy potřebuje načíst historii, logy, soubory nebo spustit diagnostiku. Spotřebu ovlivňuje i vybraný model a to, zda lze využít cache.
Sníží cache vždy spotřebu?
Ne vždy. Cache pomáhá hlavně u opakovaného nebo stabilního kontextu a u modelů, které ji podporují. Když do každé zprávy přidáte velké množství nového obsahu, cache má menší prostor pomoci.
Mám kvůli cache zakládat méně konverzací?
Ano, pokud řešíte stejný problém nebo projekt. Pokračování ve stejné konverzaci pomáhá Alexovi navázat na kontext a může zlepšit efektivitu. Pro nesouvisející téma je ale lepší založit novou konverzaci, aby se nemíchal kontext.
Co když Alex narazí na chybu?
Pokud požadavek technicky selže, systém spotřebu vyhodnocuje podle skutečného průběhu. V přehledu uvidíte, co bylo započítáno. Při nejasnostech kontaktujte podporu.
Další kroky
- Alex modely a limity - Jak vybrat model podle náročnosti
- Osvědčené postupy - Jak psát zadání a šetřit request units
- Paměť Alexe - Jak Alex pamatuje preference a kontext
- Interaktivní otázky - Jak Alex pokládá otázky v chatu
Potřebujete navýšit limit nebo máte dotaz? Otevřete support ticket.