Contador de Tokens Local no Navegador

Calculadora de Tokens Cross-Model: Estime Custos de API de LLM Instantaneamente

Cole texto ou insira contagens manuais para prever preços de prompt, conclusão, cache e lote entre os preços de modelos OpenAI, Claude, Gemini e personalizados sem enviar dados para um servidor.

Preços OpenAI, Claude, Gemini e personalizadosCenários de prompt, conclusão, cache e loteExecução local no navegador sem cadastro

Estimador de custo de tokens de LLM

Use esta calculadora de tokens cross-model para estimar gastos com API para prompts, respostas, prefixos em cache, chunks RAG, loops de agente e saídas estruturadas.

Tokens

Words

Characters (no spaces)

Total characters

Current token cost snapshot

A quick read on what the current token count costs across the models you have selected.

Paste text above to generate a current token cost snapshot.

Modelos para comparar

Selecione um ou mais modelos

Detalhamento de custos

Revise contagens de tokens e preços por modelo, em seguida, exporte o cenário para planejamento, aquisição ou cotação de clientes.

Paste text above to start counting tokens and comparing model cost.

Nota de privacidade

Este contador de tokens local no navegador mantém o texto do prompt em seu dispositivo. Calculamos apenas tokens e preços na sessão atual.

Fonte de preços

Usando o fallback de preços integrado porque o catálogo ativo não está disponível no momento.

A OpenAI usa contagem compatível com tiktoken local onde disponível. Anthropic, Gemini e modelos personalizados podem usar aproximações do lado do navegador, portanto, sempre confirme a cobrança final com os painéis do provedor para orçamentos de produção.

Advanced cost settings

Tune response size, cache assumptions, request volume, safety margin, and custom pricing without crowding the main paste-and-count flow.

Tokens de saída esperadosTokens de entrada em cacheTokens de entrada adicionaisSolicitações neste cenárioSolicitações mensais projetadasMargem de segurança (%)Markup do cliente (%)

Aplicar desconto de API em lote ao total do cenário

Preços de modelos personalizados

Nome do modelo personalizadoPreço de entrada por 1 milhão de tokens (USD)Preço de saída por 1 milhão de tokens (USD)Preço de entrada em cache por 1 milhão de tokens (USD)

Como estimar preços de tokens entre provedores de LLM

Siga estas etapas para usar a calculadora como uma calculadora de tokens cross-model, calculadora de tokens de prompt e conclusão, e contador de tokens local no navegador.

Cole texto de origem ou insira contagens manuais de tokens
Use o modo de texto quando quiser contagem de tokens local no navegador a partir de um prompt, esquema, transcrição ou chunk RAG. Use o modo manual quando você já souber a contagem de tokens de outro pipeline.
Escolha provedores e suposições de cenário
Selecione OpenAI, Claude, Gemini ou um modelo personalizado, em seguida, preencha os tokens de saída esperados, tokens de entrada em cache, tokens de recuperação adicionais, volume de solicitações e uso mensal.
Modele efeitos de lote, cache e margem
Ative o desconto de lote para trabalhos em massa assíncronos, adicione tokens de prompt em cache para instruções de sistema repetidas e inclua uma margem de segurança ou markup do cliente se precisar de guardrails de orçamento.
Compare e exporte o resultado
Revise o custo por solicitação, o total do cenário, o custo mensal, o orçamento seguro e o preço ajustado pelo markup. Exporte JSON ou CSV para revisões de aquisição, cotações de clientes ou documentos de seleção de modelos.

Estudos de caso: onde a estimativa de custo de tokens é importante

Estes exemplos correspondem a um comportamento de busca de alta intenção em torno de comparação de preços, cache, lote e uso de LLM multilíngue.

Estudo de Caso 1: Estimador de custo de fluxo de trabalho de agente

Profile

Uma startup executando agentes de várias etapas com loops de planejador, recuperador e revisor.

Challenge

A equipe precisava estimar como chamadas de ferramentas repetidas e prompts de sistema longos afetariam a economia unitária antes do lançamento.

Solution

Eles usaram a calculadora para modelar tokens de prompt, tokens de conclusão, contexto de recuperação adicional e descontos de lote entre os modelos candidatos.

Implementation

Cada etapa do agente foi colada no modo de texto, então a equipe ajustou as solicitações mensais e a margem de segurança até que o cenário correspondesse à sua previsão de produção.

Results

Eles identificaram a combinação de modelos mais barata para o fluxo de trabalho e reduziram o custo mensal projetado em mais de um terço antes do lançamento.

Estudo de Caso 2: Calculadora de preços de API OpenAI vs Claude

Profile

Uma plataforma de suporte comparando GPT-4o-mini com Claude 3.5 Sonnet para tratamento de chat.

Challenge

Eles precisavam de uma maneira rápida de comparar preços de tokens de prompt e conclusão no mesmo histórico de conversas sem escrever scripts personalizados.

Solution

A calculadora processou um histórico de chat representativo localmente e retornou estimativas mensais lado a lado para ambos os provedores.

Implementation

A equipe colou várias conversas de 10 turnos, definiu o volume de solicitações projetado e comparou o preço ajustado pelo markup para planos empresariais.

Results

Eles selecionaram a opção de menor custo para casos de suporte padrão e reservaram o modelo premium apenas para caminhos de escalonamento.

Estudo de Caso 3: Calculadora de custo de API em lote

Profile

Uma equipe de operações processando dezenas de milhares de descrições de produtos durante a noite.

Challenge

Sua margem dependia se os preços de lote assíncronos alteravam materialmente o custo de grandes trabalhos de atualização de conteúdo.

Solution

Eles modelaram o trabalho com o desconto de lote ativado e incluíram um buffer para descrições de cauda longa que eram maiores que a média.

Implementation

A equipe inseriu uma amostra representativa, projetou a contagem total de solicitações e exportou o CSV para aprovação do orçamento.

Results

Eles moveram a carga de trabalho para a fila de lote com uma estimativa clara de economia e obtiveram um orçamento de processamento noturno previsível.

Estudo de Caso 4: Custo de cache de contexto Anthropic

Profile

Um fluxo de trabalho legal-tech com prompts de sistema reutilizáveis grandes e documentos de política.

Challenge

A equipe precisava entender o quanto os prefixos em cache reduziriam o custo de consultas repetidas sobre as mesmas instruções base.

Solution

Eles usaram tokens de entrada em cache para modelar contexto repetido e compararam a economia mensal efetiva contra a operação sem cache.

Implementation

As instruções legais compartilhadas foram inseridas como tokens em cache, enquanto prompts e saídas dinâmicos específicos da matéria foram estimados separadamente.

Results

Eles justificaram o cache de prompt internamente e reduziram o custo aparente de fluxos de trabalho de alta conformidade.

Estudo de Caso 5: Custo de token de LLM multilíngue

Profile

Uma equipe de conteúdo global localizando prompts e saídas estruturadas em inglês, japonês e chinês.

Challenge

As contagens de palavras pareciam semelhantes, mas o uso de tokens variava acentuadamente por idioma e formato de saída.

Solution

Eles colaram prompts localizados na ferramenta para medir a inflação de tokens e comparar os preços dos provedores antes de lançar em novos mercados.

Implementation

A equipe duplicou cenários por idioma, ajustou o tamanho de saída esperado e documentou a diferença de preço por mercado.

Results

Eles evitaram precificar incorretamente em idiomas com muitos tokens e definiram políticas de uso específicas do mercado com maior confiança.

FAQs do estimador de custo de tokens

O que é uma calculadora de tokens cross-model?

É uma ferramenta que permite estimar o uso de tokens e o custo da API entre vários provedores de LLM a partir da mesma entrada, para que você possa comparar preços antes de construir.

Quão preciso é este estimador de custo de tokens de llm?

Modelos compatíveis com OpenAI usam suporte de tokenizador local onde disponível. Outros provedores podem depender de aproximações do lado do navegador, portanto, a estimativa é forte para planejamento, mas os painéis de cobrança do provedor permanecem a fonte final de verdade.

Por que separar tokens de prompt e conclusão?

A maioria dos provedores cobra preços diferentes para tokens de entrada e saída, e a saída é frequentemente muito mais cara. Dividi-los torna a estimativa utilizável para orçamentos reais.

Posso estimar o custo de cache de contexto Anthropic aqui?

Sim. Adicione a porção do seu prompt que é reutilizada como tokens de entrada em cache, em seguida, compare o cenário com execuções sem cache para ver como prefixos repetidos alteram o orçamento.

Isso funciona como uma calculadora de custo de API em lote?

Sim. Ative o alternador de desconto de lote para estimar o total menor que você esperaria de fluxos de trabalho de processamento em massa assíncronos.

Meus dados são armazenados quando uso este contador de tokens local no navegador?

Não. A calculadora foi projetada para execução local na sessão do navegador, portanto, prompts e documentos colados permanecem em seu dispositivo durante a estimativa.

Posso usar isso como um estimador de tokens de chunk rag?

Sim. Cole um chunk de documento representativo, em seguida, adicione tokens de entrada extras para sobrecarga de recuperação e multiplique as solicitações para modelar o custo de padrões de recuperação top-K.

Como estimo os preços de tokens de saída estruturada da OpenAI?

Cole o prompt e quaisquer instruções de esquema ou saída estruturada no modo de texto, em seguida, defina os tokens de conclusão esperados para que você possa ver como a sobrecarga de formatação altera o custo total.

Por que o custo de tokens de LLM multilíngue varia por idioma?

Diferentes tokenizadores dividem texto não inglês de forma diferente, portanto, contagens de palavras semelhantes podem produzir totais de tokens muito diferentes. Testar cada idioma de destino é a maneira mais segura de precificar o uso global.

Posso comparar um modelo personalizado ou auto-hospedado?

Sim. Use a seção de preços personalizados para inserir seu próprio nome de modelo e taxas por milhão de tokens para entrada, saída e entrada em cache.