Rastreamento de Uso

O modulo wippy/usage registra o consumo de tokens de LLMs e fornece consultas agregadas agrupadas por intervalo de tempo, modelo ou usuario. Ele se vincula ao contrato wippy.llm:usage_tracker, de modo que qualquer codigo que chame atraves do modulo LLM produz automaticamente registros de uso.

Configuracao

Adicione o modulo ao seu projeto:

wippy add wippy/usage
wippy install

Declare a dependencia e aponte o requisito target_db para o banco de dados onde os registros de uso devem residir:

version: "1.0"
namespace: app

entries:
  - name: app_db
    kind: db.sql.sqlite
    path: ./data/app.db

  - name: dep.usage
    kind: ns.dependency
    component: wippy/usage
    version: "*"

  - name: target_db
    kind: registry.entry
    meta:
      wippy.usage.target_db: app:app_db

Quando a aplicacao inicia, wippy/migration executa a migracao 01_create_token_usage_table do modulo, que cria a tabela token_usage junto com indices em user_id, context_id, model_id e timestamp.

Schema

token_usage
├── usage_id           text primary key (uuid v7)
├── user_id            text not null
├── context_id         text
├── model_id           text not null
├── prompt_tokens      integer
├── completion_tokens  integer
├── thinking_tokens    integer default 0
├── cache_read_tokens  integer default 0
├── cache_write_tokens integer default 0
├── timestamp          timestamp
└── meta               text (JSON)

Rastreamento Automatico

wippy/llm resolve o contrato wippy.llm:usage_tracker antes de cada geracao. wippy/usage vincula sua implementacao como padrao:

contracts:
  - contract: wippy.llm:usage_tracker
    default: true
    methods:
      track_usage: wippy.usage:usage_tracker

Toda chamada LLM bem-sucedida invoca track_usage com o id do modelo, as contagens de tokens e um context_id opcional. O user_id e obtido do ator de seguranca ativo; chamadas fora de um contexto de usuario sao registradas como "system".

API do Rastreador

Importe o rastreador diretamente quando precisar registrar uso fora do fluxo LLM:

imports:
  usage_tracker: wippy.usage:usage_tracker

local tracker = require("usage_tracker")

local usage_id, err = tracker.track_usage(
    "openai:gpt-4o",
    prompt_tokens,
    completion_tokens,
    thinking_tokens,
    cache_read_tokens,
    cache_write_tokens,
    { context_id = "chat-42", metadata = { feature = "summary" } }
)

Parametro	Tipo	Descricao
`model_id`	string	Id canonico do modelo
`prompt_tokens`	number	Tokens de entrada
`completion_tokens`	number	Tokens de saida
`thinking_tokens`	number	Tokens de raciocinio (0 quando nao reportado)
`cache_read_tokens`	number	Acertos de cache de prompt
`cache_write_tokens`	number	Gravacoes no cache de prompt
`options.context_id`	string	Tag livre; fallback para `ctx.get("context_id")`
`options.timestamp`	number	Timestamp Unix; padrao e agora (UTC)
`options.metadata`	table	Metadados JSON arbitrarios armazenados junto ao registro

Retorna usage_id ou nil, err.

API do Repositorio

wippy.usage:token_usage_repo oferece consultas agregadas:

imports:
  usage: wippy.usage:token_usage_repo

local usage = require("usage")

local summary  = usage.get_summary(start_unix, end_unix)
local by_time  = usage.get_usage_by_time(start_unix, end_unix, usage.INTERVAL.DAY)
local by_model = usage.get_usage_by_model(start_unix, end_unix)
local by_user  = usage.get_usage_by_user(start_unix, end_unix)

Funcoes

Funcao	Retorno
`get_summary(start, end)`	Totais do intervalo: tokens de prompt/completion/thinking/cache, contagem de requisicoes, `total_tokens` (prompt + completion + thinking)
`get_usage_by_time(start, end, interval)`	Array de baldes, um por intervalo; baldes ausentes retornam zeros
`get_usage_by_model(start, end)`	Totais por modelo, ordenados por `total_tokens` descendente
`get_usage_by_user(start, end)`	Totais por usuario, ordenados por `total_tokens` descendente
`create(user_id, model_id, prompt, completion, options)`	Insercao de baixo nivel usada pelo rastreador

Intervalos

usage.INTERVAL.HOUR   -- "hour"
usage.INTERVAL.DAY    -- "day"
usage.INTERVAL.WEEK   -- "week"
usage.INTERVAL.MONTH  -- "month"

get_usage_by_time alinha os baldes ao intervalo configurado. No PostgreSQL usa generate_series com aritmetica de intervalos; no SQLite usa uma CTE recursiva sobre timestamps UNIX. O total_tokens em cada balde exclui tokens de cache.

Intervalos de Tempo

Tanto o rastreador quanto o repositorio aceitam timestamps UNIX na fronteira da API publica. Internamente o repositorio converte para strings RFC3339 para armazenamento e consulta. Passe valores de os.time() ou time.now():unix(), nao strings formatadas.

Metadados e Contexto

A coluna meta armazena um blob JSON livre. Use-a para correlacionar registros com eventos da aplicacao:

tracker.track_usage(model_id, prompt, completion, 0, 0, 0, {
    context_id = "chat-42",
    metadata   = {
        session_id = "s-7",
        route      = "/api/summarise",
        agent_id   = "writer",
    },
})

context_id e uma coluna de nivel superior e pode ser indexada; metadata e armazenado como texto e destina-se a exibicao, nao a filtragem.

Veja Tambem

LLM - Geracao LLM e o contrato usage_tracker
Migracoes - Executor de migracoes que cria o schema
Visao Geral do Framework - Uso dos modulos do framework