사용량 추적

wippy/usage 모듈은 LLM 토큰 소비를 기록하고 시간 간격, 모델 또는 사용자별로 그룹화된 집계 쿼리를 제공합니다. 이 모듈은 wippy.llm:usage_tracker 컨트랙트에 바인딩되므로, LLM 모듈을 통해 호출하는 모든 코드가 자동으로 사용량 레코드를 생성합니다.

설정

프로젝트에 모듈을 추가합니다:

wippy add wippy/usage
wippy install

의존성을 선언하고 target_db 요구사항을 사용량 레코드가 저장될 데이터베이스에 연결합니다:

version: "1.0"
namespace: app

entries:
  - name: app_db
    kind: db.sql.sqlite
    path: ./data/app.db

  - name: dep.usage
    kind: ns.dependency
    component: wippy/usage
    version: "*"

  - name: target_db
    kind: registry.entry
    meta:
      wippy.usage.target_db: app:app_db

애플리케이션이 시작되면 wippy/migration이 모듈의 01_create_token_usage_table 마이그레이션을 실행하여 user_id, context_id, model_id, timestamp에 대한 인덱스와 함께 token_usage 테이블을 생성합니다.

스키마

token_usage
├── usage_id           text primary key (uuid v7)
├── user_id            text not null
├── context_id         text
├── model_id           text not null
├── prompt_tokens      integer
├── completion_tokens  integer
├── thinking_tokens    integer default 0
├── cache_read_tokens  integer default 0
├── cache_write_tokens integer default 0
├── timestamp          timestamp
└── meta               text (JSON)

자동 추적

wippy/llm은 각 생성 전에 wippy.llm:usage_tracker 컨트랙트를 해석합니다. wippy/usage는 자신의 구현을 기본값으로 바인딩합니다:

contracts:
  - contract: wippy.llm:usage_tracker
    default: true
    methods:
      track_usage: wippy.usage:usage_tracker

성공적인 모든 LLM 호출은 모델 id, 토큰 수, 선택적 context_id와 함께 track_usage를 호출합니다. user_id는 활성 보안 액터에서 가져옵니다; 사용자 컨텍스트 외부의 호출은 "system"으로 기록됩니다.

트래커 API

LLM 흐름 외부에서 사용량을 기록해야 할 때 트래커를 직접 임포트합니다:

imports:
  usage_tracker: wippy.usage:usage_tracker
local tracker = require("usage_tracker")

local usage_id, err = tracker.track_usage(
    "openai:gpt-4o",
    prompt_tokens,
    completion_tokens,
    thinking_tokens,
    cache_read_tokens,
    cache_write_tokens,
    { context_id = "chat-42", metadata = { feature = "summary" } }
)
파라미터 타입 설명
model_id string 정규 모델 id
prompt_tokens number 입력 토큰
completion_tokens number 출력 토큰
thinking_tokens number 추론 토큰 (보고되지 않은 경우 0)
cache_read_tokens number 프롬프트 캐시 히트
cache_write_tokens number 프롬프트 캐시 쓰기
options.context_id string 자유 형식 태그; ctx.get("context_id")로 폴백됨
options.timestamp number Unix 타임스탬프; 기본값은 지금 (UTC)
options.metadata table 레코드와 함께 저장되는 임의의 JSON 메타데이터

usage_id 또는 nil, err를 반환합니다.

리포지토리 API

wippy.usage:token_usage_repo는 집계 쿼리를 제공합니다:

imports:
  usage: wippy.usage:token_usage_repo
local usage = require("usage")

local summary  = usage.get_summary(start_unix, end_unix)
local by_time  = usage.get_usage_by_time(start_unix, end_unix, usage.INTERVAL.DAY)
local by_model = usage.get_usage_by_model(start_unix, end_unix)
local by_user  = usage.get_usage_by_user(start_unix, end_unix)

함수

함수 반환
get_summary(start, end) 범위 전체의 합계: prompt/completion/thinking/cache 토큰, 요청 수, total_tokens (prompt + completion + thinking)
get_usage_by_time(start, end, interval) 간격당 하나씩 버킷 배열; 누락된 버킷은 0을 반환
get_usage_by_model(start, end) 모델별 합계, total_tokens 내림차순 정렬
get_usage_by_user(start, end) 사용자별 합계, total_tokens 내림차순 정렬
create(user_id, model_id, prompt, completion, options) 트래커가 사용하는 저수준 삽입

간격

usage.INTERVAL.HOUR   -- "hour"
usage.INTERVAL.DAY    -- "day"
usage.INTERVAL.WEEK   -- "week"
usage.INTERVAL.MONTH  -- "month"

get_usage_by_time은 구성된 간격에 버킷을 정렬합니다. PostgreSQL에서는 간격 산술과 함께 generate_series를 사용합니다; SQLite에서는 UNIX 타임스탬프에 대한 재귀적 CTE를 사용합니다. 각 버킷의 total_tokens는 캐시 토큰을 제외합니다.

시간 범위

트래커와 리포지토리 모두 공개 API 경계에서 UNIX 타임스탬프를 받습니다. 내부적으로 리포지토리는 저장 및 쿼리를 위해 RFC3339 문자열로 변환합니다. 포맷된 문자열이 아닌 os.time() 또는 time.now():unix() 값을 전달하세요.

메타데이터 및 컨텍스트

meta 컬럼은 자유 형식 JSON 블롭을 저장합니다. 이를 사용하여 레코드를 애플리케이션 이벤트와 연관시킵니다:

tracker.track_usage(model_id, prompt, completion, 0, 0, 0, {
    context_id = "chat-42",
    metadata   = {
        session_id = "s-7",
        route      = "/api/summarise",
        agent_id   = "writer",
    },
})

context_id는 최상위 컬럼이며 인덱싱될 수 있습니다; metadata는 텍스트로 저장되며 필터링이 아닌 표시용으로 사용됩니다.

참고 항목