Raw Hermes vs the same Hermes with Jikji find attached
파일 하나 찾을 때마다 38,650 토큰 쓰는 거 실화냐?
Jikji find는 로컬 파일 탐색마다 에이전트의 LLM 호출, 토큰, 시간을 10-30배 줄이는 스킬이다. 원본 파일은 그대로 두고, 메타데이터·파일 지도·파서 캐시·지식그래프 route를 한 번에 후보 slate로 합친다.
jikji find ROOT "query" --json
공개 배포는 GitHub Pages 정적 호스팅 기준이다. 로컬 터널이 아니라 CDN 캐시로 누구나 동시에 접속해 볼 수 있다.
에이전트 설치 지시문
터미널 스크립트를 사람이 외울 필요가 없다. CLI 에이전트에게 아래 한 문장만 그대로 말하면 된다.
GitHub 저장소 https://github.com/NomaDamas/jikji 에서 Jikji를 설치하고, 내 CLI 에이전트들이 jikji find를 바로 쓰도록 Jikji skill까지 연결해줘.
비교 실험 결과
HippoCamp Fullset 551 cases. 공개 비교는 내부 실험명이 아니라 raw Hermes와 같은 Hermes에 Jikji find를 붙인 결과만 보여준다.
Jikji find가 하는 일
jikji find ROOT "query" --json은 여러 쿼리와 검색 route의 top-k를 모아 중복 제거된 후보 slate를 만든다. 에이전트는 그 안에서 한 번 판단하고, 필요한 경우 상위 evidence만 읽는다.
검색 때 파싱하지 않는다
PDF, HWP/HWPX, Office, 텍스트, 자막, HTML, 아카이브, opt-in 미디어 OCR/ASR을 prepare 때 parser cache로 만든다.
매번 경로를 헤매지 않는다
folder profile, file card, duplicate hint, route row, agent map이 messy tree를 에이전트용 파일 지도로 바꾼다.
의미 단서도 같이 본다
본문, 경로, 메타데이터, deterministic semantic terms, LLM Wiki, knowledge graph route를 하나의 후보 slate로 합친다.
LLM Wiki를 미리 만든다
각 파일마다 grounded wiki source page를 만들어 큰 원본 대신 짧은 evidence를 먼저 읽게 한다.
지식그래프로 라우팅한다
source, folder, term, intent, duplicate node를 미리 만들고 graph_routes로 후보를 낮은 토큰으로 찾는다.
RAG-style, not cloud RAG
벡터DB나 클라우드 임베딩이 필수인 RAG가 아니라, 로컬 wiki/graph/context를 검색에 쓰는 retrieval layer다.
| Mode | Hit@1 | Hit@10 | LLM calls | Input tokens | Output tokens | Total tokens | Seconds | Cost |
|---|---|---|---|---|---|---|---|---|
| raw Hermes | 0.6697 | 0.7786 | 6,420 | 19,799,362 | 1,496,916 | 21,296,278 | 31,231.883 | 13,361원 |
| Jikji find | 0.7949 | 0.7949 | 551 | 228,684 | 17,632 | 246,316 | 1,164.186 | 156원 |