
EZO‑8B β
Gemini 2.5 Flash に並ぶタスク処理性能を、国内最⾼の Compute‑per‑Quality で提供。
▶︎ 3 行で始める API
curl $EZO_API_BASE/v1/chat/completions \
-H "Content-Type: application/json" \
-u $BASIC_USER:$BASIC_PASS \
-d '{"model": "AXCXEPT/ezo-8b-beta", "messages": [{"role": "system", "content": "You are a helpful assistant. Your name is EZO-8B-BETA."}, {"role": "user", "content": "9.11 と 9.8 はどちらが大きい?"}], "stream": true}'
OpenAI SDK 互換。Streaming / Function Call 対応。詳細
Demo
Features
Compute Efficiency
A40 ×1 で 45 qps – クラウド GPU コストを最小化。
OpenAI-Compatible
完全互換エンドポイントで既存アプリにドロップイン。
Enterprise‑grade
TLS・Basic/Auth・Rate‑limit & ログを標準装備。
Rapid Fine‑Tuning
独自 RL‑DPO 手法で <2 日間 で SOTA 近傍まで改善。受託カスタムも応相談。
Benchmark Comparison (MT / JMT)
Gemini 2.5 Flash
9.26
MT‑Bench
9.12
JMT‑Bench
EZO‑8B β
9.08
MT‑Bench
8.87
JMT‑Bench
AIME‑2024: 80
GPT‑4o
8.96
MT‑Bench
8.61
JMT‑Bench
Qwen3‑8B
8.91
MT‑Bench
8.65
JMT‑Bench
AIME‑2024: 80
*Internal eval (Judge: GPT‑4o / Gemini‑2.5 Flash, 2025‑05‑13)。数値は社内環境での比較です。
β版ご利用にあたって
β利用規約カスタム LLM / 受託開発のご相談
わずか 2 日間のトレーニングでパフォーマンスを引き上げた手法を、貴社データセットにも適用可能です。
お問い合わせ※ axcxept.com からのメールが迷惑メールに振り分けられないよう、受信設定をご確認ください。