EZO‑8B β

Gemini 2.5 Flash に並ぶタスク処理性能を、国内最⾼の Compute‑per‑Quality で提供。

▶︎ 3 行で始める API

curl $EZO_API_BASE/v1/chat/completions \
  -H "Content-Type: application/json" \
  -u $BASIC_USER:$BASIC_PASS \
  -d '{"model": "AXCXEPT/ezo-8b-beta", "messages": [{"role": "system", "content": "You are a helpful assistant. Your name is EZO-8B-BETA."}, {"role": "user", "content": "9.11 と 9.8 はどちらが大きい？"}], "stream": true}'

OpenAI SDK 互換。Streaming / Function Call 対応。詳細

Demo

Features

Compute Efficiency

A40 ×1 で 45 qps – クラウド GPU コストを最小化。

OpenAI-Compatible

完全互換エンドポイントで既存アプリにドロップイン。

Enterprise‑grade

TLS・Basic/Auth・Rate‑limit & ログを標準装備。

Rapid Fine‑Tuning

独自 RL‑DPO 手法で <2 日間で SOTA 近傍まで改善。受託カスタムも応相談。

Benchmark Comparison (MT / JMT)

Gemini 2.5 Flash

9.26

MT‑Bench

9.12

JMT‑Bench

EZO‑8B β

9.08

MT‑Bench

8.87

JMT‑Bench

AIME‑2024: 80

GPT‑4o

8.96

MT‑Bench

8.61

JMT‑Bench

Qwen3‑8B

8.91

MT‑Bench

8.65

JMT‑Bench

AIME‑2024: 80

*Internal eval (Judge: GPT‑4o / Gemini‑2.5 Flash, 2025‑05‑13)。数値は社内環境での比較です。

β版ご利用にあたって

β利用規約

カスタム LLM / 受託開発のご相談

わずか 2 日間のトレーニングでパフォーマンスを引き上げた手法を、貴社データセットにも適用可能です。

お問い合わせ

※ axcxept.com からのメールが迷惑メールに振り分けられないよう、受信設定をご確認ください。