はじめに

Arkor を使うと、TypeScript / Node 開発者がプロダクトの他の部分と同じ流儀でオープンウェイト LLM をファインチューニングできます。型安全な設定、自分のコード内で動くライフサイクルコールバック、そしてローカル Studio による開発ループ。すべて普段のワークフローのままです。

Arkor が想定しているユーザー

あなたは TypeScript / Node 製のアプリを開発しているプロダクトエンジニア（あるいは少人数のチーム）です。自分の機能の裏側にカスタムのオープンウェイトモデルを置きたい。けれど専任の ML チームはおらず、そのために別の Python コードベースを抱え込みたくはない。 Arkor はまさにこのワークフローのためのものです。

Python ML エコシステムとの関係

カスタムのオープンウェイトモデルが現実的な選択肢になっているのは、Python ML エコシステムを支えてきた人々と企業による長年の積み重ねがあるからです。Arkor はその基盤の上に立っており、学習自体は他のみんなが使っているのと同じスタックで動きます。 Arkor が加えるのはその上に乗る TypeScript の表面です。今はファインチューニングをカバーしており、評価とサービングがその次です。狙いは、モデルのワークフローが、あなたが出荷しているプロダクトと同じコードベース・同じエディタ・同じ型・同じレビュー手順の中で生きることです。

「プロダクトと同じ流儀でモデルを出荷する」とは

具体的には:

型安全な設定。 createTrainer({ model, dataset, lora, ... }) はコンパイル時にチェックされます。YAML のドリフトも、別言語の設定もありません。
学習コードの素早い反復。 トレーナーを編集してリビルドすれば、次の実行で最新コードが動きます。ノートブックの再起動は不要です。
自分のコード内でのコールバック。 onLog、onCheckpoint、onCompleted、onFailed が完全に型付けされた状態で、あなたの TypeScript 関数として発火します。onCheckpoint の中から infer({ messages }) を呼んで、学習完了前に部分学習済みモデルを動作確認できます。
ローカル Studio。 arkor dev を実行すると Web UI が立ち上がり、ジョブのステータス、ライブの loss チャート、ログのテール、ファインチューンしたモデルとチャットするための Playground が見られます。外部ダッシュボードもサインアップも不要です。

現時点で動くもの

Arkor はアルファ版です。設計が固まるまで API は予告なく変わります。最新版は npm に公開されています。今できること:

1 ファイルからオープンウェイト LLM（現状は Gemma ベース）をファインチューニング。
数分で完了するエンドツーエンドのテンプレートを 3 種から選択。triage（サポートの分類）、translate（9 言語）、redaction（個人情報のマスク）。
ダッシュボードではなく、ライフサイクルコールバックでコードから学習に反応する。
インフラの追加セットアップなしで、Arkor のマネージド GPU 上で学習を実行。アカウントなしで試せます。学習をアカウントに紐づけたい場合は、学習を始める前に pnpm exec arkor login --oauth を実行してください。匿名で先に始めた作業をあとからアカウントへ統合する機能は将来的にサポート予定です。
ローカル Studio で学習をライブ確認。完了後は Playground で学習済みモデルとチャット。

まだ入っていないもの:

ローカル GPU での学習。今日のところすべての学習はマネージド GPU で実行されます。
用意されたデモ以外の独自データセットの持ち込み。
Gemma 以外のベースモデル。
学習バックエンドのセルフホスト。

「動くもの／これから」の全体像は README にあります。

試してみる

pnpm create arkor my-arkor-app
cd my-arkor-app
pnpm dev

最初の実行は、テンプレートにもよりますがおおよそ 7〜12 分で終わります。ステップごとの手順は Quickstart に続きます。

コンセプト

CLI

SDK

Studio

Cookbook

はじめに

Arkor が想定しているユーザー

Python ML エコシステムとの関係

「プロダクトと同じ流儀でモデルを出荷する」とは

現時点で動くもの

試してみる

はじめに

コンセプト

CLI

SDK

Studio

Cookbook

Documentation Index

​Arkor が想定しているユーザー

​Python ML エコシステムとの関係

​「プロダクトと同じ流儀でモデルを出荷する」とは

​現時点で動くもの

​試してみる

Arkor が想定しているユーザー

Python ML エコシステムとの関係

「プロダクトと同じ流儀でモデルを出荷する」とは

現時点で動くもの

試してみる