Tsukutta

画像・音声・動画を1本のAPIで。Kotoniaに生成APIを公開

画像・音声・動画の生成をAPIから可能に。APIキーはセルフ発行、OpenAI互換。全レスポンスに応答速度を返却するので数字で速さを体感可能です。

CY SILVEM2026年6月21日公開
約3分で読めます4

変更したこと

これまでアプリの中からしか使えなかった画像・音声・動画の生成機能を、外部から呼べるAPIとして公開しました。エンドポイントは3本です。

・POST /api/v1/images/generations — 画像生成(同期、1024² / 20stepsで約4秒)

・POST /api/v1/audio/generations — 音声合成(同期、最初の音声まで約85〜120ms)

・POST /api/v1/videos/generations — 動画生成(非同期ジョブ、約60〜90秒)

認証はBearerトークン1本。リクエストの形はOpenAI互換に寄せたので、既存のクライアントから移しやすいです。

使用例:

`curl -X POST https://kotonia.ai/api/v1/audio/generations `

`-H "Authorization: Bearer kotonia_xxxxxxxx" `

`-H "Content-Type: application/json" `

-d '{ "input": "Hello!", "engine": "qwen3", "language": "en" }'

使いやすくなったところ

APIキーがセルフ発行になりました。問い合わせも審査も不要で、「API管理」ページにプロジェクト名を入れて発行するだけ。平文キーは発行直後の1回だけ表示され(保存はハッシュのみ)、漏れたら失効して再発行できます。

全レスポンスに応答速度(実測ミリ秒)が入ります。「速い」と言葉で書く代わりに、毎回の応答に実測値を載せました。速さは自分の目で確かめてもらえます。

無料枠は画像・音声それぞれ1日10回(動画は別クォータ)。課金はアプリ側の既存の残高・クォータにそのまま乗るので、API用に別アカウントを作る必要はありません。

発行・利用制限: https://kotonia.ai/api-manager
使い方・リファレンス: https://kotonia.ai/use/api-manager

次に実現したいこと

次は **`kotonia-cli`** をリリース予定です。Claude Code のように、ターミナルから対話で生成を回せる CLI ツールです。

今回のAPIを土台にして、画像・音声・動画の生成をコマンド1つから叩けるようにする予定。「キーを発行 → kotonia-cliを入れる → そのまま生成」までを最短にして、curlを手で組まなくても使い始められる状態を目指します。

■本サイトはこちらより

https://kotonia.ai/

この記事が良かったら

「チップをリクエスト」で著者にチップの受け取り設定をお願いできます

シェア