Project AIRI logoProject AIRI

開発ログ @ 2025.03.20

またお会いしましたね!前回の開発ログから10日が経ちました。

ユーザーインターフェースに多くの改善を加え、より多くの LLM プロバイダーや音声プロバイダーを統合できるようにし、Discord、bilibili、その他多くのソーシャルメディアプラットフォームで初めて AIRI を公開しました。

お伝えしたいことがたくさんあります。

既視感

少し時間を巻き戻してみましょう!

Gelbana

ああ、心配しないでください。私たちが愛する AIRI はこのようなゲルバナにはなりません。でも、もし Steins;Gate アニメシリーズを見たことがないなら、ぜひ見てみることを強くお勧めします〜!

初期設定 UI デザインの開発を続けており、アニメーション効果が改善され、10日前にはカスタマイズ可能なテーマカラーが実装されました。私たち全員にとって本当に忙しい一週間でした(特に私たちは皆パートタイムでこのプロジェクトに参加していますから(笑)。もしよろしければ、ぜひ参加してください。🥺(懇願))。

当時の最終結果はこんな感じでした:

new uinew ui

0.571024

β世界線へようこそ。

モデルのラジオグループやナビゲーション項目のカラーカード、そしてカスタマイズ可能なテーマができたので、ビジネスワークフローで UI コンポーネントをデバッグする際に困難に直面することは明らかでした。これは明らかに開発速度を低下させます。

そこで、Histoire という魔法のツールを導入することにしました。これは基本的に Storybook のようなものですが、ViteVue.js の組み合わせにより適しています。

これは @sumimakito が完成後に録画したファーストルックです:

OKLCH パレット全体を一度にキャンバスに展開して参照することができます。しかし、色を試して Project AIRI のテーマと同じ感覚を得るには、少し不完全ですよね?

そこで、まずカラースライダーを再実装して、より適切な感じにしました:

color slidercolor slider

これでスライダーがよりプロフェッショナルになりました。

ロゴとデフォルトの緑色は、AIRI のテーマに合わせて置き換えることができます。そのため、UI ページ専用に別のロゴをデザインしました:

project airi logo for histoireproject airi logo for histoire

ああ、そうそう、UI コンポーネント全体はいつものように Netlify の /ui/ パスにデプロイされています。UI 要素がどのようなものか知りたい場合は、いつでもチェックしてください: https://airi.moeru.ai/ui/

この開発ログでは完全にカバーしきれない機能がたくさんあります:

モーメンタムと 3D についてもいくつか実験を行いました。

これを見てください:

brand new speech designbrand new speech design

ついに音声モデル設定をサポートしました 🎉!(以前は ElevenLabs しか設定できませんでした)私たちが開発している別の魔法のプロジェクト unspeechv0.1.2 バージョン以来、@xsai/generate-speech を介して Microsoft Speech サービス(つまり Azure AI Speech サービス、または Cognitive Speech Services)をリクエストできるようになりました。これはつまり、ついに Microsoft 用の OpenAI API 互換の TTS サービスを手に入れたことを意味します。

しかし、なぜこれをサポートすることがそれほど重要なのでしょうか?

それは、Neuro-sama の最初のバージョンでは、テキスト読み上げサービスが Microsoft によって提供されており、Ashley という声を使用し、+20% のピッチを加えることで、Neuro-sama の最初のバージョンと同じ声を得ることができるからです。自分で試してみてください:

完全に同じではありませんか、これは本当にクレイジーです!つまり、私たちはついに新しい音声機能を通じて、Neuro-sama ができることに近づくことができるのです!

character from anime Steins;Gate

1.382733

これらすべてを組み合わせて、この結果を得ることができます:

ほぼ同じです。しかし、私たちの物語はここでは終わりません。現時点では、記憶機能、より良い動作制御はまだ実装されておらず、文字起こし設定 UI も欠けています。月末までにこれらを完了できることを願っています。

私たちは以下を計画しています:

今日の DevLog はここまでです。DevStream に参加し、最後まで付き合ってくれた皆さんに感謝します。

また明日お会いしましょう。

El Psy Congroo.