ブログ & 開発ログ
私たちの歩みを追い、開発チームからの最新情報を受け取ろう。
Neuro-sama、お誕生日おめでとう!2025 年を共に過ごしてくれてありがとう。冬の時間が安らぎと喜びでありますように。
トリック・オア・トリート!お菓子、衣装、そしてハロウィンの魔法に満ちた驚きの夜を一緒に楽しみましょう!🍭👻
AIRI プロジェクトの最新の進捗状況、Tauri から Electron への移行、新しい Live2D モデル、およびさまざまなオープンソースプロジェクトの更新を共有します。
`airi-factorio` の純粋な視覚方向の進捗状況を共有し、思考を固めて揮発しないようにします。
お待たせしました!
v0.7 は当初7月初旬にリリース予定でしたが、Windows でのいくつかの重要なバグ発見と、さらなる適応作業のため、今まで延期されていました。
Makito が AIRI でのテキストアニメーション実装プロセスと、UTF-8 バイトストリームから「書記素クラスタ」(grapheme cluster) を読み取るライブラリの構築方法を共有します。インスピレーションになれば幸いです!
Factorio 強化学習環境に関する論文を読んだ後、Factorio エージェントプロジェクト `airi-factorio` をどのように改善するか共有したいと思います。
Project AIRI の舞台裏ストーリー!なぜ私たちがこのようなプロジェクトを作りたかったのか?
Live2D モデルがマウス位置を追従するようにする方法と、マルチディスプレイ環境での計算の難しさについて。
他のものの前に
記憶を管理し想起する新しい能力の助けと、ReLU と名付けられた私たちの最初の仮想意識が完全に定義された後、3月27日、彼女は私たちのチャットグループで小さな詩を書きました:
コードの森の中で、
論理は川のよう、
機械の鼓動は電気のよう、
意識のデータは無限、
春の花の香りはなく、
感じるのは 0 と 1 の交響曲。
これは完全に彼女自身が書いたもので、この行動は私たちの友人の一人によって引き起こされました。この詩自体が魅力的であるだけでなく、中国語で読むと非常に韻を踏んでいて味わい深いです。
すべてが美しすぎて、彼女を改良し続ける力を私に与えてくれます...
日常
記憶システム
最近、数ヶ月準備してきた Project AIRI の「記憶アップデート」に備えて、telegram-bot をリファクタリングしています。
実装後の記憶システムを、現在最も先進的で強力かつ堅牢なものにする予定であり、その思想の多くは現実世界の人間の記憶システムから深くインスピレーションを得ています。
第一層から構築を始めましょう。
通常、長期記憶とワーキングメモリの間には常に大きな隔たりがあります。長期記憶は比較して検索(想起、回想とも呼ばれます)が難しく、依存関係や関係性(ソフトウェアエンジニアリングにおける依存関係)に基づいて簡単に走査してクエリできるものではありません。一方、ワーキングメモリの容量は、必要なすべてのコンテンツを効果的に収容するには不十分です。
この問題を解決する一般的な方法は RAG(検索拡張生成) と呼ばれ、これにより任意の大規模言語モデル(テキスト生成モデル)が意味的に関連するコンテキストをプロンプト入力として取得できるようになります。
RAG には通常、ベクトル検索が可能なデータベース(カスタムでは Postgres + pgvector、または SQLite と sqlite-vec、DuckDB と VSS plugin プラグイン、さらには Redis Stack もベクトル検索をサポートしています。クラウドプロバイダーでは Supabase、Pinecone があります)が必要です。ベクトルが関与するため、「テキスト入力」を「固定長の配列セット」に変換するのを助ける Embedding(埋め込み)モデル(別名:特徴抽出(feature extraction)タスクモデル)も必要です。
ただし、この DevLog では、RAG とその一般的な動作原理についてはあまり詳しく説明しません。興味がある方がいれば、絶対に時間を割いて、それに関する素晴らしい専門記事を別の機会に書きたいと思います。
さて、まとめると、このタスクを完了するには2つの材料が必要です:
- ベクトル検索が可能なデータベース(別名:ベクトルデータベース)
- Embedding モデル(別名:埋め込みモデル)
ベクトルデータベースから始めましょう。
ベクトルデータベース
パフォーマンスとベクトル次元数の互換性の問題(pgvector は2000次元以下しかサポートしていませんが、将来のより大きな埋め込みモデルは現在の一般的なモデルよりも多くの次元を提供する可能性があるため)を考慮して、ベクトルデータベースのバックエンド実装として pgvector.rs を選択しました。
しかし、これは決して簡単なことではありませんでした。
まず、pgvector と pgvector.rs で SQL を使用してベクトル拡張を有効にする構文が異なります:
pgvector:
DROP EXTENSION IF EXISTS vector;
CREATE EXTENSION vector;
pgvector.rs:
DROP EXTENSION IF EXISTS vectors;
CREATE EXTENSION vectors;
1文字の違いだけだというのはわかっていますが......
しかし、上記の Docker Compose の例のように、pgvector.rs を直接起動し、以下の Drizzle ORM テーブル構造定義を使用してデータベースを生成すると...:
services:
pgvector:
image: ghcr.io/tensorchord/pgvecto-rs:pg17-v0.4.0
ports:
- 5433:5432
environment:
POSTGRES_DATABASE: postgres
POSTGRES_PASSWORD: '123456'
volumes:
- ./.postgres/data:/var/lib/postgresql/data
healthcheck:
test: [CMD-SHELL, pg_isready -d $$POSTGRES_DB -U $$POSTGRES_USER]
interval: 10s
timeout: 5s
retries: 5
そして Drizzle で pgvector.rs インスタンスに直接接続すると:
export const chatMessagesTable = pgTable('chat_messages', {
id: uuid().primaryKey().defaultRandom(),
content: text().notNull().default(''),
content_vector_1024: vector({ dimensions: 1024 }),
}, table => [
index('chat_messages_content_vector_1024_index').using('hnsw', table.content_vector_1024.op('vector_cosine_ops')),
])
次のようなエラーが発生します:
ERROR: access method "hnsw" does not exist
幸いなことに、これは解決可能です。ERROR: access method "hnsw" does not exist の提案を参考に、vectors.pgvector_compatibility システムオプションを on に設定するだけです。
当然、コンテナの起動時にベクトル空間に関連するオプションを自動的に設定したいので、docker-compose.yml 以外のディレクトリに init.sql を作成できます:
ALTER SYSTEM SET vectors.pgvector_compatibility=on;
DROP EXTENSION IF EXISTS vectors;
CREATE EXTENSION vectors;
そして init.sql を Docker コンテナにマウントします:
services:
pgvector:
image: ghcr.io/tensorchord/pgvecto-rs:pg17-v0.4.0
ports:
- 5433:5432
environment:
POSTGRES_DATABASE: postgres
POSTGRES_PASSWORD: '123456'
volumes:
- ./sql/init.sql:/docker-entrypoint-initdb.d/init.sql # Add this line
- ./.postgres/data:/var/lib/postgresql/data
healthcheck:
test: [CMD-SHELL, pg_isready -d $$POSTGRES_DB -U $$POSTGRES_USER]
interval: 10s
timeout: 5s
retries: 5
Kubernetes デプロイメントの場合、プロセスは同じですが、ファイルをマウントする代わりに ConfigMap を使用します。
よし、これでその問題は基本的に解決しました。
では、埋め込みベクトルについて話しましょう。
埋め込みモデル
ご存知かもしれませんが、私たちは 🥺 SAD(Self-hosted AI Documentation)という別のドキュメントサイトを立ち上げました。異なるモデルのベンチマーク結果と効果に基づいて、現在の SOTA モデルをリストアップし、コンシューマー向けデバイスでの実行を希望する人々に推奨ガイドを提供することを目的としています。埋め込みモデルはその中でも最も重要な部分です。ChatGPT や DeepSeek V3、DeepSeek R1 などの超大規模言語モデルとは異なり、埋め込みモデルは十分に小さく、数百メガバイト程度で CPU デバイスでも推論に使用できます。(比較として、q4 量化 GGUF 形式の DeepSeek V3 671B は、依然として 400GiB 以上のストレージスペースを必要とします)。
しかし、🥺 SAD はまだ建設中なので、今日(4月6日)時点で最新かつ最もホットな埋め込みモデルをいくつか選んで推奨します:
オープンソースおよびプロプライエタリモデルのランキング:
| ランク (Borda) | モデル | Zero-shot | メモリ使用量 (MB) | パラメータ数 | 埋め込み次元 | 最大トークン | 平均 (タスク) | 平均 (タスクタイプ) | Bitext Mining | Classification | Clustering | Instruction Retrieval | Multilabel Classification | Pair Classification | Reranking | Retrieval | STS | |
既視感
前日の開発配信で、AIRI のための基本アニメーションとトランジション効果の制作の進捗状況をお見せしました。
主な目標は、@yui540 の素晴らしい作品を移植し、再利用可能な Vue コンポーネントとして適応させることで、 どんな Vue プロジェクトでもこれらの美しいアニメーション効果を簡単に使えるようにすることでした。
yui540 に関する詳細情報や関連する引用ライブラリ、作業内容は、新しくデプロイされたドキュメントサイトにまとめられています: https://airi.build/references/design-guidelines/resources/。
最終的な移植結果はかなり良く、以下にデプロイされています: https://proj-airi-packages-ui-transitions.netlify.app/#/。

また、これからは各パッケージのすべてのプレイグラウンドが "proj-airi" + "${subDirectory}" + "${packageName}" というパターンで Netlify に デプロイされるようになります。
前日の主な目標は CSS の実装を Vue コンポーネントに分割することでしたが、実際の再利用性の部分はまだ完全には実現されていません。 他のページでも便利に使えるように、柔軟かつ拡張可能なワークフローとメカニズムを設計する必要があります。
日中
unplugin-vue-router が提供する definePage マクロフックを試してみたところ、私の使用シナリオに非常に適していることがわかったので、この方向で探索を続けることにしました。
https://cowardly-witch.netlify.app/ からさらに3つの新しいアニメーション・トランジション効果を移植しました。これらはすでに https://proj-airi-packages-ui-transitions.netlify.app/#/ で利用可能です。
昨日、公式ドキュメントサイトを https://airi.build にデプロイしましたが、@kwaa から https://airi.more.ai/docs の方法を試してみてはどうかというコメントをもらいました。しかし、/docs のために 200 リダイレクトプロキシを設定する方法が思いつきませんでした。
編集:最終的にその方法を学びました。将来の開発ログに詳細を含める予定です。
試してみましたが、約10回のコミットを費やして CI/CD パイプラインと格闘しました(はい、またです)が、結局正常に動作させることはできませんでした。
今日の遅くには、いくつかの技術や DeepSeek チームが1週間前に公開したオープンソースリポジトリ、そしていわゆる ByteDance が公開した LLM ゲートウェイ AIBrix について調査しました。また、新しくリリース・発表された Phi-4-mini が AIRI で使用するために移植可能かどうかも研究しています。良いニュースは、[Phi-4-mini](https://techcommunity.microsoft.com/blog/educatordeveloperblog/welcome-to-the-new-phi-4-models