記事一覧 | loFT LLC

個人の仕事と趣味から生まれた技術記事・リサーチノートです。カテゴリ別にご覧いただけます。

インフラストラクチャ（1件）

サーバーハードウェア、ネットワーク構成、コンテナオーケストレーション、モニタリング、GPU環境構築に関する技術ドキュメント。

主なトピック: AMD EPYC 9175F, MikroTik RouterOS, Podman/Quadlet, Ubuntu Server, Prometheus/Grafana, 10GbE ネットワーク, PostgreSQL, LLMスタックデプロイ

最新の記事:

Dagster + NATS イベント駆動パイプライン設計と実装
2025-03-01
UIプロンプトとLLMレスポンスのペアデータセット保存を実現するDagster + NATS統合、非同期パイプラインオーケストレーション、イベントルーティング、PostgreSQL監査ログ設計

全ての記事を見る →

LLMリサーチ（13件）

大規模言語モデルのベンチマーク、CPU/GPU推論検証、量子化テスト、最適化リサーチ。

主なトピック: DeepSeek V3.2, Qwen3, Kimi K2.5, GLM-4.7, Llama 4, Hermes, MiniMax, EPYC 9175F推論最適化, GGUF量子化

最新の記事:

MiniMax-2.5 (229B MoE) Expert Offload 運用と Web 生成検証：IQ5_K から IQ3_S まで
2026-02-27
229B級MoEモデル MiniMax-2.5 を EPYC 9175F + RTX PRO 6000 環境で動かした全記録。IQ5_K/IQ4_NL/IQ3_S の3段階の量子化で Expert Offload ベンチマークを実施し、React LP と歯科医院静的サイトのワンショット生成を検証した。157GB のモデルを 96GB VRAM で回すための設定と、量子化レベルごとの速度・品質トレ …

Qwen3.5-397B IQ4_NL実測：28回のランで平均22.5tok/s、ハイブリッドオフロード構成と400B級MoEの常用可能性
2026-02-27
Qwen3.5-397B-A17B（397B総パラメータ/17B活性MoE）をIQ4_NL量子化でEPYC 9175F + GPU環境にハイブリッドデプロイ。28回の連続推論で平均TG 22.5tok/s、最大PP 372tok/s。マルチGPUテンソルオフロードとcpu-moe構成を含む実行設定を記録。

Llama-4-Scout-17B-16E実測：CPU Q6_K 17tok/s vs GPU nvfp4 60tok/s、キャッシュ戦略と100kコンテキスト境界
2026-02-27
Llama-4-Scout（17B活性/16エキスパートMoE）をEPYC 9175FのCPU Q6_K推論とRTX PRO 6000 Blackwell Max-QのGPU nvfp4推論で実測比較。CPU 17tok/s vs GPU 30-60tok/s。mmapキャッシュ戦略、prompt cache、100kコンテキスト境界を検証した。

全ての記事を見る →

ソフトウェアツール（8件）

開発ツール、IDE設定、MCP統合、コード分析ユーティリティ、Webプロジェクト実装に関するドキュメント。

主なトピック: VS Code Server, Zed, Serena MCP, ctree, Dagster, Django, Lightdash, shelpa

最新の記事:

Qwen3.5-397B 自律コード生成検証：歯科医院サイトから Django CMS 基盤まで
2026-02-27
400B級 MoE モデル Qwen3.5-397B を用いた2つのコード生成検証の記録。歯科医院向け6ページ静的サイト（HTML+Tailwind+Alpine.js）のワンショット生成と、WordPress ライクな Django CMS 基盤（8アプリ、20超モデル）のシングルターン生成。設計意図をSPECとして渡せば、実装はAIが組み上げる時代の実践データ。

code-tree 仕様・開発意図・期待効果 — LLMコンテキスト最適化ツール
2025-03-01
code-treeの設計思想とツール仕様、コンテキスト圧縮とトークンコスト削減の実装方針、MCP統合による運用フロー

shelpa-mcp: ボツになった仮想パイプラインの設計記録
2025-03-01
MCP準拠の仮想シェルサーバー（shelpa-mcp）のアーキテクチャ設計、コマンドルーティング、パイプラインステージ管理、セッションCWD、デュアルライトtee実装 — 最終的にモデル矯正の壁で廃止

全ての記事を見る →

ワークフロー（2件）

開発ワークフロー、コーディング哲学、AIエージェント設定、プロンプト仕様、自動化プラクティス。

主なトピック: コーディング哲学, LLMエージェント運用, LTX2プロンプト仕様, 多言語校正, ローカルAI開発環境

最新の記事:

LTX-2 動画生成プロンプトエンジニアリング：ホラー36シーンからシネマティック連続パイプラインまで
2026-02-27
LTX-2向けの構造化プロンプト仕様を整理する。36シーン×5秒のホラーシナリオ生成テンプレート、シネマティック・ショット設計の原則、そしてマルチシーン連結時のビジュアル継続性制御まで、実運用で得た知見をまとめた。

バイリンガルAI校正・翻訳プロンプト定義
2026-02-26
本ドキュメントは、英語から日本語への翻訳、および日本語から「英語に翻訳しやすい日本語」への校正を行うための、エンジニア向け AI プロンプトの定義をまとめたものです。

全ての記事を見る →

アーキテクチャ（1件）

システムアーキテクチャ設計、分散パイプラインパターン、マイグレーション記録。

主なトピック: Rust, NATS, Dagster, OpenAI Proxy, SSEストリーミング, Go移行

最新の記事:

Rust + NATS + Dagster AI知能工場：OpenAI互換プロキシ、冪等設計、SSEストリーミング、Go移行の全記録
2026-02-27
Rust(axum)によるOpenAI互換プロキシ、NATS Core/JetStreamイベント中継、Dagster oneshotジョブ実行、PG冪等設計、Qdrantセマンティックキャッシュ、SSEストリーミング、Quadlet/systemd統合。そしてGoへの全面移行。AI知能工場のアーキテクチャ全貌。

全ての記事を見る →