Logo loFT LLC

  • person プロフィール
  • article 記事一覧
      • Dagster + NATS イベント駆動パイプライン設計と実装
      • Rust + NATS + Dagster AI知能工場:OpenAI互換プロキシ、冪等設計、SSEストリーミング、Go移行の全記録
      • Qwen3.5-122B-A10B ローカル推論による Django 5 旅行予約サイト生成テスト
      • なぜEPYC 9175Fの512MB L3キャッシュはMoE推論に効くのか:1Tモデル実測による仮説検証
      • なぜHermes-4.3-36Bの量子化選択で運用が変わるのか:BF16/FP8/nvfp4の実測比較
      • 40B Denseモデルの現実:IQuest-Coder-V1-40BをCPU/GPU/Aiderで回して分かったこと
      • MiniMax-2.5 229B MoEをIQ5K量子化でBlackwell GPU上で実行:生成速度35 tok/s・長コンテキスト65kの検証結果
      • MiniMax-2.5 (229B MoE) Expert Offload 運用と Web 生成検証:IQ5_K から IQ3_S まで
      • Qwen3.5-397B IQ4_NL実測:28回のランで平均22.5tok/s、ハイブリッドオフロード構成と400B級MoEの常用可能性
      • Llama-4-Scout-17B-16E実測:CPU Q6_K 17tok/s vs GPU nvfp4 60tok/s、キャッシュ戦略と100kコンテキスト境界
      • 1T級MoE Kimi-K2.5のCPU推論実測:スレッド最適化からLong Context運用設計まで
      • Llama-4-Maverick-17B-128E CPU推論:Q4_K_M vs Q8_0の速度・品質トレードオフ実測
      • Qwen3-Coder-Next 80Bを3モードで回す:BF16 CPU / IQ4_NL Hybrid / nvfp4 GPU実測比較
      • GLM-4.7-Flash IQ5_K ベンチマーク:CPU/Hybrid/Full GPUの3パターン実測比較
      • なぜDeepSeek-V3.2はKimi-K2.5より遅く見えるのか:プロンプトキャッシュ不一致とTGボトルネックの解析
      • code-tree 仕様・開発意図・期待効果 — LLMコンテキスト最適化ツール
      • shelpa-mcp: ボツになった仮想パイプラインの設計記録
      • shelpa: ボツになったサンドボックスMCPの設計と教訓
      • ctreeによるリファクタリング効果検証 — プロジェクトの構造最適化
      • code-tree HTML テンプレート・Markdownスキャナーの構築 — ドキュメント形式への拡張
      • ローカルLLMのパスエラーを自動解決するMCPツール:pathfinderの開発
      • pathfinderの最適化プロセス:モデル選定・精度調整・履歴相関の検証
      • Qwen3.5-397B 自律コード生成検証:歯科医院サイトから Django CMS 基盤まで
      • バイリンガルAI校正・翻訳プロンプト定義
      • LTX-2 動画生成プロンプトエンジニアリング:ホラー36シーンからシネマティック連続パイプラインまで
    Logo
    email ご相談はこちらから
      • English
    • 移動
    • 選択
    • 閉じる
      • Home
      • 開発ノート
      On this page
      code

      開発ノート

      loFT LLCのインフラ、LLMリサーチ、ソフトウェアツール、開発フレームワークに関する技術ドキュメント。

      info
      技術メモとして残していた ObsidianノートにAIの要約を利用しています。
      dns folder

      インフラストラクチャ

      サーバーハードウェア、ネットワーク構成、コンテナオーケストレーション、監視スタックに関するドキュメント。

      dns folder

      システムアーキテクチャ

      システムアーキテクチャ設計、分散パイプラインパターン、マイグレーション記録。

      psychology folder

      LLM リサーチ

      大規模言語モデルのベンチマーク、CPU/GPU推論検証、最適化リサーチ。

      build folder

      ソフトウェアツール

      開発ツール、IDE設定、MCP統合、コード分析ユーティリティ。

      account_tree folder

      ワークフロー

      開発ワークフロー、コーディング哲学、AIエージェント設定、自動化プラクティス。


      © 2017-2026 loFT LLC