記事一覧
ksh3が書いた技術記事・リサーチノートの一覧。インフラ、LLM、ソフトウェアツール、ワークフローなど幅広いトピックをカバーしています。
個人の仕事と趣味から生まれた技術記事・リサーチノートです。カテゴリ別にご覧いただけます。
インフラストラクチャ(1件)
サーバーハードウェア、ネットワーク構成、コンテナオーケストレーション、モニタリング、GPU環境構築に関する技術ドキュメント。
主なトピック: AMD EPYC 9175F, MikroTik RouterOS, Podman/Quadlet, Ubuntu Server, Prometheus/Grafana, 10GbE ネットワーク, PostgreSQL, LLMスタックデプロイ
最新の記事:
2025-03-01
UIプロンプトとLLMレスポンスのペアデータセット保存を実現するDagster + NATS統合、非同期パイプラインオーケストレーション、イベントルーティング、PostgreSQL監査ログ設計
LLMリサーチ(13件)
大規模言語モデルのベンチマーク、CPU/GPU推論検証、量子化テスト、最適化リサーチ。
主なトピック: DeepSeek V3.2, Qwen3, Kimi K2.5, GLM-4.7, Llama 4, Hermes, MiniMax, EPYC 9175F推論最適化, GGUF量子化
最新の記事:
2026-02-27
229B級MoEモデル MiniMax-2.5 を EPYC 9175F + RTX PRO 6000 環境で動かした全記録。IQ5_K/IQ4_NL/IQ3_S の3段階の量子化で Expert Offload ベンチマークを実施し、React LP と歯科医院静的サイトのワンショット生成を検証した。157GB のモデルを 96GB VRAM で回すための設定と、量子化レベルごとの速度・品質トレ …
2026-02-27
Qwen3.5-397B-A17B(397B総パラメータ/17B活性MoE)をIQ4_NL量子化でEPYC 9175F + GPU環境にハイブリッドデプロイ。28回の連続推論で平均TG 22.5tok/s、最大PP 372tok/s。マルチGPUテンソルオフロードとcpu-moe構成を含む実行設定を記録。
2026-02-27
Llama-4-Scout(17B活性/16エキスパートMoE)をEPYC 9175FのCPU Q6_K推論とRTX PRO 6000 Blackwell Max-QのGPU nvfp4推論で実測比較。CPU 17tok/s vs GPU 30-60tok/s。mmapキャッシュ戦略、prompt cache、100kコンテキスト境界を検証した。
ソフトウェアツール(8件)
開発ツール、IDE設定、MCP統合、コード分析ユーティリティ、Webプロジェクト実装に関するドキュメント。
主なトピック: VS Code Server, Zed, Serena MCP, ctree, Dagster, Django, Lightdash, shelpa
最新の記事:
2026-02-27
400B級 MoE モデル Qwen3.5-397B を用いた2つのコード生成検証の記録。歯科医院向け6ページ静的サイト(HTML+Tailwind+Alpine.js)のワンショット生成と、WordPress ライクな Django CMS 基盤(8アプリ、20超モデル)のシングルターン生成。設計意図をSPECとして渡せば、実装はAIが組み上げる時代の実践データ。
2025-03-01
code-treeの設計思想とツール仕様、コンテキスト圧縮とトークンコスト削減の実装方針、MCP統合による運用フロー
2025-03-01
MCP準拠の仮想シェルサーバー(shelpa-mcp)のアーキテクチャ設計、コマンドルーティング、パイプラインステージ管理、セッションCWD、デュアルライトtee実装 — 最終的にモデル矯正の壁で廃止
ワークフロー(2件)
開発ワークフロー、コーディング哲学、AIエージェント設定、プロンプト仕様、自動化プラクティス。
主なトピック: コーディング哲学, LLMエージェント運用, LTX2プロンプト仕様, 多言語校正, ローカルAI開発環境
最新の記事:
2026-02-27
LTX-2向けの構造化プロンプト仕様を整理する。36シーン×5秒のホラーシナリオ生成テンプレート、シネマティック・ショット設計の原則、そしてマルチシーン連結時のビジュアル継続性制御まで、実運用で得た知見をまとめた。
2026-02-26
本ドキュメントは、英語から日本語への翻訳、および日本語から「英語に翻訳しやすい日本語」への校正を行うための、エンジニア向け AI プロンプトの定義をまとめたものです。
アーキテクチャ(1件)
システムアーキテクチャ設計、分散パイプラインパターン、マイグレーション記録。
主なトピック: Rust, NATS, Dagster, OpenAI Proxy, SSEストリーミング, Go移行
最新の記事:
2026-02-27
Rust(axum)によるOpenAI互換プロキシ、NATS Core/JetStreamイベント中継、Dagster oneshotジョブ実行、PG冪等設計、Qdrantセマンティックキャッシュ、SSEストリーミング、Quadlet/systemd統合。そしてGoへの全面移行。AI知能工場のアーキテクチャ全貌。

