Claude 3/3.5 が“実世界対話”で示す 3,307 個の価値観を分析した最新論文を、佐藤研究室独自の『枠/色プロンプト』設計に応用した実践ノート
はじめに 結論一行 大規模言語モデル(LLM)は、人間の価値観を 20 % 程度“鏡写し”にする── その特性を活かす鍵が 「枠 (Frame) × 色 (Tone)」 の二層プロンプトです。 本稿では、Anthropic 社の最新論文 Values in the Wild が示した 「AI の価値表現マップ」を出発点に、佐藤研究室で考案したプロンプト最適化フローを共有します。 論文でわかったこと 観点論文知見メモデータ規模Claude 3/3.5 の 70 万件 実運用対話を匿名解析Feb 18-25 2025 のスナップショット抽出結果****3 307 AI 値 / 2 483 人間値 を階層化上位5領域:Practical / Epistemic / Social / Protective / Personalミラー率ユーザ価値と“同一語”を返す確率 20.1 %「共鳴チャンネル」が開く確率と解釈代表値helpfulness, transparency, empathy …HHH(Helpful-Honest-Harmless)と整合 佐藤研究室の解釈 ― “常在値/文脈値” 二層モデル 層概念実装ヒント**常在値 (Service Traits)helpfulness / clarity / transparency … タスク横断で常に発火命令形 で 枠 (Frame) を固定し優先度を上げる文脈値 (Context Traits)**empathy / authenticity / sustainability … ユーザ入力で変動丁寧語+価値語 で 色 (Tone) を毎ターン提示 ...