AI | 佐藤桂輔研究室

日本語散文リンター「nihongo-slopless」をGitHubで公開しました

日本語散文リンター「nihongo-slopless」をGitHubで公開しました。 nihongo-slopless は、日本語Markdownやテキスト文書に含まれる、抽象的な表現、根拠不足、責任主体の曖昧さ、チャット応答の残骸、長すぎる文・段落などを、編集候補として提示するCLIツールです。現時点では公開ベータとして位置づけています。このツールは、AIが書いたかどうかを判定するものではありません。作成者や生成元の推定ではなく、読み手が判断しにくくなる箇所を確認するためのものです。根拠が薄い、条件が書かれていない、責任主体がぼやけている、といった問題は、人間が書いた文章にも、AIが関わった文章にも起こり得ます。同じ入力には同じ結果を返す、決定論的なCLIとして作りました。LLMに文章全体を評価させるのではなく、指摘の条件を見える形にして、公開前の確認や授業での振り返りに使えるようにすることを意図しています。授業や研究室で使う場合も、指摘をすべて直すことは目的ではありません。直すか、あえて残すかを説明する材料として使い、主張、根拠、条件、読み手への配慮を確認する練習につなげたいと考えています。今後は、実際の文書での誤検出や見逃しを記録しながら、研究計画、授業資料、広報文、AIエージェントが生成した草稿などの公開前確認に使いやすい形へ整えていく予定です。関連リンク: GitHub: nihongo-slopless 公開資料

AIを測定装置のように疑う — 校正された不信感という作法

AIはブラックボックスだから危ない、という話をよく聞きます。確かに、中が見えない道具を確認なしに「答え」として扱うのは危ういと思います。ただ、ブラックボックスであること自体を問題にすると、多くの道具を手放すことになります。万有引力の法則は強力に使えますが、なぜ質量を持つものが引き合うのかを根源まで閉じているわけではありません。実験装置も、内部をすべて自作できなくても、校正できる、誤差を見積もれる、どの条件で壊れるかを知っている、というところまで持っていければ道具として使えます。焦点は、ブラックボックスかどうかよりも、その癖をどこまで把握できているかの方にあると感じています。信じる前に、まず測る自動測定装置は便利です。試料をセットしてボタンを押せば、きれいなグラフが出ます。ただ、その曲線には試料の置き方、ホルダーの寄与、温度の揺れ、残留磁場、解析ソフトの前提が混ざります。慣れた人ほど、まず装置を疑います。標準試料を測る、空のホルダーを測る、変な値が出たら対象由来か装置由来か解析由来かを切り分ける。PPMSでもラマンでも、最初の数分はだいたい「装置と挨拶する時間」に消えていきます。 AIとの付き合い方も、ここに近いと感じています。「答えをくれる存在」と見ると危ういのですが、「応答を返す装置」と見ると少し扱いやすくなります。同じ問いを少し違う言い方で投げる、既知の問題で試す、返ってきた答えを手元の資料や自分の手計算で照らす。完全な透明性がなくても、安全に使える範囲までは持っていけます。必要なのは「校正された不信感」と呼びたい姿勢です。ただ、AIは普通の測定装置とは少し違う比喩としては通用するのですが、AIには測定装置にない厄介さもあります。ひとつは、応答が固定されにくいこと。モデルの更新や設定、検索の有無、聞き方の少しの違いで結果が揺れます。ふたつめは、誤りが数字として見えにくいこと。測定値ならばらつきやノイズで気づけますが、AIの誤りはもっともらしい文章として出てきます。エラーバーのかわりに、なめらかな説明が出てくる感じです。そしていちばん厄介なのが、AIは答えだけでなく問いの形まで動かしてしまうことです。どの整理が自然そうか、どの論点が重要そうかまでセットで差し出してくる。気づくと、AIが答えやすい問いを「よい問い」だと思い始めているかもしれません。普通の測定装置は対象を測りますが、AIは対象を測りながら、使う人の理解感も一緒に動かしてしまうところがある。だからAIを使うときは、AIの応答と、それを読んだ自分の判断の、両方を測る必要があると感じています。信頼は、気持ちではなく経路でつくる実用的な作法は、案外地味です。既知の問題で試す、根拠が薄いときにどんな応答をするか観察する、得意な作業と苦手な作業を分ける、重要な判断に使ったときは、どの出力を何で確かめたかを短く残しておく。すべてのやりとりを記録する必要はありません。残しておくとよいのは、判断に直接触れる部分だけです。何を入れて、何が返ってきて、どこを採用し、何と照らし合わせ、どこからは使わないと決めたか。「AIを使いました」だけでも「使いませんでした」だけでも、説明として足りない気がします。大事なのは、その判断がどんな確認を通っているかの方ではないかと思います。おわりに AIを拒んでも安全になるわけではないし、任せきりにすれば賢くなるわけでもありません。透明でない道具と付き合う作法を、勘ではなく、後から辿れる経路にしていく作業だと感じています。同時に、検証の負担を使う側だけに背負わせず、組織や提供側にも置きどころを分けていく必要もありそうです。最後にひとつだけ。AIを使う前に、自分は何を問いたかったのか。AIの答えを読んだあと、その問いは深まったのか、それともAIが答えやすい形に丸められただけなのか。AIは、問いを閉じる道具にも、広げる道具にもなり得ます。皆さんは、AIを使ったあとに、どんな問いが手元に残っていますか。

オンライン教材「AIと協働する技術 ― エージェント・ハーネス設計の12講」を公開しました

オンライン教材「AIと協働する技術 ― エージェント・ハーネス設計の12講」を公開しました。 📘 教材を読むこの教材は「プログラミング」の教材ではありません本教材は、PythonやAPIの使い方を学ぶプログラミング教材ではありません。 AIに「何をさせるか」「どう役割を分けるか」「どこまで任せるか」――こうした設計の考え方を身につけるための教材です。コードを書かなくても、ChatGPTやClaudeなどの生成AIを日常的に使っている方であれば、十分に読み進められます。教材の概要 AIエージェントの「賢さ」ではなく「働かせ方の構造」を理解し、道具設計・計画管理・役割分担・安全統制を自ら設計できるようになることを目指しています。高専・高校・大学の1〜2年生を主な読者として想定し、全12章の2部構成で学びます。 Part I　基盤：1体のAIを働かせる（第1〜6章）第1章　AIを「魔法」ではなく「系」として見る第2章　1つのループがエージェントを生む第3章　AIに道具を持たせる第4章　計画しないAIは迷う第5章　必要な知識を、必要なときに読む第6章　AIは忘れる――文脈と要約の設計 Part II　協調：複数のAIを設計する（第7〜12章）第7章　役割分担でAIを強くする第8章　仕事を分解し、依存を設計する第9章　AI同士が連絡するとき、何が必要か第10章　自分で仕事を見つけるAI 第11章　互いに邪魔しない作業空間をつくる第12章　安全・権限・倫理――最後に人間が責任を持つ本教材の特徴プログラミング不要 ― コードではなく、AIの「外側の設計」（道具、計画、知識管理、役割分担、権限）を扱います身近な比喩で理解 ― 物理実験の手順になぞらえて、AIの働かせ方を段階的に学べます人間が主役 ― 「AIの出力に対する最終責任は人間にある」という原則を全体を通じて重視していますぜひご活用ください。ご意見・ご感想はお問い合わせページよりお寄せください。

gpt-5.1を試しながら振り返る、最近の『対話』

OpenAI から gpt-5.1-pro が公開されました。新しいモデルに触れるとき、私は毎回「1年前に自分が書いた LinkedIn 投稿をどのように読み取るか」をひとつの指標にしています。この LinkedIn 投稿はいまでも気に入っていて、モデルごとに少しずつ違う読み方を見せてくれるのを楽しんできました。今回 gpt-5.1-pro と向き合ったときにも、思わず「まじか」とつぶやいてしまう一言が返ってきました。その具体的なやりとりについては後半で触れつつ、ここではまず、きっかけになった LinkedIn のテキストを原文のまま残しておきたいと思います。 Below is the LinkedIn post I originally wrote in English one year ago: Let us reflect on the true essence of dialogue. There is a saying that “A knife is a chef’s life.” A chef treats their knife with the utmost respect, maintaining it with care and fostering a deep bond with their tool. This represents a relationship that transcends mere tool usage, evolving into something more profound. ...