技術や仕組み

10 AIの回答に根拠をもたせてみた

10 AIの回答に根拠をもたせてみた
監修者情報
監修者アイコン
蕏塚 昌大

大学院では物理学の国際共同実験に携わり、機械学習を活用したソフトウェアモジュールを開発。2017年に新卒として株式会社SHIFT SECURITYに入社。標準化エンジニアとしてWebアプリケーションやクラウドの診断をはじめとする各種セキュリティ診断サービスの標準化を推進。週末は庭の雑草抜きに勤しむ。好きな言葉は「根こそぎ」。

前回は、Webページの画面属性をChatGPTに判定させるために、APIを使ってあれこれ試してみた。
今度は、AIが出した結果を人間の作業画面にどう反映させるかを考えながら、回答文のフォーマットを考えていく。

まずは、指定された画面属性(例. パスワード欄)を持つかどうかで、○か×かという判定結果が必要だ。
もしこの判定が完璧にできるのならば、そのまま作業画面に反映させ、
人間の作業が要らなくなるという考えも出てくるだろう。

しかし、AIはあくまでアシスタントだ。
今の段階ではハルシネーションに代表されるように精度の足りないところがあるし、
結果の責任を取ってくれるわけではない。

そこで、判定結果とあわせて判定根拠も提示してもらうことにした。
AIが○や×と判断した理由が書かれていれば、
作業員はその説明の正しさを見て最終的な判断を下すことができる。

一方で、判定は画面ごと・属性ごとに実施されるところ、
その結果や根拠の文面をすべて読んでいくのはなかなかに辛い。
意味のある提案だけを確認するようにしたい。

そこで、判定に対する自信の度合いを信頼度として示してもらうことにした。
信頼度の低い結果は無視してしまうようにすれば、
必要最低限の提案にだけ目を通せるようになる。

プロンプトをこまごま整形していって、
ChatGPTからこのような回答が返ってくるようになった。

パスワード欄:o (100%) レスポンス内のテキスト情報に、「メールアドレス :メールアドレスをコンピューターに記憶させる パスワード :※パスワードを忘れた方はこちらからパスワードの再発行を行ってください。※メールアドレスを忘れた方は、お手数ですが、お問い合わせページからお問い合わせください」という文言があり、パスワード欄が存在することがわかります。

次は、この仕組みを自動化して、作業画面への反映を自動化していこうと考えている。
そのためには、プログラムで応答を処理できるよう、フォーマットをさらに検討していく必要がある。

道のりは険しいけど、一歩ずつ着実に進んでいきたい。

次の話 11 文章量の多いAIの回答をFunction callingでわかりやすい回答にしてみた

生成AI活用システムの脆弱性診断はSHIFT SECURITYにお任せください

生成AI活用システムの脆弱性診断

ChatGPT等の生成AIを活用した
システム固有のセキュリティリスクを可視化します

生成AI活用システム診断ページはこちら
\ 記事をシェアする /

こちらの記事もおすすめ

Contact

お見積り・ご相談など、お気軽にご相談ください

ご相談・ご質問はこちら

お問い合わせ

お見積り依頼はこちら

お見積り依頼

資料請求はこちら

資料請求

お電話でのご相談はこちら
(平日10:00~18:00)

TEL.050-1707-3537
サイトTOPへ