技術や仕組み

14 ”発言を資産化する仕組み”をAIで作ってみた(前編)

14 ”発言を資産化する仕組み”をAIで作ってみた(前編)
監修者情報
監修者アイコン
蕏塚 昌大

大学院では物理学の国際共同実験に携わり、機械学習を活用したソフトウェアモジュールを開発。2017年に新卒として株式会社SHIFT SECURITYに入社。標準化エンジニアとしてWebアプリケーションやクラウドの診断をはじめとする各種セキュリティ診断サービスの標準化を推進。週末は庭の雑草抜きに勤しむ。好きな言葉は「根こそぎ」。

先日、他拠点のメンバーに業務知識の講習をする機会があり、教鞭をとった。
1週間かけて行うこの勉強合宿は、僕にとって”大きな挑戦”だった。
実りある講習にするために、準備は万全にして臨まなければならなかった。

準備をはじめてみると、
頭の中にある業務知識をスライド資料だけで伝えるのは到底難しいものだった。
補足するためには口頭で多くの情報が必要になった。
講習の準備をしながら、この作業を今回限りで終わらせるのはもったいない、
資産として残したいと強く思った。

とはいえ、ひたすら文字を記録し続けるのは現実的ではないし、
はなし言葉をそのまま文章にしても、読むのが苦痛になってしまう。
そこで、AIを使って効率的に情報を整理し、資産化する方法を考えた。
具体的には、次のようなプロセスだ。

  • (1)音声をマイクで拾う
  • (2)文字起こし
  • (3)文字起こしデータを定期的に要約
  • (4)イメージ画像を生成
  • (5)要約とイメージ画像を組み合わせてスライドにまとめる

このプロセスを通じて、発言内容を効率的に資産化できるのではないかと考えた。

文字起こしには、OpenAIのWhisperを使用した。
この方法については、以下の記事が非常に参考になった。

https://knowledge.sakura.ad.jp/34497/

マイク音にはノイズが混じるため、ブラウザ上で発言区間に区切る。
その後、サーバでトランスクリプションによってテキストに変換する。
このテキストをGoogleスプレッドシートに蓄積し、定期的に1つのテキストに結合する。
結合したテキストをGPTで要約し、さらに画像生成AIによってイメージ画像を得る。
そして、要約とイメージ画像を組み合わせてスライドにまとめる。

この一連の流れをシンプルなパイプラインとしてイメージできたので、
さっそく作ってみることにした。
この仕組みができれば、今回に限らず多くの場面で役立つと感じている。

その結果は、また次回に、

後編につづく

次の話 15 ”発言を資産化する仕組み”をAIで作ってみた(後編)

生成AI活用システムの脆弱性診断はSHIFT SECURITYにお任せください

生成AI活用システムの脆弱性診断

ChatGPT等の生成AIを活用した
システム固有のセキュリティリスクを可視化します

生成AI活用システム診断ページはこちら
\ 記事をシェアする /

こちらの記事もおすすめ

Contact

お見積り・ご相談など、お気軽にご相談ください

ご相談・ご質問はこちら

お問い合わせ

お見積り依頼はこちら

お見積り依頼

資料請求はこちら

資料請求

お電話でのご相談はこちら
(平日10:00~18:00)

TEL.050-1707-3537
サイトTOPへ