SiriやAlexa、Googleアシスタントのように、音声で ChatGPT を使用できるアプリ「TalkGPT」を作成しました。
声からしゃべった内容を認識して ChatGPT が返答し、さらにそれを読み上げてくれます。
アプリは無料です。ブラウザ上で動きますので、スマホでもPCでも、お好きな端末で遊ぶことができます。
▽ TalkGPT
https://musemyuzu.com/flask/talk-gpt/
YouTube動画でも紹介しています
▽ ソースコードはこちら
https://github.com/MuseMyuzu/FlaskWithOpenAI
遊び方
右下のボタンを押すと録音マークが点灯し、録音が開始します。しゃべり終わったらもう一度同じボタン(送信マークに変わっている)を押すと録音が停止し、文字起こしが始まります。
文字起こしされた文字が表示され、ChatGPTからの返答が返ってきます。また、返答の音声も流れ始めます。
モード選択
左下のバーで「日本語(Ja)」か「英語(En)」を選択します。日本語モードなら日本語で、英語モードなら英語で返答してくれます(こちらが話しかけた返答によらず)。
英語モードにすれば、翻訳アプリ的な使い方もできるかも?
音量バー
再生される音声のボリュームを調整できます。左に振り切ればミュート。
ヘッダー
メニュー
左上の三本線(通称、ハンバーガーメニュー)を押すとメニューが表示されます。前作のモールス変換機へ飛べます。
設定
設定ボタンを押すことで飛べます。遊び方、注意点、リンクなどを確認できます。
全画面
右上の四角いマークで全画面モードにできます。スマホの場合は表示されません。
注意
内容は保存されません
会話内容、音量バーや言語バーの設定などは保存されません。ページを再読み込みしたり、設定画面に移動したりするとデータはリセットされます。
音声が送られます
録音音声は私の契約するサーバーに送信され、そこで文字起こしが行われます。音声はこのアプリ以外には使用せず、文字起こしが終わればすぐに削除するのでご安心ください。
ライセンス
ソースコードは下記のリンクにあります。ライセンスは GPL 3.0 です。
アプリ自体はSNS、ブログ、その他各種サービスで自由に共有・紹介してもらって構いません。
使用ライブラリ
ソースコードの一番上にライセンスが記載されているものは、他者のライブラリや作品を使用しています。逆に、記載のないものは私自身が開発したものorライセンス表記の必要ないプログラムです。
- Flask
https://github.com/pallets/flask
BSD-3-Clause license。PythonとHTML等をつなげてくれるもの。 - チャットボット
https://codepen.io/masa_mf3/pen/WNpjJzM
MITライセンス。ベースの見た目はほぼ変えてません。 - Google Cloud Text-to-Speech
https://github.com/googleapis/python-texttospeech
Apache-2.0 license。テキストの読み上げをするためのライブラリ。Google Cloud Platform の Text-to-Speech API を簡単に利用することができます。
↓使い方はこちら
コメント