OpenAI GPT API(5) モデルについて

今回はOpenAIから提供されている様々なモデルについて説明します。
各モデルの価格設定と、それぞれのモデルでアウトプット(出力結果)に
どのような違いがあるのか、実際に試してみてクオリティの違いなどを確認していきたいと思います。
本記事は「OpenAI GPT API(4) モデルについて」の続きです。

GPT-3.5で使用可能なモデル

上図はGPT-3.5で使用可能なモデルのリストです。
GPT-3.5はGPT-3をベースに改良を加えたモデルです。
本連載で今まで使用してきた「text-davinci-003」はここに含まれます。
「text-davinci-003」はTextCompletion処理をおこなう場合においては
最も性能がよいとされています。
「gpt-3.5-turbo」は今まで使用してきたTextCompletionAPIでは使用できなくて、
ChatGPT APIで使用可能なモデルです。

各モデルの価格設定

以下で確認できます。
https://openai.com/pricing

使用料金は今後変動する可能性が高いですが、現時点では上記の設定になっています。
今まで使用してきたモデル「Davinci」の使用料金は1,000トークンにつき
$0.02(2セント)に設定されています。
「Curie」の場合の使用料金は10倍安く、1,000トークンにつき$0.002(0.2セント)に設定されています。
「Ada」は最も安く、1,000トークンにつき$0.0004(0.04セント)に設定されています。

モデル名や価格設定はわかりにくいですが、
TextCompletionAPIにおいては「Davinci」が最も性能はよいが低速で価格設定は最も高価です。
「Ada」は性能は高くないが、高速で安価です。

各モデルを使用した場合、アウトプットにどのような違いがあるか

ストレス解消の方法についてAIに尋ねた場合の各モデルのレスポンスを比較してみます。
以下のプロンプトで試してみます。

プロンプト:
ストレス解消の方法は?

Davinciの場合

Curieの場合

Babbageの場合

Adaの場合

Davinciの場合、実用的と思われるよいレスポンスが得られました。しかしCurie、Babbage、Adaレベルの返答では実用は難しそうです。

質問のレベルを落としてみます。
以下タスクを想定します。

タスク例:
テキストボックスがあり、ユーザーは自由な文章を入力できる。
ユーザーが入力した文章の中から電話番号を見つけ出し
電話番号だけを抽出する。

このようなシンプルなタスクの場合、各モデルで対応可能か
以下のプロンプトで試してみます。

プロンプト:
以下の文章から電話番号を抽出してください:
「私の電話番号は090-1111-2222です」

Davinciの場合

Curieの場合

Babbageの場合

Adaの場合

この場合、Ada以外のすべてのモデルで対応できました。
このようにタスク内容、処理速度、料金、正確性、プロンプトの難易度などを考慮して
モデルの選定をおこなうことが重要です。
次回はプロンプトエンジニアリングについて説明します。

木曜日担当:nishida



アプリ関連ニュース

お問い合わせはこちら

お問い合わせ・ご相談はお電話、またはお問い合わせフォームよりお受け付けいたしております。

tel. 06-6454-8833(平日 10:00~17:00)

お問い合わせフォーム