生成AI
本記事では、画像とプロンプト(命令文)を入力データとして、その回答を文章で生成するサンプルコードを掲載しました。この場合、視覚言語モデル(Vision Language Model, VLM)を用います。 使用したモデルは、Hugging Faceの「llava-calm2-siglip」です。…
はじめに Llama-3(ラマ)モデルはMeta社のオープンソースのLLM(大規模言語モデル)です。これを元に日本語での精度を向上させたモデルがいくつか公開されています。無料で利用できます。 本記事では、このLlama-3モデル(派生モデル)をローカルPCでChatGP…
本記事では、Pythonを用いた画像生成AIの雛形コードを載せました。例えば、下図のような手書きの画像があります。 図1. 手書きによる画像 本プログラムを実行すると、上図1を元にした下図5つのような生成AIにより類似の画像を生成します。 図2. 生成AIによ…