Python ローカルPCにて、視覚言語モデルVLMを操作する「transformers, huggingface」

Python 生成AI 画像処理

本記事では、画像とプロンプト（命令文）を入力データとして、その回答を文章で生成するサンプルコードを掲載しました。この場合、視覚言語モデル（Vision Language Model, VLM）を用います。使用したモデルは、Hugging Faceの「llava-calm2-siglip」です。…

Python ローカルPCにて、Llama-3モデルによる質疑応答の操作を実現する「llama-cpp-python, huggingface」

Python 生成AI

はじめに Llama-3（ラマ）モデルはMeta社のオープンソースのLLM（大規模言語モデル）です。これを元に日本語での精度を向上させたモデルがいくつか公開されています。無料で利用できます。本記事では、このLlama-3モデル（派生モデル）をローカルPCでChatGP…

Python 生成AI

本記事では、Pythonを用いた画像生成AIの雛形コードを載せました。例えば、下図のような手書きの画像があります。図1. 手書きによる画像本プログラムを実行すると、上図1を元にした下図５つのような生成AIにより類似の画像を生成します。図2. 生成AIによ…