Google AI Studioの使い方｜PDFを読み取って指定したテーマの情報をピックアップする方法

生成AI(エーアイ)

2026.04.06

この記事は約4分で読めます。

Google AI Studio単体では、現時点では「ローカルフォルダ内のPDFを直接スキャン」する機能はありません。以下の2パターンで実現できます。

全体像（実務で使う設計）

方法は2択

手動アップロード型（最も簡単）
API＋スクリプト型（実務・自動化向け）

① 手動アップロードでやる（最短・非エンジニア向け）手順

① AI Studioを開く

Google AI Studioにアクセス
「New prompt」または「Chat」を選択

② PDFをアップロード

画面右側 or 下部の「Upload」
対象PDFをドラッグ

③ プロンプトを書く（ここが核心）

以下をそのまま使えます：

このPDFの内容から、以下のテーマに関する情報を漏れなく抽出してください。テーマ：
「〇〇（例：相続、賃貸管理、地域課題など）」条件：
・重要な情報はすべて抽出
・要約ではなく、網羅的に整理
・見出しごとに分類
・数値、事例、具体策は必ず残す
・曖昧な部分は「不明」と明記出力形式：
① 概要
② 重要ポイント一覧
③ 詳細（構造化）
④ 実務で使える示唆

限界

複数PDFは一括不可（1つずつ）
フォルダ単位処理はできない
完全自動化は不可

② API＋ローカル連携（本命・実務レベル）

ここからが「本当に使えるやり方」です。

構成

ローカルフォルダ
　↓
Pythonスクリプト
　↓
Gemini API（AI Studioの裏側）
　↓
結果をまとめて出力

②-1 必要なもの

Google AI StudioでAPIキー発行
Python環境

②-2 サンプルコード（そのまま使える）

import os
import google.generativeai as genai# APIキー設定
genai.configure(api_key="YOUR_API_KEY")model = genai.GenerativeModel("gemini-1.5-pro")folder_path = "./pdfs"results = []for file in os.listdir(folder_path):
    if file.endswith(".pdf"):
        path = os.path.join(folder_path, file)        with open(path, "rb") as f:
            pdf_data = f.read()        response = model.generate_content([
            {
                "mime_type": "application/pdf",
                "data": pdf_data
            },
            """
            このPDFから「〇〇」に関する情報をすべて抽出し、
            以下の形式で整理してください：            ・重要ポイント
            ・具体事例
            ・数値データ
            ・実務で使える示唆
            """
        ])        results.append(f"### {file}\n{response.text}")# 結果出力
with open("output.txt", "w", encoding="utf-8") as f:
    f.write("\n\n".join(results))

②-3 ポイント（精度を上げるコツ）

1. プロンプト設計が9割

悪い例：

「まとめて」

良い例：

「テーマ別に分類」
「具体例を抜き出す」
「意思決定に使える形」

2. 分割処理（重要）

PDFが長い場合：

・ページごとに分割
・チャンク処理

→ 精度が大幅に上がる

3. 最後に統合させる

① 各PDFごとに抽出
② 全体をまとめ直す

実務での最適構成（推奨）レベル1（すぐやる）

AI StudioにPDF投げる

レベル2（効率化）

Pythonで複数PDF処理

レベル3（プロ仕様）

フォルダ監視＋自動処理
スプレッドシート出力
Notion連携

よくある失敗

① PDF丸投げ

→ 情報が抜ける

② テーマが曖昧

→ 使えない要約になる

③ 出力形式未指定

→ バラバラな結果になる

まとめ

これは単なる「PDF読み取り」ではなく、情報抽出エンジンの設計です。