Google AI Studio単体では、現時点では「ローカルフォルダ内のPDFを直接スキャン」する機能はありません。以下の2パターンで実現できます。
全体像(実務で使う設計)
方法は2択
- 手動アップロード型(最も簡単)
- API+スクリプト型(実務・自動化向け)
① 手動アップロードでやる(最短・非エンジニア向け)手順
① AI Studioを開く
- Google AI Studioにアクセス
- 「New prompt」または「Chat」を選択

Sign in - Google Accounts
② PDFをアップロード
- 画面右側 or 下部の「Upload」
- 対象PDFをドラッグ
③ プロンプトを書く(ここが核心)
以下をそのまま使えます:
このPDFの内容から、以下のテーマに関する情報を漏れなく抽出してください。テーマ:
「〇〇(例:相続、賃貸管理、地域課題など)」条件:
・重要な情報はすべて抽出
・要約ではなく、網羅的に整理
・見出しごとに分類
・数値、事例、具体策は必ず残す
・曖昧な部分は「不明」と明記出力形式:
① 概要
② 重要ポイント一覧
③ 詳細(構造化)
④ 実務で使える示唆
限界
- 複数PDFは一括不可(1つずつ)
- フォルダ単位処理はできない
- 完全自動化は不可
② API+ローカル連携(本命・実務レベル)
ここからが「本当に使えるやり方」です。
構成
ローカルフォルダ
↓
Pythonスクリプト
↓
Gemini API(AI Studioの裏側)
↓
結果をまとめて出力
②-1 必要なもの
- Google AI StudioでAPIキー発行
- Python環境
②-2 サンプルコード(そのまま使える)
import os
import google.generativeai as genai# APIキー設定
genai.configure(api_key="YOUR_API_KEY")model = genai.GenerativeModel("gemini-1.5-pro")folder_path = "./pdfs"results = []for file in os.listdir(folder_path):
if file.endswith(".pdf"):
path = os.path.join(folder_path, file) with open(path, "rb") as f:
pdf_data = f.read() response = model.generate_content([
{
"mime_type": "application/pdf",
"data": pdf_data
},
"""
このPDFから「〇〇」に関する情報をすべて抽出し、
以下の形式で整理してください: ・重要ポイント
・具体事例
・数値データ
・実務で使える示唆
"""
]) results.append(f"### {file}\n{response.text}")# 結果出力
with open("output.txt", "w", encoding="utf-8") as f:
f.write("\n\n".join(results))
②-3 ポイント(精度を上げるコツ)
1. プロンプト設計が9割
悪い例:
- 「まとめて」
良い例:
- 「テーマ別に分類」
- 「具体例を抜き出す」
- 「意思決定に使える形」
2. 分割処理(重要)
PDFが長い場合:
・ページごとに分割
・チャンク処理
→ 精度が大幅に上がる
3. 最後に統合させる
① 各PDFごとに抽出
② 全体をまとめ直す
実務での最適構成(推奨)レベル1(すぐやる)
- AI StudioにPDF投げる
レベル2(効率化)
- Pythonで複数PDF処理
レベル3(プロ仕様)
- フォルダ監視+自動処理
- スプレッドシート出力
- Notion連携
よくある失敗
① PDF丸投げ
→ 情報が抜ける
② テーマが曖昧
→ 使えない要約になる
③ 出力形式未指定
→ バラバラな結果になる
まとめ
これは単なる「PDF読み取り」ではなく、情報抽出エンジンの設計です。


