機密動画をネットワーク遮断下で安全に文字起こし・要約する手順書
会議録画・説明会動画などの機密性のある動画を、一切の外部通信なしでテキスト化・要約します。 すべての処理はローカルPC上で完結するため、データ漏洩のリスクがありません。
以下のソフトウェアを事前にインストールしてください。
モデルのダウンロードにはインターネット接続が必要ですが、一度DLすれば以降はオフラインで使用できます。
| ソフト | 用途 | インストール方法 |
|---|---|---|
| Python | スクリプト実行 | python.org からDL |
| ffmpeg | 動画から音声抽出 | gyan.dev からDL → PATHに追加 |
| OpenAI Whisper | 音声→テキスト変換 | pip install openai-whisper |
| Ollama | ローカルLLMで要約 | ollama.com からDL |
コマンドプロンプトで以下を実行(初回実行時に自動DLされますが、事前にDLしておくと安心です):
py -c "import whisper; whisper.load_model('medium')"| モデル | サイズ | 精度 | 速度(1時間動画/CPU) | 推奨 |
|---|---|---|---|---|
| base | 145 MB | 低 | 約10分 | テスト用 |
| small | 484 MB | 中 | 約20分 | 速度重視 |
| medium | 1.5 GB | 高 | 約40分 | 推奨 |
| large-v3 | 3.1 GB | 最高 | 約90分 | 精度重視 |
ollama pull gemma2約5GBのダウンロードです。完了まで待ってください。
where ffmpeg && py -c "import whisper; print('OK')" && ollama list動画ファイルから音声を抽出し、テキストに変換します。
この処理はオンラインのままで実行してもOKです(Whisperはローカル処理のため外部通信しません)。
py C:\Users\kawag\work\video_summarizer.py "動画ファイルのパス"py C:\Users\kawag\work\video_summarizer.py "C:\Users\kawag\Downloads\説明会.mp4"| オプション | 既定値 | 説明 |
|---|---|---|
| --model | medium | Whisperモデル(base / small / medium / large-v3) |
| --language | ja | 言語コード(ja=日本語, en=英語) |
| --output | 自動生成 | 出力ファイルパス |
動画と同じフォルダに {ファイル名}_transcript.txt が生成されます。
要約処理を行う前に、必ずネットワークを切断してください。
バッチファイルはネットワーク接続中だと自動で処理を中止する安全機能を備えています。
文字起こしテキストをローカルLLMで要約します。
C:\Users\kawag\work\offline_summarize.bat "文字起こしファイルのパス"C:\Users\kawag\work\offline_summarize.bat "C:\Users\kawag\Downloads\説明会_transcript.txt"同じフォルダに {ファイル名}_summary.txt が生成されます。
要約の構成:
# --- 全手順まとめ ---
# Step 1: 文字起こし(オンラインOK)
py C:\Users\kawag\work\video_summarizer.py "動画.mp4"
# Step 2: 機内モード ON
# Step 3: 要約(オフライン必須)
C:\Users\kawag\work\offline_summarize.bat "動画_transcript.txt"
# Step 4: 機内モード OFF| ファイル | 役割 |
|---|---|
| C:\Users\kawag\work\video_summarizer.py | 動画→文字起こし(ffmpeg + Whisper) |
| C:\Users\kawag\work\offline_summarize.py | 文字起こし→要約(Ollama)+ ネットワークチェック |
| C:\Users\kawag\work\offline_summarize.bat | 要約のバッチファイル(ドラッグ&ドロップ対応) |
以下の動画・音声形式に対応しています:
| 種別 | 拡張子 |
|---|---|
| 動画 | .mp4, .mov, .avi, .mkv, .webm |
| 音声 | .mp3, .m4a, .wav, .flac |
--model large-v3 を指定してください。処理時間は2倍程度になりますが、精度が向上します。
py C:\Users\kawag\work\video_summarizer.py "動画.mp4" --model large-v3--language en を指定してください。
py C:\Users\kawag\work\video_summarizer.py "video.mp4" --language enスタートメニューから「Ollama」を起動してください。タスクトレイにアイコンが表示されれば起動完了です。
機内モードでもOllamaはローカルで動作します。
Windowsの設定 → システム → 電源とバッテリー → 画面とスリープ で、スリープまでの時間を「なし」に設定してください。処理完了後に元に戻すのを忘れずに。
オンライン時に ollama pull モデル名 でDLし、要約時に --model モデル名 を指定してください。
# 例: llama3 を使う場合
ollama pull llama3
C:\Users\kawag\work\offline_summarize.bat "transcript.txt"
# → バッチ内のモデル名を変更するか、直接Pythonスクリプトを実行:
py C:\Users\kawag\work\offline_summarize.py "transcript.txt" --model llama3Step 1(video_summarizer.py)だけを実行すれば、タイムスタンプ付きのテキストファイルが得られます。
Step 2〜3 は不要です。この場合、ネットワーク切断も不要です。