AIでショート動画を作る方法|YouTube・Instagram向けに初心者ができること

スマホでAIを使ってショート動画を編集しているイメージ 目的別AI

この記事の情報は2026年4月時点のものです。

「ショート動画を作りたいけど、動画編集なんてやったことがない」——YouTubeショートやInstagramリールを見て「自分も投稿してみたい」と思ったことはありませんか。

2026年現在、 AIを使えば、顔出しなし・声出しなし・動画編集経験ゼロでも、スマホ1台でショート動画が作れる 時代です。

台本はChatGPTが書いてくれる。

画像はDALL-Eが作ってくれる。

編集はCapCutのAIが自動でやってくれる。

この記事では、台本作成→素材生成→編集→投稿までの全フローを4ステップで解説します。


まず結論:ショート動画の作り方4ステップ

STEP1:台本を作る → ChatGPTに「動画の構成」を作ってもらう
STEP2:素材を用意する → AI画像生成またはスマホ撮影で素材を準備
STEP3:編集する → CapCutのAI機能で字幕・BGM・エフェクトを自動追加
STEP4:投稿する → YouTube Shorts・Instagram Reels・TikTokに投稿

この4ステップで、1本20〜30分で完成します。

しかも全工程スマホだけでOK 📝


初心者におすすめのAI動画ツール3選

CapCut(キャップカット)——編集はこれ1つでOK

ショート動画編集の定番アプリ

スマホアプリ(iOS・Android対応)で無料で使えます。

AI字幕自動生成、背景除去、AIアバター(顔出しなしで動画に喋らせる機能)、長尺動画→ショート自動変換など、 AIで動画編集したいことがほぼ全部できる万能ツール

ChatGPT——台本はAIに任せる

動画の構成・ナレーション原稿・タイトル案をChatGPTに作ってもらいます。

「何を話すか」を考える時間が最も長い工程 なので、ここをAIに任せるだけで制作時間が半分以下になります。

DALL-E(ChatGPTの画像生成)——素材もAIで作る

顔出しなしの動画では AI生成画像がそのまま動画素材 になります。

ChatGPTのDALL-E機能で「イラスト風の○○の画像を作って」と頼むだけ。撮影も素材サイトも不要 ✍️


STEP1:台本を作る——ChatGPTで構成を自動生成

ChatGPTでショート動画の台本を作成しているイメージ

なぜ台本が最重要か

ショート動画の成功は 「最初の3秒」で決まる と言われています。

冒頭で視聴者の興味を引けなければ、即スワイプされて終わり。

だからこそ、 「何を、どの順番で、どう伝えるか」の台本が命 です。

コピペで使えるプロンプト

以下の条件でショート動画の台本を作ってください。

テーマ:〔例:AIで節約する方法〕
動画の長さ:30秒〜60秒
投稿先:〔例:YouTubeショート〕

構成:
1. フック(冒頭3秒):視聴者が「え?」と思う一文
2. 本題(20〜40秒):要点を3つに絞って伝える
3. まとめ(5〜10秒):行動を促す一文

条件:
- 話し言葉で、カジュアルなトーン
- 1文を短く(15文字以内を目安)
- 字幕として画面に表示することを前提にする

ポイント

「フック」が命

「知らないと損する○○」「実は○○は間違い」「30秒で分かる○○」のように、 視聴者が「知りたい」と思う疑問を冒頭で投げかける のが再生数を伸ばすコツです 😊


STEP2:素材を用意する——3つのパターン

パターンA:AI画像を使う(顔出しなし)

最もハードルが低い方法

ChatGPTのDALL-Eで画像を5〜10枚生成し、それを動画の素材として使います。

「顔出しなし・声出しなし」で動画を作りたい方はこのパターンが最適。

以下の条件で画像を作ってください。

テーマ:〔例:スマホでAIを使っている人のイラスト〕
スタイル:〔例:フラットイラスト、明るい色合い〕
サイズ:縦長(9:16のアスペクト比。ショート動画用)
条件:テキスト・文字・ロゴは入れない

パターンB:スマホで撮影する

日常の風景やルーティンを撮影して素材にする方法。

「特別な撮影」は不要

コーヒーを入れる手元、パソコンの画面、通勤中の風景——日常の何気ないシーンが、ショート動画では立派な素材になります。

パターンC:AIアバターを使う(顔出しなし+喋らせたい)

CapCutの AIアバター機能 を使えば、70種類以上のプリセットアバターが台本を読み上げてくれます。

自分の顔も声も出さずに「人が喋っている動画」が作れます 🙌


STEP3:編集する——CapCutのAI機能で自動化

初心者向けの編集フロー(15分)

①CapCutアプリを開いて「新しいプロジェクト」を作成 アスペクト比を 「9:16」(縦型) に設定。ショート動画は縦型が必須。

②素材を並べる STEP2で用意した画像や動画素材を、タイムラインに順番に並べる。1枚あたり3〜5秒が目安。

③字幕を自動生成する CapCutの 「自動キャプション」 機能を使えば、ナレーション音声から字幕が自動生成されます。手動で字幕を入力する必要なし。音声なしの場合は、テキストテンプレートで字幕を手動追加。

④BGMを追加する CapCutの音楽ライブラリから無料のBGMを選択。 動画の雰囲気に合ったBGMを選ぶだけ で完了。音量は控えめ(ナレーションの邪魔にならない程度)に設定。

⑤エクスポートする 「エクスポート」ボタンをタップして動画を書き出し。解像度は 1080p が推奨。

要点:CapCutなら「素材を並べる→字幕自動生成→BGM追加→エクスポート」の4工程で編集完了。15分あれば十分


STEP4:投稿する——プラットフォーム別のポイント

YouTubeショート

長さ:60秒以内(60秒を超えるとショートとして扱われない)
コツ:タイトルとキーワードが重要。検索されやすいタイトルをつける
投稿方法:YouTubeアプリの「+」ボタン→「ショート動画を作成」

Instagramリール

長さ:最大90秒。15〜30秒が最もリーチが伸びやすい
コツ:ビジュアルのクオリティが重要。AI画像の品質が直接影響する
投稿方法:Instagramアプリの「+」ボタン→「リール」

TikTok

長さ:15〜60秒が最もパフォーマンスが良い
コツ:冒頭3秒で視聴者を引きつける。テンポの速い編集が好まれる
投稿方法:TikTokアプリの「+」ボタン→動画をアップロード

3つすべてに投稿するのがおすすめ

同じ動画を YouTubeショート・Instagramリール・TikTokの3つすべてに投稿 するのが最も効率的。

1本の動画で3つのプラットフォームにリーチできます ✍️


顔出しなし・声出しなしで作るショート動画の3パターン

顔出しなしでAI画像を使ったショート動画を組み立てているイメージ

パターン①:AI画像+テキスト字幕

AI生成画像を並べて、字幕で情報を伝えるスタイル。

最もシンプルで初心者向け

「豆知識」「○○の方法」「ランキング」系の情報動画に最適。

パターン②:AI画像+AI音声ナレーション

AI画像にAI音声でナレーションをつけるスタイル。

CapCutの テキスト読み上げ機能(TTS) を使えば、テキストを入力するだけでAIが音声を生成。自分の声を使う必要なし。

パターン③:AIアバター+台本読み上げ

CapCutのAIアバターが台本を読み上げるスタイル。

「人が喋っている動画」を顔出しなしで作れる のが最大のメリット。

解説系・レビュー系に向いている。


初心者が最初に作るべきショート動画のテーマ3選

テーマ①:「○○の3つのコツ」系

「ChatGPTを上手に使う3つのコツ」「スマホで写真をきれいに撮る3つのコツ」のように、 3つの要点を30秒で伝える 構成。最もシンプルで作りやすい。

テーマ②:「知らないと損する○○」系

「知らないと損するAIの使い方」「知らないと損するiPhoneの隠れ機能」のように、 「損するかも」の不安でクリックさせる 構成。冒頭のフックが作りやすい。

テーマ③:「ビフォーアフター」系

「AIで写真を加工したらこうなった」「AIで文章を書いたらこうなった」のように、 変化を見せる 構成。視覚的なインパクトが強く、再生数が伸びやすい。


ショート動画制作の注意点

注意①:著作権に気をつける

BGMは CapCutのライブラリ内の楽曲を使用 すれば著作権の心配はありません。

外部の楽曲を無断で使用すると、動画が削除されたりアカウントが停止されるリスクがあります。

注意②:AI生成コンテンツの表示ルール

2026年現在、YouTubeやTikTokでは AI生成コンテンツであることの開示が求められる ケースが増えています。

各プラットフォームの最新のガイドラインを確認してください。

注意③:最初から完璧を求めない

「60〜70点の動画をコンスタントに投稿する方が、100点の動画を月1本作るより価値がある」 ——これはショート動画クリエイターの間で広く共有されている考え方です。

最初の動画は下手でOK。10本作れば感覚が掴めます 🙏


よくある質問

スマホだけで全工程できる?

できます。

ChatGPT(台本)→DALL-E(画像生成)→CapCut(編集)→投稿 の全フローがスマホ1台で完結します。

パソコンは不要です。

無料で作れる?

基本的に 無料で始められます

ChatGPTの無料版、CapCutの無料版で十分。

ただしCapCutの一部AI機能(AIアバターの一部・高品質エクスポート)は有料プランやクレジットが必要です。

動画1本にどれくらい時間がかかる?

慣れれば 1本20〜30分

台本5分+素材10分+編集15分が目安。

最初は1時間くらいかかるかもしれませんが、3〜5本作れば大幅に時間が短縮されます。


もっとAIを活用したい方へ

ショート動画の作り方が分かったら、さらに活用の幅を広げてみてください。


まとめ|今日、ChatGPTで30秒の台本を1本作ってみる

AIでショート動画を作る方法のポイントを改めて整理します。

  • 顔出しなし・声出しなし・編集経験ゼロでもショート動画は作れる
  • 4ステップ ——①台本(ChatGPT)→②素材(DALL-E/スマホ撮影)→③編集(CapCut)→④投稿
  • スマホ1台で全工程完結。 基本無料で始められる
  • 1本20〜30分で完成。 最初は1時間かかってもOK
  • 3つのプラットフォームに同時投稿 ——YouTubeショート・Instagramリール・TikTok

最も簡単な第一歩は、 今日ChatGPTを開いて「30秒のショート動画の台本を作って。テーマは○○」と頼んでみること

3分で台本が完成します。

「動画は難しい」はもう過去の話。

AIがあれば、誰でもクリエイターになれる時代です 🙌

この記事のポイントまとめ

  • AIなら顔出しなし・声出しなし・編集経験ゼロでもショート動画が作れる
  • 4ステップ:台本(ChatGPT)→素材(DALL-E)→編集(CapCut)→投稿
  • スマホ1台で完結。基本無料。慣れれば1本20〜30分
  • 冒頭3秒の「フック」が再生数を決める。台本が最重要
  • 60〜70点の動画をコンスタントに出すほうが、100点を月1本より価値がある

コメント