DCAI
Loading Light/Dark Toggl

ComfyUI Flux.1でControlNet + IP-Adapterの詳しい使い方

⏱️13min read
📅 2025年1月16日
🔄 2025年2月5日
カテゴリー:📂 AIイラスト中級
ComfyUI Flux.1でControlNet + IP-Adapterの詳しい使い方のメイン画像
Supported by

flux.1の公開から5カ月が経とうとしていますが、周辺環境も充実してきました。今回の記事ではFlux.1でのコントロールネットについて解説していきたいと思います。去年の11月に発表された「FLUX.1 Tools」を使えばCannyやDepthを使うこともできますが、今回の記事ではコントロールネットのみの記事になります。「FLUX.1 Tools」に関してはまた、別の記事にまとめたいと思います。

PR
🔍Graphics Cardsfrom Amazon
1
MSI GeForce RTX 3060 VENTUS 2X 12G OC グラフィックスボード VD7553の商品画像

MSI GeForce RTX 3060 VENTUS 2X 12G OC グラフィックスボード VD7553

ASIN:B08WPRMVWB

2
MSI GeForce RTX 3050 LP 6G OC PCIe4.0 ロープロファイルサイズ 補助電源不要 デュアルファン搭載 グラフィックスボード VD8790の商品画像

MSI GeForce RTX 3050 LP 6G OC PCIe4.0 ロープロファイルサイズ 補助電源不要 デュアルファン搭載 グラフィックスボード VD8790

ASIN:B0CTJZCJH1

3
玄人志向 NVIDIA GeForce RTX3060 搭載 グラフィックボード GDDR6 12GB GALAKURO GAMINGシリーズ 【国内正規代理店品】 GG-RTX3060-E12GB/OC/DFの商品画像

玄人志向 NVIDIA GeForce RTX3060 搭載 グラフィックボード GDDR6 12GB GALAKURO GAMINGシリーズ 【国内正規代理店品】 GG-RTX3060-E12GB/OC/DF

ASIN:B08XMC4QJ1

4
GIGABYTE NVIDIA RTX3050 搭載 グラフィックボード GDDR6 6GB【国内正規代理店品】 GV-N3050OC-6GLの商品画像

GIGABYTE NVIDIA RTX3050 搭載 グラフィックボード GDDR6 6GB【国内正規代理店品】 GV-N3050OC-6GL

ASIN:B0CVSGRV4G

5
玄人志向 NVIDIA Geforce RTX5060Ti 搭載 グラフィックボード GDDR7 16GB【国内正規品】 GG-RTX5060Ti-E16GB/OC/DFの商品画像

玄人志向 NVIDIA Geforce RTX5060Ti 搭載 グラフィックボード GDDR7 16GB【国内正規品】 GG-RTX5060Ti-E16GB/OC/DF

ASIN:B0F5394R5S

6
ASUS GeForce RTX 3050 LP BRK OC Edition 6GB GDDR6 ビデオカード / RTX3050-O6G-LP-BRK 国内正規流通品の商品画像

ASUS GeForce RTX 3050 LP BRK OC Edition 6GB GDDR6 ビデオカード / RTX3050-O6G-LP-BRK 国内正規流通品

ASIN:B0CXPBVJD3

7
玄人志向 NVIDIA GeForce RTX2060 搭載 グラフィックボード GDDR6 12GB GALAKURO GAMINGモデル GG-RTX2060-E12GB/DF ブラックの商品画像

玄人志向 NVIDIA GeForce RTX2060 搭載 グラフィックボード GDDR6 12GB GALAKURO GAMINGモデル GG-RTX2060-E12GB/DF ブラック

ASIN:B09Q66CLY2

8
玄人志向 NVIDIA GeForce GTX1650搭載 グラフィックボード GDDR6 4GB デュアルファン・補助電源なしモデル GF-GTX1650D6-E4GB/DF3の商品画像

玄人志向 NVIDIA GeForce GTX1650搭載 グラフィックボード GDDR6 4GB デュアルファン・補助電源なしモデル GF-GTX1650D6-E4GB/DF3

ASIN:B08PBP1F6Y

9
GIGABYTE NVIDIA GeForce RTX4060搭載 グラフィックボード GDDR6 8GB【国内正規代理店品】 GV-N4060OC-8GLの商品画像

GIGABYTE NVIDIA GeForce RTX4060搭載 グラフィックボード GDDR6 8GB【国内正規代理店品】 GV-N4060OC-8GL

ASIN:B0CG69PH11

10
【国内正規品】NVIDIA RTX A400 4GB GDDR6 Ampere アーキテクチャ グラフィックスボード ENQRA400-4GER ELSA エルザの商品画像

【国内正規品】NVIDIA RTX A400 4GB GDDR6 Ampere アーキテクチャ グラフィックスボード ENQRA400-4GER ELSA エルザ

ASIN:B0DFXNDR4S

カスタムノードのインストール

ComfyUIでコントロールネットを使用する前提としてプリプロセッサーのカスタムノードをインストールする必要があります。ComfyUI Managerの「Custom Nodes Manager」を使ってComfyUI's ControlNet Auxiliary Preprocessorsを検索してインストールしましょう。

ComfyUIでコントロールネットを使用したことがない方は下記の記事にて基本的な使い方を解説しているので目を通しておきましょう。

コントロールネットモデルのインストール

現在コントロールネットモデルは「Xlabs」「InstantX」「Jasper AI」から公開されています。それぞれのモデルを紹介します。

Xlabs

Xlabsからは1024×1024で学習された、「Canny」「Depth」「HED」の3つのモデルとベータ版の「ip-adapter」が公開されています。はじめの3つのモデルはComfyUI\models\xlabs\controlnetsに置きましょう。

Canny V3 Depth V3 HED V3

「ip-adapter」はComfyUI\models\xlabs\ipadaptersに置きましょう。

ip-adapter

InstantX

InstantXはCanny, Depth, Tile, Blur, Pose, Gray, Low qualityがバンドルされた「ControlNet Union」と独立した「Canny」「IP-Adapter」があります。古いバージョンのComfyUIではカスタムノードが必要でしたが現在は基本ノードのみで使用可能となりました。ダウンロードしたモデルは名前がdiffusion_pytorch_model.safetensorsとなっていますので自分で解りやすいようにflux-dev-controlnet-union.safetensorsの様な名前に変更して\ComfyUI\models\controlnetに置きます。

ControlNet Union Canny IP-Adapter

Jasper AI

Jasper AIからは「Upscaler」「Surface-Normals」「Depth」の3つがあります。ダウンロードしたモデルは\ComfyUI\models\controlnetに置きます。こちらもダウンロードしたモデルは名前がdiffusion_pytorch_model.safetensorsとなっていますので自分で解りやすいようにjasperaiFlux.1-dev-Controlnet-Depth.safetensorsの様な名前に変更しましょう。

Upscaler Surface-Normals Depth

Flux.1のコントロールネットを使ってみる

モデルのインストールが完了したら、コントロールネットを使ってみましょう。ワークフローを見ながら解説します。

Xlabs

Xlabsのコントロールネットモデルを使う場合は専用のカスタムノードをインストールする必要があります。

カスタムノードのインストール

ComfyUI Managerを開き「x-flux-comfyui」をインストールしましょう。

「Custom Nodes Manager」を使ってx-flux-comfyuiを検索してインストールしましょう。

公式ワークフローの解説

インストールが完了したら\ComfyUI\custom_nodes\x-flux-comfyui\workflowsにワークフローがあります。今回はflux-controlnet-canny-v3-workflow.jsonを解説します。

XlabsコントロールネットCanny V3のワークフロー 
ノードについて

コントロールネットを使う場合の専用のノードを解説します。

Load Flux ControlNet

XlabsのFlux.1のコントロールネットモデルを読み込みます。model_nameには適応したいFlux.1モデルを選択します。controlnet_pathには使用したいコントロールネットモデルを選択しましょう。

Apply Flux ControlNet

コントロールネットモデルとモデルに適応したプリプロセッサーの画像(今回はCanny Edgeで摘出した画像)をコントロールネットコンディションとして出力します。インプットのcontrolnet_conditionは複数のコントロールネットを適応させたい時に使います。また、strengthでコントロールネットの強度を調節します。

Xlabs Sampler

XLabsのコントロールネットを使用したサンプラーになります。このサンプラーでは通常のKSamplerの様にサンプラー、スケジューラータイプ等は使えないので注意しましょう。特徴として以下の3つのパラメーターがあります。

  • timestep_to_start_cfg:どのステップ段階からCFGとネガティブプロンプトを適応するかを設定します。
  • true_gs:CFGのスケールになります。
  • image_to_image_strangth:img2imgでの使用時にオリジナル画像の強度を設定します。

InstantX

InstantXは通常のコントロールネットの構成で使用できます。Civitaiにて公式ワークフローが公開されています。

InstantXサンプルワークフロー 

公式ワークフローはOpenPoseの使用例となっています。OpenPoseデータは「Optional: Extract Openpose from image」から摘出していますが、データのみが必要な方はDCAIのドライブに公開してます。

Jasper AI

Normal sample

Jasper AIも先ほどのInstantXとほとんど同じ構成で使用できます。違いとしては「SetUnionControlNetType」が必要ないのでモデルの「Load ControlNet Model」から直接Apply Controlnetに繋がります。コチラは公式のワークフローがないのでシンプルなワークフローをドライブに公開しました。

Jasper AI Normalサンプルワークフロー 

Upscaler sample

Upscalerモデルは他と少し設定が違うのでワークフロー例を紹介します。

Jasper AI Upscalerサンプルワークフロー 

ワークフローの特徴としてはプロンプトを空白のまま生成します。「Upscale Image」のupscale_methodはインプット画像によってlanczosに切り替えた方が綺麗に生成される場合があります。

このアップスケーラーは非常に小さな画像をアップスケールするモデルなので1024ピクセル以上の画像をアップスケールするにはOOM(アウト オブ メモリー)エラーが出るか、エラーが出なくても生成にかなりの時間が掛かるうえに生成結果は使い物にならないでしょう。

コントロールネットをつかった実用的なワークフローの紹介

GGUF Flux IPAdapterワークフロー 

紹介したコントロールネットを使ったワークフローを紹介します。今回組み込んだ機能は下記の様になります。

  • GGUFを使ってVRAMへの負担を軽減
  • LoRAを使いイラストの方向性を決める
  • IP adapterを使いキャラクターを固定
  • 2ndパスを導入してスケール&ディテールアップ

ワークフローはPatreonで公開していますが、有料サポーター様のみ閲覧・ダウンロードが可能となっています。

また、ワークフローがダウンロード出来なくでも解説を見ればご自身でも構成できるので、このまま解説にお進みください。

必須カスタムノードのインストール

このワークフローを実行するには下記のカスタムノードとモデルをインストールする必要があります。すでに導入済の方もトラブルを避けるために最新版にアップデートしておきましょう。

  • ComfyUI-GGUF:GGUF形式ののUnetとCLIPを読み込むためのカスタムノード
  • ComfyUI-IPAdapter-Flux:InstantXが公開しているIPAdapterを実行する為のカスタムノード

必須モデルのインストール

下記のモデルをダウンロードしましょう。

GGUFモデル

この例ではベースモデルのflux1-devQ8_0.ggufを使っています。OOM(アウト オブ メモリー)エラーで生成が出来ないときは品質は変わりますが、Q8_0からQ6_KQ5_K_Sに変更しましょう。

詳しくは下記の記事を参考にしてください。

ベースモデル

ダウンロードしたモデルは\ComfyUI\models\unetに置きましょう。

テキストエンコーダー

ダウンロードしたモデルは\ComfyUI\models\clipに置きましょう。

LoRAモデル

ダウンロードしたLoRAモデルは\ComfyUI\models\lorasに置きましょう。

IPAdapterモデル

ダウンロードしたIPAdapterモデルは\ComfyUI\models\ipadapter-fluxに置きましょう。ipadapter-fluxフォルダーがない場合は新たにフォルダーを作ってください。

グラフの解説

それでは、各グループを見ていきましょう。

IP Adapter

IP Adapterグループ 

IP AdapterグループはIP Adapter関係のノードがまとまっています。

「Load Image」で参考画像を読み込みます。使用する参考画像はSDXLのAnimagine XL V3.1で生成した画像を使い、イラストスタイルと人物を参照します。ただし、精度はあまり高くはありません。

「Upscale Image」では、参照画像をIP Adapterに適した1024ピクセルにリサイズします。

「Load IPAdapter Flux Model」のipadapterにダウンロードしたip-adapter.binを読み込みclip_visionにgoogle/siglip-so400m-patch14-384を選択します。このモデルはカスタムノードをインストールすれば自動的にインストールされます。providerは「cuda」「cpu」「mps (Multi-Process Service)」から選択できます。

「Apply IPAdapter Flux Model」でIP Adapterの適応率を調節できます。weightで強度を指定して、start_percent/end_percentで生成ステップのどの段階からIP Adapterを適応するかを設定します。執筆時のバージョンではend_percentを1.0にすると生成結果にノイズが出てしまうので0.8位までで設定しましょう。

Load Basic Models

Load Basic Modelsグループ 

Load Basic Modelsグループは基本的なモデルを呼び出します。

「Unet Loader (GGUF)」でベースモデルのflux1-devQ8_0.ggufを読み込みます。OOM(アウト オブ メモリー)エラーで生成が出来ないときは品質は変わりますが、Q8_0からQ6_KQ5_K_Sに変更しましょう。

「DualCLIPLoader (GGUF)」ノードでテキストエンコーダーを読み込みます。通常の「t5xxl_fp16」の代わりにt5-v1-xxl-encoder-Q8_0.ggufを読み込みます。コチラもVRAMにあわせてQ6_KQ5_K_Sに設定しましょう。

2つの「LoraLoaderModelOnly」で各LoRAを読み込みます。今回は両方ともにstrength_modelは0.50に設定しています。

Basic Info

Basic Infoグループ 

Basic Infoグループでは生成に必要な情報がまとめられています。

ほとんどデフォルトの設定ですが、プロンプトは下記の様に記述しています。

A masterful highly intricate detailed anime.
A girl looking at viewer.
in the In the European medieval fantasy era.

生成サイズは後ほど拡大されますが720pサイズの1280x720ピクセルに設定しています。

Upscale

Upscaleグループ 

Upscaleグループでは、1stパスで生成されたピクセルイメージを4x-UltraSharp.pthを使って一度4倍にしてから、「Scale Image to Total Pixels」ノードで任意のピクセルに縮小しています。今回は3.0MPを選択していますがOOM(アウト オブ メモリー)エラーが出る場合はこの数字を小さくしましょう。

2nd Pass Info

2nd Pass Infoグループ 

2nd Pass Infoグループは2ndパス用の設定になります。一番重要なのはdenoiseの値でこれを下げることにより1stパスに近い結果になります。

ワークフローの使い方

基本的には「Queue」ボタンで生成できます。「RandomNoise」ノードをranomizeで1stパスの結果を素早く見たい場合は「Preview Image (2nd Pass)」ノードをミュートもしくはバイパスして「Queue」ボタンを押します。この設定では1stパスが生成された時点で止まるので好きな生成結果が出るまで続けましょう。

1stパスの結果に満足したらサイドメニューのQueueリストより気に入った結果の画像を右クリックして「Load Workflow」より呼び出します。

呼び出したら最初に「RandomNoise」ノードをfixedに設定します。

「Preview Image (2nd Pass)」ノードのミュートもしくはバイパスを解除して「Queue」ボタンでUpscaleより生成を再開します。(メモリーから1stパスのデータが解放されている場合は初めからの生成になります。)

このワークフローでは「Save Image」ノードを使っていないのでPreview Image (2nd Pass)」を右クリックしてSave Imageで保存するかノードを「Save Image」ノードに変更してください。

最終結果

最終的に以下の様な結果がでました。Flux.1ではアニメイラストの生成が苦手(顔や目の生成が良くない)とされていますが、このワークフローの様にIP AdapterやLoRAを使ってスタイルに方向性をもたすことによってディテールのあるイラストを生成することが可能となりました。

最終結果 

まとめ

今回はFlux.1でコントロールネットの使い方を紹介しました。コントロールネットを使うことにより標準のFlux.1ベースモデルだけでは難しいイラストの表現可能となり、さらなる高品質なイラストが生成できるようになります。フォトリアルな画像の生成では高品質な生成が可能なFlux.1ですがイラストの表現力はSDXLの「Animagine XL」、「Pony Diffusion V6 XL」や「Illustrious-XL」の方が高品質な画像を生成してくれます。しかし、コントロールネットを使えば今回紹介してワークフローの様にIP Adapterを使って高品質なイラストを生成することも可能になります。

PR
🔍PC Chairsfrom Amazon
1
EdoErgo オフィスチェア 椅子 テレワーク 疲れない 跳ね上げ式アームレスト コンパクト 約105度ロッキング pc 事務椅子 360度回転 座面昇降 強化ナイロン樹脂ベース 通気性メッシュ テレワーク 在宅ワーク H-WY01 (黑網+黑枠+黑足)の商品画像

EdoErgo オフィスチェア 椅子 テレワーク 疲れない 跳ね上げ式アームレスト コンパクト 約105度ロッキング pc 事務椅子 360度回転 座面昇降 強化ナイロン樹脂ベース 通気性メッシュ テレワーク 在宅ワーク H-WY01 (黑網+黑枠+黑足)

ASIN:B0DCVMD3ZK

2
Dilosso オフィスチェア デスクチェア 腰サポートバー メッシュ通気性テレワーク チェア 疲れない 人間工学 跳ね上げ式アームレスト 3Dヘッドレスト ロッキング機能 高反発クッション ロッキング機能 在宅勤務 事務椅子 勉強 (ブラック) [並行輸入品]の商品画像

Dilosso オフィスチェア デスクチェア 腰サポートバー メッシュ通気性テレワーク チェア 疲れない 人間工学 跳ね上げ式アームレスト 3Dヘッドレスト ロッキング機能 高反発クッション ロッキング機能 在宅勤務 事務椅子 勉強 (ブラック) [並行輸入品]

ASIN:B0DTT4P9F3

3
HLIFE オフィスチェア デスクチェア 人間工学 テレワーク チェア 疲れない 椅子 腰サポート 跳ね上げ式アームレスト 3Dヘッドレスト ロッキング機能 高反発クッション PCチェア 通気性メッシュ ゲーミング/勉強/事務用 おしゃれ パソコンチェア(ホワイト)の商品画像

HLIFE オフィスチェア デスクチェア 人間工学 テレワーク チェア 疲れない 椅子 腰サポート 跳ね上げ式アームレスト 3Dヘッドレスト ロッキング機能 高反発クッション PCチェア 通気性メッシュ ゲーミング/勉強/事務用 おしゃれ パソコンチェア(ホワイト)

ASIN:B0D5H3YJMS

4
【床傷防止!PUキャスター】タンスのゲン オフィスチェア 腰楽ランバーサポート【ワントーンタイプ新登場!】ハイバック ロッキング チェアー デスクチェア 椅子 65090108(80325)の商品画像

【床傷防止!PUキャスター】タンスのゲン オフィスチェア 腰楽ランバーサポート【ワントーンタイプ新登場!】ハイバック ロッキング チェアー デスクチェア 椅子 65090108(80325)

ASIN:B00YQW38O8

5
不二貿易(Fujiboeki) オフィスチェア デスクチェア 幅52×奥行58.5×高さ88~99cm ブラック メッシュバック ガス昇降 腰サポート ハンター 90866の商品画像

不二貿易(Fujiboeki) オフィスチェア デスクチェア 幅52×奥行58.5×高さ88~99cm ブラック メッシュバック ガス昇降 腰サポート ハンター 90866

ASIN:B002YWKLAQ

6
Supzmg オフィスチェア 椅子 テレワーク 疲れない デスクチェア パソコンチェア ワークチェア 通気性メッシュ 跳ね上げ式アームレスト ロッキング機能 在宅勤務 事務椅子 勉強椅子 H-WY15 (黑網+黑枠+黑足)の商品画像

Supzmg オフィスチェア 椅子 テレワーク 疲れない デスクチェア パソコンチェア ワークチェア 通気性メッシュ 跳ね上げ式アームレスト ロッキング機能 在宅勤務 事務椅子 勉強椅子 H-WY15 (黑網+黑枠+黑足)

ASIN:B0DG5HWQB5

7
ナカバヤシ オフィスチェア デスクチェア メッシュチェア ブラック Z0615の商品画像

ナカバヤシ オフィスチェア デスクチェア メッシュチェア ブラック Z0615

ASIN:B0827QMTX7

8
【リニューアルでより頑丈に】アイリスプラザ オフィスチェア デスクチェア メッシュ 通気性 腰サポートバー 無段階昇降 360度回転 コンパクト OFC-MAL ブラックの商品画像

【リニューアルでより頑丈に】アイリスプラザ オフィスチェア デスクチェア メッシュ 通気性 腰サポートバー 無段階昇降 360度回転 コンパクト OFC-MAL ブラック

ASIN:B01DLSTRHE

9
ComHoma オフィスチェア 椅子 テレワーク疲れない 360度回転 座面昇降 120度ロッキング 跳ね上げ式アームレスト デスクチェア 事務椅子 C字ランバーサポート 人間工学 反発力ある背もたれ 腰ラク メッシュ 在宅ワーク 非再生ウレタン 通気性 腰にフィット ブラック CH219 勉強 コンピューターチェア イスの商品画像

ComHoma オフィスチェア 椅子 テレワーク疲れない 360度回転 座面昇降 120度ロッキング 跳ね上げ式アームレスト デスクチェア 事務椅子 C字ランバーサポート 人間工学 反発力ある背もたれ 腰ラク メッシュ 在宅ワーク 非再生ウレタン 通気性 腰にフィット ブラック CH219 勉強 コンピューターチェア イス

ASIN:B0DYHW7BFQ

10
Supzmg オフィスチェア 椅子 テレワーク 疲れない デスクチェア ワークチェア ロッキング機能 収納式フットレスト リクライニング 人間工学 チェア S字立体背もたれ ハイバック 高反発座面 事務椅子 通気性に優れ H-WY03 (ブラック)の商品画像

Supzmg オフィスチェア 椅子 テレワーク 疲れない デスクチェア ワークチェア ロッキング機能 収納式フットレスト リクライニング 人間工学 チェア S字立体背もたれ ハイバック 高反発座面 事務椅子 通気性に優れ H-WY03 (ブラック)

ASIN:B0D3D5CYPY

Supported by