サイトアイコン のざのざノート

【AIでテキストから画像生成】Bing Image Creatorで画像生成 使い方と作例

最近、AIに関する新しい発表が相次いでいます。

その中の一つ、「Bing Image Creator」は、Microsoft社が開発した画像生成モデルである「DALL-E」の先進バージョンを搭載した、高画質な画像を簡単に生成できるツールです。

2023年3月21日に新しいBingとEdgeブラウザに導入されました。

Microsoft Bing の Image Creator

DALL-E とは?

DALL-Eは、OpenAIが開発した画像生成モデルで、テキスト記述からオリジナルでリアルな画像やアートを作成することができます。コンセプト、属性、スタイルを組み合わせることができます。DALL-E 2では、前作よりもさらにリアルな画像を生成することができます。

使い方

「Bing Image Creator」は、サイドバーのBing Image Creatorアイコンをクリックして画像を生成するか、Bingチャット(クリエイティブモード)から呼び出すだけで使うことができます。生成したい画像の説明やアートスタイルを指定することで、一度に4枚の画像を生成します。

作例

生成された4枚の画像と私が選択した一枚をご覧ください。

モジュラーシンセサイザーを操る猫

英訳「Cat manipulating modular synthesizer」

かわいくてかっこいいですね。

35ミリの単焦点レンズで撮ったような被写界深度が浅めな画角が雰囲気を出してます。

二点透視図法の画像。大きな窓のある部屋、外はオーシャンビュー、窓は西向き、赤いソファが2つ、大きなテレビが1つ、ガラスのテーブルが1つ、犬が1匹、部屋の隅には観葉植物が1つ。

英訳「Two-point perspective image. Room with large windows, ocean view outside, window facing west, two red sofas, one large TV, one glass table, one dog, and one houseplant in the corner of the room.」

ほぼイメージ通りの画像が出てきました。脳内イメージとの乖離が少ないように、テキストを細かく具体的に書くことが大切です。

ただ犬の形状がどの画像も不完全でよく見るとちょっと気持ち悪いです。

黄色の背景、白い皿の上にミントアイスが置いてある。85mmレンズの画角。

英訳「Yellow background, mint ice cream on white plate, 85mm lens angle of view.」

かわいくておいしそうなミントアイスがでてきました。形状が単純な食べ物との相性はよさそうです。

美少女、日本アニメ風、サイバーパンク、ショートヘア、スターバックス風ロゴマーク

英訳「beautiful girl ,Japanese Anime Style, Cyberpunk, Short Hair, Starbucks style logo.」

以前の記事で同じキーワードでMidjourneyを使用して画像を生成しましたが、生成された画像のテイストが大きく異なっていることがわかります。

イラストのテイストはBing Image Creatorの方が日本の萌え系イラストに近いですね。

スタバのロゴの扱いもBing Image Creatorでは完全に独立した形になっています。

スタバのロゴをどう配置したいのか明確に指示すれば違った画像が出てきそうです。

モバイルバージョンを終了