Hướng Dẫn Tạo Prompt Stable Diffusion Với ChatGPT

4pixos Academy • Trung tâm đào tạo Diễn họa Kiến trúc Quốc tế
Facebook
Twitter
LinkedIn
Pinterest
Reddit

Stable Diffusion đã trở thành một công cụ đột phá trong việc tạo ra các hình ảnh chất lượng cao từ văn bản, và điều thú vị hơn nữa là bạn có thể tận dụng ChatGPT để tối ưu hóa quá trình tạo prompt cho công cụ này. Đối với những người trong ngành diễn họa kiến trúc, việc nắm bắt và ứng dụng các công nghệ mới như Stable Diffusion không chỉ giúp tăng hiệu suất làm việc mà còn mở ra cơ hội sáng tạo vô tận.

Trong bài viết này, 4pixos Academy sẽ hướng dẫn bạn cách tạo prompt Stable Diffusion với ChatGPT, từ đó nâng cao chất lượng hình ảnh và đẩy mạnh hiệu quả công việc của bạn.

1. Giới thiệu về Stable Diffusion và khó khăn khi tạo prompt

Stable Diffusion là một mô hình máy học nguồn mở giúp chuyển đổi văn bản thành hình ảnh, được phát triển vào năm 2022. 

Xem thêm: Stable Diffusion là gì? 5 Tính Năng Thần Kỳ Của Stable Diffusion Mà Bạn Cần Biết

Đây là một bước đột phá trong công nghệ tạo ảnh dựa trên mô tả bằng văn bản, cho phép người dùng tạo ra những hình ảnh chất lượng cao từ các câu lệnh. Với khả năng mô phỏng nhiều phong cách nghệ thuật, chất liệu, và kỹ thuật đa dạng, Stable Diffusion đã nhanh chóng trở thành công cụ hữu ích trong nhiều lĩnh vực sáng tạo, từ nghệ thuật, thiết kế đến quảng cáo và giải trí và diễn họa kiến trúc.

Tác phẩm đã sử dụng Stable Diffusion trong việc thêm người và Upscale

Tuy nhiên, việc tạo ra các câu lệnh (prompt) hiệu quả để sử dụng trong Stable Diffusion là một thách thức không hề nhỏ. Để mô hình tạo ra được hình ảnh chính xác và phù hợp với ý tưởng của người dùng, prompt cần phải bao gồm nhiều yếu tố chi tiết và cụ thể. Các yếu tố cần được cân nhắc khi tạo prompt bao gồm:

  • Chủ đề: Nội dung chính của hình ảnh là gì? Ví dụ, đó có thể là con người, động vật, phong cảnh hay một đối tượng trừu tượng.
  • Chất liệu và kỹ thuật: Người dùng có thể yêu cầu hình ảnh theo phong cách tranh sơn dầu, ảnh kỹ thuật số, hoặc hình ảnh 3D.
  • Phong cách nghệ thuật và nghệ sĩ: Việc chỉ định phong cách theo một nghệ sĩ hoặc trường phái nghệ thuật cụ thể có thể ảnh hưởng lớn đến kết quả. Ví dụ, phong cách của Van Gogh hay Monet sẽ tạo ra những hình ảnh rất khác nhau.
  • Độ phân giải và chi tiết bổ sung: Độ phân giải cao hay các chi tiết bổ sung như màu sắc, ánh sáng cũng rất quan trọng để hình ảnh trông sống động và chính xác hơn.
  • Website hoặc nền tảng sử dụng: Tùy theo nơi xuất bản hoặc ứng dụng, yêu cầu về phong cách và chất lượng có thể thay đổi.

Do đó, việc viết một prompt đủ chi tiết và cụ thể để đạt được kết quả mong muốn có thể mất nhiều thời gian và đòi hỏi sự hiểu biết về các yếu tố này.

Đây chính là điểm mà các mô hình ngôn ngữ GPT của OpenAI, như ChatGPT, có thể giúp ích rất nhiều. Với khả năng xử lý ngôn ngữ tự nhiên và tạo ra các văn bản sáng tạo, ChatGPT có thể hỗ trợ người dùng tự động hóa quá trình tạo prompt. Bằng cách cung cấp cho mô hình một mô tả ngắn gọn hoặc một tập hợp các từ khóa, người dùng có thể nhận lại một prompt hoàn chỉnh, chi tiết và chính xác, sẵn sàng để sử dụng với Stable Diffusion.

Nhờ vậy, ngay cả những người dùng không có nhiều kinh nghiệm trong việc tạo prompt cũng có thể dễ dàng tạo ra các câu lệnh AI phù hợp với nhu cầu của mình, giúp quá trình sáng tạo hình ảnh bằng AI trở nên đơn giản và hiệu quả hơn.

2. Hướng dẫn tạo prompt Stable Diffusion với ChatGPT

Việc tạo ra các prompt cho Stable Diffusion bằng ChatGPT không quá khó khăn, đặc biệt nếu bạn đã quen với các thông số cơ bản của Stable Diffusion như “seed”, “sampler”, và những yếu tố quan trọng khác. Dưới đây là các bước hướng dẫn tạo prompt Stable Diffusion với ChatGPT.

Lưu ý:

Các phiên bản mới hơn của ChatGPT có độ chính xác cao hơn. Nếu có thể, bạn nên sử dụng phiên bản trả phí để có kết quả tốt nhất.

Bước 1: Truy cập ChatGPT

Để bắt đầu, hãy truy cập trang web chat.openai.com của OpenAI. Tại đây, bạn có thể bắt đầu tạo prompt cho Stable Diffusion.

Trước khi bắt đầu, hãy bấm nút “+ New Chat” ở thanh bên trái để khởi động một cuộc trò chuyện mới. Điều này giúp đảm bảo rằng bạn không bị ảnh hưởng bởi các cuộc trò chuyện trước đó.

Bước 2: Xây dựng yêu cầu prompt chi tiết

Sau khi mở cuộc trò chuyện mới, bạn cần xác định rõ yêu cầu của mình khi tạo prompt. Ví dụ, nếu bạn muốn tạo prompt cho một bức chân dung minh họa, bạn có thể làm theo các bước dưới đây:

a. Xác định phong cách hình ảnh

Điều quan trọng là bạn phải mô tả rõ ràng phong cách hình ảnh mà bạn muốn. Ví dụ “photorealistic close-up illustration”, hãy nêu rõ yêu cầu này trong câu lệnh.

Sự chính xác này sẽ giúp loại bỏ những hiểu lầm và giúp AI hiểu rõ hơn về kỳ vọng của bạn.

b. Xác định chủ đề

Việc lựa chọn một chủ đề cụ thể cũng rất quan trọng để đảm bảo kết quả ổn định. Chủ đề có thể là đối tượng, động vật, phong cảnh, hoặc người nổi tiếng.

Ví dụ, nếu bạn chọn một người nổi tiếng cụ thể như “Ana de Armas”, điều này sẽ ảnh hưởng rất lớn đến hình dáng và phong cách của bức chân dung mà ChatGPT tạo ra.

c. Sử dụng ví dụ cụ thể

Để giúp ChatGPT tạo prompt chính xác hơn, bạn có thể cung cấp một vài ví dụ về prompt mà bạn muốn tạo.

Những ví dụ này nên có phong cách và chủ đề tương đồng với mong muốn của bạn. Ví dụ:

Examples of high-quality prompts for a stunning close-up photorealistic illustration of Ana de Armas for text-to-image models (Stable Diffusion, MidJourney, or Dalle2) are:

  • “A dreamy, vibrant portrait of Ana de Armas; aesthetically pleasing anime style, trending on popular art platforms, minutely detailed, with precise, sharp lines, a composition that qualifies as an award-winning illustration, presented in 4K resolution, inspired by master artists like Eugene de Blaas and Ross Tran, employing a vibrant color palette, intricately detailed.”
  • “A portrait exuding Alberto Seveso and Geo2099’s distinctive styles; an ultra-detailed and hyper-realistic portrayal of Ana de Armas, designed with Lisa Frank aesthetics, featuring popular art elements such as butterflies and florals, sharp focus, akin to a high-quality studio photograph, with meticulous detailing, made famous by artists such as Tvera, Wlop, and Artgerm.”

Bước 3: Đánh giá kết quả của ChatGPT

Sau khi gửi yêu cầu chi tiết, ChatGPT sẽ trả về một loạt các prompt dựa trên phong cách và chủ đề bạn yêu cầu. Bạn có thể sử dụng những prompt này trực tiếp với Stable Diffusion hoặc điều chỉnh chúng theo các thông số mong muốn.

Để tránh các đặc điểm không mong muốn trong ảnh, bạn có thể sử dụng prompt loại trừ (negative prompt), ví dụ như:

Negative Prompt: “codeugly, poorly drawn hands, extra limbs, disfigured, watermark, bad anatomy, distorted face”.

Bước 4: Điều chỉnh prompt cho các tình huống khác nhau

ChatGPT cho phép bạn điều chỉnh prompt tùy theo nhu cầu. Ví dụ, nếu bạn muốn tạo hình ảnh toàn thân thay vì cận cảnh, bạn chỉ cần thêm từ khóa “full-body” vào yêu cầu và ví dụ.

Ví dụ:

Examples of high-quality prompts for stunning photorealistic full-body illustration of Ana de Armas for text-to-image models (Stable Diffusion, midjourney, or Dalle2) are:

  • Full-body portrayal of a jubilant Ana de Armas, detailed anime realism, trending on Pixiv, minute detailing, sharp and clean lines, award-winning illustration, 4K resolution, inspired by Eugene de Blaas and Ross Tran’s artistry, vibrant color usage, intricately detailed.
  • Full-body depiction of Ana de Armas, Alberto Seveso and Geo2099 style, an intricately detailed and hyper-realistic image in Lisa Frank style, trending on Artstation, butterflies and florals, sharp focus akin to a studio photograph, intricate details, praised by artists Tvera, Wlop, and Artgerm.

Bước 5: Yêu cầu thêm các prompt tương tự

Nếu bạn tìm được prompt ưng ý, bạn có thể yêu cầu ChatGPT tạo thêm những ví dụ tương tự. Bạn có thể yêu cầu như sau:

“I find the third prompt useful. Could you provide more examples in a similar style?”

ChatGPT sẽ đưa ra nhiều gợi ý khác nhau để bạn có thể lựa chọn.

Kết thúc quá trình hướng dẫn tạo prompt Stable Diffusion với ChatGPT, hy vọng bạn đã nắm vững những kiến thức cơ bản và kỹ năng cần thiết để khai thác tiềm năng của công cụ mạnh mẽ này trong sáng tạo nghệ thuật số. Hãy nhớ rằng, việc tạo ra những tác phẩm đẹp mắt và chuyên nghiệp không chỉ phụ thuộc vào công nghệ mà còn yêu cầu khả năng điều hướng sáng tạo và hiểu sâu sắc về các yếu tố thị giác. Đừng quên ghé thăm thư viện của 4pixos để cập nhật thêm nhiều kiến thức bổ ích bạn nhé. 

Nếu bạn muốn đào sâu vào việc ứng dụng AI trong thiết kế và diễn họa, đừng bỏ lỡ khóa học Art Direction w AI của 4pixos Academy. Trong khóa này, bạn sẽ được hướng dẫn chi tiết cách cài đặt cũng như ứng dụng Stable Diffusion và MidJourney – hai trong số những công cụ AI hàng đầu hiện nay trong diễn họa kiến trúc. Khóa học không chỉ giúp bạn làm chủ công nghệ, mà còn định hình tư duy thẩm mỹ trong quá trình sáng tạo nghệ thuật theo cách chuyên nghiệp và hiệu quả nhất.

Ngoài ra, bạn cũng có thể tìm hiểu các khóa học khác của 4pixos tại đây.

Xem thêm
> DALL-E 2, Midjourney, Stable Diffusion: Đâu Là Công Cụ AI Tốt Hơn Cho 3D Artist?
> Stable Diffusion là gì? 5 Tính Năng Thần Kỳ Của Stable Diffusion Mà Bạn Cần Biết
> Hướng Dẫn Chi Tiết Cài Stable Diffusion Trên Google Colab
> Google Colab là gì? Hướng dẫn sử dụng Google Colab cho người mới bắt đầu
> Nên Vận Dụng AI Vào Giai Đoạn Nào Trong Quá Trình Diễn Hoạ Kiến Trúc?