Tùy Chỉnh Chế Độ Xem
Cài đặt chỉ áp dụng cho trình duyệt này
Chế độ ánh sáng màn hình
  • Giao diện sáng
  • Giao diện tối
  • Giao diện mặc định

Trở Thành Một Nghệ Sĩ AI Bằng Cách Sử Dụng Cụm Từ Và Khuếch Tán Ổn Định

tro-thanh-mot-nghe-si-ai-bang-cach-su-dung-cum-tu-va-khuech-tan-on-dinh

Chúng ta đang sống trong thời kỳ thú vị khi mỗi tuần, chúng ta có thông báo về công nghệ tiên tiến. Vài tháng trước, OpenAI đã loại bỏ mô hình chuyển văn bản thành hình ảnh hiện đại nhất DALL·E 2. Chỉ một số ít người được tiếp cận sớm để trải nghiệm hệ thống AI mới có thể tạo ra hình ảnh chân thực từ mô tả bằng ngôn ngữ tự nhiên. Nó vẫn đóng cửa cho công chúng.

Vài tuần sau, Stability AI đã ra mắt phiên bản mã nguồn mở của DALLE2 được gọi là mô hình Khuếch tán ổn định. Lần ra mắt này đã thay đổi mọi thứ. Khi mọi người trên internet đăng kết quả nhanh chóng và ngạc nhiên trước nghệ thuật hiện thực.

Các trọng số của mô hình có sẵn tại Hugging Face CompVis/stable-diffusion-v1-4. Bạn cũng có thể kiểm tra mã nguồnthẻ mô hình . Nó được mở cho công chúng theo giấy phép CreativeML OpenRAIL M.

Trong bài đăng này, chúng ta sẽ tìm hiểu về Khuếch tán ổn định và hiểu sự cần thiết của một trình tạo dấu nhắc tuyệt vời. 

Khuếch tán ổn định

Mô hình Khuếch tán ổn định là mô hình chuyển văn bản thành hình ảnh hiện đại mã nguồn mở để tạo tác phẩm nghệ thuật được tạo bằng ngôn ngữ tự nhiên. Nó sử dụng khuếch tán tiềm ẩn để nhận dạng hình dạng và tiếng ồn, đồng thời tìm nạp tất cả các phần tử về tiêu điểm trung tâm đồng bộ với lời nhắc.

Mô hình được đào tạo trên bộ hình ảnh LAION-5B bao gồm 5 tỷ hình ảnh có sẵn công khai trên internet. Các hình ảnh đi kèm với chú thích và thẻ.

Phải mất hàng trăm GPU cao cấp (Nvidia A100) để đào tạo chế độ này và chi phí đào tạo cho Khuếch tán ổn định là khoảng 660.000 USD. Trong quá trình đào tạo, mô hình tương quan các từ với hình ảnh bằng cách sử dụng CLIP (Đào tạo trước hình ảnh ngôn ngữ tương phản).

Bạn không cần phải tự đào tạo mô hình. Bạn có thể trải nghiệm miễn phí trên Hugging Face Spaces và DreamStudio. Bạn thậm chí có thể tải xuống các trọng số mô hình và chạy nó cục bộ. 

Hugging Face Spaces

Hugging Face - Stable Diffusion thật tuyệt vời. Chỉ cần viết một mô tả đơn giản và nhấp vào nút tạo hình ảnh. Sau vài giây, bạn sẽ thấy 4 hình ảnh được tạo liên quan đến lời nhắc của bạn. 

tro-thanh-mot-nghe-si-ai-bang-cach-su-dung-cum-tu-va-khuech-tan-on-dinh-1

Đôi khi việc tạo hình ảnh có thể mất vài phút hoặc thậm chí khiến bạn phải xếp hàng do nhu cầu cao. Bạn có thể dùng thử miễn phí không giới hạn, nhưng bạn luôn có thể xem ứng dụng Demo chính thức có tên DreamStudio.

DreamStudio

Sau khi đăng ký tài khoản DreamStudio miễn phí, bạn sẽ nhận được 2 đô la hoặc 200 thế hệ. Nó nhanh và bạn có thể thử với các tùy chọn khác như kích thước, tỷ lệ Cfg, hạt giống, các bước và số lượng hình ảnh. Hình ảnh được tạo của bạn luôn được lưu trong lịch sử và bạn có thể sử dụng API để tích hợp nó với các ứng dụng hiện có của mình. 

Như bạn có thể thấy, tôi mất vài giây để tạo một hình ảnh hoàn toàn mới bằng lời nhắc. 

tro-thanh-mot-nghe-si-ai-bang-cach-su-dung-cum-tu-va-khuech-tan-on-dinh

Đây là một ví dụ khác. Tôi là một fan hâm mộ lớn của Chúa tể của những chiếc nhẫn và Người Hobbit, vì vậy tôi nghĩ, tại sao không tạo một hình ảnh kết xuất 3D? 

tro-thanh-mot-nghe-si-ai-bang-cach-su-dung-cum-tu-va-khuech-tan-on-dinh

Bạn có thể thêm kiểu hoặc thậm chí tên nền tảng trong lời nhắc. Có rất nhiều thứ bạn có thể cố gắng tạo ra một hình ảnh cụ thể. Bạn thậm chí có thể viết một lời nhắc dài mô tả tất cả các chi tiết.

tro-thanh-mot-nghe-si-ai-bang-cach-su-dung-cum-tu-va-khuech-tan-on-dinh

Nhưng làm thế nào để bạn tạo ra hình ảnh chi tiết và chất lượng cao, như hình dưới đây? Các nghệ sĩ thực sự bây giờ là những người quảng bá đang tưởng tượng ra những nhân vật mới và thế giới mới. Họ đang sử dụng các từ khóa để tạo ra nghệ thuật sáng tạo thực tế. 

tro-thanh-mot-nghe-si-ai-bang-cach-su-dung-cum-tu-va-khuech-tan-on-dinh-5

Tạo lời nhắc bằng Phraser 

Nếu bạn muốn trở thành một nghệ sĩ AI và trở nên nổi tiếng, hãy làm việc theo trí tưởng tượng của bạn và viết những gợi ý sáng tạo. Bạn cũng cần các công cụ để hướng dẫn bạn và cho phép bạn khám phá các phong cách, kết cấu, màu sắc, nội dung, cảm giác và thời đại khác nhau. 


Phraser là trình tạo lời nhắc tốt nhất. Thay vì thử các từ khác nhau, bạn sẽ chọn các tùy chọn đa dạng từ các phần khác nhau, chẳng hạn như kiểu và loại nội dung. 


Khi bắt đầu, nó sẽ yêu cầu bạn chọn các mạng thần kinh như DALLE2, giữa hành trình và Khuếch tán ổn định. Sau đó, loại nội dung, mô tả, phong cách, màu sắc, kết cấu, độ phân giải, cài đặt máy ảnh, cảm xúc và thời đại. Sau khi chọn tùy chọn, bạn sẽ được cung cấp lời nhắc. 

tro-thanh-mot-nghe-si-ai-bang-cach-su-dung-cum-tu-va-khuech-tan-on-dinh-6

Bạn có thể sao chép và dán lời nhắc vào Hugging Face Spaces hoặc kết nối DreamStudio với API. 

Thật dễ dàng để kết nối và hướng dẫn kết nối API được cung cấp ở cuối lời nhắc. 

tro-thanh-mot-nghe-si-ai-bang-cach-su-dung-cum-tu-va-khuech-tan-on-dinh-7

Lợi thế đáng kể của việc kết nối API là bạn có thể trải nghiệm các kết quả Phổ biến ổn định trong ứng dụng web Cụm từ. Bạn sẽ tiết kiệm thời gian trong việc sao chép và dán lời nhắc. 


tro-thanh-mot-nghe-si-ai-bang-cach-su-dung-cum-tu-va-khuech-tan-on-dinh-8

 
Phần kết luận

Chúng tôi đang bước vào một kỷ nguyên mới của nghệ thuật sáng tạo và mỗi tuần chúng tôi thấy rằng cộng đồng đang mang đến một biến thể mới của mô hình Khuếch tán. Ví dụ: nateraw/stable-diffusion-videos tạo video bằng cách nội suy không gian tiềm ẩn của Stable Diffusion.
“Hãy chú ý đến trình nhắc hình ảnh và video của chuyên gia giới thiệu các kỹ năng trên Twitter và Linkedin.”

Trong bài đăng này, chúng ta đã tìm hiểu về mô hình Khuếch tán ổn định và cách chúng ta có thể sử dụng các nền tảng miễn phí như Ôm mặt và DreamStudio để tạo hình ảnh do AI tạo ra. Ngoài ra, chúng ta đã tìm hiểu về Phraser, hỗ trợ bạn viết lời nhắc/mô tả sáng tạo cho mô hình. 

Copyright Disclaimer:

This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.

Tuyên bố miễn trừ bản quyền:

Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.

Tham khảo các bài viết cùng chủ đề:

Đọc thêm
إرسال تعليق