Stable Diffusion 3.5: Phiên bản mạnh mẽ nhất từ Stability AI

Bevoice / October 23, 2024

Stability AI vừa giới thiệu Stable Diffusion 3.5, dòng mô hình AI tạo ảnh mạnh mẽ nhất của họ cho đến nay. Phiên bản này bao gồm nhiều biến thể tùy chỉnh được, chạy mượt mà trên các thiết bị phổ thông và khả dụng miễn phí theo Giấy phép Cộng đồng của Stability AI.

Bạn đọc có thể tải xuống Stable Diffusion 3.5 Large và Stable Diffusion 3.5 Large Turbo từ Hugging Face và mã nguồn mở trên GitHub ngay hôm nay.

Sau phiên bản Stable Diffusion 3 Medium ra mắt hồi tháng 6, Stability AI đã dành thời gian để tiếp thu ý kiến phản hồi từ cộng đồng và phát triển phiên bản 3.5, thay vì đưa ra một bản vá lỗi nhanh chóng.

Stable Diffusion 3.5 thể hiện cam kết của Stability AI trong việc trao quyền cho các nhà phát triển và nghệ sĩ với những công cụ tiên tiến, dễ tiếp cận và miễn phí cho hầu hết các trường hợp sử dụng.

Những điểm mới trong Stable Diffusion 3.5:
Phiên bản này cung cấp nhiều mô hình được phát triển để đáp ứng nhu cầu của các nhà nghiên cứu, người dùng cá nhân, công ty khởi nghiệp và doanh nghiệp lớn:

Stable Diffusion 3.5 Large: Với 8 tỷ tham số, chất lượng vượt trội và khả năng tuân thủ lời nhắc tốt hơn, đây là mô hình cơ sở mạnh mẽ nhất trong dòng Stable Diffusion, lý tưởng cho mục đích sử dụng chuyên nghiệp ở độ phân giải 1 megapixel.

Stable Diffusion 3.5 Large Turbo: Phiên bản rút gọn của Stable Diffusion 3.5 Large, tạo hình ảnh chất lượng cao với độ tuân thủ lời nhắc vượt trội chỉ trong 4 bước, nhanh hơn đáng kể so với Stable Diffusion 3.5 Large.

Stable Diffusion 3.5 Medium (sẽ ra mắt vào ngày 29 tháng 10): Với 2.5 tỷ tham số, kiến trúc MMDiT-X cải tiến và phương pháp huấn luyện được nâng cấp, mô hình này được thiết kế để chạy "mượt mà" trên phần cứng tiêu dùng, cân bằng giữa chất lượng và khả năng tùy chỉnh dễ dàng. Nó có khả năng tạo hình ảnh với độ phân giải từ 0.25 đến 2 megapixel.

Điểm mạnh của Stable Diffusion 3.5:

Khả năng tùy chỉnh cao: Dễ dàng tinh chỉnh mô hình để phù hợp với nhu cầu sáng tạo cụ thể hoặc xây dựng ứng dụng dựa trên quy trình công việc tùy chỉnh.

Hiệu suất tối ưu: Được tối ưu hóa để chạy trên phần cứng tiêu dùng tiêu chuẩn mà không yêu cầu cấu hình quá cao, đặc biệt là các mô hình Stable Diffusion 3.5 Medium và Stable Diffusion 3.5 Large Turbo.

Đầu ra đa dạng: Tạo hình ảnh đại diện cho thế giới, không chỉ một kiểu người, với nhiều màu da và đặc điểm khác nhau mà không cần lời nhắc quá phức tạp.


Giấy phép Cộng đồng của Stability AI:

Miễn phí cho mục đích phi thương mại: Cá nhân và tổ chức có thể sử dụng mô hình miễn phí cho mục đích phi thương mại, bao gồm cả nghiên cứu khoa học.

Miễn phí cho mục đích thương mại (doanh thu hàng năm lên đến 1 triệu đô la): Các công ty khởi nghiệp, doanh nghiệp vừa và nhỏ, và nhà sáng tạo có thể sử dụng mô hình cho mục đích thương mại miễn phí, miễn là tổng doanh thu hàng năm của họ dưới 1 triệu đô la.
Quyền sở hữu đầu ra: Giữ quyền sở hữu đối với các sản phẩm được tạo ra mà không bị ràng buộc bởi giấy phép.

Thông tin bổ sung:
Stability AI đã nỗ lực để ngăn chặn việc sử dụng sai mục đích Stable Diffusion 3.5.

Stable Diffusion 3.5 Medium sẽ ra mắt vào ngày 29 tháng 10.

ControlNets sẽ sớm ra mắt, cung cấp các tính năng kiểm soát nâng cao cho nhiều trường hợp sử dụng chuyên nghiệp.

Để biết thêm chi tiết, vui lòng truy cập: https://stability.ai/news/introducing-stable-diffusion-3-5