Claude 3.5 Sonnet: Đối thủ đáng gờm của GPT-4o và Gemini 1.5

Bevoice / June 21, 2024

Cuộc đua AI tiếp tục nóng lên: Anthropic vừa ra mắt mô hình mới nhất của mình, Claude 3.5 Sonnet, với tuyên bố có khả năng ngang bằng hoặc vượt trội GPT-4o của OpenAI và Gemini của Google trong nhiều tác vụ. Mô hình mới này đã có sẵn cho người dùng Claude trên web và iOS, đồng thời Anthropic cũng cung cấp quyền truy cập cho các nhà phát triển.

Claude 3.5 Sonnet sẽ là mô hình tầm trung trong dòng sản phẩm của Anthropic, bên cạnh Haiku (mô hình nhỏ gọn) và Opus (mô hình cao cấp nhất). Dù sở hữu cái tên có phần kỳ lạ, 3.5 Sonnet lại cho thấy hiệu suất vượt trội hơn cả 3 Opus với khoảng cách đáng kể. Mô hình mới này cũng được cho là nhanh gấp đôi so với phiên bản trước, một cải tiến đáng chú ý.

Tuy nhiên, cần nhớ rằng các bài kiểm tra hiệu năng AI luôn cần được đánh giá một cách khách quan. Việc lựa chọn bài kiểm tra, tốc độ phát triển chóng mặt của các mô hình và sản phẩm AI khiến cho việc khẳng định vị trí dẫn đầu trở nên khó khăn. Dù vậy, Claude 3.5 Sonnet vẫn ghi điểm ấn tượng khi vượt qua GPT-4o, Gemini 1.5 Pro và Llama 3 400B của Meta trong 7/9 bài kiểm tra chung và 4/5 bài kiểm tra về thị giác máy tính.

Hiệu năng vượt trội - nhưng cuộc đua vẫn chưa ngã ngũ

Điểm số benchmark ấn tượng của Claude 3.5 - nhưng mọi thứ thay đổi rất nhanh chóng.

Nguồn: Anthropic

Vậy hiệu suất ấn tượng đó có ý nghĩa gì trong thực tế? Anthropic cho biết Claude 3.5 Sonnet sẽ vượt trội hơn hẳn trong việc viết và dịch mã, xử lý quy trình nhiều bước, diễn giải biểu đồ và chuyển đổi văn bản từ hình ảnh. Claude mới này cũng được cho là có khả năng hiểu hài hước tốt hơn và viết theo phong cách tự nhiên như con người.

Bên cạnh mô hình mới, Anthropic còn giới thiệu tính năng Artifacts, cho phép người dùng xem và tương tác trực tiếp với kết quả từ yêu cầu của họ. Ví dụ, nếu yêu cầu mô hình thiết kế, bạn có thể xem kết quả, chỉnh sửa ngay trong ứng dụng. Tính năng nhỏ nhưng hữu ích này cho thấy Anthropic đang nỗ lực biến Claude thành công cụ đa năng hơn là chatbot đơn thuần.

Tính năng Artifacts mới hé lộ tiềm năng phát triển của Claude trong tương lai.
Nguồn: Anthropic

Artifacts dường như là tín hiệu cho tầm nhìn dài hạn của Anthropic dành cho Claude. Hãng này từng tuyên bố tập trung chủ yếu vào doanh nghiệp và có kế hoạch biến Claude thành công cụ cho phép các công ty “tập trung kiến thức, tài liệu và công việc đang thực hiện một cách an toàn trong một không gian chung”. Điều này nghe giống Notion hay Slack hơn là ChatGPT, với mô hình của Anthropic là trung tâm của hệ thống.

Tuy nhiên, hiện tại, mô hình mới vẫn là tâm điểm chú ý. Tốc độ cải tiến chóng mặt trong lĩnh vực AI thật đáng kinh ngạc: Anthropic ra mắt Claude 3 Opus vào tháng 3, tự hào tuyên bố nó ngang bằng GPT-4 và Gemini 1.0, trước khi OpenAI và Google tung ra phiên bản cải tiến của riêng họ. Giờ đây, Anthropic đã có động thái mới, và chắc chắn sẽ không lâu nữa cho đến khi các đối thủ cạnh tranh đáp trả. Dù không được nhắc đến nhiều như Gemini hay ChatGPT, Claude vẫn là một đối thủ đáng gờm trong cuộc đua AI.