Tin tức công nghệ

Mô hình AI siêu nhẹ 7 triệu tham số của Samsung

Gần đây, cộng đồng AI xôn xao về một mô hình mới đến từ Samsung AI Research tại Montreal: Tiny Recursion Model (TRM). Điều đặc biệt là TRM chỉ có 7 triệu tham số, nhưng trong một số bài kiểm tra phức tạp, nó vượt cả các mô hình khổng lồ với hàng tỷ tham số.

TRM hoạt động như thế nào?

Khác với các mô hình lớn tạo ra câu trả lời từng từ một, TRM có cách làm khá “ngầu”:

  1. Tạo bản nháp: TRM nhanh chóng tạo một câu trả lời thô, giống như viết bản nháp đầu tiên.
  2. Lưu trữ suy nghĩ: Nó mở một “bảng suy nghĩ” để ghi lại các khả năng logic, các bước kiểm tra.
  3. Tự đánh giá và sửa lỗi: TRM liên tục so sánh bản nháp với câu hỏi, hỏi bản thân “logic này ổn chưa?”, sửa đi sửa lại lên tới 16 vòng.
  4. Ra câu trả lời cuối cùng: Sau khi hoàn tất vòng lặp, mô hình cho ra một câu trả lời chất lượng cao, có logic hơn và chính xác hơn.

Tóm gọn lại: TRM tự kiểm tra chính mình nhiều lần, nên dù nhỏ nhưng vẫn chính xác, hiệu quả.

Vì sao TRM “nhỏ mà có võ”?

  • Tiết kiệm tài nguyên: Chỉ 7 triệu tham số, dễ triển khai trên điện thoại, laptop, thiết bị nhúng.
  • Hiệu quả hơn mô hình lớn: So với HRM (27 triệu tham số) hay các mô hình hàng tỷ tham số khác, TRM đạt độ chính xác cao hơn trên nhiều bài kiểm tra logic, Sudoku hay giải mê cung.
  • Cơ chế đơn giản, hiệu quả: Không cần quá nhiều lớp hay self-attention phức tạp, TRM chỉ dùng tầng linear + vòng lặp là đủ.

Tương lai của AI di động?

TRM mở ra hướng AI siêu nhẹ nhưng thông minh, phù hợp cho các thiết bị cá nhân, IoT, hoặc nơi mà GPU mạnh không sẵn có. Thay vì chạy các mô hình khổng lồ tốn điện, người dùng có thể có trải nghiệm AI nhanh, mượt mà ngay trên điện thoại hay laptop.

Related Posts

1 of 2

Leave A Reply

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *