Lập trình AI

Nhật ký tự học AI bài 3.1 – Xác suất

Đây là một bài rất quan trọng về tư duy, không khó về công thức. Hiểu xong bài này là tôi có sự thay đổi “cách nhìn” về AI và Machine Learning luôn.

Xác suất trong toán học

Xác suất là nhánh toán học đo lường khả năng xảy ra của một biến cố ngẫu nhiên, với giá trị nằm trong khoảng từ 0 (không thể xảy ra) đến 1 (chắc chắn xảy ra). Nó ứng dụng rộng rãi trong thống kê, dự báo và khoa học dữ liệu để mô hình hóa sự không chắc chắn

Công thức cơ bản

Xác suất của biến cố A, ký hiệu là P(A), được tính bằng tỷ lệ giữa số kết quả thuận lợi cho A và tổng số kết quả có thể xảy ra (trong trường hợp các kết quả có khả năng xảy ra như nhau):

P(A)=n(A)n(Ω)P(A)=\frac{n(A)}{n(\Omega )}

Trong đó:

  • n(A) số trường hợp thuận.
  • n(Ω) tổng số trường hợp.

Giá trị của P(A) luôn nằm trong khoảng [0, 1].

Xác suất trong AI

Thế giới không có đúng sai tuyệt đối, do đo dữ liệu cũng vậy, luôn có sai số, xác suất giúp mô hình AI “chấp nhận” sai số thay vì không có kết quả nếu không có dữ liệu đúng tuyệt đối. Ví dụ khi kiểm tra bức ảnh 1 con mèo, mô hình AI sẽ tính toán xác suất có điều kiện dựa trên các pixel và đưa ra kết quả:

  • Mèo: 95%
  • Chó 5%

Dưới đây là một số ứng dụng của xác suất trong AI:

Lĩnh vực AIỨng dụng cụ thểXác suất dùng để làm gìVí dụ trực quan
Classification (Phân loại)Nhận diện ảnh, spam emailƯớc lượng khả năng thuộc mỗi lớpẢnh này: mèo 0.82, chó 0.15, khác 0.03
Regression (Hồi quy)Dự đoán giá nhà, nhiệt độƯớc lượng giá trị + độ tin cậyGiá nhà ≈ 2.3 tỷ ± sai số
Natural Language ProcessingDịch máy, chatbotChọn từ/câu có xác suất cao nhấtTừ tiếp theo có xác suất cao nhất
Speech RecognitionNhận diện giọng nóiSo sánh xác suất các chuỗi âm thanh“hello” 0.74, “yellow” 0.21
Recommendation SystemsGợi ý video, sản phẩmXác suất người dùng sẽ thíchBạn thích video này 89%
Anomaly DetectionPhát hiện gian lậnPhát hiện sự kiện có xác suất rất thấpGiao dịch này chỉ có 0.1% xảy ra
Reinforcement LearningGame, robot, xe tự hànhCân bằng khám phá – khai thácHành động A thắng 60%, B thắng 40%
Computer VisionObject detectionĐộ tin cậy của mỗi bounding boxNgười: 0.93, xe: 0.87
Medical AIChẩn đoán bệnhXác suất mắc bệnhNguy cơ bệnh X: 12%
ForecastingDự báo thời tiết, nhu cầuƯớc lượng kịch bản tương lai70% khả năng mưa
Generative AISinh văn bản, ảnhLấy mẫu theo phân phối xác suấtToken tiếp theo có xác suất cao
Model EvaluationĐánh giá mô hìnhĐo độ chắc chắn & rủi roPrecision, Recall, Likelihood

Related Posts

Leave A Reply

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *