Mục tiêu bài học này là hiểu hàm tuyến tính là gì? ứng dụng của nó trong AI, hiểu sơ lược về cách nó hoạt động trong AI, không yêu cầu hiểu sâu, vì tầm này chưa hiểu sâu được 😅.
Hàm tuyến tính
Hàm tuyến tính là hàm số có dạng:
Trong đó:
- x: đầu vào (input, feature)
- y: đầu ra (output, prediction)
- w (weight): hệ số – quyết định độ dốc
- b (bias): độ lệch – quyết định điểm cắt trục y
Giải thích theo cách dân dã thì Hàm Tuyến Tính là cách AI nói: “Khi x tăng 1 đơn vị thì y thay đổi bao nhiêu?”
Ví dụ thực tế:
Giả sử bạn bán cà phê:
- Giá mỗi ly: 30k
- Tiền thuê mặt bằng mỗi ngày: 500k
Ta có:
- x = số ly bán được
- y = lợi nhuận
- w = 30 → bán thêm 1 ly, lời thêm 30k
- b = -500 → chưa bán ly nào đã lỗ 500k
Vai trò của độ dốc w:
- w > 0 → x tăng, y tăng (thuận)
- w < 0 → x tăng, y giảm (ngược)
- |w| lớn → y thay đổi rất nhanh
- w ≈ 0 → x gần như không ảnh hưởng y
Trong AI:
- w lớn → feature quan trọng
- w nhỏ → feature ít tác động
Vai trò của b (bias – độ lệch)
Trong ví dụ trên b = -500, ý nghĩa của nó là là mỗi ngay trôi qua, quán sẽ bay ngay 1 khoản chi phí cố định là 500k, bao gồm: lương nhân viên, chi phí mặt bằng, chi phí nguyên liệu ..v..v.. Nếu 1 ngày bạn không bán được cốc nào thì lợi nhuận:
Còn nếu bán được 100 cốc sẽ lời:
Nếu b = 0, thì chi phí bỏ ra bằng 0, điều này rất khó xảy ra thực tế. Liên hệ với AI, độ lệch Bias xác định trạng thái mặc định của mô hình khi không có thông tin đầu vào.
Độ lệch Bias quyết định 1 phần khả năng thông minh của Model, nếu độ lệch = 0, khi x = 0, không có dữ liệu, không ra kết quả. Ngược lại có giá trị b, AI sẽ có câu trả lời mặc định cho câu hỏi của người dùng.
Ứng dụng của hàm tuyến tính trong AI
Dưới đây là 1 số ứng dụng của hàm tuyến tính mà tôi hỏi bạn ChatGPT, hiểu được 20% còn lại không hiểu gì, nhưng mục tiêu bài học này chưa cần hiểu những ứng dụng này, chỉ cần biết là đủ:
| Ứng dụng | Hàm tuyến tính đóng vai trò gì | Ý nghĩa cốt lõi |
|---|---|---|
| Linear Regression | Mô hình dự đoán trực tiếp | Dự đoán giá trị liên tục (giá nhà, doanh thu, nhiệt độ…) |
| Logistic Regression | Tính tổng tuyến tính trước sigmoid | Phân loại nhị phân (spam / không spam, bệnh / không bệnh) |
| Perceptron | Lõi tính toán của neuron | Mô hình neuron đơn giản nhất |
| Neural Network (Dense layer) | Mỗi layer = phép biến đổi tuyến tính | Học cách tổ hợp feature |
| CNN (Convolution) | Tích chập = hàm tuyến tính cục bộ | Trích xuất cạnh, hoa văn, texture |
| RNN / LSTM / GRU | Biến đổi trạng thái ẩn | Ghi nhớ & cập nhật thông tin theo thời gian |
| Attention / Transformer | Linear projection (Q, K, V) | Biến đổi không gian biểu diễn |
| Embedding (NLP, RecSys) | Ánh xạ rời rạc → vector liên tục | Đưa chữ, item vào không gian số |
| Dimensionality Reduction (PCA) | Phép chiếu tuyến tính | Giữ thông tin chính, giảm nhiễu |
| Feature Engineering | Kết hợp feature thủ công | Đơn giản hóa mô hình |
| Reinforcement Learning (Value function) | Xấp xỉ hàm giá trị | Đánh giá hành động |
| Anomaly Detection (linear score) | Tính điểm bất thường | Phát hiện gian lận, lỗi hệ thống |
| Calibration / Scoring | Chuẩn hoá đầu ra | Làm model “đáng tin hơn” |
| Control & Robotics | Mô hình hóa hệ động lực | Điều khiển ổn định |







