Mục tiêu bài học
- Hiểu bản chất của AI là gì
- Hiểu cách AI hoạt động ở mức cơ bản, đủ để không còn mơ hồ hay thần thánh hóa
Trước khi bắt tay vào học AI, tôi cần biết nó thực chất là gì
Trước khi đụng tới code, model, hay mấy từ nghe rất “ngầu” như deep learning, neural network…, tôi tự thấy mình cần dừng lại một chút và hỏi một câu rất đời:
Rốt cuộc thì AI là cái gì? Nó có thực sự “thông minh” như người ta nói không?
Câu trả lời, sau một hồi tự hỏi rồi tự hỏi… AI 😄, là: không hẳn.
AI ≠ Trí tuệ (Intelligence)
Nghe chữ Artificial Intelligence thì rất dễ tưởng tượng ra một thứ gì đó:
- biết suy nghĩ
- có cảm xúc
- biết tính toán lợi – hại
- thậm chí… biết thù dai 😅
Nhưng thực tế thì đơn giản (và phũ) hơn nhiều.
Trí tuệ nhân tạo thực chất là:
- một phần mềm rất lớn
- chạy trên lượng dữ liệu siêu to khổng lồ
- được vận hành bằng các thuật toán toán học
Nó:
- ❌ không có suy nghĩ
- ❌ không có cảm xúc
- ❌ không có tham – sân – si
- ❌ không có động cơ cá nhân
Nó chỉ làm đúng một việc: xử lý đầu vào và trả ra đầu ra theo cách con người thiết kế và huấn luyện.
Nói cho dễ hiểu:
AI không “muốn” giúp bạn, nó chỉ được lập trình để phục vụ mục đích của con người.
Model thực chất là cái gì vậy?
Lúc mới dùng AI, tôi bị choáng thật sự.
Nào là:
- chatgpt 3.5
- chatgpt 4
- chatgpt 5.2
- gemini 1, 2, 3…
Nghe rất “cao siêu”, nhưng thú thật là tôi không biết model là cái gì.
Tôi có hỏi AI, nhưng câu trả lời ban đầu thì… hơi quá sức. Sau đó tôi rút ra được một cách hiểu ngắn gọn hơn:
Model cốt lõi là một hàm số toán học rất lớn
Dạng tổng quát của nó là:y=f(x;θ)
Trong đó:
- x: đầu vào (input)
- Ví dụ: “Thủ đô Việt Nam là gì?”
- θ (Theta): tập hợp các tham số
- Đây là thứ được “học” từ dữ liệu trong quá trình huấn luyện
- y: đầu ra dự đoán
- Lưu ý: chưa chắc đã là thứ người dùng nhìn thấy cuối cùng
Nói nôm na:
👉 Model là một cỗ máy toán học, nhận x, xử lý bằng θ, rồi cho ra y.
Huấn luyện (Training) model là đang làm gì?
Nghe người ta nói “dạy AI” nhiều lắm, nhưng thực chất là dạy kiểu toán học, không phải ngồi giảng bài cho nó nghe 😄.
Huấn luyện model thực chất là:
- một bài toán tối ưu hóa (Optimization Problem)
- mục tiêu là tìm bộ tham số θ sao cho:
- kết quả dự đoán gần đúng nhất với kết quả thực tế
- sai số là nhỏ nhất trên toàn bộ dữ liệu
Nói ngắn gọn cho dễ nhớ:
Huấn luyện AI = chỉnh tham số cho tới khi nó trả lời ít sai nhất có thể
Ví dụ chi tiết: một luồng AI hoạt động như thế nào?
Giờ ta lấy ví dụ quen thuộc:
Tôi hỏi AI: “Thủ đô Việt Nam là gì?”
AI trả lời: “Hà Nội”
Để đi từ câu hỏi tới câu trả lời, AI phải làm những gì?
Bước 1: Nhận input → Chuỗi ký tự (text)
Ở tầng thấp nhất, AI không hiểu tiếng Việt.
Nó chỉ thấy:
"t h ủ đ ô v i ệ t n a m l à g ì ?"
Tôi bình luận:
→ Đoạn này thì… hiểu, không có gì khó.
Bước 2: Tokenization – Bẻ câu thành token
Model dùng một bộ gọi là tokenizer để tách câu thành các mảnh nhỏ hơn.
Ví dụ minh họa:
["thủ", " đô", " việt", " nam", " là", " gì", "?"]
Tôi bình luận:
→ Hiểu luôn, chưa thấy gì lạ.
Bước 3: Embedding – Biến token thành vector
Mỗi token được biến thành một vector nhiều chiều, ví dụ:
"việt" → [0.13, -1.2, 0.88, ..., 0.004]
Các vector này:
- mã hóa ngữ nghĩa
- “Việt Nam” sẽ gần “Hà Nội”
- và xa “Paris”, “New York”
Quan trọng nhất:
Đây là toán học thuần túy, không phải hiểu theo kiểu con người.
Tôi bình luận:
→ Tới đây thì bắt đầu… không hiểu rồi 😅
Nhưng không sao, vì đây là phần toán học, để dành cho những bài sau.
Bước 4: Transformer xử lý ngữ cảnh
Đây là chỗ dễ bị thần thánh hóa nhất.
Model làm gì?
- dùng attention để xem:
- “thủ đô” liên quan mạnh tới “việt nam”
- “là gì” cho thấy đây là câu hỏi định nghĩa
Model không:
- hỏi Google
- suy nghĩ
- hay “biết” Việt Nam là gì
Nó chỉ:
- so vector
- nhân ma trận
- cộng bias
- đi qua rất nhiều layer đã được huấn luyện
Tôi bình luận:
→ Hiểu cách nó làm việc, còn chi tiết thì… chưa cần hiểu ở bài này.
Bước 5: Sinh output – đoán token tiếp theo
Model không sinh ra “Hà Nội” ngay.
Nó tự hỏi (bằng toán học):
“Token tiếp theo có xác suất cao nhất là gì?”
Ví dụ giả lập:
| Token | Xác suất |
|---|---|
| “Hà” | 0.61 |
| “Thủ” | 0.12 |
| “TP” | 0.05 |
| “Sài” | 0.02 |
➡️ Chọn “Hà”
Bước 6: Tiếp tục đoán token tiếp theo
Context lúc này là:
"Hà"
Dự đoán tiếp:
| Token | Xác suất |
|---|---|
| ” Nội” | 0.94 |
| ” Giang” | 0.01 |
| ” Lan” | 0.003 |
➡️ Chọn ” Nội”
Tôi bình luận:
→ Hai bước này thì hiểu rồi: lấy theo xác suất cao nhất.
Kết luận bài 0
Sau bài này, tôi rút ra được vài điều:
- ✅ Đã hiểu AI thực chất là gì
- ✅ Hiểu được model là một hàm số toán học
- ✅ Hiểu được một luồng hoạt động cơ bản của AI
- ❌ Chưa hiểu sâu chi tiết toán học (và điều đó là bình thường)
AI không phải sinh vật sống,
không có cảm xúc,
không có tham – sân – si,
nó chỉ chạy theo thuật toán.
Còn chuyện khi nào máy tính hiểu được kiểu:
“thằng này hơi bướng, cần chém”
thì… lúc đó tái mặt cũng chưa muộn 😄 Còn hiện tại, cứ bình tĩnh học tiếp từng bài sau.







