Trước khi đụng tới code, model, hay mấy từ nghe rất “ngầu” như deep learning, neural network…, tôi tự thấy mình cần dừng lại một chút và hỏi một câu rất đời:

Rốt cuộc thì AI là cái gì? Nó có thực sự “thông minh” như người ta nói không?

Câu trả lời, sau một hồi tự hỏi rồi tự hỏi… AI 😄, là: không hẳn.

AI ≠ Trí tuệ (Intelligence)

Nghe chữ Artificial Intelligence thì rất dễ tưởng tượng ra một thứ gì đó:

biết suy nghĩ
có cảm xúc
biết tính toán lợi – hại
thậm chí… biết thù dai 😅

Nhưng thực tế thì đơn giản (và phũ) hơn nhiều.

Trí tuệ nhân tạo thực chất là:

một phần mềm rất lớn
chạy trên lượng dữ liệu siêu to khổng lồ
được vận hành bằng các thuật toán toán học

Nó:

❌ không có suy nghĩ
❌ không có cảm xúc
❌ không có tham – sân – si
❌ không có động cơ cá nhân

Nó chỉ làm đúng một việc: xử lý đầu vào và trả ra đầu ra theo cách con người thiết kế và huấn luyện.

Nói cho dễ hiểu:

AI không “muốn” giúp bạn, nó chỉ được lập trình để phục vụ mục đích của con người.

Model thực chất là cái gì vậy?

Lúc mới dùng AI, tôi bị choáng thật sự.
Nào là:

chatgpt 3.5
chatgpt 4
chatgpt 5.2
gemini 1, 2, 3…

Nghe rất “cao siêu”, nhưng thú thật là tôi không biết model là cái gì.

Tôi có hỏi AI, nhưng câu trả lời ban đầu thì… hơi quá sức. Sau đó tôi rút ra được một cách hiểu ngắn gọn hơn:

Model cốt lõi là một hàm số toán học rất lớn

Dạng tổng quát của nó là: $y = f(x; \theta)$ y=f(x;θ)

Trong đó:

x: đầu vào (input)
- Ví dụ: “Thủ đô Việt Nam là gì?”
θ (Theta): tập hợp các tham số
- Đây là thứ được “học” từ dữ liệu trong quá trình huấn luyện
y: đầu ra dự đoán
- Lưu ý: chưa chắc đã là thứ người dùng nhìn thấy cuối cùng

Nói nôm na:
👉 Model là một cỗ máy toán học, nhận x, xử lý bằng θ, rồi cho ra y.

Huấn luyện (Training) model là đang làm gì?

Nghe người ta nói “dạy AI” nhiều lắm, nhưng thực chất là dạy kiểu toán học, không phải ngồi giảng bài cho nó nghe 😄.

Huấn luyện model thực chất là:

một bài toán tối ưu hóa (Optimization Problem)
mục tiêu là tìm bộ tham số θ sao cho:
- kết quả dự đoán gần đúng nhất với kết quả thực tế
- sai số là nhỏ nhất trên toàn bộ dữ liệu

Nói ngắn gọn cho dễ nhớ:

Huấn luyện AI = chỉnh tham số cho tới khi nó trả lời ít sai nhất có thể

Ví dụ chi tiết: một luồng AI hoạt động như thế nào?

Giờ ta lấy ví dụ quen thuộc:

Tôi hỏi AI: “Thủ đô Việt Nam là gì?”
AI trả lời: “Hà Nội”

Để đi từ câu hỏi tới câu trả lời, AI phải làm những gì?

Bước 1: Nhận input → Chuỗi ký tự (text)

Ở tầng thấp nhất, AI không hiểu tiếng Việt.
Nó chỉ thấy:

"t h ủ   đ ô   v i ệ t   n a m   l à   g ì ?"

Tôi bình luận:
→ Đoạn này thì… hiểu, không có gì khó.

Bước 2: Tokenization – Bẻ câu thành token

Model dùng một bộ gọi là tokenizer để tách câu thành các mảnh nhỏ hơn.

Ví dụ minh họa:

["thủ", " đô", " việt", " nam", " là", " gì", "?"]

Tôi bình luận:
→ Hiểu luôn, chưa thấy gì lạ.

Bước 3: Embedding – Biến token thành vector

Mỗi token được biến thành một vector nhiều chiều, ví dụ:

"việt" → [0.13, -1.2, 0.88, ..., 0.004]

Các vector này:

mã hóa ngữ nghĩa
“Việt Nam” sẽ gần “Hà Nội”
và xa “Paris”, “New York”

Quan trọng nhất:

Đây là toán học thuần túy, không phải hiểu theo kiểu con người.

Tôi bình luận:
→ Tới đây thì bắt đầu… không hiểu rồi 😅
Nhưng không sao, vì đây là phần toán học, để dành cho những bài sau.

Bước 4: Transformer xử lý ngữ cảnh

Đây là chỗ dễ bị thần thánh hóa nhất.

Model làm gì?

dùng attention để xem:
- “thủ đô” liên quan mạnh tới “việt nam”
- “là gì” cho thấy đây là câu hỏi định nghĩa

Model không:

hỏi Google
suy nghĩ
hay “biết” Việt Nam là gì

Nó chỉ:

so vector
nhân ma trận
cộng bias
đi qua rất nhiều layer đã được huấn luyện

Tôi bình luận:
→ Hiểu cách nó làm việc, còn chi tiết thì… chưa cần hiểu ở bài này.

Bước 5: Sinh output – đoán token tiếp theo

Model không sinh ra “Hà Nội” ngay.

Nó tự hỏi (bằng toán học):

“Token tiếp theo có xác suất cao nhất là gì?”

Ví dụ giả lập:

Token	Xác suất
“Hà”	0.61
“Thủ”	0.12
“TP”	0.05
“Sài”	0.02

➡️ Chọn “Hà”

Bước 6: Tiếp tục đoán token tiếp theo

Context lúc này là:

"Hà"

Dự đoán tiếp:

Token	Xác suất
” Nội”	0.94
” Giang”	0.01
” Lan”	0.003

➡️ Chọn ” Nội”

Tôi bình luận:
→ Hai bước này thì hiểu rồi: lấy theo xác suất cao nhất.

Kết luận bài 0

Sau bài này, tôi rút ra được vài điều:

✅ Đã hiểu AI thực chất là gì
✅ Hiểu được model là một hàm số toán học
✅ Hiểu được một luồng hoạt động cơ bản của AI
❌ Chưa hiểu sâu chi tiết toán học (và điều đó là bình thường)

AI không phải sinh vật sống,
không có cảm xúc,
không có tham – sân – si,
nó chỉ chạy theo thuật toán.

Còn chuyện khi nào máy tính hiểu được kiểu:

“thằng này hơi bướng, cần chém”

thì… lúc đó tái mặt cũng chưa muộn 😄 Còn hiện tại, cứ bình tĩnh học tiếp từng bài sau.

Lập trình AI

Nhật ký tự học AI bài 1.1 – số, Vector, Không gian

18 Tháng 1, 2026

Tôi đã bắt đầu những viên gạch đầu tiên, là Toán. Về cơ bản thì càng có nhiều…

Lập trình AI

Nhật ký tự học AI bài 2.1 Hàm số trong Machine Learning

26 Tháng 1, 2026

Mục tiêu bài học, là hiểu hàm số thôi! eazy! Hàm số trong toán học Hàm số thì…

Lập trình AI

Nhật ký tự học AI bài 3.1 – Xác suất

27 Tháng 1, 2026

Đây là một bài rất quan trọng về tư duy, không khó về công thức. Hiểu xong bài…

Lập trình AI

Giáo trình tự học AI cho người năng lực trung bình

14 Tháng 1, 2026

Tôi là OnDebug.Net. Một ông hơn 30 tuổi, làm lập trình đã khá lâu, đủ để không…

Lập trình AI

Nhật ký tự học AI bài 1.2 – Tích vô hướng (dot product)

22 Tháng 1, 2026

Bài này thì lúc đầu cũng bỡ ngỡ nhưng cứ gỡ rối dần bằng cách hỏi AI tôi cũng…

Lập trình AI

Nhật ký tự học AI bài 1.3 – Ma trận (Matrix)

23 Tháng 1, 2026

Bài này thì cần nắm được ma trận là gì, biết thực hiện các phép tính trong ma…

Lập trình AI

Nhật ký tự học AI bài 2.2 Hàm tuyến tính (Linear Function)

26 Tháng 1, 2026

Mục tiêu bài học này là hiểu hàm tuyến tính là gì? ứng dụng của nó trong AI,…

Lập trình AI

Nhật ký tự học AI bài 2.3 – Hàm phi tuyến (Activation Function)

26 Tháng 1, 2026

Mục đích bài này thì cần hiểu qua Nơ-ron là gì, mạng Neural Network. Nắm được…

Mục tiêu bài học

Trước khi bắt tay vào học AI, tôi cần biết nó thực chất là gì

AI ≠ Trí tuệ (Intelligence)

Model thực chất là cái gì vậy?

Huấn luyện (Training) model là đang làm gì?

Ví dụ chi tiết: một luồng AI hoạt động như thế nào?

Bước 1: Nhận input → Chuỗi ký tự (text)

Bước 2: Tokenization – Bẻ câu thành token

Bước 3: Embedding – Biến token thành vector

Bước 4: Transformer xử lý ngữ cảnh

Bước 5: Sinh output – đoán token tiếp theo

Bước 6: Tiếp tục đoán token tiếp theo

Kết luận bài 0

Related Posts

Leave A Reply Cancel Reply

Login

Register

Recover your password.