Nhật ký tự học AI bài 1.1 – số, Vector, Không gian

18 Tháng 1, 2026

Tôi đã bắt đầu những viên gạch đầu tiên, là Toán. Về cơ bản thì càng có nhiều kiến thức toán thì càng tốt – điều đó đúng. Nhưng không có nghĩa là không đủ kiến thức thì không được phép học AI. Tôi chọn mức cơ bản nhưng hiểu thật, thay vì biết rất nhiều thứ mà không kết nối được với thực tế và cũng mất rất nhiều thời gian.

Mục tiêu của bài này, với tôi, rất rõ ràng:

Hiểu số là gì trong bối cảnh AI
Hiểu vector là gì và tại sao nó quan trọng
Hiểu không gian như một cách tư duy, không phải hình vẽ hàn lâm

Mục lục ẩn

1 Scalar (Số vô hướng)

2 Vector là gì trong AI

3 Không gian

Scalar (Số vô hướng)

Số thì rất đơn giản thôi, nó là 1 con số đơn lẻ: 1, 2, 3, 4, 5, 6, 7, 8, 9 … Trong bối cảnh toán học và AI, số không còn chỉ để “đếm” hay “tính cho ra đáp án” như khi học phổ thông. Số là đơn vị biểu diễn thông tin. Mỗi con số mang một ý nghĩa đo lường nào đó: độ lớn, mức độ, cường độ, xác suất, hay giá trị của một đặc trưng trong thế giới thực. Với máy tính, mọi thứ—hình ảnh, âm thanh, văn bản, hành vi—cuối cùng đều được quy về các con số.

Liên hệ với toán cấp 3 xíu, ví dụ trong hệ tọa độ Oxy này thì Scalar chính là các số nằm trên trục ox và oy.

Vector là gì trong AI

Ta có số để biểu diễn 1 thông tin rồi, nhưng mà ngoài đời thông tin thì rất phức tạp nó không thể biểu diễn ở 1 số đơn lẻ được mà phải 1 đống số.

Ví dụ thông tin ông Đỗ Nam Trump [chiều cao, cân nặng, tuổi] = [190, 90, 81].

Giờ thêm quê quán cho ông ấy: [chiều cao, cân nặng, tuổi, quốc gia] = [190, 90, 81, 1], do chỉ lưu được dạng số, nên ta sẽ đặt Nước Mỹ có id = 1, và lưu vào dãy số trên. Và ta có thể thêm vô số thông tin vào nó được, đây chính là khả năng mở rộng khủng khiếp của data.

Cái này chính là vector

Tôi thấy vector nó giống 1 thứ có thể biểu diễn thông tin:

Một vector = một đối tượng được mô tả bằng nhiều con số
AI sẽ không thấy chữ, ảnh, âm thanh
AI chỉ thấy vector

Ví dụ:

1 bức ảnh → vector hàng chục nghìn pixel
1 câu văn → vector embedding 384 / 768 chiều
1 người dùng → vector hành vi

Nhớ lại một chút toán thời cấp 3, vector $[ \text{chiều cao}, \text{cân nặng}, \text{tuổi} ] = [190, 90, 81]$ [chieˆˋu cao,caˆn nặng,tuổi]=[190,90,81] có thể được biểu diễn trong không gian ba chiều thông qua hệ trục tọa độ OXYZ.

Trước hết, ta vẽ ba trục tọa độ vuông góc với nhau tại gốc $O$ O. Trục $OX$ OX biểu diễn chiều cao, trục $OY$ OY biểu diễn cân nặng, và trục $OZ$ OZ biểu diễn tuổi.

Trên trục $OX$ OX, ta lấy điểm có hoành độ bằng 190. Từ điểm này, kẻ một đường thẳng song song với mặt phẳng $YOZ$ YOZ.
Trên trục $OY$ OY, ta lấy điểm có tung độ bằng 90, rồi kẻ một đường thẳng song song với mặt phẳng $XOZ$ XOZ.
Tương tự, trên trục $OZ$ OZ, ta lấy điểm có cao độ bằng 81 và kẻ một đường thẳng song song với mặt phẳng $XOY$ XOY.

Ba đường thẳng này sẽ cắt nhau tại một điểm duy nhất, gọi là điểm $A(190, 90, 81)$ A(190,90,81). Điểm $A$ A chính là vị trí của mẫu dữ liệu trong không gian ba chiều.

Khi nối gốc tọa độ $O(0,0,0)$ O(0,0,0) với điểm $A$ A, ta thu được vector $\vec{OA}$ OA. Vector này chính là biểu diễn hình học của dữ liệu $[190, 90, 81]$ [190,90,81]. Trong học máy, người ta thường không tách biệt điểm $A$ A và vector $\vec{OA}$ OA, mà coi trực tiếp $[190, 90, 81]$ [190,90,81] là vector đặc trưng đại diện cho một mẫu dữ liệu.

Không gian

Tôi vẫn nhớ chút về toán học thời cấp 3, ta đã quen với các khái niệm không gian 1 chiều, 2 chiều, 3 chiều gắn liền với các hệ trục tọa độ ox, oxy, oxyz ….

Với không gian 1 chiều, ta chỉ cần một trục số. Mỗi con số biểu diễn một vị trí trên trục đó.
Với không gian 2 chiều, ta dùng hai trục vuông góc nhau, thường gọi là trục $Ox$ Ox và $Oy$ Oy. Mỗi điểm được xác định bởi một cặp số $(x, y)$ (x,y).
Với không gian 3 chiều, ta thêm trục $Oz$ Oz, và một điểm trong không gian được xác định bởi bộ ba $(x, y, z)$ (x,y,z).

Nói một cách đơn giản, số chiều của không gian chính là số trục tọa độ cần dùng để xác định vị trí của một điểm.

Khi học AI, khái niệm không gian này không thay đổi, chỉ khác ở chỗ: các trục tọa độ không còn biểu diễn chiều dài, chiều rộng hay chiều cao, mà biểu diễn các thuộc tính của dữ liệu. Như đã ví dụ ở trên, tôi có tổng thống Mỹ Đỗ Nam Trump [chiều cao, cân nặng, tuổi] = [190, 90, 81], đây là 3 chiều và ta có thêm hàng loạt chiều vào bên trong dãy số trên.