Tôi đã bắt đầu những viên gạch đầu tiên, là Toán. Về cơ bản thì càng có nhiều kiến thức toán thì càng tốt – điều đó đúng. Nhưng không có nghĩa là không đủ kiến thức thì không được phép học AI. Tôi chọn mức cơ bản nhưng hiểu thật, thay vì biết rất nhiều thứ mà không kết nối được với thực tế và cũng mất rất nhiều thời gian.
Mục tiêu của bài này, với tôi, rất rõ ràng:
- Hiểu số là gì trong bối cảnh AI
- Hiểu vector là gì và tại sao nó quan trọng
- Hiểu không gian như một cách tư duy, không phải hình vẽ hàn lâm
Scalar (Số vô hướng)
Số thì rất đơn giản thôi, nó là 1 con số đơn lẻ: 1, 2, 3, 4, 5, 6, 7, 8, 9 … Trong bối cảnh toán học và AI, số không còn chỉ để “đếm” hay “tính cho ra đáp án” như khi học phổ thông. Số là đơn vị biểu diễn thông tin. Mỗi con số mang một ý nghĩa đo lường nào đó: độ lớn, mức độ, cường độ, xác suất, hay giá trị của một đặc trưng trong thế giới thực. Với máy tính, mọi thứ—hình ảnh, âm thanh, văn bản, hành vi—cuối cùng đều được quy về các con số.
Liên hệ với toán cấp 3 xíu, ví dụ trong hệ tọa độ Oxy này thì Scalar chính là các số nằm trên trục ox và oy.

Vector là gì trong AI
Ta có số để biểu diễn 1 thông tin rồi, nhưng mà ngoài đời thông tin thì rất phức tạp nó không thể biểu diễn ở 1 số đơn lẻ được mà phải 1 đống số.
Ví dụ thông tin ông Đỗ Nam Trump [chiều cao, cân nặng, tuổi] = [190, 90, 81].
Giờ thêm quê quán cho ông ấy: [chiều cao, cân nặng, tuổi, quốc gia] = [190, 90, 81, 1], do chỉ lưu được dạng số, nên ta sẽ đặt Nước Mỹ có id = 1, và lưu vào dãy số trên. Và ta có thể thêm vô số thông tin vào nó được, đây chính là khả năng mở rộng khủng khiếp của data.
Cái này chính là vector
Tôi thấy vector nó giống 1 thứ có thể biểu diễn thông tin:
- Một vector = một đối tượng được mô tả bằng nhiều con số
- AI sẽ không thấy chữ, ảnh, âm thanh
- AI chỉ thấy vector
Ví dụ:
- 1 bức ảnh → vector hàng chục nghìn pixel
- 1 câu văn → vector embedding 384 / 768 chiều
- 1 người dùng → vector hành vi
Nhớ lại một chút toán thời cấp 3, vector [chieˆˋu cao,caˆn nặng,tuổi]=[190,90,81] có thể được biểu diễn trong không gian ba chiều thông qua hệ trục tọa độ OXYZ.
Trước hết, ta vẽ ba trục tọa độ vuông góc với nhau tại gốc O. Trục OX biểu diễn chiều cao, trục OY biểu diễn cân nặng, và trục OZ biểu diễn tuổi.
Trên trục OX, ta lấy điểm có hoành độ bằng 190. Từ điểm này, kẻ một đường thẳng song song với mặt phẳng YOZ.
Trên trục OY, ta lấy điểm có tung độ bằng 90, rồi kẻ một đường thẳng song song với mặt phẳng XOZ.
Tương tự, trên trục OZ, ta lấy điểm có cao độ bằng 81 và kẻ một đường thẳng song song với mặt phẳng XOY.
Ba đường thẳng này sẽ cắt nhau tại một điểm duy nhất, gọi là điểm A(190,90,81). Điểm A chính là vị trí của mẫu dữ liệu trong không gian ba chiều.
Khi nối gốc tọa độ O(0,0,0) với điểm A, ta thu được vector OA. Vector này chính là biểu diễn hình học của dữ liệu [190,90,81]. Trong học máy, người ta thường không tách biệt điểm A và vector OA, mà coi trực tiếp [190,90,81] là vector đặc trưng đại diện cho một mẫu dữ liệu.

Không gian
Tôi vẫn nhớ chút về toán học thời cấp 3, ta đã quen với các khái niệm không gian 1 chiều, 2 chiều, 3 chiều gắn liền với các hệ trục tọa độ ox, oxy, oxyz ….
- Với không gian 1 chiều, ta chỉ cần một trục số. Mỗi con số biểu diễn một vị trí trên trục đó.
- Với không gian 2 chiều, ta dùng hai trục vuông góc nhau, thường gọi là trục Ox và Oy. Mỗi điểm được xác định bởi một cặp số (x,y).
- Với không gian 3 chiều, ta thêm trục Oz, và một điểm trong không gian được xác định bởi bộ ba (x,y,z).
Nói một cách đơn giản, số chiều của không gian chính là số trục tọa độ cần dùng để xác định vị trí của một điểm.
Khi học AI, khái niệm không gian này không thay đổi, chỉ khác ở chỗ: các trục tọa độ không còn biểu diễn chiều dài, chiều rộng hay chiều cao, mà biểu diễn các thuộc tính của dữ liệu. Như đã ví dụ ở trên, tôi có tổng thống Mỹ Đỗ Nam Trump [chiều cao, cân nặng, tuổi] = [190, 90, 81], đây là 3 chiều và ta có thêm hàng loạt chiều vào bên trong dãy số trên.







