Tổng quan¶

1 Học máy là gì?
2 Tại sao sử dụng Học máy?
3 Học máy có những loại nào?
4 Tài liệu tham khảo

1 Học máy là gì?¶

Học Máy ( Machine Learning ) là lĩnh vực con của Trí Tuệ Nhân Tạo ( Artificial Intelligence - AI). Mục tiêu của Học Máy là hiểu cấu trúc của dữ liệu ( data ) và xử lý dữ liệu để tạo ra các mô hình ( model ) thực hiện các công việc cụ thể. Nếu trong các phương pháp tiếp cận truyền thống, thuật toán là một tập hợp các tri thức và quy luật được lập trình rõ ràng thì ở đây các thuật toán machine learning sẽ tự học các tri thức và quy luật đó từ dữ liệu đầu vào.

Arthur Samuel định nghĩa Học Máy như sau:

[Machine Learning is the] field of study that gives computers the ability to learn without being explicitly programmed.

      Arthur Samuel, 1959

Ứng dụng đầu tiên của Học máy là chương trình lọc thư rác (spam filter). Nó đã giúp cải thiện cuộc sống của hàng trăm triệu người và phổ biến trên toàn thế thời từ thập niên 1990. Nó là tiền đề phát triển cho hàng trăm ứng dụng Học máy khác như hệ thống khuyến nghị, nhận dạng giọng nói, nhận dạng khuôn mặt,...

2 Tại sao sử dụng Học máy?¶

Cách tiếp cận cũ cho các vấn đề yêu cầu nhiều sự can thiệp thủ công từ con người, yêu cầu phải có một hệ thống tập luật rất dài. Đối với Học máy, việc tiếp cận trở nên dễ dàng hơn cho việc lập trình và cho kết quả tốt hơn vì chương trình Học máy có thể tự động mô hình hoá, nhận biết được các luật mới dựa trên dữ liệu đầu vào.

Các vấn đề phức tạp mà chưa có lời giải tốt bằng cách tiếp cận truyền thống có thể tìm được lời giải tốt bằng kỹ thuật Học máy.

Chương trình học máy có thể điều chỉnh để thích ứng với dữ liệu mới và nhận thông tin chuyên sâu về các vấn đề phức tạp với lượng lớn dữ liệu.

3 Học máy có những loại nào?¶

Có bốn loại thuật toán Học máy chính: Học có giám sát (supervised learning), học không có giám sát (unsupervised learning), học bán giám sát (semisupervised learning), học tăng cường (Reinforcement learning).

3.1 Học có giám sát¶

Trong học có giám sát, thuật toán cần được học dựa trên dữ liệu đầu vào được gán nhãn. Có hai loại chính là:

Phân lớp (Classification): tập hợp các giá trị nhãn là hữu hạn và rời rạc. Ví dụ: phân loại các loại xe cộ (xe bus, xe hơi, xe máy,...), chương trình lọc thư rác, khách hàng có khả năng thanh toán nợ hay không, ...


Lọc thư rác

Hồi quy (Regression): tập hợp các giá trị nhãn là liên tục. Ví dụ: dự đoán giá đất đai, dự đoán tuổi, ...


Hồi quy

Một số thuật toán học có giám sát tiêu biểu:

3.2 Học không có giám sát¶

Khác với học có giám sát, thuật toán học không có giám sát nhận dữ liệu đầu vào không có nhãn. Một số loại chính là:

Phân cụm (Clustering): được dùng trong việc khám phá những nhóm dữ liệu có mối tương đồng. Ví dụ: phân nhóm khách hàng có chung sở thích mua hàng.


Phân cụm

Giảm chiều dữ liệu (Dimension reduction): mục đích đơn giản hoá dữ liệu mà không mất đi những đặc trưng quan trọng. Một cách để làm điều này là hợp nhất những đặc trưng tương quan thành một. Ví dụ: số km đi được của một chiếc xe có tương quan cao với số tuổi của nó nên có thể kết hợp thành một đặc trưng như "sự hao mòn". Phương pháp này còn gọi là: trích xuất đặc trưng (feature extraction)

Biểu diễn tri thức (Knowledge/data representation): biểu diễn tri thức bằng các cấu trúc mà máy tính có thể sử dụng hiệu quả. Tác vụ này đôi khi là bước tiền xử lý cho các thuật toán machine learning khác.

Phát hiện bất thường (anomaly detection): ví dụ phát hiện sự bất thường trong giao dịch để phát hiện và ngăn chặn giao dịch trái phép.


Phát hiện bất thường

Một số thuật toán học không có giám sát:

3.3 Học bán giám sát¶

Một số thuật toán có thể hoạt động khi chúng ta có một lượng lớn dữ liệu nhưng chỉ một phần trong chúng được gán nhãn. Một ví dụ điển hình của thuật toán này là chỉ có một phần ảnh được gán nhãn và phần lớn còn lại chưa được gán nhãn được thu thập từ Internet.

3.4 Học tăng cường¶

Học tăng cường nghiên cứu các thuật toán để dạy agent tương tác với môi trường xung quanh (thực thi một tác vụ nào đó). Các agent có thể quan sát môi trường, lựa chọn hành động và nhận được phần thưởng (hoặc phạt) từ hành động đó. Được ứng dụng nhiều trong điều kiển robot và game. Ví dụ: DeepMind's AlphaGo nổi tiếng với việc chơi cờ vây thắng cả con người.