Ví dụ: Luyện tập: Trí tuệ nhân tạo cơ bản
Giới thiệu bài học Chào các em! Trong bài học hôm nay, chúng ta sẽ bước vào phần Luyện tập của chương "Trí tuệ nhân tạo cơ bản". Sau khi đã tìm hiểu các khái niệm nền tảng về AI, giờ là lúc các em thực hành để hiểu rõ hơn cách máy tính có thể "học" từ dữ liệu. Chúng ta sẽ cùng nh
Giới thiệu bài học
Chào các em! Trong bài học hôm nay, chúng ta sẽ bước vào phần Luyện tập của chương "Trí tuệ nhân tạo cơ bản". Sau khi đã tìm hiểu các khái niệm nền tảng về AI, giờ là lúc các em thực hành để hiểu rõ hơn cách máy tính có thể "học" từ dữ liệu. Chúng ta sẽ cùng nhau xây dựng một ví dụ cụ thể, từng bước một, để thấy rõ quy trình luyện tập cho một mô hình trí tuệ nhân tạo đơn giản.
Lý thuyết: Quy trình luyện tập một mô hình AI
Luyện tập (training) là quá trình máy tính tự động điều chỉnh các tham số bên trong của nó dựa trên một tập dữ liệu mẫu, nhằm đưa ra dự đoán hoặc quyết định chính xác cho những dữ liệu mới. Quy trình này thường gồm 3 bước chính:
- Bước 1 – Chuẩn bị dữ liệu: Thu thập và gán nhãn cho dữ liệu. Dữ liệu thường được chia làm hai phần: dữ liệu huấn luyện (dùng để học) và dữ liệu kiểm tra (dùng để đánh giá).
- Bước 2 – Đưa dữ liệu vào mô hình: Máy tính nhận từng mẫu dữ liệu huấn luyện, thực hiện tính toán và đưa ra một dự đoán.
- Bước 3 – So sánh và điều chỉnh: So sánh kết quả dự đoán với nhãn đúng. Nếu sai, máy tính sẽ tự động điều chỉnh các tham số (ví dụ: trọng số) để lần sau dự đoán tốt hơn. Quá trình này lặp lại nhiều lần cho đến khi mô hình đạt độ chính xác mong muốn.
Ví dụ minh họa từng bước: Phân loại trái cây
Chúng ta sẽ xây dựng một mô hình AI đơn giản để phân biệt táo và cam dựa trên hai đặc điểm: độ tròn (thang điểm từ 1 đến 10) và màu sắc (1 là cam, 2 là đỏ).
Bước 1: Chuẩn bị dữ liệu
Chúng ta có 6 mẫu dữ liệu huấn luyện như sau:
- Mẫu 1: Độ tròn=9, Màu sắc=2 → Nhãn: Táo
- Mẫu 2: Độ tròn=8, Màu sắc=2 → Nhãn: Táo
- Mẫu 3: Độ tròn=7, Màu sắc=1 → Nhãn: Cam
- Mẫu 4: Độ tròn=6, Màu sắc=1 → Nhãn: Cam
- Mẫu 5: Độ tròn=5, Màu sắc=1 → Nhãn: Cam
- Mẫu 6: Độ tròn=10, Màu sắc=2 → Nhãn: Táo
Chúng ta tạm quy ước: Táo = 1, Cam = 0.
Bước 2: Đưa dữ liệu vào mô hình
Giả sử mô hình của chúng ta chỉ đơn giản là một công thức tính điểm: Điểm = (Độ tròn × 0,2) + (Màu sắc × 0,5). Nếu điểm >= 2,5 thì kết luận là Táo (1), ngược lại là Cam (0). Ban đầu các tham số (0,2 và 0,5) được chọn ngẫu nhiên.
Xét mẫu đầu tiên: Độ tròn = 9, Màu sắc = 2.
Tính điểm: (9 × 0,2) + (2 × 0,5) = 1,8 + 1,0 = 2,8.
Vì 2,8 >= 2,5 nên mô hình dự đoán: "Đây là Táo".
Kết quả đúng với nhãn thật (Táo). Vậy mô hình không cần điều chỉnh cho mẫu này.
Xét mẫu thứ 3: Độ tròn = 7, Màu sắc = 1.
Tính điểm: (7 × 0,2) + (1 × 0,5) = 1,4 + 0,5 = 1,9.
Vì 1,9 < 2,5 nên mô hình dự đoán: "Đây là Cam".
Đúng với nhãn thật (Cam). Mô hình vẫn ổn.
Bước 3: So sánh và điều chỉnh
Xét mẫu thứ 5: Độ tròn = 5, Màu sắc = 1.
Tính điểm: (5 × 0,2) + (1 × 0,5) = 1,0 + 0,5 = 1,5.
Dự đoán: Cam. Đúng.
Xét mẫu thứ 6: Độ tròn = 10, Màu sắc = 2.
Tính điểm: (10 × 0,2) + (2 × 0,5) = 2,0 + 1,0 = 3,0.
Dự đoán: Táo. Đúng.
Vậy với bộ tham số hiện tại, mô hình dự đoán đúng cả 6 mẫu. Tuy nhiên, nếu có mẫu mới, ví dụ: Độ tròn = 7, Màu sắc = 2 (một quả táo hơi méo nhưng màu đỏ), ta tính: (7×0,2)+(2×0,5)=1,4+1,0=2,4 < 2,5 → dự đoán Cam – sai! Lúc này, mô hình phải điều chỉnh tham số, ví dụ tăng hệ số của màu sắc lên 0,6, để lần sau dự đoán đúng hơn.
Như vậy, quá trình luyện tập là lặp lại liên tục: dự đoán → so sánh → điều chỉnh tham số, cho đến khi mô hình đạt độ chính xác cao trên cả dữ liệu huấn luyện lẫn dữ liệu kiểm tra.
Ghi nhớ
- Luyện tập là quá trình máy tính tự học từ dữ liệu mẫu để cải thiện khả năng dự đoán.
- Ba bước cơ bản: chuẩn bị dữ liệu, đưa dữ liệu vào mô hình và so sánh – điều chỉnh.
- Mô hình càng được luyện tập với nhiều dữ liệu chất lượng thì càng thông minh và chính xác.
- Dữ liệu huấn luyện và dữ liệu kiểm tra phải tách biệt để đánh giá đúng năng lực thực sự của mô hình.
Bài tập gợi ý
- Em hãy mô tả quy trình luyện tập một mô hình AI để phân biệt chó và mèo dựa trên đặc điểm "chiều dài lông" và "kích thước tai". Hãy tự đưa ra 4 mẫu dữ liệu giả định và thực hiện bước dự đoán như ví dụ trên.
- Giả sử một mô hình dự đoán đúng 5/6 mẫu trong tập huấn luyện nhưng chỉ đúng 3/6 mẫu trong tập kiểm tra. Theo em, vấn đề gì đã xảy ra? Làm thế nào để khắc phục?
- Nếu chúng ta thay đổi ngưỡng điểm từ 2,5 lên 2,8 trong ví dụ trái cây, hãy kiểm tra lại kết quả dự đoán của mẫu thứ 1 và mẫu thứ 6. Có sự khác biệt không?