Ví dụ: Luyện tập: Trí tuệ nhân tạo cơ bản
Giới thiệu bài học Chào các em, sau khi đã tìm hiểu về khái niệm Trí tuệ nhân tạo (AI) cơ bản, hôm nay chúng ta sẽ cùng nhau đi sâu vào một trong những quy trình quan trọng nhất để tạo ra một hệ thống AI: đó là luyện tập (training) . Luyện tập giống như việc chúng ta dạy một đứa
Giới thiệu bài học
Chào các em, sau khi đã tìm hiểu về khái niệm Trí tuệ nhân tạo (AI) cơ bản, hôm nay chúng ta sẽ cùng nhau đi sâu vào một trong những quy trình quan trọng nhất để tạo ra một hệ thống AI: đó là luyện tập (training). Luyện tập giống như việc chúng ta dạy một đứa trẻ học một điều mới. Đầu tiên, chúng ta đưa ra các ví dụ, giải thích và sau đó kiểm tra lại. Một mô hình AI cũng hoạt động tương tự như vậy. Bài học này sẽ giúp các em hiểu được bản chất của quá trình luyện tập thông qua một ví dụ minh họa từng bước cụ thể.
Lý thuyết: Quy trình luyện tập một mô hình AI cơ bản
Luyện tập (training) là quá trình một mô hình AI "học" từ dữ liệu có sẵn để có thể đưa ra dự đoán hoặc quyết định chính xác trên dữ liệu mới. Quy trình này thường gồm các bước cơ bản sau:
- Bước 1: Thu thập dữ liệu: Đây là bước đầu tiên và quan trọng nhất. Chúng ta cần có một bộ dữ liệu đầu vào (input) và đầu ra (output) tương ứng để làm "sách giáo khoa" cho máy tính. Dữ liệu càng đa dạng và chính xác thì mô hình học càng tốt.
- Bước 2: Chọn mô hình: Chọn một loại "bộ não" cho máy tính. Với các bài toán đơn giản, chúng ta có thể dùng các công thức toán học.
- Bước 3: Đưa dữ liệu vào và so sánh: Cho mô hình "nhìn" dữ liệu đầu vào để nó đưa ra dự đoán. Sau đó, so sánh dự đoán đó với kết quả thực tế (output) mà chúng ta đã có.
- Bước 4: Điều chỉnh mô hình: Dựa vào sự khác biệt (sai số) giữa dự đoán và kết quả thực tế, chúng ta sẽ "chỉnh sửa" bộ não (các tham số của mô hình) để lần sau nó dự đoán chính xác hơn.
- Bước 5: Lặp lại: Lặp lại bước 3 và 4 nhiều lần với nhiều bộ dữ liệu khác nhau cho đến khi mô hình đưa ra dự đoán đủ chính xác. Khi đó, ta nói mô hình đã được luyện tập xong.
Ví dụ minh họa từng bước: Dự đoán điểm thi dựa trên số giờ học
Để hiểu rõ hơn, chúng ta sẽ cùng nhau thực hành một ví dụ đơn giản: Dự đoán điểm thi của một học sinh dựa trên số giờ học của bạn ấy.
Bước 1: Thu thập dữ liệu
Giả sử chúng ta có dữ liệu của 3 học sinh như sau:
- Học sinh A: Học 2 giờ, điểm thi: 4.
- Học sinh B: Học 4 giờ, điểm thi: 6.
- Học sinh C: Học 6 giờ, điểm thi: 8.
Bước 2: Chọn mô hình
Vì dữ liệu có vẻ như có một mối quan hệ thẳng (càng học nhiều, điểm càng cao), chúng ta chọn một mô hình đơn giản nhất: Mô hình đường thẳng (tuyến tính). Công thức của nó là: Điểm = w * (Số giờ học) + b. Ở đây, w và b là hai tham số mà mô hình sẽ tự học. Ban đầu, ta chưa biết chúng là gì, nên sẽ gán cho chúng một giá trị ngẫu nhiên. Ví dụ: w = 1.0 và b = 0.
Bước 3: Đưa dữ liệu vào và so sánh (Dự đoán lần 1)
Chúng ta đưa học sinh A (2 giờ) vào mô hình ban đầu:
Dự đoán của mô hình: Điểm_dự_đoán = 1.0 * 2 + 0 = 2 điểm.
Kết quả thực tế của học sinh A là: 4 điểm.
Sai số: 4 - 2 = 2 điểm. Mô hình đã dự đoán thấp hơn thực tế 2 điểm.
Bước 4: Điều chỉnh mô hình
Vì mô hình dự đoán thấp hơn thực tế, chúng ta cần tăng giá trị dự đoán lên. Có hai cách:
- Tăng tham số w (hệ số góc). Ý nghĩa: Cứ mỗi giờ học, điểm sẽ tăng nhiều hơn.
- Tăng tham số b (điểm gốc). Ý nghĩa: Dù không học, điểm cũng cao hơn một chút.
Trong ví dụ này, chúng ta sẽ điều chỉnh tăng cả hai tham số một chút. Ví dụ: w = 1.2 và b = 1.
Bước 5: Lặp lại (Dự đoán lần 2)
Chúng ta lại đưa học sinh A (2 giờ) vào mô hình đã điều chỉnh:
Dự đoán của mô hình: 1.2 * 2 + 1 = 3.4 điểm.
So với thực tế 4 điểm, sai số bây giờ là: 4 - 3.4 = 0.6 điểm. Đã tốt hơn so với lần đầu.
Chúng ta tiếp tục điều chỉnh và lặp lại. Sau vài lần, mô hình có thể đạt đến trạng thái dự đoán gần với thực tế, ví dụ dự đoán được 3.9 hoặc 4.1. Lúc này, mô hình cũng bắt đầu dự đoán tốt hơn cho học sinh B và C.
Ghi nhớ
- Luyện tập là quá trình "học" từ dữ liệu thông qua việc lặp lại và điều chỉnh.
- Dữ liệu càng nhiều và càng tốt, mô hình càng thông minh.
- Sai số là khoảng cách giữa dự đoán và thực tế, mục tiêu của luyện tập là làm cho sai số này ngày càng nhỏ.
- Sau khi được luyện tập, mô hình có thể áp dụng để dự đoán cho những dữ liệu mới mà nó chưa từng thấy (ví dụ: một bạn học 5 giờ thì sẽ được bao nhiêu điểm?).
Bài tập gợi ý
- Bài tập 1: Em hãy quan sát dữ liệu trong ví dụ trên. Nếu một bạn học 5 giờ, theo em mô hình sau khi luyện tập tốt có thể dự đoán bạn ấy được khoảng bao nhiêu điểm? Hãy thử suy luận bằng lý thuyết.
- Bài tập 2: Giả sử có một bạn học sinh D: Học 8 giờ nhưng điểm thi chỉ được 5. Theo em, dữ liệu này có "tốt" không? Khi thêm dữ liệu này vào, mô hình có thể gặp khó khăn gì? Hãy giải thích.