Học, máy học và AI (Phần I).
1. Học, học suy luận và học máy là gì?
Trước tiên chúng ta cùng xem một số ví dụ sau để minh họa cho việc học, theo những cách học khác nhau.
Ví dụ:
- Trẻ nhỏ học nói bằng cách quan sát, lắng nghe, lặp lại và bắt chước các cụm từ của người lớn. Cách học của chúng là học quy nạp.
- Ở trường phổ thông, chúng ta học toán, vật lý, sinh học, hóa học bằng cách làm theo hướng dẫn của giáo viên và những chỉ dẫn trong sách giáo khoa. Chúng ta tìm hiểu các quy tắc chung và áp dụng chúng cho các trường hợp cụ thể. Kiểu học này là học suy luận.
- Các nhà vật lý thực nghiệm thiết kế các thí nghiệm và quan sát kết quả của các thí nghiệm để xác nhận hoặc phản biện một phỏng đoán về bản chất của các vật thể quan sát được. Loại hình học tập này là học tập quy nạp.
Vậy chúng ta có thể thấy:
Học là một quá trình thu nhận kiến thức mới bằng cách kiểm tra dữ liệu thực nghiệm của những điều ta quan sát được. Việc học sẽ thành công nếu kiến thức có thể được kiểm tra với dữ liệu mới. Máy học là một quá trình học tập được tự động hóa
Theo Russell và Norvig trong cuốn sách Artificial Intelligence: A Modern Approach:
"Một tác nhân (người, rô bốt, máy móc) đang học hỏi nếu nó cải thiện hiệu suất của mình đối với các nhiệm vụ trong tương lai sau khi quan sát thế giới."
Vapnik đã đưa ra một định nghĩa toán học như sau:
"Học tập là một bài toán ước lượng hàm trên cơ sở dữ liệu thực nghiệm."
Theo ngôn ngữ toán học, kinh nghiệm là dữ liệu thực nghiệm và kiến thức là ước lượng hàm.
Một ví dụ cổ điển của việc học là xây dựng một đường cong phù hợp với dữ liệu. Giả sử ta cần tìm một định luật, một hàm chưa biết: $f: R \rightarrow R$ có dạng cụ thể và không gian của tất cả các hàm có dạng này có thể được tham số hóa bởi N số thực. Ví dụ, nếu f được giả sử là một đa thức bậc d, thì N = d + 1 và các tham số là hệ số $w_0, w_1, ...., w_d$ của f. Trong trường hợp này, việc tìm kiếm các hệ số phù hợp nhất bằng phương pháp bình phương tối thiểu (least square) ước tính $f$ chưa biết, từ một tập các cặp $( x_1, y_1 ), ...., (x_m, y_m) $.
Người ta tính toán vectơ của hệ số $w$ sao cho giá trị:
$\Sigma_{i=1}^{m} (f_w(x_i)-y_i)^2$ với $f_w(x_i) = \Sigma_{j=0}^{d} w_j x_{ij}$
là cực tiểu khi, thường là m > N. Nếu trong trường hợp lý tưởng, thì $f(x_i)$ sẽ bằng $y_i$. Nhưng nói chung, các giá trị $y_i$ sẽ bị ảnh hưởng bởi nhiễu. Kỹ thuật bình phương nhỏ nhất, với những phát kiến của Gauss và Legendre, là kỹ thuật tính toán hiệu quả và dựa trên đại số tuyến tính.
2. Lịch sử của máy học và AI.
• Năm 1945 Vannevar Bush đề xuất trong bài viết “As We May Think” xuất bản trên tạp chí “The Atlantic”, một hệ thống khuếch đại kiến thức và hiểu biết của chính mọi người. Bush và các cộng sự dựa trên những gì được cho là, vào thời điểm đó, là công nghệ tiên tiến của tương lai: Cuộn phim có độ phân giải cực cao, được kết hợp với nhiều người xem màn hình và máy ảnh, bằng các điều khiển cơ điện. Thông qua cỗ máy này, Bush hy vọng có thể biến một sự bùng nổ thông tin thành bùng nổ tri thức.
• Năm 1948 John von Neumann nói rằng máy móc có thể làm bất cứ điều gì mà con người có thể làm.
• Năm 1950 Alan Turing đặt ra câu hỏi "Máy móc có suy nghĩ được không?" trong “Máy tính và trí thông minh” và đề xuất bài kiểm tra Turing nổi tiếng. Bài kiểm tra được thực hiện như một trò chơi bắt chước. Ở một bên là một con người, người có nhiệm vụ trò chuyện với một game thủ vô danh ở phía bên kia. Hầu hết những game thủ đó sẽ là con người; nhưng một trong số đó sẽ là một chatbot với mục đích đánh lừa, cho người bên kia nghĩ rằng đó là con người thật.
• 1956 John McCarthy đã đặt ra thuật ngữ trí tuệ nhân tạo.
• 1959, Arthur Samuel, nhà tiên phong người Mỹ trong lĩnh vực máy tính chơi game và trí tuệ nhân tạo, đã định nghĩa máy học là một lĩnh vực nghiên cứu cung cấp cho máy tính khả năng học hỏi mà không cần được lập trình rõ ràng. Chương trình chơi cờ caro dường như là chương trình tự đào tạo đầu tiên trên thế giới và là một minh chứng rất sớm về khái niệm cơ bản của trí tuệ nhân tạo (AI). Tuy nhiên, việc chú trọng ngày càng nhiều vào phương pháp tiếp cận dựa trên tri thức, hợp lý đã gây ra rạn nứt giữa AI và máy học. Các hệ thống xác suất bị cản trở bởi các vấn đề lý thuyết và thực tế về thu thập và biểu diễn dữ liệu, vốn là vấn đề nan giải vì dung lượng bộ nhớ phần cứng nhỏ và tốc độ máy tính chậm vào thời điểm đó.
• Đến năm 1980, các hệ thống chuyên gia đã thống trị AI, và số liệu thống kê không còn được ưa chuộng. Hệ thống chuyên gia sử dụng ý tưởng rằng “các hệ thống thông minh có được sức mạnh của chúng từ kiến thức mà chúng sở hữu hơn là từ các hình thức và sơ đồ suy luận cụ thể”. Công việc học tập dựa trên kiến thức nền đã tiếp tục trong AI, dẫn đến lập trình logic quy nạp. Nghiên cứu mạng Neuron đã bị AI và khoa học máy tính từ bỏ cùng thời gian. Thành công chính của chúng đến vào giữa những năm 1980 với việc phát minh lại một thuật toán trong mạng Neuron, nhờ vào việc tăng tốc độ máy tính và tăng bộ nhớ phần cứng. Học máy, được tổ chức lại như một lĩnh vực riêng biệt, bắt đầu phát triển mạnh mẽ vào những năm 1990.
• AI ~ ML: Giải quyết các vấn đề có thể giải quyết được có tính chất thực tế.
• Các phương pháp và mô hình vay mượn từ thống kê và lý thuyết xác suất. Thuyết xác định Laplacian dẫn đến mô hình xác suất của các vật thể quan sát ngẫu nhiên - sự thay đổi mô hình mới trong khoa học.
• Xu hướng hiện nay là được hưởng lợi từ Internet. Trong cuốn sách của Russel và Norvig “Artificial Intelligence: A Modern Approach” (2010) AI bao gồm các phần sau:
- Xử lý ngôn ngữ tự nhiên,
- Biểu diễn tri thức,
- Lập luận tự động để sử dụng thông tin được lưu trữ để trả lời các câu hỏi và đưa ra kết luận mới;
- Máy học để thích ứng với hoàn cảnh mới và để phát hiện và ngoại suy các mẫu,
- Thị giác máy tính để nhận thức các đối tượng,
- Người máy.
Tất cả các lĩnh vực trí tuệ nhân tạo được liệt kê ở trên ngoại trừ biểu diễn tri thức và người máy hiện được gộp lại thành lĩnh vực học máy. Phát hiện và nhận dạng mẫu đã và vẫn được coi là lĩnh vực khai thác dữ liệu nhưng chúng trở nên đa dạng hơn và nhiều phần khác của máy học.
Do đó AI = biểu diễn tri thức + ML + người máy.
• Học đại diện (Repréntation learning), một từ mới để biểu thị kiến thức nhưng có hương vị khác, là một phần của ML.
• Robotics = ML + phần cứng.
Tại sao một bước chuyển từ trí tuệ nhân tạo sang học máy lại xảy ra như vậy?
Câu trả lời là chúng ta có thể hình thức hóa hầu hết các khái niệm và mô hình hóa vấn đề của trí tuệ nhân tạo bằng ngôn ngữ toán học và biểu diễn cũng như thống nhất chúng theo cách mà chúng ta có thể áp dụng các phương pháp toán học để giải quyết nhiều vấn đề về thuật toán mà máy có thể trình diễn.
Bài đã dài nên tôi xin phép được tạm dừng tại đây, trong phần 2 chúng ta sẽ đề cập đến các xu hướng hiện tại của Học Máy.
Thank Ms LHV for material.