Sự phát triển của trí tuệ nhân tạo những năm gần đây ảnh hưởng mạnh tới nhiều lĩnh vực, gắn liền với nó là thuật ngữ công nghệ machine learning.
Trong suy nghĩ phổ biến, AI hay học máy thường được hiểu rằng máy móc có khả năng tiếp thu kiến thức và suy nghĩ, hành động giống như người. Điều đó có thực sự chính xác? Học máy là gì, vì sao các nhà khoa học lại đầu tư phát triển công nghệ này?
Thuở còn đi học, đa phần chúng ta thường sợ nhất là các môn học thuộc lòng và không hiểu vì sao trí nhớ của mình chỉ tồn tại trong đầu đúng từ tối hôm trước đến hết tiết kiểm tra của ngày hôm sau.
Rõ ràng, luôn có sự phân biệt hiện tượng học vẹt và học thực sự. Khi bạn nhớ mà không hiểu bản chất, đó là học vẹt. Nếu bên cạnh việc nhớ, bạn hiểu và có thể áp dụng các kiến thức đó trong những công việc, bài học khác, đó là học thật.
Máy học cũng tương tự. Máy tính nếu chỉ lưu trữ dữ liệu mà không thể xử lý, nó chỉ là bộ nhớ thông thường. Nhưng nếu bên cạnh việc lưu trữ, máy có thể khai phá và xử lý dữ liệu, tự đưa ra quyết định, nó sẽ được gọi là máy học.
Cơ chế của học máy
Machine Learning là một dạng chương trình mà bạn có thể đưa bất kỳ dữ liệu đầu vào (số, chữ, âm thanh, ký hiệu…) vào đó, và chương trình sẽ suy luận kết quả đầu ra.
Với bất kỳ dữ liệu đầu vào nào, Machine Learning đều có thể đưa ra kết quả dự báo và độ chính xác của dự báo phụ thuộc vào lượng dữ liệu đầu vào. Trong Machine Learning, tập dữ liệu đầu vào thường được gọi với các tên như tập huấn luyện, tập dữ liệu mẫu, tập quan sát. Số lượng dữ liệu của tập huấn luyện càng lớn thì kết quả dự báo của Machine Learning càng chính xác.
Sau dữ liệu, thuật toán chính là công cụ để học máy thực hiện việc phân tích dữ liệu và suy luận ra kết quả. Đây chính là những “người thầy” của máy.
Việc lựa chọn một giải thuật phù hợp cho một bài toán học máy là bước khá quan trọng. Lựa chọn thuật toán phụ thuộc vào bản thân của tập dữ liệu. Không phải cứ thuật toán phức tạp là hiệu quả sẽ cao. Đối với những tập dữ liệu đơn giản thì không cần phải dạy bằng một thuật toán quá phức tạp. Mỗi thuật toán đều có ưu và nhược điểm riêng đối với từng tập dữ liệu. Việc áp dụng và phát huy như thế nào là tùy theo nhận định của con người.
Ví dụ, bạn có thông tin về số lượng giày của một thương hiệu nào đó được bán ra thị trường quốc tế từ tháng 1 tới tháng 11/2018 và bạn muốn dự đoán nhu cầu thị trường thế giới trong tháng 12. Điều này hoàn toàn khả thi nhờ Machine Learning. Tập dữ liệu đầu vào sẽ được nhập vào máy tính và chạy trên một thuật toán nhất định. Kết quả đầu ra sẽ là thông tin mà bạn cần. Quy luật của thị trường được máy tính tự tìm ra và các con số dự báo ra đời.
Ứng dụng của học máy
Học máy là sự giao thoa giữa thống kê cổ điển với khoa học máy tính. Một mục tiêu quan trọng của ngành học máy là làm sao để máy tính thông minh hơn, có khả năng học hỏi và hình thành tri thức một cách tự động từ kinh nghiệm và trở nên hữu ích hơn trong giao tiếp với con người.
Đây cũng là một trong những mục tiêu ban đầu của ngành học máy, vào những năm 1950 trong thế kỷ trước. Giờ đây, sau nhiều năm phát triển và đặc biệt trong quãng 5 – 10 năm trở lại đây, học máy đã được ứng dụng trong rất nhiều lĩnh vực của xã hội.
Học máy có một vai trò quan trọng với mọi Chính phủ trên toàn cầu, trong việc phân tích và dự báo dữ liệu thông tin quốc gia, từ quốc phòng – an ninh tới y tế, tài chính, kinh doanh…
Dữ liệu luôn được thu thập liên tục bằng rất nhiều phương tiện trong từng giây. Những bộ dữ liệu quý giá này sẽ được xử lý bởi hệ thống học máy. Thông tin sau khi xử lý, phân tích chính xác và đưa ra những chỉ báo hiệu quả sẽ mang lại rất nhiều giá trị và lợi thế cho quốc gia đó.
Ví dụ, các dữ liệu tài chính xử lý qua học máy sẽ giúp con người dự báo các dữ liệu tương lai và từ đó, nắm được quy luật vận hành của thị trường. Ô tô tự lái thu thập thông tin trên đường phố từ camera vận hành và hệ thống tín hiệu giao thông, từ đó ra quyết định nên đi hay dừng, rẽ hay lùi để đưa người đến địa điểm an toàn trong thời gian ngắn nhất…
Có thể nói, trong tương lai, học máy sẽ phủ khắp mọi lĩnh vực trong cuộc sống, miễn là nơi đó có dữ liệu. Nhờ có học máy, thời tiết sẽ được dự báo chính xác hơn. Trong y tế, thông tin bệnh nhân được quản lý sâu tới nguồn gen và hỗ trợ bác sĩ lên phác đồ điều trị phù hợp. Các kênh đầu tư sẽ có thêm nhiều gợi ý chính xác hơn.
Tuy nhiên, để máy tính học tốt, nó phải có khả năng xử lý dữ liệu tốt hơn: dữ liệu đến từ việc giao tiếp với người và giao tiếp giữa những loại thiết bị máy móc với nhau. Khi máy giao tiếp với người, nó phải tiếp nhận được dữ liệu mà người cung cấp cho máy, hiểu những thông tin mà con người truyền đạt cho nó.
Cái cốt lõi của học máy cũng chính là vấn đề suy diễn từ dữ liệu. So với thống kê cổ điển, điều mới là máy phải thực hiện một cách hiệu quả các phép suy diễn và học tập từ dữ liệu bằng các thuật toán hiệu quả và cơ sở quản lý dữ liệu đồ sộ của máy tính. Do đó học máy cũng được xem là một trong những lĩnh vực tiên phong của thống kê hiện đại nói riêng và khoa học dữ liệu nói chung.
Với sự phát triển của dữ liệu lớn và các thuật toán xử lý, khi khai thác hết tiềm năng của học máy, con người sẽ có sự hỗ trợ hiệu quả từ máy móc để phân tích và xử lý những thông tin có thể là quá tải với bộ não của con người.
Theo VnExpress