Câu hỏi trang 134 Khởi động (KĐ)
Khi truy cập tài khoản thư điện tử, ngoài các thư trong Hộp thư đến (Inbox) em có thể thấy nhiều thư được tự động phân loại vào Hộp thư rác (Spam). Hãy quan sát Hình 25.1 và cho biết việc phân loại này được thực hiện như thế nào.
Quan sát hình 25.1 kết hợp với kiến thức thực tế để trả lời.
Việc phân loại thư vào Hộp thư rác (Spam) thông qua quá trình sau:
- Hộp thư đến (Inbox): Đây là nơi nhận và hiển thị tất cả các thư đến.
- Bộ lọc thư: Bộ lọc thư là một công cụ hoặc hệ thống được sử dụng để xác định xem một thư điện tử có phải là thư rác hay không. Bộ lọc này có thể sử dụng các quy tắc và thuật toán để phân tích nội dung và thông tin của thư.
- Thư rác: Các thư được xác định là thư rác sẽ được tự động chuyển vào Hộp thư rác (Spam). Điều này giúp người dùng tách biệt giữa các thư quan trọng và thư không mong muốn hoặc có tính spam.
Câu hỏi trang 134 Hoạt động (HĐ)
Bộ lọc thư điện tử, thường là tập hợp các quy tắc, được thiết kế để phát hiện và đánh dấu các thư rác trước khi chúng được chuyển vào hộp thư của người dùng. Có quy tắc chỉ đơn giản là trong nội dung hoặc tiêu đề thư có các cụm từ đáng ngờ như “miễn phí”, “giảm giá”, “rẻ bất ngờ”.... hay địa chỉ thư của người gửi hoặc địa chỉ của máy chủ gửi thư thuộc vào một “danh sách đen” xác định. Theo em, có thể xây dựng các bộ lọc thư này bằng cách nào?
Dựa vào kiến thức của bản thân kết hợp tìm kiếm thông tin để trả lời câu hỏi.
Để xây dựng bộ lọc thư điện tử, có thể sử dụng các phương pháp học máy.
Câu hỏi trang 136 Câu hỏi 1
Chọn phương án đúng. Học máy là:
A. Chương trình máy tính có khả năng đưa ra quyết định hay dự đoán dựa trên dữ liệu.
B. Khả năng phân tích dữ liệu thu nhận được của máy tính để đưa ra dự đoán hoặc quyết định dựa trên các quy tắc được xác định rõ ràng.
C. Việc sử dụng các phương pháp và kỹ thuật cho phép máy tính học từ dữ liệu để đưa ra dự đoán hoặc quyết định mà không cần lập trình cụ thể.
D. Chương trình máy tính có khả năng tự cải thiện hiệu suất thực hiện nhiệm vụ thông qua việc cập nhật các dữ liệu mới sau khi hoàn thành nhiệm vụ đó nhiều lần.
Các phương án đúng là: A và C.
Câu A là đúng: Chương trình máy tính có khả năng đưa ra quyết định hay dự đoán dựa trên dữ liệu.
Câu C là đúng: Học máy sử dụng phương pháp và kỹ thuật cho phép máy tính học từ dữ liệu để đưa ra dự đoán hoặc quyết định mà không cần lập trình cụ thể. Thay vì viết rõ ràng các quy tắc và hướng dẫn cho máy tính, chúng ta cung cấp dữ liệu huấn luyện và để máy tính tự học từ dữ liệu đó.
Câu hỏi trang 136 Câu hỏi 2
Tại sao cần chia dữ liệu học máy thành hai phần: dữ liệu huấn luyện và dữ liệu kiểm tra?
Chia dữ liệu học máy thành 2 phần nhằm giúp người sử dụng và thiết lập để dàng trong quá trình sử dụng.
Dữ liệu huấn luyện và dữ liệu kiểm tra được chia ra để đánh giá hiệu suất của mô hình học máy:
- Dữ liệu huấn luyện được sử dụng để huấn luyện mô hình, tức là mô hình học từ dữ liệu này để tìm ra các mẫu và quy luật trong dữ liệu.
- Dữ liệu kiểm tra được sử dụng để đánh giá hiệu suất của mô hình đã được huấn luyện.
Câu hỏi trang 136 Hoạt động (HĐ)
Trong Mục 1 em đã được giới thiệu một số ứng dụng thực tế của Học máy. Hãy kể tên một vài công việc mà ngày nay không thể thiếu vai trò của Học máy.
Dựa vào hiểu biết của bản thân và tìm kiếm trên Internet để trả lời.
Một số công việc mà ngày nay không thể thiếu vai trò của Học máy:
- Lọc thư rác.
- Chẩn đoán bệnh.
Advertisements (Quảng cáo)
- Phân tích thị trường.
- Nhận dạng tiếng nói.
- Nhận dạng chữ viết.
- Dịch tự động.
Câu hỏi trang 139 Câu hỏi
Vai trò quan trọng của Học máy trong các lĩnh vực khác nhau được thể hiện như thế nào?
Học máy có vai trò quan trọng trong nhiều lĩnh vực khác nhau và thể hiện sự quan trọng của nó qua nhiều khía cạnh.
Học máy có vai trò quan trọng trong nhiều lĩnh vực khác nhau và thể hiện sự quan trọng của nó qua các khía cạnh sau:
- Xử lý dữ liệu lớn: Học máy giúp xử lý lượng lớn dữ liệu trong thời gian thực một cách nhanh chóng và hiệu quả. Nó có khả năng tìm ra các mẫu và xu hướng quan trọng trong dữ liệu, giúp nhận diện thông tin hữu ích và tri thức ẩn trong dữ liệu đó.
- Tự động hóa nhiệm vụ phức tạp: Học máy cho phép tự động hóa các nhiệm vụ phức tạp mà trước đây đòi hỏi sự can thiệp của con người. Ví dụ, trong lĩnh vực lọc thư rác, học máy giúp xây dựng mô hình phân loại thư rác một cách tự động, giảm công sức và thời gian của người dùng.
- Chẩn đoán và dự đoán: Trong lĩnh vực y tế, học máy được sử dụng để xây dựng các mô hình chẩn đoán bệnh và dự đoán tình trạng sức khoẻ. Điều này giúp cải thiện khả năng chuẩn đoán của bác sĩ và đưa ra phương án điều trị phù hợp cho bệnh nhân.
- Phân tích và dự báo thị trường: Học máy có thể phân tích dữ liệu thị trường từ nhiều nguồn khác nhau để xác định xu hướng, dự báo biến động giá cả và hỗ trợ quyết định kinh doanh. Điều này giúp người đầu tư và nhà kinh doanh hiểu rõ hơn về thị trường và đưa ra các chiến lược đầu tư dựa trên thông tin phân tích.
- Nhận dạng và xử lý âm thanh và hình ảnh: Học máy giúp nhận dạng và xử lý các dạng bức ảnh, tiếng nói và chữ viết tay. Ví dụ, trong việc nhận dạng tiếng nói, học máy giúp xây dựng các mô hình nhận dạng và phân biệt tiếng nói của các người nói khác nhau.
- Dịch tự động: Học máy được sử dụng để xây dựng các mô hình dịch tự động, giúp dịch văn bản và tiếng nói từ một ngôn ngữ sang ngôn ngữ khác. Điều này giúp loại bỏ rào cản ngôn ngữ và tạo điều kiện cho giao tiếp và trao đổi thông tin đa ngôn ngữ.
Câu hỏi trang 136 Luyện tập (LT)
Tại sao có thể nói Học máy có vai trò không thể thiếu trong các ứng dụng mà dữ liệu không ngừng thay đổi theo thời gian? Hãy chỉ ra một vài minh họa cụ thể.
Học máy là một công cụ hữu ích, là một phần quan trọng của trí tuệ nhân tạo, đóng góp vào sự phát triển của nhiều ứng dụng thực tế.
Đưa ra ví dụ dựa trên hiểu biết của bản thân hoặc tìm kiếm trên Internet.
- Bởi vì học máy là một công cụ hữu ích, là một phần quan trọng của trí tuệ nhân tạo, đóng góp vào sự phát triển của nhiều ứng dụng thực tế.
- Một vài ví dụ cụ thể:
+ Xử lý dữ liệu lớn và thời gian thực: Học máy cho phép xử lý một lượng lớn dữ liệu một cách nhanh chóng và hiệu quả. Chương trình học máy có thể tự động xác định các mẫu và xu hướng quan trọng trong dữ liệu, giúp chúng ta hiểu rõ hơn về sự biến đổi và thay đổi trong dữ liệu theo thời gian.
+ Tự động hóa nhiệm vụ phức tạp: Trước đây, nhiều nhiệm vụ phức tạp đòi hỏi sự can thiệp của con người. Nhưng với học máy, chúng ta có thể tự động hoá các nhiệm vụ này. Ví dụ, học máy có thể tự động phát hiện thư rác trong email hoặc phân loại ảnh dựa trên nội dung.
+ Bổ sung tri thức và hỗ trợ chuyên gia: Học máy giúp chuyên gia và nhà nghiên cứu xây dựng và bổ sung tri thức. Chúng ta có thể học từ dữ liệu và áp dụng tri thức này vào các lĩnh vực như y học, tài chính, và khoa học tự nhiên.
+ Tự động cập nhật mô hình: Học máy không ngừng bổ sung dữ liệu và tự động cập nhật mô hình đã được huấn luyện. Điều này đặc biệt quan trọng trong các ứng dụng có dữ liệu đa dạng và thay đổi liên tục theo thời gian, ví dụ như phát hiện các mẫu thư rác mới, triệu chứng bệnh mới, hay bản dịch ngôn ngữ mới.
Câu hỏi trang 139 Vận dụng (VD)
Ngoài hai phương pháp học máy cơ bản nêu trong bài, một số tài liệu còn đề cập tới phương pháp học bán giám sát và học tăng cường. Hãy tìm hiểu về các phương pháp học máy này trên Internet.
Truy cập Internet và tìm hiểu về các phương pháp học máy.
- Học bán giám sát (Supervised Learning):
+ Trong học bán giám sát, mô hình được đào tạo trên dữ liệu có nhãn (gần nhãn) và không có nhãn (không gắn nhãn).
+ Dữ liệu gần nhân là những ví dụ mà chúng ta biết kết quả mong muốn (ví dụ: hình ảnh của mèo hoặc chó đã được gắn nhãn là “mèo” hoặc "chó”).
+ Mục tiêu là học cách dự đoán đúng kết quả cho các ví dụ mới chưa gặp trước đó.
+ Học bán giám sát thường được sử dụng trong xử lý ngôn ngữ tự nhiên, phân loại hình ảnh, và nhiều ứng dụng khác.
- Học tăng cường (Reinforcement Learning):
+ Trong học tăng cường, tác nhân (agent) tương tác với môi trường và nhận phần thưởng (hoặc hình phạt) dựa trên hành động của nó.
+ Mục tiêu là học cách thực hiện các hành động để tối đa hóa phần thưởng trong môi trường.
+ Học tăng cường thường được sử dụng trong chế tạo robot, chơi trò chơi, và các tác vụ tối ưu hóa.