8 Ý tưởng Dự án Deep Learning cho người mới bắt đầu

(Weekly Study - Deep Learning) Bạn đã từng nghiên cứu các kỹ thuật Deep Learning, nhưng chưa bao giờ làm việc trên một dự án? Ở đây, chúng tôi đưa ra 8 ý tưởng dự án học sâu dành cho người mới bắt đầu sẽ giúp bạn rèn giũa các kỹ năng và bổ sung vào hồ sơ xin việc của mình.

8 Ý tưởng Dự án Deep Learning cho người mới bắt đầu

1. Nhận dạng giống chó

Có nhiều giống chó khác nhau và hầu hết chúng đều giống nhau. Khi mới bắt đầu, bạn có thể xây dựng mô hình nhận dạng giống Chó để xác định giống chó đó.

Đối với dự án này, bạn có thể sử dụng bộ dữ liệu về giống chó để phân loại các giống chó khác nhau từ một hình ảnh. Bạn có thể tải xuống bộ dữ liệu về giống chó từ Kaggle.

Chúng tôi cũng đã tìm thấy hướng dẫn đầy đủ này về Phân loại giống chó bằng cách sử dụng Học sâu của Kirill Panarin.

2. Nhận diện khuôn mặt

Đây cũng là một dự án học sâu tốt cho người mới bắt đầu. Trong dự án này, bạn phải xây dựng một mô hình học sâu phát hiện khuôn mặt người từ hình ảnh.

Nhận dạng khuôn mặt là công nghệ thị giác máy tính. Trong tính năng nhận diện khuôn mặt, bạn phải xác định vị trí và hình dung khuôn mặt người trong bất kỳ hình ảnh kỹ thuật số nào.

Bạn có thể xây dựng dự án này bằng Python bằng OpenCV. Đối với hướng dẫn đầy đủ hãy xem bài viết này, Real-time Face Recognition with Python & OpenCV.

3. Phát hiện bệnh cây trồng

Trong dự án này, bạn phải xây dựng một mô hình dự đoán dịch bệnh trên cây trồng bằng cách sử dụng hình ảnh RGB. Để xây dựng mô hình phát hiện bệnh trên cây trồng, Mạng thần kinh chuyển đổi (CNN) được sử dụng.

CNN chụp ảnh để xác định bệnh và phát hiện. Có nhiều bước khác nhau trong Mạng thần kinh chuyển đổi. Các bước sau là:

  • Convolution Operation.
  • ReLU Layer.
  • Pooling.
  • Flattening.
  • Full Connection.

Bạn có thể tải xuống bộ dữ liệu hình ảnh cây trồng nông nghiệp từ Kaggle.

4. Phân loại hình ảnh với Bộ dữ liệu CIFAR-10

Phân loại hình ảnh là dự án tốt nhất cho người mới bắt đầu. Trong một dự án phân loại hình ảnh, bạn phải phân loại hình ảnh thành các lớp khác nhau.

Đối với dự án này, bạn có thể sử dụng Bộ dữ liệu CIFAR-10, chứa 60.000 hình ảnh màu. Những hình ảnh này được phân loại thành 10 lớp, chẳng hạn như ô tô, chim, chó, ngựa, tàu, xe tải,...

Đối với dữ liệu đào tạo, có 50.000 hình ảnh và đối với dữ liệu thử nghiệm, 10.000 hình ảnh được sử dụng. Phân loại hình ảnh là một trong những ứng dụng được sử dụng nhiều nhất của học sâu. Bạn có thể tải xuống bộ dữ liệu CIFAR-10 tại đây. 

5. Nhận dạng chữ số viết tay

Để khám phá và kiểm tra kỹ năng học sâu của bạn, chúng tôi nghĩ đây là dự án tốt nhất để xem xét. Trong dự án này, bạn sẽ xây dựng một hệ thống nhận dạng có thể nhận dạng các chữ số viết tay của con người.

Bạn có thể xem hướng dẫn này về Nhận dạng chữ số viết tay bằng Python.

Hướng dẫn này sử dụng tập dữ liệu MNIST và một loại mạng thần kinh sâu đặc biệt là Mạng thần kinh kết hợp.

6. Phát hiện màu sắc

Đây là một dự án cấp độ người mới bắt đầu, nơi bạn phải xây dựng một ứng dụng tương tác. Ứng dụng này sẽ xác định màu đã chọn từ bất kỳ hình ảnh nào. Có 16 triệu màu dựa trên các giá trị màu RGB khác nhau, nhưng chúng ta chỉ biết một số màu.

Để thực hiện dự án này, bạn cần có một tập dữ liệu được gắn nhãn của tất cả các màu mà chúng ta biết, sau đó bạn cần tính toán màu nào giống nhất với giá trị màu đã chọn.

Để thực hiện dự án này, bạn nên làm quen với các thư viện Python của Computer Vision là OpenCV và Pandas.

Bạn có thể kiểm tra tất cả các chi tiết liên quan đến dự án này tại đây.

7. Hoạt ảnh thời gian thực

Đây là một dự án mã nguồn mở về thị giác máy tính. Trong dự án này, bạn phải thực hiện hoạt ảnh trong thời gian thực bằng OpenCV. Chúng tôi đã lấy hình ảnh này từ kho lưu trữ GitHub của dự án.

Như bạn có thể thấy trong hình ảnh, người mẫu bắt chước biểu cảm của người trước máy ảnh và thay đổi biểu cảm hình ảnh cho phù hợp.

Dự án này rất hữu ích, đặc biệt nếu bạn dự định tham gia vào ngành thời trang, bán lẻ hoặc quảng cáo.  Bạn cũng có thể kiểm tra mã của dự án này tại GitHub và  sổ ghi chép Colab

8. Phát hiện buồn ngủ khi lái xe

Tai nạn trên đường là một vấn đề nghiêm trọng, và nguyên nhân chính là do người lái xe buồn ngủ. Nhưng bạn có thể ngăn chặn vấn đề này bằng cách tạo một hệ thống phát hiện tình trạng buồn ngủ của người lái xe.

Hệ thống Phát hiện Buồn ngủ của Người lái xe phát hiện tình trạng buồn ngủ của người lái xe bằng cách liên tục đánh giá mắt của người lái xe và cảnh báo anh ta bằng chuông báo.

Đối với dự án này, một webcam là cần thiết để giám sát đôi mắt của người lái xe. Python, OpenCV và Keras  được sử dụng để cảnh báo người lái xe khi anh ta cảm thấy buồn ngủ.

Bạn có thể xem hướng dẫn dự án hoàn chỉnh này tại đây, Hệ thống phát hiện buồn ngủ của trình điều khiển với OpenCV & Keras.

>>> Bạn có thể đọc: 7 cách để có được nguồn dữ liệu chi phí thấp cho học máy

Read Also
Đăng nhận xét