Tự học Data Analyst với Excel tại nhà chỉ 199K Tìm hiểu thêm Mua Ngay!

Lộ Trình Học Machine Learning Dành Cho Người Mới Bắt Đầu

Bạn quan tâm đến Machine Learning? Đây là lộ trình học tập hoàn chỉnh của bạn để bắt đầu sự nghiệp của bạn trong lĩnh vực này.
Liu Liu

lo-trinh-hoc-machine-learning-danh-cho-nguoi-moi-bat-dau

Bạn quan tâm đến Machine Learning? Đây là lộ trình học tập hoàn chỉnh của bạn để bắt đầu sự nghiệp của bạn trong lĩnh vực này.

Bạn đã quyết tâm hướng tới học máy nhưng lại bối rối không biết bắt đầu từ đâu? Tôi từng phải đối mặt với sự lựa chọn, không biết rằng đâu mới là một sự khởi đầu tốt? Nên học Python hay học R? Toán học luôn là một phần đáng sợ đối với tôi và tôi cũng từng lo lắng về việc làm thế nào để có được nền tảng vững chắc cho Machine Learning.

Trong bài viết này, tôi sẽ cho bạn biết một số bước cơ bản và các khóa học bạn nên tham gia trước khi bắt đầu học máy thực tế.

1. Bước đầu tiên cho Machine Learning (Lập trình cơ bản)

Bước đầu tiên là bạn nên học lập trình và rất có thể là Python. Nếu bạn chưa bao giờ viết một dòng mã nào, thì tôi khuyên bạn nên tham gia CS50 của Đại học Harvard, khóa học tốt nhất dành cho người mới bắt đầu lập trình, nó sẽ dạy bạn từ đầu tất cả Ngôn ngữ C và rất nhiều Python và JavaScript với kiến ​​thức cơ bản về SQL và JSON. Khóa học rất thú vị này miễn phí tại edx.org và bạn có thể tìm thấy nó tại đây. Đọc một bài viết về cs50 tại đây .

Nếu bạn muốn bắt đầu trực tiếp từ Python, thì tôi khuyên bạn nên xem miễn phí "Giới thiệu về Khoa học Máy tính với Python" của MIT trên edX. Lưu ý rằng đại số trung học là điều kiện tiên quyết cho khóa học này vì chúng sẽ giúp bạn giải quyết rất nhiều vấn đề toán học trong thế giới thực.

Nếu bạn cảm thấy logic tính toán của mình không tốt và bạn không phải là người giải quyết vấn đề giỏi trong lập trình, tôi sẽ giới thiệu khóa học này của Microsoft, tất cả đều liên quan đến Tư duy tính toán, có sẵn miễn phí trên edx. Khóa học này thực sự rất hay và dạy rất nhiều logic tính toán và tư duy phản biện.

Nếu bạn có đủ kiến ​​thức cơ bản về lập trình nhưng không có kiến ​​thức về lập trình hướng đối tượng, thì tôi khuyên bạn nên học Lập trình hướng đối tượng. Mặc dù nó không được sử dụng nhiều trong học máy (mức cơ bản) nhưng chắc chắn nó sẽ giúp ích rất nhiều. Tôi sẽ đề xuất khóa học này, khóa học này dạy cho bạn những kiến ​​thức cơ bản về OOP và các thuật toán trong python. Bạn có thể tìm khóa học này miễn phí tại edx.org.

Bước tiếp theo là làm quen với cấu trúc dữ liệu và thuật toán. Một lập trình viên giỏi phải biết một số thuật toán cơ bản như danh sách liên kết, cây nhị phân, v.v. Khóa học này Microsoft sẽ dạy bạn:

  • Phân tích thuật toán
  • Sắp xếp và tìm kiếm thuật toán
  • Cấu trúc dữ liệu: Danh sách được liên kết, Ngăn xếp, Hàng đợi
  • Khóa học này được cung cấp  miễn phí tại edx.org.

Nếu bạn muốn đi sâu vào Cấu trúc dữ liệu và thuật toán, chuyên ngành của UC San Diego là một kiệt tác. Nó có 6 khóa học và sẽ đưa bạn từ cấp độ 0 đến cấp độ anh hùng về cấu trúc dữ liệu và thuật toán. Bạn có thể nhấp vào từng khóa học và kiểm tra tài liệu của nó miễn phí, nhưng nếu bạn muốn có chứng chỉ, giá của nó là 50$/tháng, tùy thuộc vào thời gian bạn có thể hoàn thành khóa học đó. Tìm chuyên môn này trong Coursera.org hoặc bấm vào đây .

2. Bước thứ 2 cho Machine Learning

Vâng, bạn đã đoán đúng, phần nguy hiểm nhất đối với hầu hết những người mới bắt đầu - TOÁN HỌC.

Nhưng đừng lo lắng, nó không khó như chúng ta nghĩ và nếu bạn nghĩ rằng bạn có kiến ​​thức cơ bản tốt về toán trung học (vectơ, ma trận, phép tính, xác suất và thống kê), bạn chỉ cần tham gia một khóa bồi dưỡng nhưng nếu bạn nghĩ rằng bạn không đủ giỏi thì nơi tốt nhất để mọi người học toán là KHAN ACADEMY.  Lượng nội dung rất phong phú và hữu ích tại Khan Academy và mọi thứ đều có sẵn miễn phí. Bạn có thể tìm thấy tất cả các khóa học về đại số tuyến tính, xác suất và thống kê cũng như giải tích nhiều biến ở đó.

Một khóa học hay khác là Toán cho chuyên ngành máy học từ Coursera của Imperial College London. Đây là một khóa học tuyệt vời dạy những điều cơ bản và sửa đổi các khái niệm nhưng không đi quá sâu. Các bài tập và câu đố khá khó khăn. Nó có 3 khóa học trên đó.

MIT có một khóa học tuyệt vời về Thống kê dạy:

  • Xây dựng các công cụ ước tính bằng phương pháp khoảnh khắc và khả năng tối đa, đồng thời quyết định cách chọn giữa chúng
  • Định lượng sự không chắc chắn bằng cách sử dụng khoảng tin cậy và thử nghiệm giả thuyết
  • Chọn giữa các mô hình khác nhau bằng cách sử dụng kiểm tra độ vừa vặn
  • Đưa ra dự đoán bằng các mô hình tuyến tính tuyến tính, phi tuyến tính và tổng quát
  • Thực hiện giảm kích thước bằng phân tích thành phần chính (PCA)

Nó có sẵn miễn phí trên edx.org.

Nếu bạn muốn học toán trong khi viết mã, Microsoft có một khóa học rất hay, “Toán cơ bản cho học máy: Phiên bản Python”. Đây là một khóa học tương tác dạy toán bằng đồ họa bằng cách sử dụng các thư viện nổi tiếng của Python là Numpy, pandas và matplotlib, vốn là điều kiện tiên quyết của khóa học này. Tìm khóa học này miễn phí tại edx.org  .

Udacity có 3 khóa học miễn phí tuyệt vời về Thống kê:

Bạn cũng có thể học toán song song với học máy thực tế, gặp cái gì không biết cứ tìm trên Khan Academy hoặc Youtube là có hàng trăm video hay về chủ đề đó.

3. Bước thứ 3 cho Machine Learning

Bây giờ bạn đã cảm thấy thoải mái với đại số tuyến tính, phép tính đa biến và thống kê, vì vậy bây giờ bạn cần tìm hiểu các thư viện trực quan hóa dữ liệu nổi tiếng của Python là Numpy, Pandas, Matplotlib và Scipy giúp bạn phân tích bất kỳ loại dữ liệu nào và thao tác cũng như xem dữ liệu đó dưới dạng đồ họa. Tất nhiên, có rất nhiều thư viện trực quan hóa dữ liệu, nhưng đây là những thư viện quan trọng nhất. Thực hiện các khái niệm của bạn về đại số tuyến tính và giải tích bằng đồ họa và trực quan hóa chúng.

Một trong những kiệt tác về vấn đề này là Thống kê với chuyên môn Python của Đại học Michigan, dạy cách trực quan hóa dữ liệu và các thao tác trên đó một cách chi tiết. Tất nhiên, có sẵn miễn phí (nhấp vào từng khóa học để kiểm tra miễn phí) trên Coursera.org.

Một khóa học khác của Đại học Michigan dành cho người mới bắt đầu phân tích dữ liệu là "Giới thiệu về Khoa học dữ liệu bằng Python", dạy từ những điều cơ bản về numpy đến pandas một cách rất tốt. Có sẵn miễn phí trên Coursera.org. Phần tiếp theo của khóa học này là một người thay đổi cuộc chơi. Được đặt tên là "Vẽ biểu đồ và biểu diễn dữ liệu ứng dụng trong Python", đồng thời dạy tất cả cách trực quan hóa đồ họa cũng như các mẹo và kỹ thuật của nó.

Một khóa học hay khác là “Python for Research” của Harvard, dạy những thư viện này cùng với một số nghiên cứu điển hình nổi tiếng, và dự án cuối cùng của nó thực sự thú vị và dạy nhiều điều mới. Có sẵn miễn phí trên edx.org.

Một khóa học rất toàn diện khác là Python cho Khoa học dữ liệu của UC San Diego dạy:

  • Python
  • Jupyter notebooks
  • Pandas
  • NumPy
  • Matplotlib
  • Git
  • Sci kit-learn
  • NLTK

Mặc dù khóa học này cũng sẽ dạy cho bạn kiến ​​thức cơ bản về máy học nhưng quan trọng hơn là các thư viện khoa học dữ liệu được dạy trong khóa học này. Có sẵn miễn phí trên edx.org (đừng quên đọc các điều kiện tiên quyết của nó).

4. Bước 4 Học máy thực hành

Cho đến nay, bạn đã học đại số tuyến tính, phép tính đa biến, xác suất và số liệu thống kê và Python, cùng với các thư viện trực quan hóa dữ liệu của nó, vì vậy, bây giờ bạn đã sẵn sàng để chuyển sang phần thú vị nhất, đó là machine learning. Khóa học đầu tiên có thể có rất nhiều ý nghĩa. Nếu nó không tốt, bạn có thể thay đổi lĩnh vực chỉ vì đơn giản là bạn không thích khóa học đó. Vì vậy, tất cả các khóa học ở đây sẽ có chất lượng cao và trước khi bạn bắt đầu khóa học đầu tiên về machine learning, hãy thực hiện một số nghiên cứu về nó.

Khóa học giới thiệu này sẽ không dạy bạn machine learning, nhưng thay vào đó, nó sẽ cung cấp cho bạn ý tưởng về machine learning là gì, thuật ngữ machine learning có nghĩa là gì, chiến lược AI là gì và đạo đức của nó. Khóa học này sẽ cung cấp cho bạn cái nhìn tổng quan về machine learning là gì và cách thức hoạt động cũng như quy trình làm việc của nó cũng như cách xây dựng AI trong công ty của bạn. Nó cung cấp và giới thiệu cho bạn một cách tổng quan về AI. Khóa học được giảng dạy bởi giảng viên machine learning rất nổi tiếng Andrew Ng, có sẵn miễn phí trên Coursera.org.

Bạn có thể tìm trên google hoặc xem trong bất kỳ blog nào, khóa học đầu tiên mà mọi người đề xuất là machine learning của Đại học Stanford do  Andrew Ng giảng dạy và đó là một khóa học tuyệt vời. Hơn 2,5 triệu sinh viên đã đăng ký khóa học này và hơn 200.000 sinh viên đã xếp hạng nó (4,9*). Nó dạy từ những khái niệm rất cơ bản đến những khái niệm nâng cao, đây là một khóa học rất toàn diện cho người mới bắt đầu. Tổng thời lượng của khóa học này là hơn 56 giờ. Bạn muốn đọc một bài đánh giá về khóa học này? Của bạn đây. Một đánh giá khác ở đây. Đây là một đánh giá khác về khóa học này trên Quora. Đây là danh sách các nội dung trong đó:

  • Hồi quy tuyến tính
  • Hồi quy đa thức
  • Hồi quy logistic
  • Phân loại nhiều lớp
  • Mạng lưới thần kinh
  • Máy véc tơ hỗ trợ (SVM)
  • K-nghĩa là phân cụm
  • Phân tích thành phần chính (PCA)
  • Phát hiện bất thường
  • Hệ thống đề xuất

Vấn đề duy nhất (theo một số người) là nó được dạy bằng quãng tám/Matlab nhưng đối với tôi thì không có vấn đề gì lớn, bởi vì nó sẽ xóa tất cả các khái niệm cơ bản và sâu về machine learning mà việc triển khai chúng bằng bất kỳ ngôn ngữ nào khác sẽ không thành công, là bất kỳ loại vấn đề cộng với Matlab là một kỹ năng bổ sung. Khóa học này được cung cấp miễn phí trên trang web chính thức của Stanford (tại đây) và Coursera.org (tại đây).

Khóa học này phải được nhiều người biết đến vì nó tốt đến mức không thể giải thích được.

Sau khóa học này, bạn cần triển khai tất cả những điều bạn đã học trong Python và tiến xa hơn những gì bạn đã học để chuyên môn hóa bằng deeplearning.ai trên Coursera của Andrew Ng, Kian Katanfrosh  Younes Bensouda  cũng là điều bắt buộc. Chuyên ngành này có 5 khóa học được:

  • Mạng lưới thần kinh và học sâu
  • Cải thiện Mạng nơ-ron sâu: Điều chỉnh siêu tham số, Chính quy hóa và Tối ưu hóa
  • Cấu trúc các dự án học máy
  • Mạng thần kinh tích chập
  • Mô hình trình tự

Các kỹ năng chính bạn sẽ đạt được là

  • Tenorflow
  • Mạng thần kinh tích chập
  • Mạng lưới thần kinh nhân tạo
  • Học kĩ càng

Vì vậy, bây giờ bạn đã hiểu rõ về TensorFlow và machine learning. Bạn có thể không thích TensorFlow hoặc bạn chỉ muốn kiểm tra đối thủ nổi tiếng của TensorFlow là PyTorch (của Facebook), vậy tại sao không bắt đầu khóa học deep learning miễn phí này của Udacity do Facebook phối hợp với Amazon Web Services và một phần của Udacity deep nổi tiếng cung cấp học Nano Degree trị giá 1400$.

Tất nhiên, đây mới chỉ là bước đầu, còn rất nhiều điều cần học hỏi và khám phá, nhưng hy vọng rằng nếu bạn làm những điều này, bạn sẽ biết được mình đang đứng ở đâu và phải làm gì tiếp theo.

Một số lời khuyên và khuyến nghị

Dưới đây là một số khuyến nghị.

  • Bắt đầu nghe Podcast “Machine Learning Guide” của OC Devel ngay bây giờ. Điều này sẽ cung cấp cho bạn cái nhìn tổng quan đầy đủ về học máy, những gì có trong đó và hành trình của một nhà phát triển ứng dụng web và Android chuyển sang con đường học máy. Có sẵn trên  Apple Podcasts /iTunes, Google Podcasts và  trang web của anh ấy .
  • Nhận “Học máy thực hành với Scikit-Learn và TensorFlow: Khái niệm, công cụ và kỹ thuật để xây dựng hệ thống thông minh” hoặc phiên bản mới của nó được phát hành vào tháng 10 năm 2019 có tên là “Học máy thực hành với Scikit-Learn, Keras và TensorFlow: Khái niệm, Công cụ và Kỹ thuật để Xây dựng Hệ thống Thông minh.” Tác giả của cuốn sách này là  Aurélien Géron. Phiên bản đầu tiên của cuốn sách này là số 1 về  Trí tuệnhân tạo (Sách),  số 1 về Xử lý ngôn ngữ tự nhiên (Sách) và số 1 về Mạng nơ-ron máy tính. Cuốn sách này là rất rộng rãi và khuyến khích.
  • Đừng quên đọc cái này. Nó có rất nhiều thông tin hữu ích.
  • Thực hành nhiều trên Kaggle (bạn sẽ biết về nó khi bắt đầu học máy).
  • Hãy tận tâm và tin rằng bạn có thể làm được. Tất cả những gì bạn cần là sự nhất quán.

Chúc may mắn và có thời gian vui vẻ khi học cách làm cho  máy móc trở nên thông minh hơn.

Copyright Disclaimer:

This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.

Tuyên bố miễn trừ bản quyền:

Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.

Tham khảo các bài viết cùng chủ đề:

  1. Tìm hiểu Học sâu Deep Learning thông qua 10 dự án mạng thần kinh vào năm 2022
  2. Hiểu về Học máy và Trí tuệ nhân tạo AI theo cách hiểu phổ thông nhất
  3. 7 cách để có được nguồn dữ liệu chi phí thấp cho học máy

Đăng nhận xét

Cookie Consent
We serve cookies on this site to analyze traffic, remember your preferences, and optimize your experience.
Oops!
It seems there is something wrong with your internet connection. Please connect to the internet and start browsing again.
AdBlock Detected!
We have detected that you are using adblocking plugin in your browser.
The revenue we earn by the advertisements is used to manage this website, we request you to whitelist our website in your adblocking plugin.
Site is Blocked
Sorry! This site is not available in your country.