Tùy Chỉnh Chế Độ Xem
Cài đặt chỉ áp dụng cho trình duyệt này
Chế độ ánh sáng màn hình
  • Giao diện sáng
  • Giao diện tối
  • Giao diện mặc định

9 Khóa Học Harvard Miễn Phí Để Học Data Science

9-khoa-hoc-harvard-mien-phi-de-hoc-data-science


Đã có một bài viết về xây dựng lộ trình học khoa học dữ liệu với các khóa học miễn phí do MIT cung cấp.

Tuy nhiên, trọng tâm của hầu hết các khóa học trong bài báo đều thiên về lý thuyết và tập trung nhiều vào việc học toán và thống kê đằng sau các thuật toán máy học.

Mặc dù lộ trình của MIT sẽ giúp bạn hiểu các nguyên tắc đằng sau mô hình dự đoán, nhưng điều còn thiếu là khả năng thực sự triển khai các khái niệm đã học và thực hiện một dự án khoa học dữ liệu trong thế giới thực.

Sau khi dành thời gian tìm kiếm trên Internet, tôi đã tìm thấy một vài khóa học miễn phí của Harvard bao gồm toàn bộ quy trình khoa học dữ liệu?Từ lập trình đến phân tích dữ liệu, thống kê và học máy.

Sau khi bạn hoàn thành tất cả các khóa học trong lộ trình học tập này, bạn cũng được cung cấp một dự án quan trọng nhất cho phép bạn áp dụng mọi thứ bạn đã học vào thực tế.

Trong bài viết này, tôi sẽ liệt kê 9 khóa học Harvard miễn phí mà bạn có thể tham gia để học khoa học dữ liệu từ đầu. Vui lòng bỏ qua bất kỳ khóa học nào trong số này nếu bạn đã có kiến ​​thức về chủ đề đó.

Bước 1: Lập trình

Bước đầu tiên bạn nên thực hiện khi học khoa học dữ liệu là học cách viết mã. Bạn có thể chọn làm điều này với lựa chọn ngôn ngữ lập trình của mình? Lý tưởng nhất là Python hoặc R.

Nếu bạn muốn học R, Harvard cung cấp một khóa học giới thiệu về R được tạo riêng cho những người học về khoa học dữ liệu, được gọi là Khoa học dữ liệu: Khái niệm cơ bản về R .

Chương trình này sẽ đưa bạn qua các khái niệm R như biến, kiểu dữ liệu, số học vectơ và lập chỉ mục. Bạn cũng sẽ học cách sắp xếp dữ liệu với các thư viện như dplyr và tạo các biểu đồ để trực quan hóa dữ liệu.

Nếu bạn thích Python hơn, bạn có thể chọn học phần Giới thiệu về Lập trình với Python của CS50 do Harvard cung cấp miễn phí. Trong khóa học này, bạn sẽ học các khái niệm như hàm, đối số, biến, kiểu dữ liệu, câu lệnh điều kiện, vòng lặp, đối tượng, phương thức, v.v.

Cả hai chương trình trên đều có nhịp độ riêng. Tuy nhiên, khóa học Python chi tiết hơn chương trình R và yêu cầu cam kết thời gian lâu hơn để hoàn thành. Ngoài ra, phần còn lại của các khóa học trong lộ trình này được dạy bằng R, vì vậy có thể đáng để học R để có thể theo dõi dễ dàng.

Bước 2: Trực quan hóa dữ liệu

Trực quan hóa là một trong những kỹ thuật mạnh mẽ nhất mà bạn có thể dịch những phát hiện của mình trong dữ liệu cho người khác.

Với chương trình Trực quan hóa dữ liệu của Harvard, bạn sẽ học cách xây dựng trực quan hóa bằng cách sử dụng thư viện ggplot2 trong R, cùng với các nguyên tắc truyền đạt thông tin chuyên sâu dựa trên dữ liệu.

Bước 3: Xác suất

Trong khóa học này, bạn sẽ học các khái niệm xác suất thiết yếu là nền tảng để tiến hành các kiểm tra thống kê trên dữ liệu. Các chủ đề được giảng dạy bao gồm các biến ngẫu nhiên, tính độc lập, mô phỏng Monte Carlo, giá trị kỳ vọng, sai số chuẩn và Định lý giới hạn trung tâm.

Các khái niệm trên sẽ được giới thiệu với sự trợ giúp của một nghiên cứu điển hình, điều đó có nghĩa là bạn sẽ có thể áp dụng mọi thứ bạn đã học vào một bộ dữ liệu thực tế trong thế giới thực.

Bước 4: Thống kê

Sau khi học xác suất, bạn có thể tham gia khóa học này để tìm hiểu các nguyên tắc cơ bản về lập mô hình và suy luận thống kê.

Chương trình này sẽ hướng dẫn bạn xác định ước tính dân số và biên độ sai số, giới thiệu cho bạn thống kê Bayes và cung cấp cho bạn các nguyên tắc cơ bản của mô hình dự đoán.

Bước 5: Công cụ năng suất (Tùy chọn)

Tôi đã đưa khóa học quản lý dự án này vào làm tùy chọn vì nó không liên quan trực tiếp đến việc học khoa học dữ liệu. Thay vào đó, bạn sẽ được dạy sử dụng Unix/Linux để quản lý tệp, Github, kiểm soát phiên bản và tạo báo cáo trong R.

Khả năng thực hiện những điều trên sẽ giúp bạn tiết kiệm rất nhiều thời gian và giúp bạn quản lý tốt hơn các dự án khoa học dữ liệu từ đầu đến cuối.

Bước 6: Tiền xử lý dữ liệu

Khóa học tiếp theo trong danh sách này có tên là Sắp xếp dữ liệu và sẽ hướng dẫn bạn chuẩn bị dữ liệu cũng như chuyển đổi dữ liệu thành định dạng mà các mô hình máy học có thể tiếp thu dễ dàng.

Bạn sẽ học cách nhập dữ liệu vào R, dữ liệu gọn gàng, xử lý dữ liệu chuỗi, phân tích cú pháp HTML, làm việc với các đối tượng ngày giờ và khai thác văn bản.

Là một nhà khoa học dữ liệu, bạn thường cần trích xuất dữ liệu có sẵn công khai trên Internet dưới dạng tài liệu PDF, trang web HTML hoặc Tweet. Không phải lúc nào bạn cũng được cung cấp dữ liệu rõ ràng, được định dạng trong tệp CSV hoặc trang tính Excel.

Khi kết thúc khóa học này, bạn sẽ học cách sắp xếp và làm sạch dữ liệu để đưa ra những hiểu biết quan trọng từ dữ liệu đó.

Bước 7: Hồi quy tuyến tính

Hồi quy tuyến tính là một kỹ thuật học máy được sử dụng để mô hình hóa mối quan hệ tuyến tính giữa hai hoặc nhiều biến. Nó cũng có thể được sử dụng để xác định và điều chỉnh ảnh hưởng của các biến gây nhiễu.

Khóa học này sẽ dạy cho bạn lý thuyết đằng sau các mô hình hồi quy tuyến tính, cách kiểm tra mối quan hệ giữa hai biến và cách phát hiện và loại bỏ các biến gây nhiễu trước khi xây dựng thuật toán máy học.

Bước 8: Học máy

Cuối cùng, khóa học mà bạn có thể đã chờ đợi! Chương trình học máy của Harvard sẽ dạy cho bạn kiến ​​thức cơ bản về học máy, các kỹ thuật để giảm thiểu việc trang bị quá mức, các phương pháp tiếp cận mô hình có giám sát và không giám sát cũng như các hệ thống đề xuất.

Bước 9: Dự án Capstone

Sau khi hoàn thành tất cả các khóa học trên, bạn có thể tham gia dự án capstone về khoa học dữ liệu của Harvard, nơi các kỹ năng của bạn về trực quan hóa dữ liệu, xác suất, thống kê, sắp xếp dữ liệu, tổ chức dữ liệu, hồi quy và học máy sẽ được đánh giá.

Với dự án cuối cùng này, bạn sẽ có cơ hội tổng hợp tất cả kiến ​​thức đã học được từ các khóa học trên và có khả năng hoàn thành một dự án khoa học dữ liệu thực hành từ đầu.

Lưu ý: Tất cả các khóa học trên đều có sẵn trên nền tảng học tập trực tuyến của edX và có thể được kiểm tra miễn phí. Tuy nhiên, nếu bạn muốn có chứng chỉ khóa học, bạn sẽ phải trả tiền cho một chứng chỉ.

Copyright Disclaimer:

This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.

Tuyên bố miễn trừ bản quyền:

Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.

Tham khảo các bài viết cùng chủ đề:

Đọc thêm
Đăng nhận xét