Datasets for Data Science, Machine Learning, AI & Analytics
Weekly Study cung cấp cho bạn danh sách Bộ các dữ liệu Dataset cho Trí tuệ nhân tạo AI, Phân tích dữ liệu Data Analyst, Khoa học dữ liệu Data Science, Học máy Machine Learning và Học sâu Deep Learning
➢ Anacode Chinese Web Datastore: Tập hợp các tin tức và blog của Trung Quốc được thu thập thông tin ở định dạng JSON
➢ Appen Open Source Datasets: Hơn 270 bộ dữ liệu âm thanh, hình ảnh, video và văn bản bằng hơn 80 ngôn ngữ
➢ AssetMacro: Dữ liệu lịch sử của các chỉ số kinh tế vĩ mô và dữ liệu thị trường
➢ Awesome Public Datasets: Một danh sách tập trung vào chủ đề gồm các tập dữ liệu mở HQ
➢ AWS Public Data Sets: Kho lưu trữ tập trung các tập dữ liệu công khai
➢ BigML Public Data Sources: Một danh sách dài các nguồn dữ liệu mà bất kỳ ai cũng có thể sử dụng
➢ USA.gov: API và nguồn cấp dữ liệu để giúp mọi người tìm thấy thông tin hữu ích của chính phủ
➢ DataPortals.org: Danh sách toàn diện các cổng dữ liệu mở từ khắp nơi trên thế giới
➢ Data.gov.uk: Tìm dữ liệu do chính quyền trung ương, chính quyền địa phương và các cơ quan công quyền công bố để giúp bạn xây dựng sản phẩm và dịch vụ
➢ Data Planet: Kho lưu trữ dữ liệu thống kê có cấu trúc và tiêu chuẩn hóa lớn nhất
➢ DataSF.org: Tìm kiếm hàng trăm bộ dữ liệu từ Thành phố và Hạt San Francisco
➢ Data.world: Khám phá và chia sẻ dữ liệu, kết nối với những người thú vị và cùng nhau giải quyết vấn đề nhanh hơn
➢ Europeana Data: Mở siêu dữ liệu trên 20 triệu văn bản, hình ảnh, video và âm thanh được Europeana thu thập
➢ GEO Gene Expression Omnibus: Một tài nguyên trực tuyến, được quản lý để duyệt, truy vấn và truy xuất dữ liệu biểu hiện gen
➢ HitCompanies Datasets: Dữ liệu toàn diện về 10.000 công ty ngẫu nhiên của Vương quốc Anh được lấy mẫu từ HitCompanies, được cập nhật tự động bằng AI / Machine Learning
➢ ICWSM 2009 Data Challenge: 44 triệu bài đăng trên blog được thực hiện từ ngày 1 tháng 8 đến ngày 1 tháng 10 năm 2008
➢ JMP Public Featured Datasets: Các tập dữ liệu công khai được phân loại từ JMP
➢ Kaggle Datasets: Khám phá, phân tích và chia sẻ dữ liệu chất lượng
➢ Linking Open Data: Cung cấp dữ liệu miễn phí cho mọi người
➢ LoveTheSales: Thị trường bán hàng trực tuyến lớn nhất thế giới
➢ Lyst Fashion Data Trends: Nguồn đáng tin cậy của ngành để theo dõi xu hướng dữ liệu thời trang
➢ Million Song Dataset: Một bộ sưu tập các tính năng âm thanh và siêu dữ liệu có sẵn miễn phí cho một triệu bản nhạc nổi tiếng đương đại
➢ NASDAQ Data Link: Nguồn hàng đầu cho các bộ dữ liệu tài chính, kinh tế và thay thế
➢ NASA Space Science Data Coordinated Archive: Kho lưu trữ của NASA về dữ liệu sứ mệnh khoa học không gian
➢ Qlik Sense Data Sources: Kết nối và kết hợp dữ liệu từ hàng trăm nguồn dữ liệu
➢ Robert Schiller Data: Dữ liệu nhà ở, dữ liệu thị trường tài chính và hơn thế nữa, từ cuốn sách Phi lý trí của ông
➢ Sports Statistics: Dữ liệu cho bóng đá, NBA, NFL, NHL, v.v.
➢ StatLib Datasets Archive: Tập dữ liệu từ Đại học Carnegie Mellon
➢ UCI Machine Learning Repository: Tập hợp cơ sở dữ liệu, lý thuyết miền và trình tạo dữ liệu được cộng đồng máy học sử dụng để phân tích thực nghiệm các thuật toán máy học (phiên bản beta mới)
➢ UCR Time Series Classification Archive: Tập dữ liệu, giấy tờ, liên kết và mã
➢ UK Open Postcode Geo: Chúng tôi sắp xếp dữ liệu mở của Vương quốc Anh theo vị trí và chỉ dẫn nguồn
➢ United States Census Bureau: Một loại dữ liệu Điều tra dân số Hoa Kỳ
➢ Virtual Screening of Bioassay Data: Bộ dữ liệu xét nghiệm sinh học có sẵn để tải xuống, của Amanda Schierz, J.
➢ Web Data Commons: Dữ liệu có cấu trúc từ Common Crawl, kho dữ liệu web lớn nhất có sẵn cho công chúng
➢ WorldData.AI: Kết nối dữ liệu của bạn với nhiều trong số 3,5 tỷ bộ dữ liệu WorldData và cải thiện các mô hình Khoa học dữ liệu và Máy học của bạn
➢ Yahoo Webscope Program: Thư viện tham khảo gồm các bộ dữ liệu thú vị và hữu ích về mặt khoa học cho các học giả và các nhà khoa học khác sử dụng phi thương mại
➢ Yelp Open Dataset: Một tập dữ liệu đa năng cho việc học; tập hợp con các doanh nghiệp, bài đánh giá và dữ liệu người dùng của Yelp để sử dụng cho mục đích cá nhân, giáo dục và học thuật