AITC Wiki

DTS002TC 大数据基础

DTS002TC Essentials of Big Data

DTS002TC 大数据基础

English version: DTS002TC Essentials of Big Data

本课程全面介绍大数据基础,涵盖 Python 编程基础、NumPy 数值计算、Pandas 数据处理、Matplotlib 数据可视化以及使用 Scikit-Learn 的机器学习入门。

课程概览

DTS002TC 是西交利物浦大学的大数据基础入门课程。课程涵盖大数据的理论基础和 Python 及其数据科学生态系统的实践编程技能。

讲义

#主题资料
1大数据概述讲义 1
2大数据技术层面讲义 2
2+GPU 简介GPU 简介
3a数据侦探 - CIKWCIKW
3b大数据的存储与处理讲义 3
4大数据分析讲义 4
5计算机视觉与大数据分析讲义 5
5+课程作业 1 (SJL)CW1
Day2Python 入门Python 入门
Day2Matplotlib 与机器学习Matplotlib 与 ML

实验课

实验 1:Python 基础

实验 2:Python 核心概念

实验 3:NumPy 基础

实验 4:NumPy 高级数组

实验 5:NumPy 计算

实验 6:布尔数组与 Pandas

实验 7:数据可视化

实验 8:Scikit-Learn 机器学习

实验 9-10:期末练习

复习

来源

所有资料来源于 raw/DTS002/ 中的课程原始文件。