DTS002TC 大数据基础
English version: DTS002TC Essentials of Big Data
本课程全面介绍大数据基础,涵盖 Python 编程基础、NumPy 数值计算、Pandas 数据处理、Matplotlib 数据可视化以及使用 Scikit-Learn 的机器学习入门。
课程概览
DTS002TC 是西交利物浦大学的大数据基础入门课程。课程涵盖大数据的理论基础和 Python 及其数据科学生态系统的实践编程技能。
讲义
| # | 主题 | 资料 |
|---|---|---|
| 1 | 大数据概述 | 讲义 1 |
| 2 | 大数据技术层面 | 讲义 2 |
| 2+ | GPU 简介 | GPU 简介 |
| 3a | 数据侦探 - CIKW | CIKW |
| 3b | 大数据的存储与处理 | 讲义 3 |
| 4 | 大数据分析 | 讲义 4 |
| 5 | 计算机视觉与大数据分析 | 讲义 5 |
| 5+ | 课程作业 1 (SJL) | CW1 |
| Day2 | Python 入门 | Python 入门 |
| Day2 | Matplotlib 与机器学习 | Matplotlib 与 ML |
实验课
实验 1:Python 基础
实验 2:Python 核心概念
实验 3:NumPy 基础
实验 4:NumPy 高级数组
实验 5:NumPy 计算
实验 6:布尔数组与 Pandas
实验 7:数据可视化
实验 8:Scikit-Learn 机器学习
实验 9-10:期末练习
复习
来源
所有资料来源于 raw/DTS002/ 中的课程原始文件。