Skip to content

数据分析

能力图谱

模块核心能力
数据获取爬虫、API 对接、数据库查询、文件解析
数据预处理清洗、转换、ETL、NumPy/Pandas
数据可视化Matplotlib、pyecharts、ECharts、AntV
图像处理OpenCV、PyMuPDF、视觉差异检测

学习路线

阶段内容
数据获取爬虫、API、多源数据采集
数据预处理Pandas 清洗、NumPy 计算、ETL 流水线
数据可视化Matplotlib、pyecharts、前端图表库
图像处理OpenCV、PDF 处理、视觉比对

工具选型

场景推荐工具
表格数据处理Pandas
数值计算NumPy
基础图表Matplotlib
交互式图表pyecharts / ECharts
图像处理OpenCV
PDF 处理PyMuPDF (fitz)
爬虫requests + BeautifulSoup / Selenium

实战建议

数据分析的核心不是工具,而是明确问题 -> 获取数据 -> 清洗转换 -> 分析可视化 -> 得出结论的完整链路。每个环节都可能出问题,数据质量决定分析质量。

基于 VitePress 构建